大神一句話,菜鳥跑半年。我不是大神,但我可以縮短你走彎路的半年~
就像歌兒唱的那樣,如果你不知道該往哪兒走,就留在這學(xué)點(diǎn)生信好不好~
這里有豆豆和花花的學(xué)習(xí)歷程,從新手到進(jìn)階,生信路上有你有我!
豆豆開始寫于19.2.4
之前從未涉足這個(gè)領(lǐng)域,但確實(shí)是未來發(fā)展方向 還是老規(guī)矩,流程學(xué)習(xí)很快,重點(diǎn)在于為什么做以及做完怎么解讀 先補(bǔ)充背景知識吧,春晚之前發(fā)出來生信星球祝大家春節(jié)快樂咯!明年進(jìn)步會更大!一起加油吧
背景知識 NGS與轉(zhuǎn)錄
轉(zhuǎn)錄組即某個(gè)物種或特定細(xì)胞在某一功能狀態(tài)下產(chǎn)生的所有RNA的總和 (哪些序列能夠表達(dá),何時(shí)何處表達(dá), 轉(zhuǎn)錄活躍程度)
部分基因是能夠轉(zhuǎn)錄 =》染色質(zhì)多為開放狀態(tài);其余基因抑制 狀態(tài)=》染色質(zhì)狀態(tài)較為緊密【基因開啟、關(guān)閉:基因調(diào)控】
基因表達(dá)調(diào)控 :信號轉(zhuǎn)導(dǎo)、轉(zhuǎn)錄前(染色質(zhì)構(gòu)象和表觀調(diào)控等)、轉(zhuǎn)錄調(diào)控、轉(zhuǎn)錄后調(diào)控(剪切、編輯、轉(zhuǎn)運(yùn)等)、翻譯和翻譯后調(diào)控【針對DNA序列:順式元件Cis; 針對結(jié)合因子包括蛋白和非蛋白因子:反式作用因子Trans】
非編碼區(qū)大量組織特異性調(diào)控序列 :增強(qiáng)子enhancer、沉默子silencer、絕緣子insulator等+幾個(gè)/幾十/幾百調(diào)控因子(轉(zhuǎn)錄因子、染色質(zhì)調(diào)控蛋白、組蛋白、RNA分子)+三維結(jié)構(gòu)
目前技術(shù):
分離純化多拷貝的基因組重復(fù)序列,如染色體端粒(telomere):locked nucleic acids (LNAs )和transcription activator-like (TAL )
常規(guī)技術(shù):ChIP-seq 和ChIA-PE 依賴于單個(gè)調(diào)控因子或組蛋白修飾【不能純化、分析單個(gè)調(diào)控序列所結(jié)合的多個(gè)調(diào)控因子及三維結(jié)構(gòu)】
挑戰(zhàn):native狀態(tài)下 區(qū)分結(jié)合調(diào)控序列的特異性調(diào)控因子 和細(xì)胞內(nèi)大量的非特異性 因子
文獻(xiàn)綜述一定要看 PPT大體印象;綜述幫助理解;文獻(xiàn)獲取流程
PPT: Basics of ChIP-Seq https://www.msi./sites/default/files/basics_chip_seq_0.pdf
Basic workflow ChIP-seq Data Analysis https:///slide/3385783/
ChIP overview 圖中可以看到,基本原理是:特定時(shí)間點(diǎn)上用甲醛交聯(lián) 等方式“固定”細(xì)胞內(nèi)所有DNA結(jié)合蛋白的活動(dòng),細(xì)胞內(nèi)蛋白和DNA相互作用的關(guān)系被“截屏”了=》然后裂解 細(xì)胞、斷裂DNA(此時(shí)存在蛋白、與蛋白相連的DNA、游離的DNA)=》加上特定抗體 取出蛋白及相連的DNA=》將與蛋白相連的DNA解離、純化 =》測序=》看到蛋白質(zhì)抓取的片段們就是IGV中形成的峰,而游離的DNA們就沒有峰
綜述: ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia (2012) https://www.ncbi.nlm./pubmed/22955991
首先就介紹了ChIP的歷史【染色質(zhì)免疫沉淀(Chromatin immunoprecipitation ,ChIP)技術(shù)誕生很早,由Orlando等人創(chuàng)立于1997 年,發(fā)表于2000 年,先利用Microarray技術(shù) ChIP-chip ,后2007 年利用DNA sequencing技術(shù) ChIP-seq 。雖然技術(shù)在進(jìn)步,但都是要先通過免疫沉淀拉下來DNA】
它用來研究細(xì)胞內(nèi)DNA與蛋白質(zhì)相互作用,確定特定蛋白(如轉(zhuǎn)錄因子)是否結(jié)合特定基因組區(qū)域(如啟動(dòng)子或其它DNA結(jié)合位點(diǎn)),或確定基因組上與組蛋白修飾相關(guān)的特定位點(diǎn)
然后提到兩個(gè)組織:ENCODE(http:///ENCODE/ )和modENCODE(http://www./ for small genomes),他們在4個(gè)物種(果蠅、秀麗隱桿線蟲、人、小鼠)的100多種細(xì)胞做了超過1000次ChIP-seq實(shí)驗(yàn),發(fā)現(xiàn)了140多種不同的因子和組蛋白修飾 【與外顯子測序不一樣,ChIP-seq不是通過設(shè)計(jì)好的探針來捕獲序列,而是通過特異的RNApoly酶、組蛋白、轉(zhuǎn)錄因子來捕獲,哪里結(jié)合蛋白就捕獲哪里。每做一次實(shí)驗(yàn),換一個(gè)蛋白,所捕獲的序列是不一樣的】
ChIP workflow 文獻(xiàn): Getting-Started-with-ChIP-Seq(2013)
http:///wp-content/uploads/2013/02/Getting-Started-with-ChIP-Seq.pdf
Key steps:
Experimental design sequencing platform; the number of sequence reads (standard 20-40M); biological replication
Controls for ChIP-seq experiments
Reference genome alignment of ChIP-seq reads
(mapping)
Background estimation
Peak finding
Quality control of ChIP-seq experiments
Differential binding analysis
Motif analysis