大家好,這是專注表觀組學(xué)十余年,領(lǐng)跑多組學(xué)科研服務(wù)的易基因。 本期,我們講講全基因組DNA甲基化實(shí)驗(yàn)怎么做,從技術(shù)原理、建庫測序流程、信息分析流程和研究套路等四方面詳細(xì)介紹。 一、全基因組甲基化測序技術(shù)原理表觀修飾不需要改變 DNA 序列便能實(shí)現(xiàn)對性狀的改變,表觀修飾的改變與基因功能乃至細(xì)胞狀態(tài)、發(fā)育、衰老、疾病等存在重要的關(guān)聯(lián)。在眾多的表觀遺傳修飾中,最為重要且研究最為廣泛的修飾之一是 DNA 甲基化,而全基因組甲基化測序(WGBS-seq)無疑是最有效的研究手段。 全基因組甲基化測序利用重亞硫酸鹽能夠?qū)⑽醇谆陌奏ぃ–)轉(zhuǎn)化為胸腺嘧啶 (T)的特性,將基因組用重亞硫酸鹽處理后測序,即可根據(jù)單個(gè) C 位點(diǎn)上未轉(zhuǎn)化為 C 未轉(zhuǎn)化為 T 的 reads 數(shù)目與所有覆蓋的 reads 數(shù)目的比例,計(jì)算得到甲基化率。該技術(shù)對于全面研究胚胎發(fā)育、衰老機(jī)制、疾病發(fā)生發(fā)展的表觀遺傳機(jī)制,以及篩選疾病相關(guān)的表觀遺傳學(xué)標(biāo)記位點(diǎn)具有重要的應(yīng)用價(jià)值。 全基因組甲基化測序原理示意圖入下: 圖1:重亞硫酸鹽測序技術(shù)原理 二、全基因組甲基化測序建庫流程樣品檢測——樣品打斷 ——文庫構(gòu)建——BS處理——文庫質(zhì)檢 (一)樣品檢測對DNA樣品的檢測主要包括2種方法: (1)瓊脂糖凝膠電泳分析DNA降解程度以及是否有污染,檢測具有明顯的主帶,且條帶清晰;
(二)文庫構(gòu)建樣本檢測合格后,使用Bioruptor系統(tǒng)將1μg樣品基因組DNA與未甲基化的lambda DNA混合,然后將其片段化,平均大小約為250bp。片段化后,純化的隨機(jī)片段化DNA隨后用T4 DNA聚合酶,Klenow片段和T4多核苷酸激酶的混合物進(jìn)行修復(fù),鈍化和磷酸化末端。隨后使用Klenow片段(3'-5'exo-)對鈍的DNA片段進(jìn)行3'腺苷酸化,然后與連接5'-甲基胞嘧啶而不是使用T4 DNA連接酶的胞嘧啶連接的銜接子進(jìn)行連接。完成每個(gè)步驟后,使用磁珠純化DNA。之后,根據(jù)說明使用ZYMO EZ DNA甲基化金試劑盒將未甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶。最后,用JumpStart Taq DNA聚合酶進(jìn)行PCR擴(kuò)增,再使用磁珠對PCR產(chǎn)物進(jìn)行純化獲得最終文庫。 (三)文庫質(zhì)檢文庫構(gòu)建完成后,先使用Qubit2.0進(jìn)行初步定量,稀釋文庫至1ng/ul,隨后使用Agilent 2100對文庫的insert size進(jìn)行檢測,insert size符合預(yù)期后,使用qPCR方法對文庫的有效濃度進(jìn)行準(zhǔn)確定量(文庫有效濃度> 2nM),以保證文庫質(zhì)量。 (四)上機(jī)測序文庫檢測合格后,把不同文庫按照有效濃度及目標(biāo)下機(jī)數(shù)據(jù)量的需求pooling后在illumina Nova平臺(tái)測序,測序策略為PE150。 三、全基因組甲基化測序信息分析流程(一)原始下機(jī)數(shù)據(jù)質(zhì)控原始下機(jī)數(shù)據(jù)為FASTQ格式,是高通量測序的標(biāo)準(zhǔn)格式。FASTQ文件每四行為一個(gè)單位,包含一條測序序列(read)的信息。該單位第一行為read的ID,一般以@符號(hào)開頭;第二行為測序的序列,也就是reads的序列;第三行一般是一個(gè)+號(hào),或者與第一行的信息相同;第四行是堿基質(zhì)量值,是對第二行序列的堿基的準(zhǔn)確性的描述,一個(gè)堿基會(huì)對應(yīng)一個(gè)堿基質(zhì)量值,所以這一行和第二行的長度相同。以下為一條read信息的示例: 原始下機(jī)數(shù)據(jù)包含建庫時(shí)引進(jìn)的接頭序列以及質(zhì)量過低的堿基,這些因素會(huì)導(dǎo)致后續(xù)比對到基因組的reads較少,從而導(dǎo)致得到的信息較少,因此需要進(jìn)行過濾。利用trim_galore軟件對原始數(shù)據(jù)進(jìn)行去除接頭序列及低質(zhì)量堿基等質(zhì)控步驟。 (二)序列比對經(jīng)過質(zhì)控的reads需要根據(jù)與參考基因組的序列相似度比對到參考基因組上。相比于常規(guī)基因組及轉(zhuǎn)錄組測序,WGBS測序方法產(chǎn)生的數(shù)據(jù)的特點(diǎn)決定其在比對時(shí)存在三大困難: (1)DNA片段正鏈和負(fù)鏈經(jīng)過重亞硫酸鹽轉(zhuǎn)化后將不再反向互補(bǔ),再經(jīng)過PCR,便會(huì)產(chǎn)生四條不同的序列,這將大大增加比對時(shí)的計(jì)算量。 (2)經(jīng)過重亞硫酸鹽轉(zhuǎn)化后,DNA序列大部分C堿基被轉(zhuǎn)化成T堿基,因此序列含大量T而缺乏C;經(jīng)過PCR后,產(chǎn)生的互補(bǔ)鏈則含有大量A而缺乏G。這樣便導(dǎo)致序列的復(fù)雜度降低(即序列的組成特征更單一),從而增加比對的難度。 (3)C和T的比對是不對稱的。經(jīng)過重亞硫酸鹽轉(zhuǎn)化后,序列中非甲基化的C堿基(占大部分)被轉(zhuǎn)化為T,這將導(dǎo)致測序序列與參考基因組不匹配,T既可能應(yīng)該比對到T上,有可能應(yīng)該比對到C上;而C則只能比對到C上。這也增加了比對的難度。 利用BSMAP軟件進(jìn)行比對。BSMAP進(jìn)行比對時(shí),先以參考基因組上C堿基的位置作為指導(dǎo),將reads中對應(yīng)參考基因組C堿基位置的T標(biāo)記為C,其他T保持不變,從而使reads可以直接比對到參考基因組。 (三)甲基化水平計(jì)算甲基化水平可根據(jù)未轉(zhuǎn)化為 T 的 C 與轉(zhuǎn)化為 T 的 C 的 reads 的比例計(jì)算得到,即: Beta-value = C-reads / (C-reads + T-reads) * 100% 其中,Beta-value 即為該胞嘧啶的甲基化水平,C-reads 為覆蓋該位點(diǎn)的支持甲基化的reads 數(shù)目(測得該位點(diǎn)為 C 的 reads),T-reads 為覆蓋該位點(diǎn)的不支持甲基化的 reads 數(shù)目(測得該位點(diǎn)為 T 的 reads)。 計(jì)算原理示意圖如下: 利用BSMAP統(tǒng)計(jì)甲基化水平。 (四)差異甲基化區(qū)域(DMR)鑒定及統(tǒng)計(jì)DMR檢測使用權(quán)威期刊發(fā)表的metilene軟件。該軟件先將基因組進(jìn)行預(yù)分段,以排除較長序列中不包含CG位點(diǎn)的片段。隨后,利用二元分隔算法,遞歸縮小檢測范圍,以搜索得到組間累積平均甲基化差異最大的區(qū)域,作為可能的DMR;最后,結(jié)合雙重統(tǒng)計(jì)學(xué)檢驗(yàn)(MWU-test和2D KS-test),得到準(zhǔn)確的DMR。檢測原理如下圖所示: 本分析檢測DMR的標(biāo)準(zhǔn)如下: (1)區(qū)域平均甲基化差異不小于0.1; (2)CpG位點(diǎn)數(shù)不少于5個(gè); (3)區(qū)域長度不小于50 bp; (4)甲基化水平差異統(tǒng)計(jì)檢驗(yàn)的校正P值小于0.05; (5)2D KS-test檢驗(yàn)P值小于0.05。 (五)信息分析流程示意圖四、總結(jié):全基因組甲基化研究思路DNA甲基化組學(xué)研究的核心內(nèi)容在于對DNA甲基化數(shù)據(jù)的挖掘。DNA甲基化一般遵循三個(gè)步驟進(jìn)行數(shù)據(jù)挖掘。
五、全基因組甲基化研究案例Whole-Genome Bisulfite Sequencing of Two Distinct Interconvertible DNA Methylomes of Mouse Embryonic Stem Cells. 兩種狀態(tài)的小鼠胚胎干細(xì)胞的甲基化組學(xué)研究 1、背景 小鼠胚胎干細(xì)胞一般生長在含有血清的基質(zhì)中,被稱作血清干細(xì)胞(serum ESCs);加兩種激酶抑制因子使胚胎干細(xì)胞在無血清的情況下更能保持多能性的基態(tài),這種干細(xì)胞稱為2i干細(xì)胞(2i ESCs);這兩種狀態(tài)的胚胎干細(xì)胞可以互相轉(zhuǎn)化。以前這方面的甲基化研究大多基于質(zhì)譜,覆蓋度和研究結(jié)果有限,尚缺乏2i胚胎干細(xì)胞的甲基化組學(xué)研究。 2、方法 利用全基因組重亞硫酸鹽甲基化測序(WGBS),對這兩種可互相轉(zhuǎn)換的小鼠胚胎干細(xì)胞進(jìn)行甲基化組學(xué)研究 3、結(jié)論 全面準(zhǔn)確的檢測了兩種小鼠胚胎干細(xì)胞的DNA甲基化修飾并進(jìn)行了系統(tǒng)的比較;同serum ESCs相比,雄性2iESCs全局低甲基化;在血清中,雌性ESCs跟雄性2i ESCs類似呈現(xiàn)全局低甲基化,而在2i ESCs狀態(tài)下,甲基化水平會(huì)進(jìn)一步降低。 以上就是關(guān)于全基因組甲基化測序?qū)嶒?yàn)流程和分析思路的介紹,易基因科技提供全面的DNA甲基化研究整體解決方案,技術(shù)詳情了解請致電易基因0755-28317900。 參考文獻(xiàn): [1] Ashburner, M. and C. A. Ball, et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet, 2000, 25 (1): 25-9. [2] Dirk Schübeler. Function and information content of DNA methylation. Nature, 2015, 517: 321–326. [3] Frank Jühling et al. metilene: Fast and sensitive calling of differentially methylated regions from bisulfite sequencing data. Genome Research, 2016, 26: 256-262. [4] Kanehisa M, Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic acids research, 2000,28(1): 27-30. [5] Tadafumi Kato Kazuya Iwamoto. Comprehensive DNA methylation and hydroxymethylation analysis in the human brain and its implication in mental disorders. Neuropharmacology, 2014, 80: 133-139. [6] Xiaojing Yang et al. Gene Body Methylation Can Alter Gene Expression and Is a Therapeutic Target in Cancer. Cancer Cell 26, 577–590. [7] Yuanxin Xi et al. BSMAP: whole genome bisulfite sequence MAPping program. BMC Bioinformatics, 2009, 10:232. [8] Gao F, et al. De novo DNA methylation during monkey pre-implantation embryogenesis. Cell Res. 2017 Apr;27(4):526-539. pii: cr201725. |
|