真核生物基因的表達(dá)受到基因組中順式作用元件的復(fù)雜調(diào)控。哺乳動(dòng)物基因組中存在大量的順式作用元件,例如:?jiǎn)?dòng)子、增強(qiáng)子、沉默子、絕緣子等等,其數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)蛋白編碼基因。目前人類基因組中已知的順式調(diào)控元件就有一百多萬(wàn)個(gè),而蛋白編碼基因只有大約兩萬(wàn)個(gè)。遺傳學(xué)研究也表明基因調(diào)控不僅僅是單個(gè)基因之間一對(duì)一的簡(jiǎn)單調(diào)控事件,而是以調(diào)控網(wǎng)絡(luò)的形式發(fā)揮作用,不同的調(diào)控元件以及靶基因之間存在著復(fù)雜的相互作用。例如,一個(gè)基因的啟動(dòng)子可以整合來(lái)自多個(gè)增強(qiáng)子或者沉默子的調(diào)控作用,一個(gè)增強(qiáng)子元件也能夠同時(shí)影響多個(gè)基因的表達(dá)1-3。隨著三維基因組技術(shù)的發(fā)展,人們對(duì)基因表達(dá)調(diào)控相關(guān)的染色質(zhì)構(gòu)象已經(jīng)有了一定的理解,但由于技術(shù)的限制,大部分研究都是集中在成對(duì)的相互作用(pair-wiseinteraction)上,而對(duì)于多個(gè)順式調(diào)控元件同時(shí)與一個(gè)基因啟動(dòng)子之間的高階相互作用(high-orderinteraction)的研究仍然比較有限。此外,多個(gè)基因組元件是如何通過(guò)三維基因組構(gòu)象的變化同時(shí)參與基因表達(dá)調(diào)控的機(jī)制目前也尚不清楚。 近年來(lái),為了探究更精準(zhǔn)和全面的染色質(zhì)互作情況,檢測(cè)高階染色質(zhì)互作的技術(shù)也相繼出現(xiàn)。然而,這些技術(shù)往往局限于基因組的特定位點(diǎn),或是需要特殊的儀器設(shè)備。得益于三代測(cè)序平臺(tái)(單分子測(cè)序平臺(tái))的日漸成熟,最近開(kāi)發(fā)的基于牛津納米孔技術(shù)(Oxford Nanopore Technology, ONT)的Pore-C方法4在檢測(cè)染色質(zhì)高階相互作用方面表現(xiàn)出優(yōu)異的性能,可以通過(guò)應(yīng)用新的統(tǒng)計(jì)方法有效地分析全基因組中多個(gè)染色質(zhì)位點(diǎn)之間高階相互作用的協(xié)同性。 盡管上述這些基于大量細(xì)胞的研究方法能夠有效地檢測(cè)染色質(zhì)的高階相互作用,但它們無(wú)法解決細(xì)胞間的異質(zhì)性問(wèn)題,阻礙了它們?cè)趶?fù)雜組織器官樣品中的應(yīng)用。而現(xiàn)有的單細(xì)胞Hi-C(single-cell Hi-C,scHiC)技術(shù)受限于二代測(cè)序較短的讀長(zhǎng)(通常是雙端總共300bp)也難以對(duì)染色質(zhì)高階相互作用進(jìn)行檢測(cè)。目前除了單細(xì)胞超分辨率成像以外,2022年開(kāi)發(fā)的scSPRITE5是唯一一種可以在單細(xì)胞水平檢測(cè)染色質(zhì)高階相互作用的測(cè)序方法。但是該方法更適用于遠(yuǎn)距離的間接染色質(zhì)高階相互作用,而對(duì)于與基因調(diào)控更相關(guān)的直接染色質(zhì)高階相互作用的檢測(cè)能力很有限。此外,scHi-C的另一個(gè)挑戰(zhàn)是很難平衡捕獲細(xì)胞群體異質(zhì)性所需的高通量(每次實(shí)驗(yàn)?zāi)軌驒z測(cè)大量單細(xì)胞)與探索高分辨率3D基因組結(jié)構(gòu)所需的高深度(每個(gè)單細(xì)胞中捕獲大量染色質(zhì)相互作用)之間的矛盾。因此,需要一種可擴(kuò)展的scHi-C方法來(lái)剖析高階染色質(zhì)三維結(jié)構(gòu),并在單細(xì)胞水平上研究這些染色質(zhì)高階相互作用在不同生物過(guò)程中的協(xié)同調(diào)控機(jī)制。 為了應(yīng)對(duì)這些挑戰(zhàn),北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬課題組在Nature Methods上發(fā)表題為“scNanoHi-C: a single-cell long-read concatemer sequencing method toreveal high-order chromatin structures within individual cells”的文章。該研究在國(guó)際上率先使用單分子測(cè)序平臺(tái)開(kāi)發(fā)了一種基于鄰近連接的單細(xì)胞染色質(zhì)構(gòu)象捕獲方法,稱為scNanoHi-C。該方法實(shí)現(xiàn)了在單細(xì)胞水平的高階染色質(zhì)相互作用檢測(cè),并且在通量上具有很好的靈活性,能夠滿足不同的實(shí)驗(yàn)需求。 在實(shí)驗(yàn)上,scNanoHi-C依次使用1%甲醛(FA)和1.5mM戊二酸二琥珀酰亞胺酯(DSG)孵育進(jìn)行交聯(lián),以降低連接反應(yīng)的隨機(jī)噪音并兼顧對(duì)短程和長(zhǎng)程染色質(zhì)相互作用的高靈敏度檢測(cè)。為了盡可能完整地保留單細(xì)胞中固定連接后的染色質(zhì)三維結(jié)構(gòu)信息,該研究設(shè)計(jì)了一種靈活的單細(xì)胞基因組長(zhǎng)片段擴(kuò)增方法。該方法使用兩端具有相同接頭的低濃度Tn5轉(zhuǎn)座酶以提高DNA片段擴(kuò)增長(zhǎng)度和基因組覆蓋度,并通過(guò)設(shè)計(jì)24種帶有不同條碼標(biāo)簽的Tn5酶結(jié)合后續(xù)PCR擴(kuò)增中引入的條碼標(biāo)簽共同控制測(cè)序的通量。通過(guò)這種方式,scNanoHi-C 能夠在一次PromethION測(cè)序中對(duì)少至幾個(gè)單細(xì)胞進(jìn)行低通量、高覆蓋度測(cè)序或者對(duì)數(shù)千個(gè)單細(xì)胞(最高可達(dá)24×96=2304個(gè)細(xì)胞)進(jìn)行高通量、低覆蓋度測(cè)序,可以根據(jù)實(shí)驗(yàn)需求靈活進(jìn)行選擇(圖1)。 為了評(píng)估scNanoHi-C技術(shù)的可靠性,該研究首先將scNanoHi-C應(yīng)用于正常二倍體的GM12878細(xì)胞系,并分別使用低深度(~0.2Gb/cell)、中等深度(~1Gb/cell)、高深度(~4Gb/cell)三種策略進(jìn)行測(cè)序,并與基于二代測(cè)序平臺(tái)的大量細(xì)胞原位Hi-C標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行比較,結(jié)果顯示出很高的一致性。同時(shí)每個(gè)策略檢測(cè)到的串聯(lián)體(含有有效染色質(zhì)相互作用的測(cè)序讀段)中大約一半為高階串聯(lián)體(包含三個(gè)以上不同調(diào)控元件間的相互作用)。在這些高階串聯(lián)體中,大約58%是三聯(lián)體,26%是四聯(lián)體,其余為五聯(lián)體以上的多聯(lián)體(基數(shù)從5到11不等)。 接著該研究在多個(gè)方面對(duì)scNanoHi-C的應(yīng)用進(jìn)行了探索: scNanoHi-C可以在單細(xì)胞水平上精準(zhǔn)捕獲染色質(zhì)三維結(jié)構(gòu)的異質(zhì)性。 scNanoHi-C能夠在單細(xì)胞水平檢測(cè)各層級(jí)染色質(zhì)結(jié)構(gòu)特征,包括染色體領(lǐng)域(整條染色體,50Mb-200Mb尺度的結(jié)構(gòu)特征)、A/B區(qū)室(常染色質(zhì)區(qū)域與異染色質(zhì)區(qū)域,5Mb-20Mb尺度的結(jié)構(gòu)特征),以及拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域樣結(jié)構(gòu)(TAD-like,0.5Mb-5Mb尺度的結(jié)構(gòu)特征)。同時(shí),scNanoHi-C的單個(gè)染色質(zhì)片段長(zhǎng)度(單體長(zhǎng)度,平均610bp)相較于傳統(tǒng)基于二代測(cè)序平臺(tái)的scHi-C(測(cè)序不超過(guò)150bp)顯著提高,這大大增加了其在染色質(zhì)相互作用對(duì)中捕獲到單核苷酸多態(tài)性(SNP)位點(diǎn)的機(jī)會(huì),能夠在二倍體細(xì)胞中直接判定單倍型的單體比例由原來(lái)二代測(cè)序平臺(tái)的大約9%提高到了25%。因此,scNanoHi-C也可用于有效地重建單個(gè)二倍體細(xì)胞的基因組三維構(gòu)象。同時(shí),利用單細(xì)胞A/B 區(qū)室化值(single-cell A/B compartment value, scA/B value),scNanoHi-C對(duì)GM12878、HG002 和K562三種人類細(xì)胞系進(jìn)行了聚類分析,能夠在單細(xì)胞精度準(zhǔn)確將三種細(xì)胞分開(kāi),并識(shí)別了細(xì)胞類型間的染色質(zhì)差異區(qū)室化區(qū)域。此外,scNanoHi-C也能夠準(zhǔn)確地檢測(cè)每個(gè)單細(xì)胞的基因組拷貝數(shù)變異(CNV)特征。分析結(jié)果表明,scNanoHi-C準(zhǔn)確地捕獲了GM12878細(xì)胞培養(yǎng)過(guò)程中產(chǎn)生的非整倍體亞克隆以及K562細(xì)胞的拷貝數(shù)變異。同時(shí),scNanoHi-C也可應(yīng)用于結(jié)構(gòu)變異的檢測(cè),如準(zhǔn)確檢測(cè)出了K562細(xì)胞中BCR-ABL1和NUP214-XKR3的基因融合事件(染色體易位事件)。 scNanoHi-C能夠在單個(gè)細(xì)胞中準(zhǔn)確鑒定高階染色質(zhì)相互作用。 該研究在GM12878 細(xì)胞數(shù)據(jù)集中,使用scNanoHi-C得到的單細(xì)胞高階串聯(lián)體信息結(jié)合ABC模型(Activity-by-contacts model)6預(yù)測(cè)的增強(qiáng)子-啟動(dòng)子(E-P) 相互作用關(guān)系共同鑒定了增強(qiáng)子-啟動(dòng)子高階相互作用。通過(guò)這種方式,該研究首次在單個(gè)細(xì)胞中以20kb的分辨率直接觀察到1097個(gè)基因的單個(gè)啟動(dòng)子能夠與多個(gè)增強(qiáng)子同時(shí)發(fā)生相互作用,表明這些基因可能同時(shí)受到多個(gè)增強(qiáng)子的調(diào)控。這些受到高階調(diào)控的基因主要富集在與GM12878這種B淋巴細(xì)胞的功能相關(guān)的免疫信號(hào)通路上,并且通常表現(xiàn)出更高的表達(dá)水平。特別地,這些基因中還包括一些B細(xì)胞譜系特異性轉(zhuǎn)錄因子如EBF1以及EBV超級(jí)增強(qiáng)子相關(guān)基因如MIR155HG、IKZF3和ETS1等。這些結(jié)果表明,多個(gè)增強(qiáng)子的協(xié)同調(diào)控可能是確保關(guān)鍵基因高水平穩(wěn)健表達(dá)的一種潛在機(jī)制。通過(guò)類似的方法,該研究還在單個(gè)細(xì)胞中鑒定出了1422個(gè)能夠與多個(gè)啟動(dòng)子同時(shí)發(fā)生相互作用的增強(qiáng)子。此外,該研究發(fā)現(xiàn)部分高階基因調(diào)控作用能夠在多個(gè)單細(xì)胞中被檢測(cè)到,這可能與細(xì)胞中頻繁使用的關(guān)鍵轉(zhuǎn)錄程序有關(guān),后續(xù)可以通過(guò)發(fā)展基于富集策略的具有更高分辨率的Hi-C技術(shù)進(jìn)行進(jìn)一步的深入研究。 scNanoHi-C能夠揭示不同基因組區(qū)域之間的協(xié)同調(diào)控關(guān)系以及染色體外環(huán)形DNA與線性基因組間的復(fù)雜相互作用。 傾向于形成高階相互作用的一組基因組位點(diǎn)稱為“基因組協(xié)同調(diào)控區(qū)域”。該研究針對(duì)scNanoHi-C的數(shù)據(jù)特點(diǎn)對(duì)鑒定基因組協(xié)同調(diào)控區(qū)域的算法進(jìn)行了優(yōu)化,并將該算法運(yùn)用到GM12878細(xì)胞活躍啟動(dòng)子和增強(qiáng)子的集合中,在全基因組范圍內(nèi)共鑒定出了917組增強(qiáng)子-啟動(dòng)子協(xié)同調(diào)控區(qū)域。其中,大約20%(187/917)的協(xié)同調(diào)控區(qū)域包含來(lái)自不同染色體的基因組位點(diǎn)(提示不同染色體之間的反式相互作用)。這些協(xié)同調(diào)控區(qū)域在活躍轉(zhuǎn)錄的基因組區(qū)域、淋巴細(xì)胞特異性轉(zhuǎn)錄因子和染色質(zhì)環(huán)相關(guān)因子(CTCF等)的結(jié)合位點(diǎn)區(qū)域中高度富集。此外,在917個(gè)協(xié)同調(diào)控區(qū)域中,有167個(gè)被發(fā)現(xiàn)與GM12878細(xì)胞特異性的超級(jí)增強(qiáng)子有關(guān)。接著,該研究將scNanoHi-C運(yùn)用到攜帶大量染色體外環(huán)形DNA(ecDNA)的COLO320DM人類結(jié)直腸癌細(xì)胞系中,檢測(cè)到了染色體外環(huán)形DNA與線性基因組(染色體內(nèi)的基因組)之間存在廣泛的染色質(zhì)高階相互作用,并且首次在單個(gè)細(xì)胞中觀察到四個(gè)主要的染色體外環(huán)形DNA的基因位點(diǎn)之間存在復(fù)雜的高階相互作用。這些結(jié)果表明,染色體外環(huán)形DNA可能通過(guò)建立復(fù)雜的高階染色質(zhì)三維結(jié)構(gòu)來(lái)驅(qū)動(dòng)癌基因的過(guò)量表達(dá)。 scNanoHi-C能夠高效輔助單細(xì)胞基因組從頭組裝。 在可用細(xì)胞數(shù)量有限的情況下,該研究表明使用scNanoHi-C輔助單細(xì)胞基因組(single-cell whole genome sequencing,scWGS)從頭組裝7可以大幅度提高組裝質(zhì)量。例如,使用20個(gè)單細(xì)胞的基因組長(zhǎng)讀長(zhǎng)測(cè)序數(shù)據(jù)和12個(gè)單細(xì)胞的scNanoHi-C數(shù)據(jù)組裝的人類基因組支架(scaffold)的NG50要優(yōu)于使用30個(gè)單細(xì)胞的基因組長(zhǎng)讀長(zhǎng)測(cè)序數(shù)據(jù)直接組裝的效果(2.49 Mb vs. 1.34 Mb) 總之,scNanoHi-C具有很好的可擴(kuò)展性和靈活性,在一次測(cè)序中可對(duì)少至幾個(gè)單細(xì)胞或多達(dá)數(shù)千個(gè)單細(xì)胞進(jìn)行染色質(zhì)三維結(jié)構(gòu)測(cè)序,并且實(shí)驗(yàn)流程相對(duì)簡(jiǎn)單、易于操作,僅需要基本的PCR儀等分子生物學(xué)設(shè)備,適合于各種生物學(xué)實(shí)驗(yàn)室使用。scNanoHi-C還是一種強(qiáng)大且多功能的工具,可用于在單細(xì)胞分辨率準(zhǔn)確區(qū)分細(xì)胞類型、對(duì)單個(gè)二倍體細(xì)胞進(jìn)行高效單倍型分型、檢測(cè)單個(gè)正常細(xì)胞和腫瘤細(xì)胞中的基因組拷貝數(shù)變異和各種復(fù)雜結(jié)構(gòu)變異以及高效輔助單細(xì)胞基因組從頭組裝。更重要的是,scNanoHi-C首次實(shí)現(xiàn)了在單個(gè)細(xì)胞中在全基因組水平對(duì)增強(qiáng)子-啟動(dòng)子的高階直接相互作用的檢測(cè),在單個(gè)細(xì)胞中準(zhǔn)確鑒定了高階基因調(diào)控事件,同時(shí)能夠?qū)?fù)雜的染色體外環(huán)形DNA與線性基因組間的高階相互作用進(jìn)行精準(zhǔn)檢測(cè)。總之,scNanoHi-C顯示了單細(xì)胞長(zhǎng)讀長(zhǎng)Hi-C測(cè)序技術(shù)在分析由高階染色質(zhì)三維結(jié)構(gòu)介導(dǎo)的不同細(xì)胞間基因調(diào)控異質(zhì)性方面的潛力,為將來(lái)進(jìn)一步研究發(fā)育和疾病進(jìn)展過(guò)程中高階染色質(zhì)結(jié)構(gòu)變化機(jī)制,揭開(kāi)基因組中各種復(fù)雜調(diào)控關(guān)系中的“暗物質(zhì)”奠定了堅(jiān)實(shí)的基礎(chǔ)。 北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心、前沿交叉學(xué)科研究院生命科學(xué)聯(lián)合中心博士生李文、生命科學(xué)學(xué)院博士生盧健森為該論文的共同第一作者,湯富酬為該論文通訊作者。該研究得到了國(guó)家自然科學(xué)基金基礎(chǔ)科學(xué)中心項(xiàng)目、北京未來(lái)基因診斷高精尖創(chuàng)新中心、昌平實(shí)驗(yàn)室的資助,北京大學(xué)高通量測(cè)序平臺(tái)以及北京大學(xué)“北極星”高性能計(jì)算平臺(tái)的協(xié)助與支持,北京大學(xué)邢棟課題組為本研究提供了重要的幫助。 參考文獻(xiàn): 1、Hafner, A. & Boettiger, A. The spatial organization of transcriptional control. Nat Rev Genet, doi:10.1038/s41576-022-00526-0 (2022). 2、Oudelaar, A. M. & Higgs, D. R. The relationship between genome structure and function. Nat Rev Genet22, 154-168, doi:10.1038/s41576-020-00303-x (2021). 3、Furlong, E. E. M. & Levine, M. Developmental enhancers and chromosome topology. Science361, 1341-1345, doi:10.1126/science.aau0320 (2018). 4、Deshpande, A. S. et al. Identifying synergistic high-order 3D chromatin conformations from genome-scale nanopore concatemer sequencing. Nat Biotechnol40, 1488-1499, doi:10.1038/s41587-022-01289-z (2022). 5、Arrastia, M. V. et al. Single-cell measurement of higher-order 3D genome organization with scSPRITE. Nature Biotechnology40, 64-73, doi:10.1038/s41587-021-00998-1 (2021). 6、Fulco, C. P. et al. Activity-by-contact model of enhancer-promoter regulation from thousands of CRISPR perturbations. Nat Genet51, 1664-1669, doi:10.1038/s41588-019-0538-0 (2019). 7Xie, H. et al. De novo assembly of human genome at single-cell levels. Nucleic Acids Res50, 7479-7492, doi:10.1093/nar/gkac586 (2022). |
|
來(lái)自: 子孫滿堂康復(fù)師 > 《藥學(xué)科 醫(yī)藥研究》