2022年,《Nature communications》期刊發(fā)表的“Short- and long-read metagenomics expand individualized structural variations in gut microbiomes”研究論文中,通過建立了ONT三代測序和Illumina二代測序數據混合組裝的新方法,表征了來自健康人類的數百個腸道微生物組中結構變異(SV)的精細遺傳變異。研究表明長讀長顯著提高了宏基因組組裝的質量,同時能夠可靠地檢測大量擴展的結構變異類型(特別是包括大插入和倒位)。 期刊:Nature communications 影響因子:17.694 發(fā)表時間:2022 DOI:10.1038/s41467-022-30857-9 深入了解腸道微生物群的遺傳變異是了解其功能和對宿主健康和疾病影響的重要要求。大多數關于微生物組的組成和功能的見解都是基于鳥槍法宏基因組測序數據獲得的,該數據支持不同種群的單核苷酸多態(tài)性(SNPs)和結構變異(SVs)的分析。ONT相對較長的讀長已經被廣泛用于組裝復雜的真核基因組和解決包括串聯(lián)重復和大結構變異在內的困難區(qū)域。該研究建立了ONT三代測序和Illumina二代測序數據混合組裝的新方法,檢測出了更多包括插入突變、缺失突變和基因倒位在內的微生物結構變異(SVs)。同時,對100個健康人群橫斷面隊列和由10個人群縱向跟蹤隊列進行宏基因組學和代謝組學的聯(lián)合分析,具體實驗設計如下圖。1、混合測序提高了人類腸道宏基因組組裝的質量 與單獨使用illumina宏基因組組裝結果相比,二代+三代的混合組裝方式獲得了更少的contigs數,且組裝總序列數量多了5.1%,平均N50值提高了2倍多。對contigs進行分箱后得到宏基因組組裝基因組(MAGs),通過混合組裝方式得到了9,612個MAGs(每個樣本20~83個),平均N50為117kb,去除冗余后得到692個MAGs(圖2b,2c),其中有623個在UHGG數據庫中可查詢到,且有208個質量較高的MAGs,其余的67個MAGs都是新的MAGs。在全面性方面,159個非冗余的MAGs均包含了23S、16S和5S rRNA三種序列,448個MAGs(64.74%)至少含有其中一種類型的rRNA序列。相比之下,基于Illumina的組裝方式得到的MAGs數量少了11%(616個),平均N50值也約為混合組裝的一半,且只有9個MAGs(1.46%)含有三種類型的rRNA序列,只有258個MAGs(41.88%)含有至少一種rRNA序列。圖2 二代+三代組裝方式增強了結構變異(SVs)的檢測和驗證 2、擴大腸道微生物群結構變異檢測范圍 基于ONT的長序列能發(fā)現(xiàn)更多SVs的特點,在本研究中通過MAGs的比對,發(fā)現(xiàn)多種類型的SVs。對于189個菌使用dRep比對,鑒定出了317,558個插入突變,34,129個缺失突變和1,373個基因倒位(圖2d)。其中,大于500 bp的SVs在每種SV類型中占很大比例(圖2e-g)。在插入和缺失的分布中觀察到兩個峰,因此假設SVs的兩個峰是原核基因組中不同生物過程的結果,特別是在轉座子/原噬菌體和其他移動元件的活性方面。鑒于此,隨機選取插入突變和缺失突變兩個峰中(140~160bp和1050~1150bp,圖2e)SVs片段進行分析,結果表明兩個峰內的SV之間存在顯著差異,且移動元件在短SVs片段中更多,從而推斷短序列的SVs可能與噬菌體整合和其他移動元件相關;但并不是所有SVs都有可檢測的移動元件,這只提供了部分和合理的解釋。接下來,通過重新匹配參考MAG或者MAG中含有SV的序列,以進一步驗證檢測出的SVs的可靠性。人工檢查最終證實,發(fā)現(xiàn)97%以上隨機挑選SVs集與ONT多處位置的Reads數目一致,從而驗證了單分子測序得到特異SVs的可靠性(圖3a),同時也發(fā)現(xiàn)同一個體相同細菌基因SVs的低異質性。在本研究的SV數據集中,一個明顯的趨勢是,細菌基因組中SVs的頻率在不同的分類群之間是不均勻的。對種水平(MAGs)的SVs分析發(fā)現(xiàn),SVs總數與所有樣本中的MAGs數以及樣本基因組大小成正比。圖3人類腸道微生物群中結構變異(SVs)的驗證和表征 3、SV作為腸道微生物組的高度個性化特征具有功能信息性 對兩個人群的189個MAGs分析發(fā)現(xiàn),不同個體間每Mb基因組中有16.7的SVs,而同一個體不同時間點每Mb基因組中SVs的中位值為0(圖3d)。因此,SVs可以很好地區(qū)分不同個體之間的細菌種類和集體腸道微生物群。在種群規(guī)模上對SV相關基因功能進行了功能富集分析,發(fā)現(xiàn)共有267個通路與插入突變和缺失突變(圖4a)相關,但未發(fā)現(xiàn)與基因倒位相關的通路,可能是由于它們的數量少于插入/缺失。在受影響最大的30條途徑中(根據富集程度排名)中有19條與代謝相關的途徑,包括例如“聚糖降解”、“鞘脂代謝”和多種碳水化合物代謝的途徑。圖4人類腸道微生物群中結構變異(SVs)的功能相關性 4、SVs使細菌與代謝物和宿主表型的聯(lián)系復雜化 基于健康人群的橫斷面隊列中不同樣本的代謝組分析表明,SVs使細菌種類和代謝物之間的相關性復雜化,導致同一細菌種類內的菌株水平功能差異與代謝物顯著相關。SVs與代謝的關聯(lián)分析發(fā)現(xiàn),70個SVs影響了細菌與74個糞便代謝物顯著性關聯(lián),31個SVs影響了細菌與66個尿液代謝物的關聯(lián),2個SVs影響了細菌與2個血清代謝物顯著關聯(lián)。12個SV-affected基因的存在,使得Fusicatenibacter saccharivorans與糞便樣本中新海藻糖代謝物的關聯(lián)不顯著(圖4d);同樣,33個SV-affected基因的存在使得Agathobacter rectalis與F1P間不再存在顯著相關性(圖4e)。在代謝物和受SV影響的基因中,發(fā)現(xiàn)了四種受SV影響的代謝物,共有11個受SV影響的基因被歸類到四個KEGG通路,其中SV影響的基因和代謝物都參與,這些發(fā)現(xiàn)顯著表明SV通過影響相關基因的功能來塑造細菌-代謝物相關性。為進一步研究SVs突變對表型的影響,選取橫截面隊列樣本中受SVs影響的兩個代謝物F1P和neotrehalose與空腹血糖做關聯(lián)分析,發(fā)現(xiàn)F1P和新海藻糖均與空腹血糖顯著負相關,且F.saccharivorans與空腹血糖也顯著負相關,但在SVs亞組中,關聯(lián)變得不顯著(圖4h);SVs的存在也使得A.rectalis與glucose的關聯(lián)減弱(圖4i)。因此,研究結果表明,通過控制SV的影響,使細菌豐度和代謝物濃度之間的相關性復雜化,結合SV可以提高細菌和宿主健康表型相關分析的檢測能力。5、在群落水平上,噬菌體和CRISPR結構高度相關 使用基于機器學習的軟件ProphageHunter對所有MAGs進行分析,得到基因組大小在1,236bp和91,792bp之間的以長尾噬菌體Siphoviridae和肌尾噬菌體Myoviridae為主的2247個噬菌體(圖5a)。對噬菌體元件和細菌基因組進行關聯(lián)分析,得到1,077個噬菌體-宿主對(圖5b),其中只有72個在MVP數據庫中。相比之下,二代測序數據只檢測到1815個噬菌體,其中80.77%在混合組裝中檢測到。從結果可以看出,ONT-二代混合組裝數據更有利于噬菌體的發(fā)現(xiàn)。除噬菌體外,菌群基因中還有用于抵抗病毒重復感染的CRISPR-Cas系統(tǒng),以防御噬菌體的再感染。對所有MAGs的分析發(fā)現(xiàn)了150,058個CRISPR spacers,平均每個樣本中1665±560個spacers,大部分的spacers是新發(fā)現(xiàn)的,只有17,600個(11.73%)在CRISPROpenDB數據庫出現(xiàn),22,962(15.30%)在西方人群的腸道菌群中出現(xiàn)。相比之下,基于二代測序的組裝方式,只發(fā)現(xiàn)了9,542個spacers。因此,新的宏基因組組裝方式具有更強的發(fā)現(xiàn)基因元件(如CRISPR spacers)的能力。對原噬菌體/CRISPR spacers的β多樣性分析發(fā)現(xiàn),橫截面隊列中個體的差異性顯著大于跟蹤隊列個體內的差異性。群體水平對原噬菌體和CRISPR spacers的組成分析表明兩者間有較強的共變,揭示原噬菌體和病毒群落組成間相關性的普氏分析結果表明,橫截面隊列中不同個體間原噬菌體和病毒組成顯著相關(圖5c)。對宏基因組數據中活性病毒序列的分析發(fā)現(xiàn),2,247個鑒定出的原噬菌體中有47個有潛在活性的,從而表明細菌基因中存在大量無活性的原噬菌體,從而保持SVs的穩(wěn)定性。圖5 ONT改進的宏基因組在人類腸道微生物組中包含高度多樣化的噬菌體和CRISPR間隔區(qū) 綜上所述,本研究建立了基于三代測序和二代測序的混合組裝方式,不僅提高了數據質量,擴大了遺傳變異的檢測范圍,也有利于原噬菌體以及CRISPR spacers等基因元件的發(fā)現(xiàn)。SVs調節(jié)影響宿主代謝組和健康的細菌功能,要求對細菌對人類健康和疾病的貢獻進行更精細的研究,而不僅僅是關注細菌豐度。將長讀長(ONT)進一步納入腸道微生物組研究將有助于深入剖析特定時間的腸道微生物組功能,并加深研究人員對人類各種腸道疾病軸的理解。參考文獻 Short- and long-read metagenomics expand individualized structural variations in gut microbiomes. Nature communications, 2022.
|