探索微生物世界的奧秘,離不開對(duì)其基因組信息的了解。然而,目前自然界中可培養(yǎng)的微生物僅占1%,絕大多數(shù)微生物無法通過傳統(tǒng)培養(yǎng)方法進(jìn)行研究。宏基因組Binning技術(shù)正是突破這一瓶頸的關(guān)鍵手段,它為我們研究不可培養(yǎng)微生物提供了全新的視角和強(qiáng)大的工具。 宏基因組Binning最核心的問題的就是組裝效果怎么樣?可以獲得多少中高質(zhì)量的宏基因組組裝基因組(MAG)? 獲得中高質(zhì)量MAG的數(shù)量,不僅取決于測序數(shù)據(jù)量,更與組裝軟件的選擇息息相關(guān)。選擇合適的軟件是提升MAG質(zhì)量的關(guān)鍵一步,今天給大家介紹兩款Nature子刊推薦的宏基因組組裝軟件——VAMB、SemiBin,從組裝質(zhì)量、數(shù)量、運(yùn)行時(shí)間等維度評(píng)估軟件的性能。 本研究開發(fā)了用于宏基因組分類學(xué)的變分自編碼器(VAMB),它使用深度變分自編碼器對(duì)序列共豐度和 k-mer 分布信息進(jìn)行編碼,然后再進(jìn)行聚類。VAMB 在模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)上分別重建了29-98%和45%的近完整(NC)基因組,其性能優(yōu)于現(xiàn)有的分類器。此外,VAMB 能夠分離平均核苷酸一致性(ANI)高達(dá) 99.5% 的密切相關(guān)的菌株。VAMB 可在標(biāo)準(zhǔn)硬件上運(yùn)行,可在以下網(wǎng)址免費(fèi)獲?。?a target="_blank" style="border-bottom: 1px solid rgb(129, 133, 143); cursor: pointer;">https://github.com/RasmussenLab/vamb. 通過性能分析,發(fā)現(xiàn)VAMB組裝出中高質(zhì)量MAG的數(shù)量最多,數(shù)據(jù)集越復(fù)雜,組裝效果越好,并且可以高效區(qū)分相似度很高的菌株,是宏基因組binning組裝的首選組裝流程。 2022年,Nature Communications期刊上介紹了一種名為SemiBin的半監(jiān)督分箱軟件。它使用深度神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)半監(jiān)督方法,既利用參考基因組中的信息,同時(shí)也保留了重建參考數(shù)據(jù)集之外的高質(zhì)量樣本的能力。利用GMGCv1(全球微生物基因目錄)中幾個(gè)不同棲息地的模擬和真實(shí)微生物組數(shù)據(jù)集,包括人類腸道、非人類腸道和環(huán)境棲息地(海洋和土壤)。研究表明SemiBin的結(jié)果優(yōu)于現(xiàn)有的最先進(jìn)的分箱方法,獲得的bins的多樣性更大。2023年,產(chǎn)品更新升級(jí)到SemiBin2,可在以下網(wǎng)址免費(fèi)獲取:https://github.com/BigDataBiology/SemiBin/ 通過性能評(píng)估,發(fā)現(xiàn)SemiBin2在二代、三代數(shù)據(jù)中,均可獲得更多污染度小于 5% 的bins多樣性。 凌恩生物緊跟子刊步伐,宏基因組Binning流程已更新以上兩款組裝軟件,協(xié)助客戶發(fā)表多篇一區(qū)高分文章~ 參考文獻(xiàn) [1] Improved metagenome binning and assembly using deep variational autoencoders.Nature Biotechnology,2021. [2] A deep siamese neural network improves metagenome-assembled genomes in microbiome datasets across different environments.Nature Communications,2022. [3] SemiBin2: self-supervised contrastive learning leads to better MAGs for short- and long-read sequencing.Bioinformatics,2023. |
|