從兩克重的大黃蜂到重達(dá)數(shù)噸的鯨魚,地球上存在著包括人類在內(nèi)的豐富的物種,在過去的漫長時間里,它們幾乎適應(yīng)了地球上的所有環(huán)境。其中,哺乳動物是最多樣化的一類動物,無論是在大小上,還是在形狀上,均表現(xiàn)出豐富的多樣性。
自生命科學(xué)研究出現(xiàn)以來,了解哺乳動物的變異是何時、如何以及在何種選擇壓力下發(fā)展起來的一直是人們感興趣的問題。此外,通過研究人的進(jìn)化史,還可以進(jìn)一步了解人類的健康狀況,例如,那些在許多物種中保守的基因可能是對正常功能至關(guān)重要的基因,因此當(dāng)其發(fā)生改變時可能導(dǎo)致疾病。
2023 年 4 月 28 日,諸多科學(xué)家們與世界上最大的哺乳動物基因組學(xué)比較資源Zoonomia Project 的國際合作,同日在 Science 雜志上發(fā)表了 11 篇研究論文。他們對 240 種哺乳動物物種(占哺乳動物家族的 80% 以上)的基因組多樣性進(jìn)行了編目。
其中,部分研究發(fā)現(xiàn)指出人類基因組中經(jīng)過數(shù)百萬年進(jìn)化后保持不變的部分,提供了可能揭示人類健康和疾病的信息。
Zoonomia Project 是由麻省理工學(xué)院、哈佛大學(xué)等單位的科學(xué)家牽頭的一個大型國際研究項目,研究人員通過對一系列哺乳動物基因組進(jìn)行測序,然后將數(shù)百個物種的基因組進(jìn)行整合分析,為理解哺乳動物、哺乳動物進(jìn)化和人類自身打開一扇新的大門。
研究人員對一系列哺乳動物基因組進(jìn)行測序,然后將它們進(jìn)行對比,這是一項巨大的計算任務(wù)。利用這種比對,研究人員確定了基因組的關(guān)鍵區(qū)域,在哺乳動物物種和數(shù)百萬年的進(jìn)化中最為保守或不變。
作者假設(shè),雖然這些區(qū)域不產(chǎn)生蛋白質(zhì),但可能包含指導(dǎo)蛋白質(zhì)產(chǎn)生時間和數(shù)量的指令,這些區(qū)域的突變可能在疾病的起源或哺乳動物物種的獨特特征中發(fā)揮重要作用。通過他們的分析,研究人員也驗證了這一假設(shè),并能夠確定至少 10% 的人類基因組是有功能的,大約是蛋白質(zhì)編碼(1%)的十倍。研究結(jié)果進(jìn)一步揭示了遺傳變異可能在罕見和常見的人類疾?。òò┌Y)中起到因果作用。
如果某些東西對物種正常的功能很重要,那么它往往會在進(jìn)化過程中被保存下來,即進(jìn)化約束概念。因此,進(jìn)化約束是衡量基因組中特定區(qū)域在生命進(jìn)化樹上的變化程度。
在今日 Science 特刊的一篇研究 Leveraging base-pair mammalian constraint to understand genetic variation and human disease 中,Sullivan 等人觀察到的在許多物種和進(jìn)化過程中保持不變的 DNA 序列,以及在一個或幾個譜系中突然開始積累突變的序列,都強有力地表明了功能相關(guān)性和進(jìn)化力量在起作用。
研究人員還通過研究髓母細(xì)胞瘤患者,發(fā)現(xiàn)了人類基因組進(jìn)化保守位置的突變,他們認(rèn)為這些突變可能導(dǎo)致腦腫瘤生長更快或抵抗治療。結(jié)果表明,在疾病研究中使用這些數(shù)據(jù)和方法可以更容易地發(fā)現(xiàn)增加疾病風(fēng)險的遺傳變化。
在研究 Evolutionary constraint and innovation across hundreds of placental mammals 中,研究人員確定了與哺乳動物世界中一些特殊特征相關(guān)的基因組部分,例如非凡的大腦大小、卓越的嗅覺以及在冬季冬眠的能力。作者使用基因組來證實,對有效種群規(guī)模和多樣性的估計可以幫助預(yù)測難以監(jiān)測和采樣的物種的風(fēng)險。
在另一項研究 A genomic timescale for placental mammal evolution 中表明,甚至在大約 65 萬年前,即地球被小行星撞擊、恐龍滅絕之前,哺乳動物就已經(jīng)開始變異和分化。
另一項題為 Three-dimensional genome rewiring in loci with human accelerated regions 的研究中,使用 Zoonomia 數(shù)據(jù)和實驗分析檢查了 10000 多個特定于人類的基因缺失,并將其中一些與神經(jīng)元的功能聯(lián)系起來。
一篇題為 Comparative genomics of Balto, a famous historic dog, captures lost diversity of 1920s sled dogs 的研究中,提供了為什么 1920 年代一只名叫巴爾托的著名雪橇犬能夠在阿拉斯加的惡劣環(huán)境中幸存下來的遺傳解釋。
一篇題為 The functional and evolutionary impacts of human-specific deletions in conserved elements 的研究中,Xue 等人則分享了對基因組結(jié)構(gòu)的研究。在確定了僅跨越少數(shù)堿基的缺失后,他們分析了這些缺失在多種人類細(xì)胞類型中調(diào)節(jié)基因表達(dá)的能力,并探索了這些缺失是否可能導(dǎo)致獨特的人類表型。
結(jié)果發(fā)現(xiàn),復(fù)雜的認(rèn)知功能再次成為人類進(jìn)化過程中序列變化的主要受益者之一,這些小缺失附近的基因系統(tǒng)地富集了那些在大腦和神經(jīng)元功能中發(fā)揮作用的基因。通過實驗證實了它們在多種細(xì)胞類型中的功能后,作者還觀察到,許多缺失導(dǎo)致人類細(xì)胞中基因表達(dá)的增加,這是獲取新功能的驅(qū)動因素。
在一篇題為 Relating enhancer genetic variation across mammals to complex phenotypes using machine learning 的研究中,研究人員使用機器學(xué)習(xí)來識別與大腦大小相關(guān)的基因組區(qū)域。
在題為 Mammalian evolution of human cis-regulatory elements and transcription factor binding sites 的研究中,描述了人類基因組中調(diào)控序列的進(jìn)化。
在題為 Insights into mammalian TE diversity through the curation of 248 genome assemblies 的研究中,檢測了 248 個胎盤哺乳動物基因組裝配體的轉(zhuǎn)座元件 (transposable element, TE) 含量,這是迄今真核生物中最大的 de novo TE 管理工作。
研究發(fā)現(xiàn),盡管哺乳動物在總 TE 含量和多樣性方面相似,但它們在近期 TE 積累方面表現(xiàn)出實質(zhì)性的差異。哺乳動物在任何給定的時間往往只積累少數(shù)幾種 TE,其中一種 TE 占主導(dǎo)地位。此外,還發(fā)現(xiàn)了飲食習(xí)慣與 DNA 轉(zhuǎn)座子入侵之間的關(guān)聯(lián)。
在題為 The contribution of historical processes to contemporary extinction risk in placental mammals 的研究中,調(diào)查了 240 種哺乳動物的單基因組的遺傳變異,發(fā)現(xiàn)由于遺傳負(fù)荷的長期積累和固定,歷史上種群較小的物種攜帶了比例較大的有害等位基因,有較高的滅絕風(fēng)險。
在題為 Integrating gene annotation with orthology inference at scale 的研究中,提出了 TOGA(Tool to infer Orthologs from Genome Alignments),這是一種集成了結(jié)構(gòu)基因注釋和同源序列推斷的方法。研究人員將其應(yīng)用于 488 個胎盤哺乳動物和 501 個鳥類,從而創(chuàng)建了迄今最大的比較基因資源。
在本期 Science 特刊的一系列論文中,比較了 240 種哺乳動物的基因組,其中還包含了許多受威脅或瀕危物種。這些 DNA 樣本由全球 50 多個不同的機構(gòu)收集和提供,這些發(fā)現(xiàn)有助于說明比較基因組學(xué)如何不僅可以闡明某些物種如何取得非凡的壯舉,還可以幫助科學(xué)家更好地了解我們基因組中功能正常的部分以及它們?nèi)绾斡绊懡】岛图膊?/span>。
1. Bogdan M. Kirilenko et al. Integrating gene annotation with orthology inference at scale. Science (2023).
2. Aryn P. Wilder et al. The contribution of historical processes to contemporary extinction risk in placental mammals. Science (2023).
3. Nicole M. Foley et al. A genomic timescale for placental mammal evolution. Science (2023).
4. Austin B. Osmanski et al. Insights into mammalian TE diversity through the curation of 248 genome assemblies. Science (2023).
5. James R. Xue et al. The functional and evolutionary impacts of human-specific deletions in conserved elements. Science (2023).
6. Matthew J. Christmas and Irene M. Kaplow et al. Evolutionary constraint and innovation across hundreds of placental mammals. Science (2023).
7. Katherine L. Moon et al. Comparative genomics of Balto, a famous historic dog, captures lost diversity of 1920s sled dogs. Science (2023).
8. Gregory Andrews et al. Mammalian evolution of human cis-regulatory elements and transcription factor binding sites. Science (2023).
9. Kathleen C. Keough et al. Three-dimensional genome rewiring in loci with human accelerated regions. Science (2023).
10. Irene M. Kaplow et al. Relating enhancer genetic variation across mammals to complex phenotypes using machine learning. Science (2023).
11. Patrick F. Sullivan et al. Leveraging base-pair mammalian constraint to understand genetic variation and human disease. Science (2023)
|