基因倍增(gene duplication)在基因組進化(特別是以動植物為代表的真核生物)中扮演了重要角色。在多種多樣的基因倍增方式中,全基因組倍增(whole genome duplication)是重要的一種。去年五月,我們向大家介紹了來自亞利桑那大學Michael Barker團隊報道的昆蟲進化中的基因組倍增(或說古多倍體化paleopolyploidy)現(xiàn)象【1】。興奮之余,我們也注意到文中所采用的方法存在一些不同的聲音(詳見推送:PNAS最新研究揭示多倍體在昆蟲進化中的普遍性——兼談多倍體現(xiàn)象與基因組倍增)。 今年年初,這些來自坊間的不同聲音終于登上了“大雅之堂”:來自愛爾蘭都柏林大學(University of Dublin)的中谷與一郎(Yoichiro Nakatani)和Aoife McLysaght在PNAS上對這篇文章以letter形式發(fā)表了另一種解讀:亞利桑那大學團隊所發(fā)現(xiàn)的昆蟲進化過程中的基因組倍增現(xiàn)象或許是假陽性【2】。如作者所言,傳統(tǒng)上來說動物界的多倍體是很罕見的,這引發(fā)了他們的懷疑。為了探究亞利桑那大學團隊原文結果的可靠性,中谷與一郎和導師Aoife McLysaght進行了一系列分析。 BTW:為什么多倍體化現(xiàn)象和多倍體個體在植物中比較常見呢?最簡單的理由是多倍體化會在減數(shù)分裂過程中直接破壞有性生殖生物(包括絕大多數(shù)動物)的傳宗接代,而植物可以通過無性生殖等方式渡過難關并最終獲得多倍體帶來的進化上的好處。 判斷全基因組倍增的兩個方法 為方便大家理解,我們先簡要回顧一下推斷全基因組倍增比較通行的兩個方法。傳統(tǒng)上來說,要通過基因共線性(gene synteny)。該法基于一個最基本的假設,就是全基因組倍增過后旁系同源基(paralog)因應該按照倍增前的順序在染色體上一字排開(下圖)。隨著時間的推移,有些基因會丟失,沒有丟失的基因也可能會經歷基因組重排(genome rearrangement)導致它們在染色體上出現(xiàn)的順序發(fā)生改變,但如果這些過程不是那么劇烈(比如這些事件發(fā)生的年代不是特別久遠的話),我們應該可以在現(xiàn)存生物的基因組里面找到它們的蹤跡——遺留下來的共線性區(qū)域(synteny block)。實際上,第一個基因組倍增的證據正是通過這種方法于1997年在經典模式生物面包酵母(Saccharomyces cerevisiae)中被發(fā)現(xiàn)的【3】。值得一提的是,發(fā)現(xiàn)者ken wolfe正是本文的主角Aoife McLysaght的博士導師。 圖1酵母的基因組倍增和后期的基因丟失 顯然,這種基于基因組共線性的方法是比較嚴密的,但它對于缺乏高質量的基因組組裝的生物則一籌莫展了。于是,一種新的方法應運而生。該法擺脫基因組的束縛,完全基于基因序列的比較:通過比較旁系同源基因之間的差異以獲得基因的相對年齡(用同義密碼子位點替換速率,也就是ks表示,理由是ks一般認為基本不受選擇,在同一物種內與演化時間成正比)。如果如圖2所示可以發(fā)現(xiàn)有很多基因有相仿的年齡(所謂ks峰),那么一個可能的推斷便是這些基因都來自一次全基因組倍增。此外,近年來還有通過基因樹拓撲結構比較的方法,該法同基因年齡法一樣不依賴于基因共線性,但計算上更為復雜(也應該更加嚴謹,小編不是很了解希望熱心網友可以補充)。不論如何,不依賴旁系同源基因共線性的方法由于可以充分挖掘轉錄組數(shù)據,且可以繞過基因組序列缺乏的難題,似乎越來越受到學姐的青睞。有趣的是,該方法也為亞利桑那大學Michael Barker老師多次使用,尤其是15年對裸子植物中基因組倍增的揭示【4】。 圖2 (來自【1】) 共線性的喪失? 言歸正傳之前還是不忘提醒大家小編也不是領域專家,以下敘述錯漏難免,請大家多多批評。 實際上亞利桑那大學團隊主要就是通過上述的第二類方法對于昆蟲進化中的基因組倍增做出的推測。然而,盡管這種方法近年來大行其道,但卻在這里遭遇了阻擊。小編以為,雙方爭論的焦點就在于,缺乏基因組共線性情況下的基因組倍增推斷是否足夠嚴謹。 讓我們來看看都柏林大學團隊是怎樣做的。他們針對亞利桑那大學團隊提出的鱗翅目(Lepidoptera)基因組倍增做了基因共線性分析(之所以選取鱗翅目是因為鱗翅目中有染色體水平的基因組組裝)。他們的假設是,如果包括家蠶Bombyx mori在內的鱗翅目昆蟲的確發(fā)生有全基因組倍增的話,理應在家蠶的基因組上找到大段的共線性區(qū)域。實際上,亞利桑那大學團隊在原文中對這一點利用家蠶基因組進行了分析,不過都柏林大學的研究者對此提出了反駁: 圖3不同類群昆蟲進化關系圖,請注意鱗翅目、甲蟲和蜜蜂的位置 他們認為亞利桑那大學作者所找到的共線性區(qū)段并不可靠,理由如下圖所示:一是這些倍增的共線性區(qū)段看上去是“隨機地”分布在基因組上的,二是有的區(qū)域(如chr5和chr10)對應了超過一個倍增區(qū)域——表明它們不是一次基因組倍增的結果。 圖4 都柏林大學團隊進一步指出,這些在染色體上呈共線性區(qū)段的旁系同源基因很多都并非是鱗翅目昆蟲或者家蠶特有的(圖4B),也就是說它們至少不是鱗翅目或家蠶基因組倍增的結果。而反過來,不論是鱗翅目特有還是蠶特有的旁系同源基因,在家蠶基因組中都缺乏(肉眼可見的)明顯基因組共線性區(qū)域,相反這些旁系同源基因的分布都是很分散的,并沒有聚成很好的共線性區(qū)段(圖5)。 圖5 但不要忘記,還有一種可能性,就是會不會是由于在蠶的進化歷史中出現(xiàn)了某些基因組大幅重排導致基因序列變化,致使基因共線性難覓蹤影呢?為探求這一假設,中谷與一郎和導師比較了蠶和非鱗翅目生物蜜蜂(圖6左)以及甲蟲(圖6右)基因組之間的共線性(縱軸方向為蠶,橫軸代表蜜蜂和甲蟲)。 圖6 都柏林大學的學者們發(fā)現(xiàn),蠶基因組居然與蜜蜂和甲蟲這兩種非鱗翅目昆蟲的基因組保持有不錯的共線性關系,并據此認為蠶基因組內部發(fā)生了大面積染色體重排的可能性微乎其微——因為如果真的有發(fā)生大面積重排的話,那么家蠶基因組不可能與非鱗翅目昆蟲還保留有較好的共線性關系。 對于都柏林大學團隊的這篇文章,原文作者、也就是亞利桑那大學團隊也做了針鋒相對的回應【5】。亞利桑那大學團隊首先表示,他們所報道的現(xiàn)象應該被理解為大規(guī)?;蚪M倍增(large-scale gene duplication)比較合理,而不是都柏林大學團隊所解釋的簡單的“全基因組倍增(whole genome duplication;WGD)”。請注意,這里一字之差其實還是有很大的差別的,畢竟全代表的是所有基因都要翻倍,而大規(guī)模這個詞,就有一定的靈活的空間了。不過小編這里要說,如果通讀亞利桑那大學團隊去年的文章的話不難發(fā)現(xiàn),盡管在題目里寫得很嚴謹Multiple large-scale gene and genome duplications during the evolution of hexapods,但是,全文統(tǒng)共出現(xiàn)有92次WGD,比如摘要部分已經6次使用WGD??傊?,小編個人認為,正文應該是存在誤導的。 接下來,亞利桑那大學團隊對于來自都柏林的同行們提出的“共線性的喪失”這一問題進行了解釋。他們表示,都柏林大學團隊對于共線性的檢測雖然仔細但都是基于裸眼觀察,而很顯然,裸眼檢測并非一項十分精確的操作。此外,原文中報道了昆蟲進化過程中的多次大規(guī)?;虮对?,所以每一種現(xiàn)存生物的基因組都可能是多次基因組倍增疊加的結果,這也就導致了不同的基因可能有不同的拷貝數(shù)(copy number;或說不同旁系同源基因的數(shù)目)。而這一切,都使得裸眼觀測共線性具有挑戰(zhàn)性。所以,即使真的看不到共線性,并不能排除是因為技術局限和其他諸多的可能性。此外,亞利桑那大學團隊還對都柏林大學團隊提出的其他一些技術疑問進行了闡釋,在此為節(jié)省篇幅不再贅述。 遙相呼應 與這兩篇PNAS文章的一唱一和相呼應的是來自近年來迅速躥紅的植物學期刊molecular plant的兩篇文章。該雜志去年年初刊登了來自復旦大學戚繼老師和馬紅老師的文章,通過ks比較和基因樹拓撲結構分析等方法全面而細致地梳理了被子植物中的全基因組倍增事件【6】。 圖7 今年年初,來自比利時根特大學(University of Ghent)的Yves van de peer等人在該雜志上以Correspondence的形式撰文發(fā)表了自己的一些不同見解【7】。最重要的一點在于,來自根特大學的學者們聲稱,原文作者可能高估了被子植物演化過程中發(fā)生過的全基因組倍增的次數(shù)。為闡明這一點,文中舉了一個例子:對于第一個完成基因組測序的蕨類植物Selaginella moellendorffii(卷柏),如果只看ks分布的話,那么其KDE(kernal density estimate)會呈現(xiàn)大概下圖中黑色曲線的樣子。 圖8 會發(fā)現(xiàn)一個峰。那么,會據此認為然卷柏中存在全基因組倍增嗎?答案是否定的,因為卷柏的基因組中完全不存在前面提到的旁系同源基因共線性區(qū)域。問題來了,既然如此,為什么我們會在卷柏中觀測到上圖中黑色曲線所描繪的ks的峰呢?答案正是單獨的基因倍增,或者按照作者所言,small scale duplication(SSD)。這些小規(guī)模的基因加倍不同與全基因組倍增,可以說在進化中,它是時時刻刻都在發(fā)生的,而一般來說,所以發(fā)生時期較為晚近的小規(guī)模倍增基因容易被保留下來(就好比清朝的文物和史料要比唐宋時期豐富),便形成了如上圖展示的情形,在ks很?。ㄒ簿褪请x現(xiàn)今時間很近的時候)的位置會出現(xiàn)一個峰。而當作者通過數(shù)學模型去除這些小規(guī)?;虮对鰩淼母蓴_之后,就會看到上圖綠色的曲線——并沒有明顯的ks峰(圖8)。根特大學的研究人員認為,這一點似乎并未在復旦大學團隊的原文中得到很好的處理。這一點,以及其他的根特大學團隊提到的一些問題,都在同期發(fā)表的來自復旦大學團隊的回應中有很好的解釋,感興趣的讀者歡迎直接閱讀原文【8】。 BTW:話音未落,根特大學團隊反手又是一篇手稿發(fā)到bioRxiv上,詳細闡述了他們的觀點(該文已于日前正式在雜志上發(fā)表【9】)。 最后小編想說,這幾篇文章存在不同觀點的交鋒,但大家都是有理有據地交流自己的看法。特別是對于提出反對的聲音,原文的作者都對對方的批評表達了感謝。亞利桑那大學團隊在文尾表示,Overall, we are excited to see deeper exploration of these ancient duplications with the growing number of high-quality insect genomes to complement our phylogenomic analyses.相信這些理性的討論會激發(fā)學界更多、更深的思考,這大概也是科學應有的發(fā)展方式吧。 引文 1. Li Z, Tiley GP, Galuska SR, et al. Multiple large-scale gene and genome duplications during the evolution of hexapods. Proc Natl Acad Sci U S A. 2018;115(18):4713-4718 2. Nakatani Y, McLysaght A. Macrosynteny analysis shows the absence of ancient whole-genome duplication in lepidopteran insects. Proc Natl Acad Sci U S A. 2019;116(6):1816-1818 3. Wolfe KH, Shields DC. Molecular evidence for an ancient duplication of the entire yeast genome. Nature. 1997;387: 708–713. 4. Li, Zheng et al. “Early genome duplications in conifers and other seed plants.” Science advances vol. 1,10 e1501084. 20 Nov. 2015, doi:10.1126/sciadv.1501084 5. Li Z, Tiley GP, Rundell RJ, Barker MS. Reply to Nakatani and McLysaght: Analyzing deep duplication events. Proc Natl Acad Sci U S A. 2019;116(6):1819-1820 6. Ren R, Wang H, Guo C, et al. Widespread Whole Genome Duplications Contribute to Genome Complexity and Species Diversity in Angiosperms. Mol Plant. 2018;11(3):414-428 7. Zwaenepoel A, Li Z, Lohaus R, Van de Peer Y. Finding Evidence for Whole Genome Duplications: A Reappraisal. Mol Plant. 2019;12(2):133-136 8. Wang H, Guo C, Ma H, Qi J. Reply to Zwaenepoel et al.: Meeting the Challenges of Detecting Polyploidy Events from Transcriptomic Data. Mol Plant. 2019;12(2):137-140 9. Zwaenepoel A, Van de Peer Y. Inference of Ancient Whole-Genome Duplications and the Evolution of Gene Duplication and Loss Rates. Mol Biol Evol. 2019;36(7):1384-1404 |
|
來自: 生物_醫(yī)藥_科研 > 《待分類》