乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      產(chǎn)生,保留和選擇:來自于祖先lncRNAs的De novo蛋白質(zhì)基因起源三部曲

       生物_醫(yī)藥_科研 2019-03-22

      De novo 蛋白質(zhì)基因可能起源于長非編碼RNA?

      Scientific issues:

      一直以來,基因復(fù)制被認(rèn)為是產(chǎn)生新基因的主要來源,在近年的研究中發(fā)現(xiàn),部分蛋白質(zhì)編碼基因也可能通過De novo起源于基因組中的非編碼區(qū)域,這些基因由于缺少祖先蛋白質(zhì)基因而被稱為 “motherless”基因,那么為什么有些基因會起源于非編碼基因,這些基因在基因組中產(chǎn)生,保留下來和所經(jīng)受選擇機(jī)制是怎樣的呢?

      Results:

      1.  鑒定64個類人猿譜系特異起源于lncRNA的De novo蛋白質(zhì)基因

      圖1

      根據(jù)圖1A圖所示流程,即結(jié)合作者自己開發(fā)的一套ab initio鑒定流程與meta 分析(整合已發(fā)表數(shù)據(jù))鑒定到64個人類中Denovo的蛋白質(zhì)編碼基因,這其中有43個為人類特異性基因(younger proteins),有21個在人類和猩猩中存在(older proteins)但在恒河猴中不存在(圖1B)。作者引用已發(fā)表數(shù)據(jù)證實這64個基因都可正常轉(zhuǎn)錄和翻譯,并且存在全長mRNA數(shù)據(jù)和EST數(shù)據(jù)以及質(zhì)譜數(shù)據(jù)支持。64個基因中83.9%的基因,43個人類特異性基因92.9%的基因在恒河河和大猩猩中至少有一個組織顯示作為lncRNA轉(zhuǎn)錄(圖1C)。同時這64個基因的基因區(qū),基因上游區(qū)域,基因下游區(qū)域的表達(dá)水平比較顯示,基因區(qū)表達(dá)水平明顯偏高(圖1D)。64個人類基因中的主要剪切位點在猩猩和恒河猴中也同樣可以被檢測到(圖1E)。有趣的是,在這64個人類蛋白質(zhì)基因在恒河猴和猩猩中的非編碼同源區(qū)域組織表達(dá)譜顯示也與人類相似(圖1F)。

      總而言之,作者根據(jù)以上證據(jù)認(rèn)為這些De novo基因的轉(zhuǎn)錄結(jié)構(gòu)和表達(dá)譜在祖先中基因中就已形成,這種特征甚至在其獲得蛋白質(zhì)編碼能力前就已出現(xiàn)。所以接下來去探索這些具有精準(zhǔn)的剪切結(jié)構(gòu)和組織表達(dá)譜的lncRNA祖先基因是否已經(jīng)在RNA水平上就已獲得某種生物學(xué)功能,也許是能夠解釋這些基因能夠作為新的De novo基因的祖先基因的一種依據(jù)。

      2.lncRNA祖先基因并沒有經(jīng)歷比其他lncRNA位點更加嚴(yán)格的選擇

      圖2

      盡管lncRNA具有各種功能,但是并不是所有的lncRNA功能都得到充分研究,因此作者采用一種演化生物學(xué)的方法衡量在恒河猴中這64個基因的同源lncRNA位點的受選擇程度來作為一種替代手段來研究其在祖先基因組中的功能情況。首先根據(jù)圖2 A圖所示流程實現(xiàn)了恒河猴中的lncRNA轉(zhuǎn)錄組鑒定,這些鏈特異性RNAseq數(shù)據(jù)來自于同一只恒河猴的十個組織,最終,組裝到5641條lncRNA轉(zhuǎn)錄本,這些轉(zhuǎn)錄本都具有已報道的特征,即在轉(zhuǎn)錄起始位點附近與CpG島附近具密度較高(此處已注釋基因作為陽性對照,基因間區(qū)作為陰性對照)(圖2B,C)。

      文章使用其中89條不作為人類De novo基因的祖先lncRNA作為陽性對照,并測序24只恒河猴基因組結(jié)合已發(fā)表數(shù)據(jù)7只恒河猴基因組共31個基因組信息計算圖2D所示基因組內(nèi)不同區(qū)域的核苷酸多樣性(π),結(jié)果顯示De novo基因的祖先基因并沒有經(jīng)歷更加嚴(yán)格的選擇壓力(NS表示差異不顯著)。

      3.Denovo蛋白質(zhì)理論壽命并沒有超出預(yù)期

      以上研究表明祖先lncRNA并沒有經(jīng)歷更加嚴(yán)格的選擇壓力。因此本文進(jìn)一步探索了這些祖先lncRNA的序列特征以探索為什么這些lncRNA更傾向于成為祖先lncRNA。

      圖3

      序列特征分析顯示,祖先lncRNA序列相較于其他lncRNA及基因間區(qū)顯著具有更高的GC含量,且這些lncRNA的ORF(開放閱讀框)區(qū)域也具有相對較高的GC含量(圖3A,B,C),有研究表明GC含量高的區(qū)域相較于GC含量低的區(qū)域ORF更加穩(wěn)定,與蛋白質(zhì)編碼基因比較顯示,這些較新的ORF具有較少的脆弱密碼子,從而有效避免了這些密碼子通過點突變成為終止密碼子(圖3D)。并且對于這些ORF的半衰期估算顯示其具有更長的半衰期,甚至超過蛋白質(zhì)編碼基因。并且older De novo基因相較于youngerDe novo基因具有更高的GC含量,更長的半衰期(圖 3E)。綜上所述,De novo蛋白質(zhì)基因的理論壽命可能會超出現(xiàn)存時間。

      4.在人類群體中新的De novo蛋白質(zhì)基因經(jīng)歷選擇壓力

      De novo gene的產(chǎn)生和保留似乎經(jīng)歷中性選擇,但是,考慮到這些富含GC的序列長期暴露于自然選擇之下,為進(jìn)一步探索這些新起源的ORF是否因為其新獲得的蛋白質(zhì)水平的功能而在最近的群體中被受到選擇保留,因此作者使用群體遺傳學(xué)方法探索了這些ORF是否在人類群體中受到選擇,但是在恒河猴中沒有受到選擇。

      圖4

      作者分析了在67個來自于不同亞種的人類個體的SNP數(shù)據(jù),發(fā)現(xiàn)在這些De novo基因的外顯子區(qū)域較內(nèi)含子區(qū)域具有更高的核苷酸多態(tài)性(圖4A),UTR區(qū)域的核苷酸多樣性也明顯低于基因間區(qū),非同義突變位點相較于同義突變位點核苷酸多態(tài)性比例遠(yuǎn)遠(yuǎn)小于1,與同源位點相比,衍生等位基因的頻譜在從頭基因的非同義位點具有過量的低頻變異(圖4C),這與已知的蛋白質(zhì)編碼基因相似(圖4E)。作為對照,我們將人lncRNA中的突變分類為最長假ORF中的同義或非同義位點,但是未觀察到它們各自頻譜中的任何差異(圖4F)。為檢驗在恒河猴中的祖先lncRNA的受選擇程度,作者對82個無親緣關(guān)系的恒河猴實現(xiàn)了深度基因組測序,對其進(jìn)行與人類相同的數(shù)據(jù)分析包括核苷酸多樣性與非同義替換/同義替換速率分析,但是結(jié)果顯示,在恒河猴中這些區(qū)域并沒有受到選擇。

      結(jié)果表明,盡管De novo起源的蛋白質(zhì)基因的產(chǎn)生和保留顯示受到中性選擇,但是在人類中顯示這些新起源的基因受到純化選擇。

      討論

      作者認(rèn)為由于計算方法可能存在的缺陷,所以可能還有大量De novo起源的蛋白質(zhì)基因未被鑒定到,所以Denovo起源的蛋白質(zhì)編碼基因可能在靈長類中普遍存在;且這些功能性De novo的基因可能代表其起源的中間階段,縮小了非編碼DNA和蛋白質(zhì)編碼基因之間的差距。這種起源過程在現(xiàn)有的基因組形成中起到了承上啟下的關(guān)鍵作用。蛋白質(zhì)編碼基因通常具有比非編碼區(qū)域更高的GC含量。之前已經(jīng)有文獻(xiàn)提出通過自然選擇可以維持基因區(qū)域中增加的GC含量,例如可能通過適應(yīng)性進(jìn)化對mRNA二級結(jié)構(gòu)的穩(wěn)定性或蛋白質(zhì)合成形成的搖擺位點上的GC偏好。然而,在這里我們發(fā)現(xiàn)其他基因相關(guān)的基因組區(qū)域也富含GC,例如內(nèi)含子區(qū)域(圖3B)。從理論上講,考慮到新基因起源的模型,每個蛋白質(zhì)編碼基因都可以追溯到非編碼DNA的古老起源事件。因此,可能存在一種可能性,即來自富含GC的lncRNA的偏向遺傳可能是支持編碼區(qū)和基因組背景之間不同程度的GC含量的另一個主要因素。由于我們提供了蛋白質(zhì)編碼基因與人類譜系中非編碼DNA區(qū)域之間的進(jìn)化和功能聯(lián)系,我們正式測試了這種“富含GC的遺傳模型”。相應(yīng)地,我們發(fā)現(xiàn)富含GC的lncRNAs是新蛋白質(zhì)的有利前體。更重要的是,可以在與這些新起源的從頭基因相關(guān)的所有基因組區(qū)域中檢測到富含GC的特征,即使對于具有確定的GC偏好的搖擺位點,以及它們的lncRNA前體和充分研究的蛋白質(zhì)編碼基因。這些特征除了是ORF獲得后的適應(yīng)性進(jìn)化的結(jié)果,蛋白質(zhì)編碼基因的富含GC的特征也可以從祖先lncRNAs繼承,從而補(bǔ)充了先前關(guān)于蛋白質(zhì)編碼基因的富含GC的特征的理論。

      本文通訊作者:李川昀,北京大學(xué)分子醫(yī)學(xué)研究所研究員。主要研究方向為面向轉(zhuǎn)化醫(yī)學(xué),基于新一代測序技術(shù)研究基因組/轉(zhuǎn)錄組對人類復(fù)雜疾病的調(diào)控,深入理解疾病發(fā)生發(fā)展中遺傳因素與環(huán)境因素的互作,發(fā)現(xiàn)新藥靶;(2)通過進(jìn)化醫(yī)學(xué)研究,從基因起源等角度詮釋人類復(fù)雜疾病的演化基礎(chǔ);(3)開發(fā)創(chuàng)新的生物信息學(xué)算法與綜合數(shù)據(jù)庫,在基因組框架下理解基因功能與復(fù)雜疾病。

      原文鏈接:https://www.ncbi.nlm./pubmed/26177073

      如果您覺得有價值,請把此文放到您朋友圈,大家都會感謝你

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多