目前,人工智能(AI)可謂科學(xué)界的頭號(hào)“網(wǎng)紅”,從沃森(Waston)機(jī)器人不到10分鐘診斷出白血病,到“阿爾法狗”擊敗世界排名第一的圍棋選手;從戰(zhàn)場(chǎng)到太空,隨處都可見(jiàn)其身影。美國(guó)《科學(xué)》雜志在近日的報(bào)道中指出,人工智能也已滲透進(jìn)科研領(lǐng)域,正以各種方式玩轉(zhuǎn)醫(yī)療。 No.1 探尋自閉癥的基因根源 一直以來(lái),攻破自閉癥對(duì)于遺傳學(xué)家來(lái)說(shuō)都是一項(xiàng)棘手的挑戰(zhàn)。遺傳定律表明,它擁有強(qiáng)大的遺傳因素。已知在自閉癥中起作用的基因變體只能解釋約20%的病例,尋找可能導(dǎo)致自閉癥的其他變體,需要從與2.5萬(wàn)個(gè)其他人類基因及周圍DNA有關(guān)的數(shù)據(jù)中尋找線索。對(duì)研究人員而言,是這是一項(xiàng)艱巨的挑戰(zhàn),通過(guò)利用人工智能構(gòu)建基因相互作用的圖譜,將已確認(rèn)的自閉癥風(fēng)險(xiǎn)基因,同數(shù)千個(gè)與自閉癥有關(guān)的未知基因進(jìn)行比對(duì),能夠迅速找出它們的相似性。 在基因組計(jì)劃中發(fā)現(xiàn),基因組可編碼蛋白質(zhì)的部分僅僅約占到人類基因組的2%,剩下98%的基因組為非編碼區(qū)域,既不能轉(zhuǎn)錄為相應(yīng)的信使RNA,也不能指導(dǎo)蛋白質(zhì)合成,曾一直被認(rèn)為是“垃圾DNA”而無(wú)人問(wèn)津。 不過(guò),正如遺傳學(xué)家最近所意識(shí)到的,基因并非“單打獨(dú)斗”。它們的行為受附近數(shù)百萬(wàn)個(gè)非編碼堿基的影響。這些非編碼堿基同DNA結(jié)合蛋白以及其他因素相互作用。而利用人工智能則可以確認(rèn)哪些非編碼變體可能影響附近的自閉癥基因。 近日,發(fā)表在《Nature Genetics》雜志上的一項(xiàng)研究結(jié)合人工智能的技術(shù)優(yōu)越性,第一次將非編碼DNA突變與神經(jīng)發(fā)育聯(lián)系在一起,并且也首次證明了非遺傳性的非編碼DNA突變可能是導(dǎo)致人類各類復(fù)雜疾病的新病因。 No.2 “垃圾”DNA,可不垃圾 最早研究“非編碼DNA突變可能導(dǎo)致遺傳性自閉癥風(fēng)險(xiǎn)”發(fā)現(xiàn),新發(fā)基因突變(de novo mutation)只能解釋約三分之一的自閉癥譜系障礙(ASD)病例,而余下的風(fēng)險(xiǎn)可能解釋為非編碼DNA的罕見(jiàn)遺傳變異。 隨后,研究人員對(duì)近2000個(gè)家庭進(jìn)行了全基因組測(cè)序研究。結(jié)果發(fā)現(xiàn),患有自閉癥的兒童比他們的兄弟姐妹具有更多在啟動(dòng)子區(qū)(非編碼區(qū))的新發(fā)突變,而非父母遺傳。這也暗示了非編碼區(qū)域的新發(fā)突變導(dǎo)致自閉癥的可能性。 No.3 人工智能協(xié)助“破案” 由于信息數(shù)據(jù)龐大且對(duì)非編碼區(qū)域的功能知之甚少,繪制關(guān)于自閉癥的非編碼區(qū)域的作用圖譜極其困難。 在這項(xiàng)最新的研究中,研究團(tuán)隊(duì)訓(xùn)練人工智能學(xué)習(xí)模型來(lái)預(yù)測(cè)給定序列如何影響基因表達(dá)。隨后他們使用機(jī)器學(xué)習(xí)分析了1790名自閉癥患者及其并未患病的父母及其兄弟姐妹的全基因組。之所以選擇這類患者,是因?yàn)樗麄兓忌系淖蚤]癥屬于新發(fā)突變,與遺傳無(wú)關(guān)。 這在基因研究的分析中引入了新的思路。在這里應(yīng)用了一套智能復(fù)雜的工具,任何特定的突變將會(huì)發(fā)生什么,甚至是那些罕見(jiàn)或以前從未觀察到的突變。 該分析模型也預(yù)測(cè)了每個(gè)自閉癥兒童的非遺傳性非編碼突變的影響,也就是之前所提到的“垃圾DNA”,研究者隨后將這些預(yù)測(cè)結(jié)果與其他未受到影響的兄弟姐妹的非編碼未突變區(qū)域進(jìn)行比較。結(jié)果發(fā)現(xiàn),與非編碼突變相關(guān)的自閉癥病例的數(shù)量與編碼區(qū)突變的病例數(shù)量相當(dāng)!也就是說(shuō),非編碼突變是自閉癥的另一重要病因。 研究還發(fā)現(xiàn),這些非編碼突變不僅僅是改變了基因調(diào)控,還影響了大腦中的基因表達(dá)和已知與自閉癥相關(guān)的基因,例如那些負(fù)責(zé)神經(jīng)元遷移和發(fā)育的基因。 這項(xiàng)研究第一次明確證實(shí)由非遺傳性非編碼突變導(dǎo)致的復(fù)雜人類疾病,具有重要意義。同樣,科學(xué)家可以應(yīng)用研究中的新技術(shù)來(lái)探索非編碼突變?cè)诎┌Y和心臟病等疾病中的作用。這會(huì)使人們對(duì)許多人類疾病的原因產(chǎn)生新的認(rèn)識(shí)。 |
|