潛在諾獎候選人、蛋白質(zhì)設(shè)計師
來源:新智元 蛋白質(zhì)設(shè)計最近風(fēng)頭正盛,這不又來了新作品,華盛頓大學(xué)的研究人員開發(fā)了兩種深度學(xué)習(xí)算法可預(yù)設(shè)計特定功能的蛋白質(zhì)。 蛋白質(zhì)是構(gòu)成生命的基石,而如何快速、準(zhǔn)確地確定蛋白質(zhì)的三維空間結(jié)構(gòu),在生命科學(xué)領(lǐng)域一直是個難題。 復(fù)雜的蛋白質(zhì)結(jié)構(gòu) 圖源:science 而現(xiàn)在研究人員利用全蛋白質(zhì)組氨基酸協(xié)同進(jìn)化分析和基于深度學(xué)習(xí)的結(jié)構(gòu)建模,可完成對蛋白質(zhì)結(jié)構(gòu)的系統(tǒng)性預(yù)測。 隨后,來自華盛頓大學(xué)生物化學(xué)系的Jue Wang等人提出了兩種深度學(xué)習(xí)方法來設(shè)計「預(yù)設(shè)定功能位點的蛋白質(zhì)」,并將其成果發(fā)表在Science上。 論文鏈接:https://www./doi/10.1126/science.abn2100 首先,他們發(fā)現(xiàn)了可折疊成包含功能位點的蛋白質(zhì)序列。 然后,他們重新訓(xùn)練了一個結(jié)構(gòu)預(yù)測網(wǎng)絡(luò),從而在只確定功能位點的情況下恢復(fù)蛋白質(zhì)的序列和完整結(jié)構(gòu)。 第一種方法叫Constrained hallucination,通過在序列空間中進(jìn)行梯度下降以優(yōu)化損失函數(shù),并輔以特定問題的交互項,以設(shè)計候選免疫原呈現(xiàn)被中和抗體識別的表位,用于抗逃逸病毒抑制的受體陷阱,金屬蛋白和酶,以及具有圍繞已知結(jié)合基序擴展的設(shè)計界面的靶結(jié)合蛋白。 第二種Missing information recovery中,從所需的功能位點開始,共同填充蛋白質(zhì)所需的缺失序列和結(jié)構(gòu)信息,并通過經(jīng)過更新的RoseTTAFold訓(xùn)練以從結(jié)構(gòu)中恢復(fù)序列。 AlphaFold2 結(jié)構(gòu)預(yù)測計算表明,這些方法可以準(zhǔn)確地生成包含非常廣泛的功能位點的蛋白質(zhì)。 潛在諾獎候選人、蛋白質(zhì)設(shè)計師 提到蛋白質(zhì)設(shè)計,不能不提到大名鼎鼎的蛋白質(zhì)設(shè)計師——David Baker。 他是華盛頓大學(xué)生物化學(xué)教授和霍華德休斯醫(yī)學(xué)研究所的研究員,IPD 所長和首席研究員。 作為蛋白質(zhì)設(shè)計和結(jié)構(gòu)研究的領(lǐng)頭人,這幾年來一直被認(rèn)為是諾獎的有力競爭者。 2020年11月30日,由 DeepMind公司開發(fā)的人工智能程序AlphaFold2,在蛋白質(zhì)結(jié)構(gòu)預(yù)測大賽CASP14中,對大部分蛋白質(zhì)結(jié)構(gòu)的預(yù)測與真實結(jié)構(gòu)只差一個原子的寬度,達(dá)到了人類利用冷凍申鏡等復(fù)雜儀器觀察預(yù)測的水平,這是蛋白質(zhì)結(jié)構(gòu)預(yù)測史無前例的與大進(jìn)步。 隨后,David Baker 教授帶領(lǐng)的研究人員,研發(fā)出了一款完全免費的RoseTTAFold,不僅擁有媲美AlphaFold2的蛋白質(zhì)結(jié)構(gòu)預(yù)測超高準(zhǔn)確度,而且更快、所需計算機處理能力更低, 現(xiàn)在,David Baker教授帶領(lǐng)的研究團(tuán)隊,進(jìn)一步將AlphaFold2與RoseTTAFold相結(jié)合,成功用干蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)的預(yù)測。 Baker表示,「在蛋白質(zhì)設(shè)計研究所這忙碌的一年中,我們設(shè)計COVID-19療法和疫苗并將其投入臨床試驗,同時開發(fā)出用于高精度蛋白質(zhì)結(jié)構(gòu)預(yù)測的RoseTTAFold工具。我很高興科學(xué)界已經(jīng)在使用 RoseTTAFold 服務(wù)器來解決突出的生物學(xué)問題」。 夢想和現(xiàn)實 OpenAI使用神經(jīng)網(wǎng)絡(luò),僅憑文本就創(chuàng)建了大量的生動圖像。 DALL·E算法是GPT-3的衍生產(chǎn)品,它通過檢測訓(xùn)練中的模式,根據(jù)簡單的文本提示生成了栩栩如生的圖像。 構(gòu)建蛋白質(zhì)功能位點也是類似的。 其中,氨基酸是字母,蛋白質(zhì)的功能位點是圖像。神經(jīng)網(wǎng)絡(luò)可以通過訓(xùn)練來觀察數(shù)據(jù)中的模式。訓(xùn)練結(jié)束,便可以對它進(jìn)行測試,檢測它是否能產(chǎn)生一個還算不錯的解決方案。 該團(tuán)隊從之前的產(chǎn)品trRosetta入手。這是一個神經(jīng)網(wǎng)絡(luò),最初的設(shè)計目的是基于氨基酸序列來構(gòu)建新的蛋白質(zhì),同時能夠預(yù)測它們的結(jié)構(gòu)。 這個算法看起來很完美,因為它既能預(yù)測蛋白質(zhì)的氨基酸序列,又能預(yù)測其結(jié)構(gòu)。 然而,它并沒有真正起作用。相比之下,RoseTTAFold表現(xiàn)得更為出色。 這個算法的強大之處就在于它的設(shè)計,即在納米尺度上對每個氨基酸進(jìn)行建模,為每個原子提供坐標(biāo)。 RoseTTAFold可以就手頭問題去預(yù)測一個特定的功能結(jié)構(gòu),并提出一個粗略的草圖作為最終設(shè)計。 不過,研究小組隱藏了部分蛋白質(zhì)序列(或結(jié)構(gòu))。 這款軟件必須學(xué)會如何從嘈雜的無線電攔截中破譯信息,也就是說,在這種情況下,你只能聽到前幾個單詞,然后通過填空理解其真實含義。 RoseTTAFold解決了「缺失信息恢復(fù)問題」,自動完成氨基酸序列和結(jié)構(gòu),以高保真度構(gòu)建了給定的功能區(qū)。 RoseTTAFold可以同時解決構(gòu)建氨基酸序列,并為該位點生成骨架的問題。這就像把單詞寫在紙上:寫信人除了要確保拼寫無誤,還要檢查語法和語義是否正確。 該團(tuán)隊對他們的新發(fā)明進(jìn)行了測試,設(shè)計出了幾種藥物和疫苗,這些藥物和疫苗可能會成功對抗病毒和癌癥。 在進(jìn)行該項目期間,Jue Wang博士兩歲的兒子因RSV肺部感染而住院,這種病毒通常表現(xiàn)出類似感冒的癥狀,但對小孩和老年人來說可能是致命的。 當(dāng)時,Jue Wang博士正在使用該算法設(shè)計新的治療方法,其中包括RSV上的潛在位點,以進(jìn)一步測試疫苗和藥物。這是一個相對良好的結(jié)構(gòu)。 這個軟件的設(shè)計概括了該疫苗可能結(jié)合的兩個位點。深度學(xué)習(xí)方法在此奏效了! 在其他的幾個測試中,該團(tuán)隊還為酶、蛋白質(zhì)結(jié)合蛋白和抓住金屬離子的蛋白質(zhì)設(shè)計了功能位點。 這種方法為揭開天然蛋白質(zhì)的神秘面紗打開了大門,同時也可能為合成生物學(xué)設(shè)計新的蛋白質(zhì)。 總之,這是深度學(xué)習(xí)的另一個勝利,也是人工智能和生物學(xué)巧妙結(jié)合的「作品」。 參考資料: https:///2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/ |
|
來自: 小飛俠cawdbof0 > 《智能》