探針資本：信息化與人工智能輔助醫(yī)藥研究（三）

生物_醫(yī)藥_科研 2019-04-03

展開全文

致力于幫助推動醫(yī)學(xué)進(jìn)步的科學(xué)家和創(chuàng)業(yè)者

《信息化與人工智能輔助醫(yī)藥研究（三）》

5 AI+藥物挖掘：覆蓋藥物研發(fā)全流程

5.1 藥物研發(fā)“智能大腦”的理想模型

5.2 自動化藥物研發(fā)新型公司圖景介紹

5.3 Big Pharma與人工智能藥物研發(fā)公司合作圖景

5.4 幾類藥物研發(fā)中的經(jīng)典AI方法和問題

5.5 人工智能輔助醫(yī)藥研究的各階段場景

5.6 人工智能賦能醫(yī)藥研究優(yōu)缺點(diǎn)

6 行業(yè)壁壘與競爭格局

-------下期預(yù)告--------

《民營口腔醫(yī)院的機(jī)遇與挑戰(zhàn)（一）》

1 口腔醫(yī)療產(chǎn)業(yè)概述

1.1 口腔醫(yī)療定義

1.2 口腔醫(yī)療行業(yè)產(chǎn)業(yè)鏈

1.3 口腔醫(yī)療機(jī)構(gòu)的分類

2 口腔醫(yī)療產(chǎn)業(yè)的市場供需狀況和市場規(guī)模分析

2.1 需求端

2.2 供給端

五

AI+藥物挖掘：覆蓋藥物研發(fā)全流程

1. 藥物研發(fā)“智能大腦”的理想模型

近來藥物開發(fā)實(shí)踐過程中的高風(fēng)險、高失敗率促使人們反思，應(yīng)在更科學(xué)研究方法指導(dǎo)下、借助大數(shù)據(jù)和先進(jìn)模型的力量，用標(biāo)準(zhǔn)化減少實(shí)驗(yàn)中的浪費(fèi)、讓哪怕是失敗的實(shí)驗(yàn)結(jié)果也可以為完善藥物研發(fā)的模型做貢獻(xiàn)。因此人們開始認(rèn)同藥物研發(fā)的理想模式是實(shí)現(xiàn)大數(shù)據(jù)、模型、測試平臺與它們之間的循環(huán)迭代（如下示意圖）。

這個概念中的循環(huán)迭代在藥物臨床前研究和臨床后/上市后研究都存在，相應(yīng)涉及的是兩套不同的技術(shù)：

·臨床前研究：藥物分子的設(shè)計(jì)和學(xué)習(xí)、自動化合成、高通量檢測；

·臨床后/上市后研究：藥物適應(yīng)癥或適宜人群或ADMET等性質(zhì)的預(yù)測、臨床實(shí)驗(yàn)方案設(shè)計(jì)與執(zhí)行、數(shù)據(jù)采集與分析學(xué)習(xí)；

以下將對全循環(huán)中涉及的各個環(huán)節(jié)做簡要介紹，其中涉及到的具體技術(shù)將在第二部分詳細(xì)介紹。

1.1 自動化分子設(shè)計(jì)

傳統(tǒng)藥物化學(xué)的任務(wù)是選擇、設(shè)計(jì)和對分子結(jié)構(gòu)作優(yōu)先排序，以得到擁有良好成藥性前景的候選分子。而影響成藥性的分子性質(zhì)通常是多維度的，包括分子進(jìn)入體內(nèi)的吸收、分布、代謝、排泄和毒性(ADMET)，以及分子的可得性和合成路線復(fù)雜度等等；因此藥物化學(xué)家會日常面對這種多維度的、且隨著研發(fā)進(jìn)程不斷改變的優(yōu)化問題?？紤]到化學(xué)空間的龐大（通常認(rèn)為有類藥性質(zhì)的分子數(shù)量級在1E30-1E60）,研發(fā)中的優(yōu)化問題會進(jìn)一步落實(shí)到“下一步應(yīng)該合成或測試哪些分子？”，而這也就是自動化藥物發(fā)現(xiàn)平臺必須回答的關(guān)鍵問題。

近年來，人們總結(jié)化合物設(shè)計(jì)原則通常包括以下三種：

1）多樣性導(dǎo)向的合成（Diversity-oriented synthesis, DOS）:盡量生成空間結(jié)構(gòu)、功能基團(tuán)和化合物骨架的小分子化合物庫。

2）生物導(dǎo)向的合成（Biology-oriented synthesis, BIOS）：用天然產(chǎn)物的骨架作為模板生成衍生物和類似物。

3）功能導(dǎo)向的合成（Function-oriented sytnehsis, FOS）：在BIOS的基礎(chǔ)上，進(jìn)一步發(fā)掘有生物活性的先導(dǎo)化合物，簡化和創(chuàng)新合成路徑獲得更簡單的骨架。

化合物選擇的評價標(biāo)準(zhǔn)經(jīng)過多年的探索與積累，已經(jīng)基本取代了早年非常依賴經(jīng)驗(yàn)的判斷標(biāo)準(zhǔn)（例如Lipinski’s rule of 5），以多種較為成熟的預(yù)測模型的形式融入了藥物化學(xué)家的先導(dǎo)化合物篩選流程，并在實(shí)踐中不斷被認(rèn)可和進(jìn)一步優(yōu)化，人工神經(jīng)網(wǎng)絡(luò)和在線計(jì)算技術(shù)也被引入以承擔(dān)大規(guī)模精細(xì)計(jì)算的任務(wù)。

另外，很多藥物從頭設(shè)計(jì)方法和軟件也被提出，例如生成式和循環(huán)神經(jīng)網(wǎng)絡(luò)(generative and recurrent neural network )、反向定量構(gòu)效模型(inverse quantitative structure-relationship models)，還有基于反應(yīng)的化合物組裝技術(shù)(reaction-based compound assembly techniques)。從頭設(shè)計(jì)方法一般從化合物的合成子結(jié)構(gòu)或弱活性的化合物母結(jié)構(gòu)框架出發(fā)，通過窮舉+預(yù)測或更為智能的深度學(xué)習(xí)方法得到有更優(yōu)秀性質(zhì)的化合物候選。

這些從頭設(shè)計(jì)化合物的方法與前文所述的化合物生成原則相結(jié)合，可以實(shí)現(xiàn)計(jì)算機(jī)自動規(guī)劃化合物合成優(yōu)先級及策略，并進(jìn)一步直接與微流控輔助合成等自動化合成方法對接，在很短的時間內(nèi)快速實(shí)現(xiàn)化合物庫構(gòu)建和測試。

1.2 自動化化合物合成

化合物合成的自動化和并行化極大有助于加快化合物的合成速度與通量，同時也通過如此標(biāo)準(zhǔn)化的流程提高可重復(fù)性和降低成本。實(shí)現(xiàn)自動化合成的要素有二：1）作為“拼裝原料”的化合物結(jié)構(gòu)片段和2）一套嚴(yán)密設(shè)計(jì)的化學(xué)反應(yīng)以在標(biāo)準(zhǔn)化重復(fù)迭代中實(shí)現(xiàn)片段的組合拼裝和產(chǎn)物純化等。一系列相關(guān)的化學(xué)反應(yīng)與自動化平臺被開發(fā)，人們也在實(shí)踐中逐步發(fā)現(xiàn)了不適宜使用的組合化學(xué)反應(yīng)類型和一些成功的自動化合成線流程（下表為例）：

由于自動化合成平臺的屬性限制，這類方法的局限性也顯而易見：由于可應(yīng)用的化學(xué)反應(yīng)類型和條件（需相對溫和）的限制，能擴(kuò)展的合成空間維度有限，生成的化合物庫多樣性也可能因此受到限制。

實(shí)現(xiàn)自動化合成涉及到硬件系統(tǒng)主要有：

1) 聲波液體轉(zhuǎn)移系統(tǒng)（acoustic liquid handling systems），用于精確轉(zhuǎn)移納升級別體積的液滴到孔板中；

2) 微流控系統(tǒng)(microfluidics systems):可以控制微量液體在表面-體積比很大、沒有湍流的情況實(shí)現(xiàn)精確的液體操控和并行進(jìn)行高產(chǎn)出的連續(xù)反應(yīng)，且因?yàn)樗柙噭┑牧糠浅Ｉ?，可以有效降低成本?/p>

3) 微量檢測相關(guān)的儀器，包括質(zhì)譜儀(mass spectrometry), HPLC，NMR等：用于檢測微流控系統(tǒng)中反應(yīng)得到的產(chǎn)物；

另值得注意的是，高通量自動化合成技術(shù)中有batch approach和continuous-flow system之間的比較區(qū)別。前者是在一次實(shí)驗(yàn)中收集非常多的數(shù)據(jù)點(diǎn)，例如默克的THE平臺使用的3456孔板，每空中測試不同的實(shí)驗(yàn)條件（反應(yīng)物濃度、不同的催化劑等）以對化學(xué)反應(yīng)做快速優(yōu)化；而后者是一次做一個實(shí)驗(yàn)（‘one-at-a-time’），但隨著濃度和時間的連續(xù)變化，通過記錄時序反應(yīng)結(jié)果做動態(tài)分析，同樣可以快速實(shí)現(xiàn)對反應(yīng)條件的優(yōu)化。且由于flow system的連續(xù)性，這種策略可以與計(jì)算機(jī)模型結(jié)合，實(shí)現(xiàn)反饋和自動的實(shí)驗(yàn)條件優(yōu)化。這兩種不同的策略在接下來介紹的自動化活性篩選中也存在。

1.3 自動化化合物活性測試

傳統(tǒng)batch approach的方法使用微孔板培養(yǎng)經(jīng)過設(shè)計(jì)的細(xì)胞，加入藥物后批量檢測候選藥物對細(xì)胞特定活性或表型的影響，以此來篩選出有理想作用活性的藥物。這套方法和設(shè)施已經(jīng)被大藥企廣泛應(yīng)用于實(shí)踐。而微流控系統(tǒng)引入的continuous-flow system以其更靈活的控制、更小的細(xì)胞和試劑用量以及更接近體內(nèi)實(shí)驗(yàn)環(huán)境等優(yōu)勢，在近些年來得到越來越多的重視，也開發(fā)出了越來越多的實(shí)驗(yàn)體系（例如liver-on-chip檢測藥物對cytochrome P450的結(jié)合、cancer-on-chip可以模擬腫瘤微環(huán)境、對干細(xì)胞的快速表觀遺傳學(xué)DNA檢測測試藥物對分化細(xì)胞的影響等）。此外，更小的實(shí)驗(yàn)體系也讓納米藥物傳遞系統(tǒng)和精細(xì)的電極檢測等技術(shù)成為可能。

1.4 設(shè)計(jì)-合成-檢測的整合

正因?yàn)榍拔乃龌衔镌O(shè)計(jì)與分析工作的智能化加上合成與測試工作的微量化和標(biāo)準(zhǔn)化，整合這些模塊并實(shí)現(xiàn)自動化藥物研發(fā)才成為可能。下圖是Boehringer-Ingelheim Pharma和AstraZeneca自動化藥物研發(fā)設(shè)施的示意圖。a圖顯示成千上萬的化合物以極高密度存儲且由機(jī)械臂進(jìn)行管理；b圖顯示在化合物的合成或測試階段也是由機(jī)械臂執(zhí)行標(biāo)準(zhǔn)化的實(shí)驗(yàn)操作；c圖顯示的是自動化藥物設(shè)計(jì)與數(shù)據(jù)分析管理工作站。

與臨床前研究的閉環(huán)迭代邏輯相同，臨床實(shí)驗(yàn)實(shí)際是以“藥物對某種人群的某類適應(yīng)癥有效”作為假設(shè)開始研究，依據(jù)已有臨床前實(shí)驗(yàn)結(jié)果等的預(yù)測設(shè)計(jì)臨床試驗(yàn)、執(zhí)行實(shí)驗(yàn)、回收數(shù)據(jù)并進(jìn)一步學(xué)習(xí)和生成新的適應(yīng)癥或適宜人群假設(shè)。同樣本著標(biāo)準(zhǔn)化和智能學(xué)習(xí)的原則，新型的臨床試驗(yàn)研究中越來越重視標(biāo)準(zhǔn)化的信息采集處理系統(tǒng)和人工智能的分析預(yù)測模型。更新的可穿戴設(shè)備、更大的來自人群的數(shù)據(jù)量也在不斷塑造這個領(lǐng)域的新面貌。

2. 自動化藥物研發(fā)新型公司圖景介紹

在理想自動化藥物研發(fā)的背景下，一批新型的、搭載人工智能的start-up在美國、歐洲等出現(xiàn)，在最近一年中也出現(xiàn)在了中國。這些公司依照業(yè)務(wù)性質(zhì)大致可以分為三類：

·作為大循環(huán)中的一部分，為傳統(tǒng)藥企的研發(fā)提供軟件或技術(shù)服務(wù)；

·致力于打造自己的研究自動化閉環(huán)平臺；

·更細(xì)致的研究領(lǐng)域內(nèi)實(shí)現(xiàn)自己的研發(fā)閉環(huán)（這一類型通常只限于臨床前研究；臨床后通常都是與大藥企合作的模式）。

進(jìn)一步，在臨床前階段的、引入自動化/人工智能技術(shù)的新藥研發(fā)公司通常有如下的市場定位考量：

·新數(shù)據(jù)/自有數(shù)據(jù)/全新生物假設(shè)：傾向于自有研發(fā)管線

多維度大量數(shù)據(jù)能被機(jī)器學(xué)習(xí)模型吸收并生成新的關(guān)于疾病發(fā)生機(jī)理的假設(shè)，進(jìn)而以算法或pipeline的形式定義新的藥物發(fā)現(xiàn)流程。這些假設(shè)可以類比于挖掘?qū)毑氐男侣窂剑灰欢艽_保每一條路都能持續(xù)高效地找到大量有效藥物，但理論上起碼每條新路徑上最顯著的結(jié)果會有成藥價值（有一定賭博的性質(zhì)），以及對新路徑的探索從整體上說會顯著增加人們對于疾病的認(rèn)識。這種創(chuàng)新性的技術(shù)突破理論上會逐漸在各個細(xì)分治療領(lǐng)域上發(fā)生，在取得有價值的發(fā)現(xiàn)之前通常會經(jīng)歷較長的迭代優(yōu)化和測試，在有限資源的支持下最終結(jié)果可能會是——找到大量優(yōu)質(zhì)候選（找到了顯著有效的因素）、找到少量優(yōu)質(zhì)候選（在有限的條件下有效）、找不到優(yōu)質(zhì)候選（此路不通）。

·公共數(shù)據(jù)/先進(jìn)的深度學(xué)習(xí)方法/只有自動化技術(shù)/無新的生物學(xué)假設(shè)：傾向于軟件工具、平臺服務(wù)、合作研發(fā)、參與公開比賽

越來越多積累的關(guān)于化合物、蛋白質(zhì)、基因組、細(xì)胞組織水平上的信息以及海量文獻(xiàn)可以被更高效地利用以充分挖掘探索的治療空間。這里的技術(shù)（主要是基于已有數(shù)據(jù)的相關(guān)性計(jì)算或預(yù)測）理論上會呈現(xiàn)斷層式的突破——一旦數(shù)據(jù)足夠、對相關(guān)性的假設(shè)合理，在適用條件范圍內(nèi)可能會一次性發(fā)現(xiàn)大量有效藥物-適應(yīng)癥組合或平臺式抬高預(yù)測有效性基準(zhǔn)。

·表現(xiàn)最好的“智能大腦”理論上一定會走向自有研發(fā)管線，因?yàn)樾滤庨_發(fā)的利潤最為豐厚；也有可能新的發(fā)現(xiàn)會導(dǎo)向新生物技術(shù)公司的誕生，以衍生出的新公司為研發(fā)實(shí)體。

3. Big Pharma與人工智能藥物研發(fā)公司合作的圖景介紹

這里的BigPharma指的是已經(jīng)擁有雄厚資源和研發(fā)實(shí)力的知名跨國藥物研發(fā)公司（例如輝瑞、諾華等）。在新藥研發(fā)數(shù)字化、智能化轉(zhuǎn)型的浪潮下，這些知名大公司往往很早就開始以自建、合作、投資等多種方式參與了領(lǐng)域的革新。同時因?yàn)锽ig Pharma的業(yè)務(wù)涵蓋了藥物研發(fā)的全過程，其創(chuàng)新與合作往往涉及臨床前后多個環(huán)節(jié)，與前文所述start-up的關(guān)系既有投資、合作也有競爭。一些主要信息匯總于下表：

4. 幾類藥物研發(fā)中的經(jīng)典AI方法和問題

人工智能技術(shù)在藥物研發(fā)領(lǐng)域的增長趨勢首先體現(xiàn)在近年來快速增長的相關(guān)科研文獻(xiàn)數(shù)量上（如下圖）。在藥物研發(fā)領(lǐng)域內(nèi)經(jīng)典貝葉斯方法、SVM仍占主導(dǎo)和有廣泛影響力，但人們對大數(shù)據(jù)和人工智能抱有濃厚的興趣和期待也是不爭的事實(shí)。

在前文所述藥物研發(fā)循環(huán)迭代的框架下，藥物研發(fā)各個環(huán)節(jié)中可以細(xì)分出幾類問題（總結(jié)如下）。雖然都涉及人工智能和大數(shù)據(jù)，但這幾類問題各自運(yùn)用的算法和面對的問題各有不同的特點(diǎn)，以下將結(jié)合一些代表案例具體闡述。

4.1 “鎖”的拆解：多維度組學(xué)數(shù)據(jù)和新工具的開發(fā)應(yīng)用帶來對疾病機(jī)制的深入理解

【技術(shù)核心】首先是數(shù)據(jù)的質(zhì)量和通量，其次是挖掘疾病和靶點(diǎn)、標(biāo)志物等之間的相關(guān)性

在藥物研發(fā)流程中，起始第一步就是“提出假設(shè)”，即關(guān)聯(lián)某種疾病與靶點(diǎn)、細(xì)胞表型或生物標(biāo)志物之間的關(guān)系。有了“假設(shè)”才能在不進(jìn)行臨床試驗(yàn)的階段有合理的優(yōu)化目標(biāo)，不斷更新迭代以得到合理的藥物候選?，F(xiàn)階段研究中，假設(shè)的來源主要包括以下幾類：

已知重要的藥物靶點(diǎn)（包括很多有名的蛋白及家族，例如GPCR、蛋白激酶等，被廣泛認(rèn)可的藥靶數(shù)量級約為1000個，其中約幾百個靶點(diǎn)被研究挖掘最為深入，有大量藥物針對它們設(shè)計(jì)；還有很多藥物設(shè)計(jì)較為困難、研究相對較少）；
通過基因組學(xué)研究發(fā)現(xiàn)的新表觀遺傳靶點(diǎn)或標(biāo)志物（包括mRNA，cDNA等），這一類研究很多是人類基因組計(jì)劃的延伸，常見形態(tài)為收集來自廣泛人群的基因組做測序，進(jìn)大型針對某類疾病的隊(duì)列研究，會收集病人很多維度的信息（包括基因組、代謝組、表觀遺傳組、臨床用藥記錄等等）并做關(guān)聯(lián)分析。最典型的例子如TCGA，大量國家級集成研究項(xiàng)目也多資助這一類研究，以為攻克這一類嚴(yán)重且影響較大的疾?。?/span>
對細(xì)胞或動物疾病模型的合成生物學(xué)研究，主要運(yùn)用先進(jìn)的基因敲除(siRNA, CRSIPR等)配合測序技術(shù)實(shí)現(xiàn)對細(xì)胞/動物模型的基因組干預(yù)或設(shè)計(jì)，繼而發(fā)現(xiàn)疾病機(jī)理中的關(guān)鍵機(jī)制和治療靶點(diǎn)；
對文獻(xiàn)、公共數(shù)據(jù)的meta-analysis，基于新的邏輯框架或生物信息學(xué)方法等充分挖掘已有文獻(xiàn)和公共數(shù)據(jù)的信息并導(dǎo)向新的假設(shè)。

人工智能在這個階段主要集中于輔助數(shù)據(jù)處理。在獲得數(shù)據(jù)的基礎(chǔ)上，大多數(shù)“發(fā)現(xiàn)相關(guān)性”本身尚不涉及常見統(tǒng)計(jì)學(xué)方法及變體以外更復(fù)雜方法。

【典型案例】

4.2 “鑰匙”的設(shè)計(jì)：化學(xué)信息學(xué)、結(jié)構(gòu)生物學(xué)中人工智能的應(yīng)用帶來學(xué)科的加速發(fā)展

【技術(shù)核心】建立候選藥物實(shí)體與一系列干預(yù)指標(biāo)之間的可靠預(yù)測模型

這一類問題是人工智能在藥物研發(fā)領(lǐng)域最為活躍的領(lǐng)域。下表匯總了領(lǐng)域內(nèi)代表性的科研工作，這些研究可以依據(jù)預(yù)測/學(xué)習(xí)目標(biāo)進(jìn)一步細(xì)分為兩類（括號中備注的是所使用的深度學(xué)習(xí)方法；RNN:循環(huán)神經(jīng)網(wǎng)絡(luò)；GAN:生成對抗網(wǎng)絡(luò)；CNN:卷積神經(jīng)網(wǎng)絡(luò)；Auto-encoder:自動編碼機(jī)）：

對給定靶點(diǎn)從頭設(shè)計(jì)新藥物（RNN, GAN）
多靶點(diǎn)/多目標(biāo)性質(zhì)藥物發(fā)現(xiàn)；虛擬篩選（DNN, CNN，Auto-encoder）

【典型案例】

4.3 “鎖與鑰匙匹配測試”的成本降低路徑：快速低成本測試并迭代優(yōu)化生物技術(shù)

【技術(shù)核心】循環(huán)迭代邏輯、高通量/高內(nèi)涵、模塊化技術(shù)

【典型案例】

5. 人工智能輔助醫(yī)藥研究的各階段場景

AI+藥物挖掘主要可應(yīng)用在臨床前和臨床試驗(yàn)兩大階段，這兩大階段對數(shù)據(jù)利用的主要目的和手段不同。臨床前階段偏向探索，如靶點(diǎn)確認(rèn)、化合物篩選，是以一種更高效的方式尋找目標(biāo)；臨床試驗(yàn)階段偏向管理，如數(shù)據(jù)記錄、生成報告，是以一種更有效的手段管理記錄流程。臨床前階段更偏向深度學(xué)習(xí)技術(shù)，學(xué)習(xí)技術(shù)算法優(yōu)劣可直接影響成本和效率；臨床階段更具有系統(tǒng)性，規(guī)范和一體化是加速研究進(jìn)展的關(guān)鍵。單就臨床前研究而言，其可以分為研究開發(fā)和臨床前實(shí)驗(yàn)兩大部分，研究開發(fā)一般歷時2-3年；臨床前實(shí)驗(yàn)一般歷時2-4年。其中研究開發(fā)又可分為作用靶點(diǎn)確認(rèn)、先導(dǎo)化合物篩選、化合物優(yōu)化與合成三步。AI+藥物挖掘主要應(yīng)用在研究開發(fā)階段。臨床試驗(yàn)階段會有大量流程和支出占用，涉及的相關(guān)方更加復(fù)雜，數(shù)據(jù)種類較多，也是目前大多的CRO涉及的領(lǐng)域。AI賦能可以將臨床試驗(yàn)流程效率大幅提高，同時也減少了出錯的概率。

5.1 作用靶點(diǎn)確認(rèn)

【技術(shù)核心】首先是數(shù)據(jù)的質(zhì)量和通量，其次是挖掘疾病和靶點(diǎn)、標(biāo)志物等之間的相關(guān)性。人工智能從文本分析切入，與靶點(diǎn)確認(rèn)結(jié)合。

·已知重要的藥物靶點(diǎn)（包括很多有名的蛋白及家族，例如GPCR、蛋白激酶等，被廣泛認(rèn)可的藥靶數(shù)量級約為1000個，其中約幾百個靶點(diǎn)被研究挖掘最為深入，有大量藥物針對它們設(shè)計(jì)；還有很多藥物設(shè)計(jì)較為困難、研究相對較少）；

·通過基因組學(xué)研究發(fā)現(xiàn)的新表觀遺傳靶點(diǎn)或標(biāo)志物（包括mRNA，cDNA等），這一類研究很多是人類基因組計(jì)劃的延伸，常見形態(tài)為收集來自廣泛人群的基因組做測序，進(jìn)而發(fā)現(xiàn)疾病與基因或表觀遺傳元件的相關(guān)性；

·大型針對某類疾病的隊(duì)列研究，會收集病人很多維度的信息（包括基因組、代謝組、表觀遺傳組、臨床用藥記錄等等）并做關(guān)聯(lián)分析。最典型的例子如TCGA，大量國家級集成研究項(xiàng)目也多資助這一類研究，以為攻克這一類嚴(yán)重且影響較大的疾??；

·對細(xì)胞或動物疾病模型的合成生物學(xué)研究，主要運(yùn)用先進(jìn)的基因敲除(siRNA, CRSIPR等)配合測序技術(shù)實(shí)現(xiàn)對細(xì)胞/動物模型的基因組干預(yù)或設(shè)計(jì)，繼而發(fā)現(xiàn)疾病機(jī)理中的關(guān)鍵機(jī)制和治療靶點(diǎn)；

·對文獻(xiàn)、公共數(shù)據(jù)的meta-analysis，基于新的邏輯框架或生物信息學(xué)方法等充分挖掘已有文獻(xiàn)和公共數(shù)據(jù)的信息并導(dǎo)向新的假設(shè)。

5.2 先導(dǎo)化合物篩選

【技術(shù)核心】建立候選藥物實(shí)體與一系列干預(yù)指標(biāo)之間的可靠預(yù)測模型。對于高通量篩選采用計(jì)算機(jī)視覺的方法，對于虛擬篩選采用深度學(xué)習(xí)的方法。

先導(dǎo)化合物篩選是人工智能在藥物研發(fā)領(lǐng)域最為活躍的領(lǐng)域，可根據(jù)設(shè)計(jì)目的不同分為兩類。一是是對給定靶點(diǎn)從頭設(shè)計(jì)新藥物，二是多靶點(diǎn)/多目標(biāo)性質(zhì)藥物發(fā)現(xiàn)。傳統(tǒng)的高通量篩選方法會在同一時間由機(jī)器人進(jìn)行數(shù)以百萬計(jì)的試驗(yàn)，成本高昂。

在這一階段，人工智能有兩種應(yīng)用方案。一種是利用深度學(xué)習(xí)開發(fā)虛擬篩選技術(shù)，利用超級計(jì)算機(jī)模擬分子化合物與靶點(diǎn)之間的相互作用，以取代高通量篩選；另一種是利用人工智能圖像識別技術(shù)優(yōu)化高通量篩選過程。并且根據(jù)目的不同，所使用的方法也不同。

·對給定靶點(diǎn)從頭設(shè)計(jì)新藥物，適用循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）、對抗生成網(wǎng)絡(luò)（GAN）

·多靶點(diǎn)/多目標(biāo)性質(zhì)藥物發(fā)現(xiàn)，適用深度神經(jīng)網(wǎng)絡(luò)（DNN）、卷積神經(jīng)網(wǎng)絡(luò)（CNN）、自動編碼器（Auto-encoder）

5.3 化合物優(yōu)化

【技術(shù)核心】物質(zhì)結(jié)構(gòu)和活性關(guān)系的確立

篩選出的先導(dǎo)化合物還需要對其構(gòu)效關(guān)系進(jìn)行繼續(xù)優(yōu)化。在這一階段要全面改進(jìn)先導(dǎo)化合物分子存在的缺陷。由于當(dāng)代藥物發(fā)現(xiàn)時某些化合物需要同時優(yōu)化20-30個指標(biāo)，且由于不同指標(biāo)之間的耦合關(guān)系，對分子的改造牽一發(fā)而動全身。

借助人工智能，能夠以直觀的方式定性推測生理活性物質(zhì)結(jié)構(gòu)與活性的關(guān)系，進(jìn)而推測靶酶活性位點(diǎn)的結(jié)構(gòu)和設(shè)計(jì)新的活性物質(zhì)結(jié)構(gòu)。可以進(jìn)一步提升藥物的構(gòu)效關(guān)系分析的速度，快速挑選最具安全性的化合物。

5.4 專利保護(hù)

藥物晶型不但決定了藥物的臨床效果，對專利保護(hù)也有巨大價值。藥物晶型專利是藥品化合物專利之后的最重要的專利，可以延長藥物專利2-6年，是原研藥企業(yè)阻止或推遲仿制藥企業(yè)在其化合物專利過期后將仿制藥推入市場的重要籌碼。對于重磅藥物而言，意味著數(shù)十億美元的市場價值。

人工智能可以預(yù)測出小分子藥物可能的全部晶型，為藥物專利保護(hù)做出貢獻(xiàn)，而不需擔(dān)心實(shí)驗(yàn)室空間有限而漏掉重要晶型。企業(yè)在更自信面臨仿制藥企的晶型專利挑戰(zhàn)的同時，大幅縮短了晶型開發(fā)的周期，更有效地挑選出合適的藥物晶型，減少成本。

5.5 病人識別及招募

人工智能能夠幫助企業(yè)更精準(zhǔn)的挖掘目標(biāo)患者，快速實(shí)現(xiàn)患者招募。

根據(jù)拜爾的數(shù)據(jù)，臨床試驗(yàn)中90%未能在規(guī)定時間內(nèi)找到數(shù)量足夠的患者，而平均耗費(fèi)的時間為指定時間的兩倍左右，其時間成本不可忽視。2016年，Biogen使用智能設(shè)備Fitbit追蹤多發(fā)性硬化癥患者的活動，其中77%的參與者完成后了續(xù)研究。這項(xiàng)實(shí)驗(yàn)顯示，有一小部分可穿戴設(shè)備使用者非常愿意自我量化，并分享他們的生理數(shù)據(jù)。使用數(shù)字健康設(shè)備（包括醫(yī)療級的可穿戴設(shè)備）招聘大量的志愿者參加臨床試驗(yàn)正在成為趨勢。

5.6 患者數(shù)據(jù)收集

在臨床中評估患者的健康狀況和身體數(shù)據(jù)，是傳統(tǒng)的新藥研發(fā)的典型流程。而在特定時間、特定空間獲取的數(shù)據(jù)并不能完全代表病人的準(zhǔn)確生理指標(biāo)，容易出現(xiàn)偏差。得益于可穿戴設(shè)備和機(jī)器學(xué)習(xí)，在這一階段數(shù)據(jù)的時間和空間來源都更為廣泛、能提升臨床試驗(yàn)中的患者參與度、數(shù)據(jù)質(zhì)量和操作效率。以Garmin為例，生命科學(xué)臨床研究領(lǐng)域云解決方案供應(yīng)商Medidata宣布與Garmin達(dá)成戰(zhàn)略合作，通過Garmin的健康手環(huán)與MedidataClinicalCloud相結(jié)合的方式提升臨床試驗(yàn)中的患者參與度、數(shù)據(jù)質(zhì)量和操作效率。

此外，臨床試驗(yàn)中仍存在相當(dāng)數(shù)量的無效數(shù)據(jù)，對該類數(shù)據(jù)的挑選耗時且枯燥。在全球來講，如今對于數(shù)據(jù)標(biāo)準(zhǔn)化的做法就是采用人類分析師來回顧在臨床試驗(yàn)當(dāng)中的數(shù)據(jù)點(diǎn)，或者監(jiān)察員飛到每個試驗(yàn)點(diǎn)采集數(shù)據(jù)。以往執(zhí)行過程當(dāng)中，我們發(fā)現(xiàn)，在這些手段之后，臨床試驗(yàn)仍然會出現(xiàn)大量的問題，所以需要尋找提升數(shù)據(jù)準(zhǔn)確率的方法。

同以Medidata為例，Medidata請到了一組前FDA（美國食品藥品監(jiān)督管理局）的數(shù)據(jù)分析師，由他們組成了這樣一個核心數(shù)據(jù)分析小組，他們設(shè)計(jì)了一個自動化的數(shù)據(jù)算法（Centralized Statistical Analytics - CSA），可自動尋找臨床試驗(yàn)當(dāng)中的錯誤數(shù)據(jù)。

6. 人工智能賦能醫(yī)藥研究優(yōu)缺點(diǎn)

AI+藥物挖掘優(yōu)點(diǎn)：

速度快：臨床前階段研發(fā)速度加快、臨床試驗(yàn)流程更為高效。
效率高：臨床試驗(yàn)階段數(shù)據(jù)有效性提升，數(shù)據(jù)獲取來源更為廣泛。
成本低：藥物研發(fā)過程節(jié)省大量開支，CRO的加入以及系統(tǒng)化大幅降低成本。
創(chuàng)新性：由于深度學(xué)習(xí)網(wǎng)絡(luò)的黑匣子特性，可能會發(fā)現(xiàn)現(xiàn)有知識體系難以尋找出的新藥物。
AI+藥物挖掘缺點(diǎn)：
依賴數(shù)據(jù)：過少的數(shù)據(jù)、錯誤的數(shù)據(jù)、低質(zhì)量的數(shù)據(jù)都會對挖掘出的藥物成果產(chǎn)生極大的影響，甚至完全沒有期待的療效。
預(yù)測不完全：AI預(yù)測出的藥物并不一定是所有的藥物。有一部分藥物有療效，但會成為漏網(wǎng)之魚。
預(yù)測錯誤：某些化合物的特征和訓(xùn)練完成提取出的網(wǎng)絡(luò)特征相似，即使沒有療效作用也會被篩選出來。
現(xiàn)有知識影響：在陌生的疾病領(lǐng)域，缺乏先驗(yàn)知識或評價體系，其研發(fā)進(jìn)展會變慢。

六

行業(yè)壁壘與競爭格局

1. 行業(yè)壁壘：堆砌成的一塊高地

行業(yè)壁壘主要可以分為人才壁壘、技術(shù)壁壘、數(shù)據(jù)壁壘、政策理解壁壘、客戶壁壘和質(zhì)量監(jiān)管壁壘。多塊壁壘將該領(lǐng)域堆砌成一塊高地，外部行業(yè)難以進(jìn)入。

2. 競爭格局：多寡頭共存

由于該產(chǎn)業(yè)的格局，終局不會僅有一家公司贏家通吃，而注定會是多寡頭共存，因?yàn)樯贽k方注定不會僅僅選擇一家軟件供應(yīng)商。當(dāng)然也會太多，一般為2-3家，可參考美國公司競爭格局。而隨著中國本土藥企和器械公司的發(fā)展，未來定有本土的人工智能輔助醫(yī)藥研究的公司成長為行業(yè)巨頭。

2.1 Atomwise

Atomwise成立于2012年，總部設(shè)在舊金山灣區(qū)。Atomwise是一家利用超級計(jì)算機(jī)進(jìn)行藥品研發(fā)的公司，致力于臨床前藥物的發(fā)現(xiàn)和開發(fā)。公司運(yùn)用深度學(xué)習(xí)模擬制藥過程，設(shè)計(jì)新的分子，預(yù)測新藥品的效果，幫助客戶更快地研發(fā)出更好的藥物，同時降低研發(fā)成本。

埃博拉病毒疫苗的研制是該公司的一個典型案例，Atomwise與多倫多大學(xué)合作，大學(xué)研究人員提供病毒生物學(xué)見解，公司提供核心人工智能技術(shù)。AI在一天之內(nèi)對現(xiàn)有的 7000多種藥物進(jìn)行分析測試，尋找出能控制埃博拉病毒的兩種候選藥物，成本不超過 1000 美元。如果利用傳統(tǒng)分析方法，類似研究需要耗時數(shù)月甚至數(shù)年，成本需要上億乃至數(shù)十億美元。

2.2 Schrodinger

Schr?dinger成立于1990年，總部位于美國紐約。 Schr?dinger在藥物研發(fā)過程中為客戶提供軟件和服務(wù), 以及形成協(xié)作和合作伙伴關(guān)系。

SchrodingerSuites是藥物發(fā)現(xiàn)的完整軟件包，其功能包括高通量虛擬篩選、化合物精確對接、藥效團(tuán)和3D-QSAR、全新藥物設(shè)計(jì)、酶催化研究、生物分子結(jié)構(gòu)模擬、ADME性質(zhì)預(yù)測、化學(xué)信息學(xué)等。

2.3 Medidata

Medidata 創(chuàng)始于 1999 年，總部位于美國紐約，中國總部在上海。Medidata幫助臨床研究人員縮短試驗(yàn)周期，實(shí)現(xiàn)可靠臨床數(shù)據(jù)的早期可視性，并保持嚴(yán)格的財務(wù)責(zé)任，提供創(chuàng)新技術(shù)，以加快將生命促進(jìn)治療推向市場的過程。

EDC系統(tǒng)是Medidata的優(yōu)勢產(chǎn)品，為臨床試驗(yàn)數(shù)據(jù)采集提高效率。Medidata已經(jīng)上市，截至2019年3月11日，其市值為44億美元。

2.4 Veeva

Veeva Systems成立于2006年，總部設(shè)在美國舊金山灣區(qū)。 Veeva是全球生命科學(xué)行業(yè)基于云計(jì)算模式的商業(yè)解決方案領(lǐng)導(dǎo)者，有VeevaVault云平臺管理研發(fā)流程。其中有Vault ETMF 臨床試驗(yàn)主文檔管理應(yīng)用、VaultQualitydocs質(zhì)量文檔管理應(yīng)用、Vault Submissions電子文檔提交管理應(yīng)用、Vault RIM監(jiān)管信息管理應(yīng)用套件。

此外Veeva還提供Veeva KOL數(shù)據(jù)和服務(wù)，搜尋和分析數(shù)據(jù)信息。Veeva已經(jīng)上市，截至2019年3月11日，市值為165億美元。

（完結(jié)）

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：生物_醫(yī)藥_科研 > 《待分類》

舉報/認(rèn)領(lǐng)