Nature Synthesis是Nature出版集團(tuán)于2022年1月創(chuàng)辦的期刊,旨在匯集來自化學(xué)和材料合成各個領(lǐng)域的基于有機(jī)、無機(jī)、有機(jī)金屬和材料化學(xué)的工作,以及這些學(xué)科的跨學(xué)科研究。 2023年1月30日,來自北卡羅來納州立大學(xué)化學(xué)與生物分子工程系的Milad Abolhasani等人在Nature Synthesis發(fā)表文章The rise of self-driving labs in chemical and materials sciences。 ![]() 該文介紹了自動化實驗室近年來的發(fā)展現(xiàn)狀和實施路線圖。 摘要 加快發(fā)現(xiàn)新的分子和材料,以及開發(fā)綠色和可持續(xù)的合成方法,將有助于解決能源、可持續(xù)性和醫(yī)療保健方面的全球挑戰(zhàn)。最近,數(shù)據(jù)科學(xué)和自動化實驗技術(shù)的發(fā)展推動了整合機(jī)器學(xué)習(xí)、實驗室自動化和機(jī)器人技術(shù)的自我驅(qū)動實驗室(self-driving labs,SDLs)的出現(xiàn)。 SDL是一個機(jī)器學(xué)習(xí)輔助的模塊化實驗平臺,它可以迭代操作由機(jī)器學(xué)習(xí)算法選擇的一系列實驗,以實現(xiàn)用戶定義的目標(biāo)。這些智能機(jī)器人助手通過對化學(xué)空間的快速探索,幫助研究人員加快基礎(chǔ)和應(yīng)用研究的步伐。 在這篇綜述中,我們介紹了SDL,并提供了非專業(yè)科學(xué)家實施它們的路線圖。我們介紹了SDL在該領(lǐng)域成功實施的現(xiàn)狀,并討論了它們目前的局限性和未來的機(jī)會。 主要內(nèi)容 為能源、可持續(xù)發(fā)展和醫(yī)療保健方面的全球挑戰(zhàn)尋找切實的解決方案非常重要。然而,目前應(yīng)對這些挑戰(zhàn)的策略是時間、資源和勞動密集型的。 這些例子有一個共同的挑戰(zhàn):需要探索大量的連續(xù)和離散的實驗變量,以找到最有效的成分以及分子和材料的制造路線。目前在化學(xué)和材料科學(xué)中的探索策略依賴于先前的知識,并且在實驗中依賴于一次一次地或以組合方式改變變量。盡管這些方法簡單明了,但它們并不能滿足化學(xué)和材料科學(xué)中解決相關(guān)挑戰(zhàn)所需的探索速度。盡管最初非常有希望,但組合篩選策略并沒有在能源材料或小分子領(lǐng)域取得重大突破,原因是每增加一個實驗變量,所需的實驗數(shù)量就會呈指數(shù)級增長。 實驗探索化學(xué)空間的巨大規(guī)模和高維度(維度在此指連續(xù)或離散的實驗變量),意味著需要新的綜合策略來加速發(fā)現(xiàn)新分子和先進(jìn)功能材料,并為它們的放大合成和制造找到可持續(xù)的方法。 機(jī)器人技術(shù)和人工智能的最新進(jìn)展為重塑實驗化學(xué)和材料科學(xué)的研究提供了一個令人興奮的機(jī)會。ML、實驗室自動化(例如合成、分離、純化和表征)和機(jī)器人技術(shù)(例如試劑制備和不同實驗?zāi)K之間的樣品轉(zhuǎn)移)的融合推動了"自我驅(qū)動實驗室(SDLs)"的發(fā)展。 SDL采用了過去十年學(xué)術(shù)界和工業(yè)界在實驗室自動化、反應(yīng)小型化(通過流動化學(xué)和微流控技術(shù))和在線分析表征方面取得的科學(xué)和技術(shù)進(jìn)展。與傳統(tǒng)化學(xué)和材料科學(xué)實驗室中依賴人類的實驗環(huán)境相比,SDL使用機(jī)器人操作多種重復(fù)性任務(wù)(這些任務(wù)耗時長、要求精確或在處理有毒或易燃化學(xué)品時有安全問題),而計算機(jī)在某些任務(wù)中可以勝過人類科學(xué)家,如處理高維大數(shù)據(jù)。 通過這種方式,SDL解決了傳統(tǒng)化學(xué)和材料科學(xué)實驗室的三個挑戰(zhàn):(1)低效和緩慢的實驗空間探索,(2)不同實驗階段之間的物理隔斷,(3)執(zhí)行一個實驗和選擇下一個實驗的時間間隔。 ![]() 圖1:傳統(tǒng)實驗室與自我驅(qū)動實驗室 研究人員從傳統(tǒng)化學(xué)和材料科學(xué)實驗室(a)過渡到SDL(b)的圖示,通過使用模塊化機(jī)器人實驗和實驗的智能規(guī)劃,來解決當(dāng)前互不關(guān)聯(lián)的實驗工作流程的挑戰(zhàn)。 通過實驗?zāi)K的機(jī)器人集成,SDLs將原本物理上不相干的試劑制備、合成、表征和性能評估等階段連接起來,建立了一個端到端的實驗工作流程,以加速新分子和材料的合成和開發(fā)。 通過加入ML,SDL可以智能地探索化學(xué)空間,而不是一次改變一個變量,同時最大限度地減少或消除獲得實驗結(jié)果和為下一個實驗條件作出決策之間的時間差距。 智能機(jī)器人助手的目的是加速發(fā)現(xiàn),并利用化學(xué)家和材料科學(xué)家的時間來解決高水平的科學(xué)問題。例如,為圖1a所示的每個研究人員提供一個研究加速度為10倍的SDL(圖1b),可以使他們的整體研究生產(chǎn)率提高至少30倍,這使得他們可以研究新的科學(xué)問題。因此,SDL重塑了操作員和/或研究人員在化學(xué)和材料科學(xué)工作流程中的角色(圖1b)。 在過去的十年中,SDL在加速分子和材料的合成和制造方面有很好的應(yīng)用,例如碳納米管、復(fù)雜的有機(jī)化合物、納米材料、相變記憶材料和薄膜材料。然而,SDL在化學(xué)和材料科學(xué)中的應(yīng)用仍然是有限的。導(dǎo)致SDL進(jìn)展緩慢的原因是缺乏:(1)標(biāo)準(zhǔn)化和具有成本效益的硬件,(2)容易獲得的軟件,(3)方便化學(xué)家和材料科學(xué)家的操作指南,(4)基于物理學(xué)的模型與自主實驗的結(jié)合。 這篇綜述介紹了用于實驗化學(xué)和材料科學(xué)的SDL,并強(qiáng)調(diào)了最近自主合成有機(jī)分子和功能(納米)材料的成功案例。同時提供了在傳統(tǒng)化學(xué)和材料科學(xué)實驗室啟動SDL的路線圖,并討論了成功實施SDL的步驟。 化學(xué)和材料科學(xué)中的SDL SDL是一個智能實驗平臺,配備了不同的硬件模塊,以閉環(huán)的形式迭代操作由ML算法選擇和規(guī)劃的一系列合成或物理過程,以實現(xiàn)預(yù)定的目標(biāo)。SDL的閉環(huán)操作是指通過遵循一系列自動化的任務(wù)、獲取實驗數(shù)據(jù)、更新ML模型并對SDL要測試的下一組實驗條件做出決定來執(zhí)行ML選擇的實驗的循環(huán)。通過智能實驗計劃,SDL產(chǎn)生的大數(shù)據(jù)可以迅速提供有關(guān)復(fù)雜多階段反應(yīng)的基本反應(yīng)機(jī)制的重要信息。 圖2說明了SDLs最近在化學(xué)和材料科學(xué)中的實施情況。例如,SDLs實現(xiàn)了半導(dǎo)體的閉環(huán)合成-屬性關(guān)系映射(圖2a)和按需合成(圖2b),比傳統(tǒng)技術(shù)快1000倍以上。一個連續(xù)8天無人看管的SDL操作(688次實驗)揭示了一種有效的光催化劑配方,用于從水中產(chǎn)生氫氣,其活性比現(xiàn)有技術(shù)高6倍(圖2e)。 ![]() 圖2:SDLs在化學(xué)和材料科學(xué)中的成功例子 SDLs的路線圖 考慮在化學(xué)或材料科學(xué)研究中采用SDL的科學(xué)家最常問的問題是:我應(yīng)該從哪里開始、哪些ML算法可以用于實驗選擇和數(shù)據(jù)挖掘、建立一個SDL需要多長時間、建立一個SDL的成本是多少。 這些問題的答案與要制備的分子或材料的類型以及研究的目標(biāo)直接相關(guān)。圖3a展示了SDL的一般路線圖,旨在回答"我應(yīng)該從哪里開始"這個問題。 從硬件的角度來看,目標(biāo)分子或材料的類別決定了所需SDL硬件模塊的選擇,即指定試劑和反應(yīng)的類型(即氣相、液相或固相),以及必要的表征技術(shù)。從軟件的角度來看,SDL操作的目標(biāo)也決定了智能實驗計劃的范圍和SDL閉環(huán)所需的軟件組件。 ![]() 圖3:SDL的路線圖 a, 在化學(xué)和材料科學(xué)實驗室建立SDL的方法概述。b, 一個使用機(jī)器人液體處理和基于孔板的合成建立的SDL的流程圖。c, 一個端到端SDL的流程圖,用于在無空氣和水分環(huán)境下加速清潔能源材料和設(shè)備的協(xié)同設(shè)計。 如圖3a所示,SDL不同模塊之間的樣品轉(zhuǎn)移可以由固定的或移動的機(jī)器人處理,或者使用泵、閥門和管道。 帶有流體樣品傳輸和固定式機(jī)械臂的SDL配置需要定制開發(fā),并將表征模塊與SDL的合成模塊具體整合,而移動式機(jī)器人則是對傳統(tǒng)化學(xué)和材料科學(xué)實驗室的一種改裝。除了樣品轉(zhuǎn)移,機(jī)器人手臂還可用于自主重新配置從起始試劑到最終純化產(chǎn)品的端到端模塊化工作流程,這大大擴(kuò)展了SDL探索連續(xù)和離散變量的能力,并能夠進(jìn)入比傳統(tǒng)實驗平臺更大的設(shè)計空間。 從軟件角度看,不同SDL模塊之間的數(shù)據(jù)流是閉環(huán)操作的關(guān)鍵點。使用強(qiáng)大的數(shù)據(jù)表征和元數(shù)據(jù)跟蹤策略的可靠數(shù)據(jù)流,即記錄和報告每個實驗的潛在特征,是真正將分子和材料的合成和制造數(shù)字化的必要條件,具有可擴(kuò)展和可轉(zhuǎn)讓的知識。只有當(dāng)SDL測試的所有反應(yīng)的標(biāo)準(zhǔn)化和可靠的數(shù)字?jǐn)?shù)據(jù)變得容易獲得時,加速發(fā)現(xiàn)才成為可能。 SDLs結(jié)合了ML建模和實驗數(shù)據(jù)的不確定性量化或遺傳算法,以順序、閉環(huán)和自適應(yīng)的方式有效探索分子或(納米)材料的合成設(shè)計空間。自主實驗的這個關(guān)鍵的適應(yīng)性方面利用了數(shù)據(jù)驅(qū)動的ML模型的不確定性量化,以克服非適應(yīng)性組合篩選技術(shù)的局限性。 建立一個SDL需要多長時間?建立一個SDL的成本是多少?這些問題的答案與所需實驗?zāi)K的復(fù)雜性(例如,單階段與多階段實驗)、操作過程條件的范圍和數(shù)量(例如,壓力和溫度)、溶劑的類型、所需的表征技術(shù)和可接受的精度直接相關(guān)。為化學(xué)和材料科學(xué)實驗室建立一個可靠的、具有高度可重復(fù)性的SDL,可能需要幾周到1-2年的時間,費(fèi)用從不到1000美元到超過100萬美元。 SDL的成功案例 在過去的五年中,概念驗證SDL(例如Chemputer、BEAR、CAMEO和Artificial Chemist)被成功地用于自主合成納米粒子、聚合物和共聚物、薄膜材料、碳納米管、超分子團(tuán)塊、復(fù)雜的有機(jī)分子、光催化劑和形狀記憶材料,應(yīng)用于添加劑制造、液體產(chǎn)品配方、藥品和清潔能源技術(shù)。 圖4顯示了SDL硬件和機(jī)器人集成的三種方法。 ![]() 圖4:機(jī)器人技術(shù)在SDL中的應(yīng)用 移動式(a)、固定式(b)或流體式(c)機(jī)器人的照片,用于SDLs的實驗?zāi)K之間的自動樣品轉(zhuǎn)移。 移動機(jī)器人(圖4a)的獨特之處在于可以方便地使用化學(xué)實驗室中的常規(guī)表征技術(shù),而不需要與SDL的合成模塊直接整合。盡管有這一優(yōu)勢,但移動機(jī)器人的成本很高,它能提供精確和可重復(fù)的樣品轉(zhuǎn)移,并有多個抓手,這對這種SDL來說是一個主要瓶頸。 圖5顯示了平行間歇式反應(yīng)器(圖5a)和流動式反應(yīng)器(圖5b)的例子,用來在SDL中自動進(jìn)行反應(yīng)。 ![]() 圖 5: SDL反應(yīng)器的多樣性 平行間歇式反應(yīng)器(a)和小型流動反應(yīng)器(b)用于薄膜材料(a,左)、金屬納米顆粒(a,右)、活性藥物成分(b,左)和膠體量子點,QD(b,右)的控制合成。 從表征的角度來看,在線和離線模塊,如定制開發(fā)的光譜技術(shù)和成像工具,以及現(xiàn)成的分析單元,如高效液相色譜、傅立葉變換紅外光譜、核磁共振光譜和氣相色譜,都已經(jīng)成功地與SDL整合,用于自主合成和開發(fā)功能材料和分子。 此外,在線表征模塊可以在多階段合成或材料制造的每個階段后提供測量的機(jī)會。這種中間階段的信息可以通過早期識別更有利的合成路線來加速在多階段過程的高維空間中進(jìn)行搜索。SDL與在線表征技術(shù)的整合利用了過去20年通過芯片上的實驗室技術(shù)的出現(xiàn)和發(fā)展而開發(fā)的大量硬件開發(fā)和在線反應(yīng)采樣技術(shù)。除了常見的光譜表征技術(shù)外,使用電子顯微鏡(透射電子顯微鏡和掃描電子顯微鏡)和小角度和廣角X射線散射對制造的(納米)材料進(jìn)行結(jié)構(gòu)表征也可以與SDL整合。 從ML的角度來看,一系列適合處理連續(xù)和離散參數(shù)的策略,從貝葉斯優(yōu)化到進(jìn)化算法(例如協(xié)方差矩陣適應(yīng)進(jìn)化策略和遺傳算法)已經(jīng)成功地在SDL中實施,用于加速開發(fā)和按需合成有機(jī)分子、納米材料和薄膜材料。 SDL的局限性和未來機(jī)遇 盡管SDL在加速合成復(fù)雜的有機(jī)分子和先進(jìn)的(納米)材料方面有成功的概念驗證案例,但仍有許多機(jī)會需要進(jìn)一步研究和開發(fā)。 首先,對于自主機(jī)器人實驗的非專業(yè)人員來說,SDL從復(fù)雜的定制開發(fā)技術(shù)過渡到實驗化學(xué)和材料科學(xué)的主流方法,需要在硬件開發(fā)方面取得重大進(jìn)展,這包括模塊工程和在線表征技術(shù),以減少進(jìn)入障礙,如成本、模塊組裝、操作和故障排除。機(jī)器人和表征模塊的高成本,定制開發(fā)的模塊的復(fù)雜組裝和大量的故障排除,所有這些加上硬件模塊、數(shù)據(jù)流、數(shù)據(jù)表示和智能實驗選擇算法的缺乏標(biāo)準(zhǔn)化,是目前SDL的主要限制。但SDL的初始成本障礙是化學(xué)和材料科學(xué)領(lǐng)域研究加速的一個有利機(jī)會。此外,最近世界各地云實驗室的增長為早期職業(yè)研究人員提供了另一個潛在的途徑,使他們能夠在沒有重大資本投資的情況下獲得最先進(jìn)的機(jī)器人實驗設(shè)施。 科學(xué)家們在整個化學(xué)和材料科學(xué)領(lǐng)域采用SDL,將意味著研究實驗室的高度智能化和靈活自動化,并具有自主可重構(gòu)的實驗?zāi)K。與小分子材料相比,自主開發(fā)先進(jìn)功能材料的挑戰(zhàn)在于文獻(xiàn)中缺乏可重復(fù)的數(shù)據(jù)。不過,盡管證明有偏差,但在有機(jī)合成方面已經(jīng)實現(xiàn)了,并成功地實現(xiàn)了數(shù)據(jù)驅(qū)動的逆向合成或高度精確的反應(yīng)預(yù)測,但在高級(納米)材料方面卻基本上失敗了。然而,這種失敗為SDL創(chuàng)造了一個獨特的機(jī)會??偟膩碚f,SDL可以通過數(shù)字化、增強(qiáng)準(zhǔn)確性、可轉(zhuǎn)移的知識和最大限度地減少人為錯誤的影響來提高實驗數(shù)據(jù)的可重復(fù)性。 盡管可以利用移動或固定的機(jī)械臂在不同模塊之間轉(zhuǎn)移液相試劑或產(chǎn)品,或自動重新配置SDL,但在處理固相試劑的SDL中,或在需要更強(qiáng)大的表征技術(shù)(如核磁共振光譜)的情況下,大多需要這些機(jī)械臂。處理固相反應(yīng)、試劑或樣品的SDL的一個關(guān)鍵要求是需要使用機(jī)器人技術(shù)進(jìn)行精確的固體粉末計量,并在不同的SDL模塊之間進(jìn)行快速和可靠的樣品轉(zhuǎn)移。盡管在過去的20年里,機(jī)器人和固體噴點技術(shù)取得了快速的發(fā)展,但精確的固體噴點和機(jī)器人手臂的高成本,以及所需的精度、可重復(fù)性、移動性和速度,對SDL的廣泛實施構(gòu)成了限制。因此,采用SDL的下一個關(guān)鍵步驟是開發(fā)具有成本效益的移動機(jī)器人操縱器,以實現(xiàn)SDL設(shè)計的自動重新配置和適應(yīng)工作空間的動態(tài)變化的靈活性。降低移動機(jī)器人機(jī)械手的成本,可以在SDL中加入多個機(jī)器人,這樣可以防止在特定機(jī)器人可能出現(xiàn)故障的情況下,SDL的閉環(huán)操作出現(xiàn)中斷。 SDL的一個重要的軟件方面是它們與ML的強(qiáng)大和靈活的整合,為在分子和材料的設(shè)計空間中的導(dǎo)航提供自主性??焖僭鲩L的ML建模和實驗選擇策略清單使得算法選擇對非專家來說是一項具有挑戰(zhàn)性的任務(wù)。這一挑戰(zhàn)對于SDL未來的發(fā)展是一個令人興奮的機(jī)會,它可以使ML算法標(biāo)準(zhǔn)化,適合不同的端到端實驗工作流程、操作模式(探索、開發(fā)或機(jī)理研究)和目標(biāo)分子或(納米)材料類別。 隨著未來幾年SDL的實驗?zāi)K和獨立輸入?yún)?shù)數(shù)量的增加,將需要更多的數(shù)據(jù)和/或物理信息的ML策略,以減少計算和實驗的總成本,以發(fā)現(xiàn)新的材料和分子或可持續(xù)的方式來大規(guī)模制造它們。 SDL最吸引人的方面之一是它們的遠(yuǎn)程操作能力,通過云端或遠(yuǎn)程連接來定義SDL操作的下一個目標(biāo),這一點在很大程度上還沒有被開發(fā)出來。自動訪問起始試劑庫,結(jié)合可靠和可重復(fù)的自動樣品制備、合成以及在線和離線表征技術(shù),將會大大減少SDL操作過程中研究人員在實驗室的時間。 參考資料 Abolhasani, M., Kumacheva, E. The rise of self-driving labs in chemical and materials sciences. Nat. Synth (2023). https:///10.1038/s44160-022-00231-0 |
|