乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      Nat Rev Mol Cell Biol|深度學(xué)習(xí)如何影響單細胞數(shù)據(jù)分析

       智藥邦 2022-02-24

      2022年2月23日,俄亥俄州立大學(xué)醫(yī)學(xué)院生物醫(yī)學(xué)信息學(xué)系的 Qin Ma 和密蘇里大學(xué)電子工程和計算機科學(xué)系的 Dong Xu 在 Nat Rev Mol Cell Biol 雜志 (2020年影響因子94.444) 發(fā)表文章,介紹了深度學(xué)習(xí)方法在單細胞數(shù)據(jù)分析中應(yīng)用的進展、局限性、最佳實踐和前景。 

      以下是全文內(nèi)容。

      摘要

      深度學(xué)習(xí)在單細胞數(shù)據(jù)分析中具有巨大的潛力,但仍有許多挑戰(zhàn)和可能的新發(fā)展有待探索。在這篇文章中,我們考慮了將深度學(xué)習(xí)方法應(yīng)用于單細胞數(shù)據(jù)分析的進展、局限性、最佳實踐和前景。 

      前言

      單細胞技術(shù)極大地促進了我們對單個細胞的異質(zhì)性和功能多樣性的理解,并為生物學(xué)和精準醫(yī)學(xué)帶來了巨大的機會,特別是用于研究正在快速分化的細胞 (例如,在耐藥和腫瘤復(fù)發(fā)的情況下),進化成不同亞群的細胞 (例如,免疫細胞) 或?qū)ν獠康臄_動產(chǎn)生反應(yīng)的細胞 (例如,在COVID-19 發(fā)病機制中)。深度學(xué)習(xí) (DL) 重新定義了我們通過使用復(fù)雜的人工神經(jīng)網(wǎng)絡(luò)架構(gòu)來分析大規(guī)模數(shù)據(jù)的能力。DL 的力量最近在AlphaFold2的蛋白質(zhì)結(jié)構(gòu)預(yù)測中得到了證明,現(xiàn)在在單細胞數(shù)據(jù)分析中使用DL是可行的。

      具體來說,自動編碼器 (autoencoders,AE) 已被廣泛用于捕捉特征和提高信噪比,以便在單細胞研究中進行準確的細胞類型聚類、批量校正和基因插補。SAUCIE 將 AE 應(yīng)用于由180 名登革熱患者的 1100 萬個 T 細胞組成的數(shù)據(jù)集,確定了基于集群的急性登革熱感染特征和對登革熱的分層免疫反應(yīng)。同時,圖神經(jīng)網(wǎng)絡(luò) (GNN) 與注意機制相結(jié)合,使DL模型更加有效和可解釋。scGNN 是第一個用于 scRNA-seq 數(shù)據(jù)的同時執(zhí)行基因插補和細胞聚類的 GNN 模型;scGNN 在阿爾茨海默病中確定了十個神經(jīng)元集群 (neuron clusters) 和細胞類型特異性標志物 (cell-type-specific markers)。SpaGCN 是一個 GNN 模型,用于從空間分辨的轉(zhuǎn)錄組學(xué)數(shù)據(jù)中識別組織結(jié)構(gòu);SpaGCN 分離了人類原發(fā)性胰腺腫瘤的癌癥和非癌癥區(qū)域,并確定了區(qū)分癌癥區(qū)域的兩個標記基因。

      為單細胞研究開發(fā)深度學(xué)習(xí)的最佳實踐

      單細胞數(shù)據(jù)的高度異質(zhì)性可以借助通用的DL模型來設(shè)計和優(yōu)化,以無假設(shè)的方式在廣泛的研究課題中進行分析。外部生物知識或數(shù)據(jù) (例如,表型信息或大量的全基因數(shù)據(jù)) 可以被納入到模型中,以改進作為約束的預(yù)測。單細胞數(shù)據(jù)往往包含有限的基準標簽和注釋,這可能導(dǎo)致模型過擬合和性能不佳。幸運的是,在許多情況下,新興的半監(jiān)督學(xué)習(xí) (將少量的標記數(shù)據(jù)與大量的無標記數(shù)據(jù)相結(jié)合 )和自我監(jiān)督學(xué)習(xí) (借助數(shù)據(jù)的其他部分/屬性,預(yù)測任何部分/屬性,構(gòu)建無標簽數(shù)據(jù)的數(shù)據(jù)表示) 往往可以實現(xiàn)同樣有洞察力的結(jié)果而不需要額外的標簽。此外,為了提高DL模型的可信度,特別是在不同的實驗平臺和條件下的模型泛化,以及對數(shù)據(jù)中噪音的魯棒性,開發(fā)者最好提供方法學(xué)的使用范圍,并證明對于什么樣的數(shù)據(jù)或在什么樣的情況下DL會有好的或不好的效果。此外,提供一些預(yù)測結(jié)果的置信度評估 (如 P 值或 Z-cores) 可以指導(dǎo)用戶進行生物推斷。

      憑借廣泛的內(nèi)置功能,可組合的DL管道可以幫助完成自動化模型開發(fā)中涉及的復(fù)雜的和重復(fù)的任務(wù)。這種可組合性允許收集適當?shù)馁Y源,以確保在軟件控制下定制系統(tǒng)??山M合的DL可以被開發(fā)者用來配置易于使用的白盒模型,以可定制的方式解決各種單細胞的研究課題,而不會帶來太多挑戰(zhàn)。此外,為其他開發(fā)者和普通用戶提供結(jié)構(gòu)良好的源代碼、實踐教程和清晰的協(xié)議文檔,包括包含的格式、處理步驟、模型訓(xùn)練、代碼版本、確??芍貜?fù)性的教程和參數(shù)調(diào)整,是一種良好的做法。

      在單細胞生物學(xué)中應(yīng)用深度學(xué)習(xí)的最佳實踐

      DL用戶通常發(fā)現(xiàn),根據(jù)可用性和準確性來決定何時和如何選擇DL工具進行單細胞數(shù)據(jù)分析是一個挑戰(zhàn)。與已經(jīng)廣泛用于單細胞數(shù)據(jù)分析的Seurat相比,DL可能會發(fā)現(xiàn)更多內(nèi)在的關(guān)系和機制。選擇最適合的DL模型通常由特定的目標驅(qū)動,例如,是用于細胞聚類還是細胞分類,以及特征順序是否重要或不同模態(tài)之間的拓撲關(guān)系是否重要。其他考慮因素包括數(shù)據(jù)結(jié)構(gòu) (例如,表格、順序、時間序列或圖形結(jié)構(gòu))、數(shù)據(jù)大小和計算費用 (多任務(wù)和多模式學(xué)習(xí))。附表提供了關(guān)于代表性DL工具的主要功能、核心模型和生物學(xué)解釋的信息和指南。由于用于單細胞數(shù)據(jù)分析的DL模型尚未成熟,運行多個工具以了解它們的比較情況可能很有價值。此外,全面的單細胞DL基準測試論文可以幫助用戶選擇最佳模型。

      深度學(xué)習(xí)在單細胞數(shù)據(jù)分析中的局限性

      盡管現(xiàn)有的DL工具已經(jīng)證明了它們在各種環(huán)境下分析單細胞數(shù)據(jù)的能力,但它們還沒有被獨立的研究小組廣泛地用于他們的生物研究中。附表只包括原始方法論論文的案例研究。雖然新技術(shù)的建立往往需要時間,但目前單細胞數(shù)據(jù)分析中的DL方法的局限性也是障礙。特別是,DL方法往往需要大量的數(shù)據(jù)和計算資源來訓(xùn)練;它們的結(jié)果可能不是穩(wěn)健的 (由于數(shù)據(jù)噪音、參數(shù)設(shè)置和新的輸入數(shù)據(jù),性能會發(fā)生變化);大多數(shù)DL模型是黑盒子,缺乏可擴展性;幾乎所有的DL工具都需要大量的計算機技能來使用。因此,在DL方法的發(fā)展和它在不同生物系統(tǒng)中的廣泛應(yīng)用之間仍然存在著差距。接下來,我們將討論填補這一空白的前景。

      深度學(xué)習(xí)在單細胞數(shù)據(jù)分析中的前景

      DL在單細胞數(shù)據(jù)分析中的應(yīng)用為未來的探索帶來了巨大的希望。前沿DL方法快速發(fā)展,分析方法的開發(fā)也在不斷適應(yīng)。由于單細胞生物學(xué)中可用的注釋數(shù)據(jù)有限,因此應(yīng)用主動學(xué)習(xí) (以交互方式建議新的數(shù)據(jù)標記以訓(xùn)練模型) 來基于少量訓(xùn)練樣本構(gòu)建模型是有發(fā)展空間的。更多地采用端到端DL框架 (例如在AlphaFold2中) 可以促進更全面和整體地使用訓(xùn)練數(shù)據(jù)來說明所有的輸入特征和關(guān)系?;谀P偷腄L預(yù)計將進一步滲透到單細胞生物學(xué)中。結(jié)構(gòu)或拓撲感知方法,物理啟發(fā)和生物信息框架將知識集成到DL模型中以用于其他應(yīng)用,在單細胞生物學(xué)中可以預(yù)期有類似的應(yīng)用。此外,可解釋的DL的發(fā)展可以支持對潛在的生物機制進行更好的解釋,包括因果或調(diào)節(jié)關(guān)系、細胞類型對外部刺激的特定反應(yīng),以及驅(qū)動疾病或表型的細胞亞群。

      另一個趨勢是降低在單細胞數(shù)據(jù)分析中應(yīng)用DL技術(shù)的障礙。我們相信,開發(fā)集成系統(tǒng)和部署云平臺將使沒有編程技能的用戶能夠通過 Web 服務(wù)或連接到在線資源的 docker,來使用單細胞DL工具。此外,模塊化的框架設(shè)計,由于其靈活性,可以利用單個DL模型和單細胞知識。值得注意的是,為可用于DL的數(shù)據(jù)、代碼和模型建立明確的標準,將有望吸引更多的開發(fā)者開發(fā)開源/訪問的DL工具,這反過來又可以擴大深入的單細胞數(shù)據(jù)分析。這些工具還可以幫助培訓(xùn)下一代的研究人員和臨床醫(yī)生,特別是讓精準醫(yī)療更容易交付給醫(yī)療實踐。

      基于DL的方法已經(jīng)在廣泛的單細胞研究中顯示出其優(yōu)越性,如了解與感知和復(fù)雜行為有關(guān)的腦細胞類型的復(fù)雜性,推斷腫瘤和免疫細胞群的高度多樣性,以大大加快發(fā)現(xiàn)新的發(fā)病機制和癌癥治療方法。我們預(yù)計此類研究將大大擴展,以提供獨特的見解,如果不結(jié)合單細胞數(shù)據(jù)和DL技術(shù),很可能無法獲得這些見解。另一個不斷增長的領(lǐng)域是DL模型從可預(yù)測和可解釋遷移到更可操作,即可以直接產(chǎn)生醫(yī)療的建議,如治療靶點、藥物再利用和藥物組合。

      附表:

      為單細胞數(shù)據(jù)分析開發(fā)的深度學(xué)習(xí)工具的例子和最佳實踐

      參考資料

      Ma, Q., Xu, D. Deep learning shapes single-cell data analysis. Nat Rev Mol Cell Biol (2022). https:///10.1038/s41580-022-00466-x

        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多