大家好,這里是專注表觀組學(xué)十余年,領(lǐng)跑多組學(xué)科研服務(wù)的易基因。 生物過(guò)程具有復(fù)雜性和整體性,單組學(xué)數(shù)據(jù)難以系統(tǒng)全面解析復(fù)雜生理過(guò)程的分子調(diào)控機(jī)制。而多組學(xué)(Multi-omics)聯(lián)合分析可同時(shí)實(shí)現(xiàn)從“因”和“果”兩個(gè)層面研究生物學(xué)問(wèn)題,并對(duì)其相關(guān)性進(jìn)行驗(yàn)證。高通量技術(shù)的發(fā)展,通過(guò)對(duì)多組學(xué)數(shù)據(jù)整合分析,已成為科學(xué)家探索生命機(jī)制的新方向。 多組學(xué)研究是探究生物系統(tǒng)中多種物質(zhì)之間互作的方法,包括基因組學(xué)、表觀基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、微生物組學(xué)等,這些物質(zhì)共同影響生命系統(tǒng)的表型、性狀等。 什么是多組學(xué)關(guān)聯(lián)分析? 關(guān)聯(lián)分析是一種實(shí)用的分析技術(shù),就是發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而描述一個(gè)事物中某些屬性同時(shí)變化的規(guī)律和模式。 需要特別注意的是:相關(guān) ≠ 因果;相關(guān) ≠ 必然 因果關(guān)系的論證一般需要嚴(yán)密的分子實(shí)驗(yàn)。 圖示:分子的相互作用,產(chǎn)生關(guān)聯(lián) 組學(xué)技術(shù)及其關(guān)聯(lián)性 不同組學(xué) ① 表觀組(差異表觀分子特征):甲基化、組蛋白修飾、開(kāi)放染色質(zhì)區(qū)、lncRNA、circleRNA、miRNA... ... ② 轉(zhuǎn)錄組(差異基因表達(dá)):mRNA ③ 蛋白組(差異蛋白):蛋白質(zhì) ④ 代謝組(差異代謝物):代謝物 ⑤ 微生物組(差異菌群):菌群結(jié)構(gòu) 多組學(xué)關(guān)聯(lián)的意義:串聯(lián)證據(jù),互相驗(yàn)證,從不同的角度合力探索和解釋生物學(xué)問(wèn)題 判斷組學(xué)之間是否可以進(jìn)行關(guān)聯(lián):是否有關(guān)聯(lián)的生物學(xué)理論基礎(chǔ)。 如: · 啟動(dòng)子區(qū)甲基化會(huì)抑制基因的表達(dá)。 · 基因主體甲基化與基因表達(dá)正相關(guān)。 · 開(kāi)放染色質(zhì)狀態(tài)與基因表達(dá)有關(guān)。 · 蛋白質(zhì)是mRNA翻譯的產(chǎn)物。 · miRNA可與mRNA相互作用影響其表達(dá)和翻譯 關(guān)聯(lián)分析的主要套路 基于參考文獻(xiàn)和數(shù)據(jù)庫(kù):項(xiàng)目異質(zhì)性強(qiáng),Case by Case 模式 基于代謝通路等已知數(shù)據(jù)庫(kù):高度依賴已知代謝網(wǎng)絡(luò)解讀深度,無(wú)法探索未知 基于統(tǒng)計(jì)學(xué):數(shù)據(jù)最樸質(zhì)的結(jié)構(gòu)特征解析,可以獲取未知信息,甚至可以為拓展新的知識(shí)體系提供幫助 圖示:實(shí)際應(yīng)用中往往三管齊下 易基因主要表觀組學(xué)技術(shù)分類
圖示:易基因組學(xué)技術(shù)研究?jī)?nèi)容 多組學(xué)關(guān)聯(lián)分析方法 (1) 直接關(guān)聯(lián) 一個(gè)基因的功能元件甲基化情況影響該基因的表達(dá)。 · 重疊分析 · Pearson/Spearman 相關(guān)性分析 (2)模型關(guān)聯(lián) 基于基因轉(zhuǎn)錄、蛋白質(zhì)、代謝物等之間的上下游相互作用聯(lián)系。 · 多元線性模型(multiple linear model) (3)網(wǎng)絡(luò)關(guān)聯(lián) 基于分子功能和通路的富集性。 · WGCNA module correlation · EMDN algorithm · SNF algorithm 多組學(xué)關(guān)聯(lián)分析方法圖例 (1)直接關(guān)聯(lián) ① 重疊分析 特點(diǎn):簡(jiǎn)單粗暴,也適用于樣本量少的情況。 分析結(jié)果:韋恩圖。 圖例:WGBS + total RNA-seq,含DMR的差異表達(dá)基因、差異miRNA靶向的差異表達(dá)基因、差異siRNA靶向的差異表達(dá)基因三者之間的重疊關(guān)系分析 關(guān)聯(lián)理論基礎(chǔ):DNA甲基化、miRNA和siRNA協(xié)同作用調(diào)控基因表達(dá)。 ② 皮爾森/斯皮爾曼相關(guān)性分析 特點(diǎn):準(zhǔn)確計(jì)算相關(guān)性程度(R值),及其顯著性(p值)。 分析結(jié)果:散點(diǎn)圖(+擬合線)、相關(guān)性熱圖 圖例:血液組織RRBS+RNA-seq,DMR的甲基化水平與差異表達(dá)的表達(dá)水平之間的皮爾森關(guān)聯(lián)分析。 關(guān)聯(lián)理論基礎(chǔ):DNA甲基化可直接調(diào)控基因表達(dá)。 圖例:腸道宏基因組+宏病毒組,健康與炎癥性腸?。║C)組分別計(jì)算噬菌體與細(xì)菌豐度之間的皮爾森相關(guān)性并發(fā)現(xiàn)差異。 關(guān)聯(lián)理論基礎(chǔ):噬菌體可侵染細(xì)菌進(jìn)而影響腸道菌群的結(jié)構(gòu)。 圖例:胚胎scRNA-seq+蛋白質(zhì)組,兩連續(xù)發(fā)育階段之間的RNA和表蛋白質(zhì)表達(dá)的相關(guān)性分析。 關(guān)聯(lián)理論基礎(chǔ):RNA轉(zhuǎn)錄和蛋白質(zhì)翻譯具有上下游關(guān)系。 圖例:腸道宏基因組+代謝組,不同管理狀態(tài)下川金絲猴腸道中短鏈脂肪酸與腸道菌群的皮爾森相關(guān)性分析。 關(guān)聯(lián)理論基礎(chǔ):腸道中有多類菌群可直接產(chǎn)生短鏈脂肪酸這類益生物質(zhì)。 (2)模型關(guān)聯(lián) 回歸分析(regression analysis)是確定兩組或兩組以上變量間關(guān)系的統(tǒng)計(jì)方法?;貧w分析按照變量的數(shù)量分為一元回歸和多元回歸。兩個(gè)變量使用一元回歸,兩個(gè)以上變量使用多元回歸。 多元線性回歸模型(multiple linear model) 特點(diǎn):基于基因表達(dá)、蛋白質(zhì)、代謝物等之間的直接和間接相互作用聯(lián)系。 分析結(jié)果:關(guān)聯(lián)網(wǎng)絡(luò)圖 圖例:腸道菌群16S+血液代謝組+肝臟轉(zhuǎn)錄組,通過(guò)多元線性模型關(guān)聯(lián)分析,篩選出若干優(yōu)秀模型,組建低劑量抗生素飼喂促進(jìn)仔豬快速生長(zhǎng)的多組學(xué)調(diào)控網(wǎng)絡(luò)。 關(guān)聯(lián)理論基礎(chǔ):腸道菌群可通過(guò)產(chǎn)生代謝物進(jìn)入血液,運(yùn)輸至肝臟影響肝臟細(xì)胞的基因表達(dá)。 (3)網(wǎng)絡(luò)關(guān)聯(lián) 細(xì)胞內(nèi)所有大分子相互作用的集合,稱為相互作用組(Interactome),是大多數(shù)基因型與表型關(guān)系的基礎(chǔ),可以用來(lái)指導(dǎo)解釋組學(xué)技術(shù)檢測(cè)到的變化如何干擾整個(gè)機(jī)體。 機(jī)體的分子響應(yīng)和變化具有功能富集性、通路富集性。因此不同組學(xué)檢測(cè)數(shù)據(jù)也具有相似的功能富集性和變化規(guī)律。 網(wǎng)絡(luò)關(guān)聯(lián)算法正是基于這些生物學(xué)理論基礎(chǔ)。
分析結(jié)果:關(guān)聯(lián)網(wǎng)絡(luò)圖
圖例:血液組織RRBS + RNA-seq,基因的差異甲基化模式與基因表達(dá)模式的共變關(guān)聯(lián)網(wǎng)絡(luò)分析。
關(guān)聯(lián)理論基礎(chǔ):基因組DNA的甲基化與基因表達(dá)變化具有功能富集性。 圖例:腸道宏基因組+代謝組,不同管理狀態(tài)下川金絲猴糞便代謝物與腸道菌群基于WGCNA的共變關(guān)聯(lián)網(wǎng)絡(luò)分析。
關(guān)聯(lián)理論基礎(chǔ):腸道菌群可響應(yīng)環(huán)境變化改變腸道微環(huán)境中相關(guān)的代謝產(chǎn)物的濃度。
圖例:基于表觀模塊的差異網(wǎng)絡(luò)分析(EMDN algorithm)
圖例:
圖例:融合網(wǎng)絡(luò)三個(gè)cluster內(nèi)部的連接性、緊密性和cluster之間相對(duì)較少的邊界,說(shuō)明該算法可以更清晰地顯示多形性成膠質(zhì)細(xì)胞瘤(GBM)患者的分型情況。
從關(guān)聯(lián)走向因果:組學(xué)分子實(shí)驗(yàn)驗(yàn)證 基因表達(dá)相關(guān)的組學(xué):
甲基化組學(xué):
宏基因組(腸道菌群):
以上是關(guān)于多組學(xué)分析方法及組學(xué)分子實(shí)驗(yàn)驗(yàn)證的解析,易基因提供表觀組、轉(zhuǎn)錄組、微生物組等多組學(xué)科研技術(shù)服務(wù)。 參考文獻(xiàn): Yan H, Bombarely A, Xu B, et al.Autopolyploidization in switchgrass alters phenotype and flowering time viaepigenetic and tranion regulation[J]. Journal of experimental botany,2019 Zhang, D., Hu, Q., … Gao, F. (2019). Epigenetic and transcriptional signatures of ex situ conserved golden snub-nosed monkeys (Rhinopithecus roxellana). Biological Conservation, 237, 175–184. Zuo, T., Lu, X. J., Zhang, Y. (2019). Gut mucosal virome alterations in ulcerative colitis. Gut, 68(7), 1169–1179. Gao, Y., Liu, X.. (2017). Protein Expression Landscape of Mouse Embryos during Pre-implantation Development. Cell Reports, 21(13), 3957–3969. Evaluating the influence of conservation activities on the gut microecosystem of Rhinopithecus roxellana based on establishment of a gut microbiome gene catalog. Unpublished. Inter-correlated gut microbiota and SCFAs changes upon antibiotics exposure links with rapid body-mass gain in weaned piglet model. The Journal of nutritional biochemistry,2019, 74: 108246. Multiple network algorithm for epigenetic modules via the integration of genome-wide DNA methylation and gene expression data. BMC Bioinformatics , 2017,18(1), 1–13. Similarity network fusion for aggregating data types on a genomic scale. Nature Methods , 2014,11(3), 333–337. Di Nanni, N., Bersanelli, M.(2020). Network Diffusion Promotes the Integrative Analysis of Multiple Omics. Frontiers in Genetics,11(February), 1–12. 相關(guān)閱讀: 多組學(xué)關(guān)聯(lián)研究怎么做?DNA甲基化組+轉(zhuǎn)錄組+宏基因組+16S研究思路 經(jīng)驗(yàn)分享:DNA甲基化與多組學(xué)研究思路及科研論文寫作 |
|
來(lái)自: 深圳易基因科技 > 《文獻(xiàn)科普》