cBioPortal想必大家并不陌生,可以完成特定基因的甲基化Beta值下載,以及基因表達與甲基化水平的相關(guān)性分析! https://www./ 單純下載某個基因的甲基化數(shù)據(jù) 以肝癌中的CFTR基因為例: 下載得到文件 cBioPortal_data.txt,在excel中打開,顯示如下: 知識點: 1、該文件存儲450K芯片檢測的CFTR基因在442個肝癌組織樣本中的甲基化beta值,取值在0-1之間。 2、有部分樣本并未進行甲基化芯片檢測,則標識為NaN(即,排除空值,實際只有379個LIHC樣本檢測到了CFTR基因甲基化)! 3、cBioPortal中可直接得到基因甲基化值,而不像Xena中得到基因上所有探針的甲基化值(而無法得到基因水平甲基化值)! 那么 cBioPortal是如何得到基因水平甲基化的呢? 基因表達與甲基化相關(guān)性分析 與直接下載數(shù)據(jù)不同,進行分析需要通過Query模式: 輸入目標基因后點擊Submit Query,進行如下操作: 需要注意的是: 1、可視化結(jié)果不支持在線修整,但支持下載數(shù)據(jù)(故可以用R等工具重新繪制圖形)。通過上圖標識5,可以下載分析和可視化所用的數(shù)據(jù)(Data),得到plot.txt文件,在excel中打開顯示如下: 可見,同時得到該基因的甲基化和mRNA表達值,這里只有373個樣本的數(shù)據(jù),因為要保證該樣本同時具有甲基化和mRNA表達的檢測。 2、下載的數(shù)據(jù)中,mRNA表達定量方法是RSEM值,包含較多0值,而在可視化時點選 Apply Log Scale會將數(shù)據(jù)log2轉(zhuǎn)化,推測原值+0.01,即log2(RSEM + 0.01),故導(dǎo)致部分樣本mRNA表達量在-6左右,顯示一橫排點的的情況。其實,更多的是類似Xena,做log2(RSEM+1)轉(zhuǎn)換將表達量控制在0以上。 3、本例,相關(guān)性統(tǒng)計分析結(jié)果中顯示的相關(guān)系數(shù)為正值,表示CFTR基因在肝癌中的甲基化和基因表達呈正相關(guān)關(guān)系!這似乎有悖于我們常規(guī)的認知...我們知道對于甲基化芯片來說,一個基因上是設(shè)計了不同位置的多個探針的,而cBioPortal只選擇了一個探針來代表基因,即甲基化beta值與mRNA表達負相關(guān)性最強的探針:
https://www./faq https://groups.google.com/forum/#!topic/cbioportal/2OVGjC8xPT8 https://www./p/182962/ 綜上 cBioPortal中下載/用于分析展示的所謂基因水平甲基化,其實只是某個探針的甲基化beta值~ 拋出問題 cBioPortal中無法獲得探針水平甲基化beta值。那么,如何實現(xiàn)各探針甲基化水平與mRNA表達的相關(guān)性分析?即如何驗證cBioPortal最終探針選擇的準確性? |
|
來自: 生物_醫(yī)藥_科研 > 《待分類》