通過(guò)Python生物信息學(xué)③提取差異基因得到了該數(shù)據(jù)集的差異分析的兩個(gè)關(guān)鍵參數(shù),1.差異倍數(shù)(foldchange)以及2.差異的P值。本篇目的是得到滿(mǎn)足差異倍數(shù)和差異P值的基因,同時(shí)進(jìn)行可視化(包括差異分析常見(jiàn)的火山圖和熱圖)。 繪制火山圖(1)第一步制作差異分析結(jié)果數(shù)據(jù)框
(2)第二步制作火山圖的準(zhǔn)備工作 選定的差異基因標(biāo)準(zhǔn)是 I.差異倍數(shù)的絕對(duì)值大于1,II. 差異分析的P值小于0.05
篩選差異基因
繪制熱圖 熱圖(heatmap)是生物學(xué)文章里(尤其是RNA-seq相關(guān)論文)經(jīng)常出現(xiàn)的圖片。熱圖的用途一般有兩個(gè)。以RNA-seq為例,熱圖可以:1)直觀(guān)呈現(xiàn)多樣本多個(gè)基因的全局表達(dá)量變化;2)呈現(xiàn)多樣本或多基因表達(dá)量的聚類(lèi)關(guān)系。熱圖一般使用顏色(例如紅綠的深淺)來(lái)展示多個(gè)樣本多個(gè)基因的表達(dá)量高低,既直觀(guān)又美觀(guān)。同時(shí)可以對(duì)樣本聚類(lèi)或者對(duì)基因聚類(lèi)。
(1)每一行為一個(gè)基因,每一列為一個(gè)sample。 (2)綠色代表相對(duì)低表達(dá),紅色代表相對(duì)高表達(dá)。 (3)相對(duì)接近的樣本或者基因會(huì)聚類(lèi)在一起,比如探針名為101695_at的基因在GSM130370相對(duì)高表達(dá),而在GSM130366低表達(dá)。 |
|
來(lái)自: DrugAI > 《待分類(lèi)》