筆記計(jì)劃分為六篇: 第一篇:讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù) 第二篇:對(duì)基因型數(shù)據(jù)質(zhì)控:缺失質(zhì)控,maf質(zhì)控,hwe質(zhì)控,樣本質(zhì)控 第三篇:基因型數(shù)據(jù)可視化:kingship,MDS,PCA 第四篇:一般線性模型進(jìn)行GWAS分析(GLM模型) 第五篇:混合線性模型進(jìn)行GWAS分析(MLM模型) 第六篇:TASSEL結(jié)果可視化:QQ plot,曼哈頓圖 已完成前三篇,本篇是第四篇。 1. 將質(zhì)控的plink數(shù)據(jù)和表型數(shù)據(jù)讀入到TASSEL軟件質(zhì)控后的plink數(shù)據(jù)和表型數(shù)據(jù): 「讀取表型數(shù)據(jù)到TASSEL中:」 「讀取基因型數(shù)據(jù)到TASSEL中:」 2. 一般線性模型(GLM)介紹
重點(diǎn)是對(duì)每個(gè)SNP做回歸分析,提取effect和p-value。 3. 合并數(shù)據(jù)TASSEL分析中,需要將分析的表型和基因型數(shù)據(jù)進(jìn)行合并,合并為一個(gè)數(shù)據(jù)框,然后對(duì)該數(shù)據(jù)框進(jìn)行分析。 3.1 對(duì)基因型數(shù)據(jù)進(jìn)行PCA分析
「PCA分析結(jié)果:」 3.2 將PCA+表型+基因型合并選中三個(gè)數(shù)據(jù),然后點(diǎn)擊Data中的Intersect Join,進(jìn)行數(shù)據(jù)合并。 3.3 查看合并后的數(shù)據(jù)可以看到,數(shù)據(jù)中包括ID,PCA及結(jié)果,表型性狀數(shù)據(jù),基因型數(shù)據(jù)。 4. GLM模型選中合并后的書(shū),點(diǎn)擊Analysis --> Association --> GLM 5. GLM結(jié)果查看可以看到,Result中有兩個(gè)GLM結(jié)果,第一個(gè)為GWAS結(jié)果,第二個(gè)為每個(gè)SNP的效應(yīng)值情況。看第一個(gè)就行。
6. 導(dǎo)出結(jié)果![]() ![]() ![]() ![]() 7. TASSEL中的結(jié)果可視化「QQ圖:」 「曼哈頓圖:」
圖片可以保存到本地。 ok,第四篇搞定了。下一篇是MLM模型的分析,歡迎繼續(xù)關(guān)注。 |
|
來(lái)自: 育種數(shù)據(jù)分析 > 《待分類(lèi)》