昨天,我介紹了TASSEL的安裝和讀取plink基因型數(shù)據(jù),使用TASSEL學(xué)習(xí)GWAS筆記(1/6):讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù) 這里,我們查看一下基因型數(shù)據(jù)導(dǎo)入后,如何對數(shù)據(jù)進行質(zhì)控。 1. 導(dǎo)入后的基因型文件導(dǎo)入后的基因型數(shù)據(jù): 2. 對基因系數(shù)據(jù)進行質(zhì)控這里TASSEL提供了SNP位點質(zhì)控和樣本質(zhì)控。 2.1 SNP位點質(zhì)控這里,選擇次等位基因頻率為0.05,MAF小于這個的位點刪除,質(zhì)控后的基因型數(shù)據(jù)保存為*Filter為后綴。 2.2 樣本雜合度質(zhì)控這里,我們沒有對樣本雜合度質(zhì)控,如果需要的話,可以設(shè)置雜合度的區(qū)間。 3. 基因型數(shù)據(jù)導(dǎo)出很多時候,糾結(jié)plink數(shù)據(jù)如何轉(zhuǎn)化為hapmap格式,或者hapmap格式如何轉(zhuǎn)化為plink格式,現(xiàn)在有方法了,在TASSEL過一遍,選擇導(dǎo)出格式就行了。 ? 選擇基因型數(shù)據(jù),點擊File --> Save As 可以看到支持很多格式: 3.1 導(dǎo)出plink格式選擇導(dǎo)出的格式為plink格式:
用git看一下導(dǎo)出的數(shù)據(jù)情況: 3.2 導(dǎo)出vcf格式
3.3 導(dǎo)出Hapmap格式
預(yù)覽一下hapmap格式: ![]() 3.4 導(dǎo)出Hapmap Diploid格式設(shè)置: 文件預(yù)覽: ![]() 結(jié)果是二進制文件,不能預(yù)覽。 3.5 導(dǎo)出HDF5格式
![]() 結(jié)果是二進制文件,不能預(yù)覽。 4. 基因型導(dǎo)入plink中質(zhì)控這里,我們直接用導(dǎo)出的re1的plink文件,進行質(zhì)控,質(zhì)控后再返回TASSEL中。 plink --file re1-plink.plk --maf 0.01 --geno 0.1 --mind 0.1 --hwe 1e-4 --recode --out qc_plink 「質(zhì)控情況:」
質(zhì)控后的結(jié)果保存為 5. 質(zhì)控后的plink文件,導(dǎo)入到TASSEL中點擊下面菜單:
![]() |
|
來自: 育種數(shù)據(jù)分析 > 《待分類》