大家好,我是鄧飛。 對(duì)于vcf文件和plink文件是經(jīng)常用的文件,對(duì)于基因型數(shù)據(jù)的處理,一般分為:
今天介紹一下vcf文件的三個(gè)處理方法:
用到的軟件是 1. 數(shù)據(jù)描述數(shù)據(jù)使用GWAS-Cookbook中的GWASdat1中的數(shù)據(jù),將數(shù)據(jù)變?yōu)関cf格式。
將plink的二進(jìn)制文件,變?yōu)関cf的代碼:
![]() 2. vcf文件修改染色體名稱
整理好的對(duì)應(yīng)關(guān)系:
代碼:
修改后的結(jié)果:
3. 修改樣本的名稱樣本對(duì)應(yīng)關(guān)系txt文件整理:
對(duì)應(yīng)關(guān)系文件內(nèi)容:
代碼:
修改后的vcf: ![]() 4. 提取vcf樣本代碼:
提取后的文件: ![]() 搞定! 想要更好的學(xué)習(xí)和交流,快來加入飛哥的知識(shí)星球,這是一個(gè)生物統(tǒng)計(jì)+數(shù)量遺傳學(xué)+GWAS+GS的社區(qū),在這里你可以向飛哥提問、幫你制定學(xué)習(xí)計(jì)劃、跟著飛哥一起做實(shí)戰(zhàn)項(xiàng)目,沖沖沖。點(diǎn)擊這里加入吧:飛哥的學(xué)習(xí)圈子 分割線 大家好,我是鄧飛,一個(gè)持續(xù)分享的農(nóng)業(yè)數(shù)據(jù)分析師,這里我將自己公眾號(hào)的干貨內(nèi)容挑重點(diǎn)羅列一下,方便大家閱讀和使用。 1,GWAS學(xué)習(xí)教程(快來領(lǐng)取 | 飛哥的GWAS分析教程更新啦),這個(gè)pdf是我將公眾號(hào)的內(nèi)容進(jìn)行了匯總,更方便從頭學(xué)習(xí)GWAS分析,里面配套了數(shù)據(jù)、代碼和講解,屬于干貨推薦的Number 1。 2,農(nóng)學(xué)人如何入門數(shù)據(jù)分析資料匯總(飛哥匯總 | 入門數(shù)據(jù)分析資源推薦),里面推薦了免費(fèi)的教程,包括編程、統(tǒng)計(jì)和專業(yè)書籍。 3,數(shù)量遺傳學(xué)電子書下載(數(shù)量遺傳學(xué),分享幾本書的電子版) 4,R語言電子書線上書籍推薦(學(xué)習(xí)R語言這幾本電子書就夠了!) |
|