乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      vcf 文件如何修改染色體修改樣本名稱提取樣本

       育種數(shù)據(jù)分析 2023-10-10 發(fā)布于河南

      大家好,我是鄧飛。

      對(duì)于vcf文件和plink文件是經(jīng)常用的文件,對(duì)于基因型數(shù)據(jù)的處理,一般分為:

      • 數(shù)據(jù)質(zhì)控
      • 數(shù)據(jù)提取
      • 染色體修改名稱
      • 樣本修改名稱

      今天介紹一下vcf文件的三個(gè)處理方法:

      • 1,染色體修改
      • 2,樣本名稱修改
      • 3,樣本提取

      用到的軟件是bcftools,用到的系統(tǒng)是Linux

      1. 數(shù)據(jù)描述

      數(shù)據(jù)使用GWAS-Cookbook中的GWASdat1中的數(shù)據(jù),將數(shù)據(jù)變?yōu)関cf格式。

      相關(guān)基因型數(shù)據(jù),可以在這里下載:快來領(lǐng)取 | 飛哥的GWAS分析教程更新啦

      將plink的二進(jìn)制文件,變?yōu)関cf的代碼:

      plink --bfile ../../gwas_cookbook/GWAS-dat1/1_QC_GWAS/HapMap_3_r3_1 --recode vcf-iid --out test1

      vcf預(yù)覽:

      2. vcf文件修改染色體名稱

      整理染色體修改對(duì)應(yīng)關(guān)系:

      awk '{print $1}' HapMap_3_r3_1.bim |sort |uniq >chr.txt
      awk '{print $1,"chr"$1}' chr.txt >chr_rename.txt

      整理好的對(duì)應(yīng)關(guān)系:

      $ cat chr_rename.txt 
      1 chr1
      10 chr10
      11 chr11
      12 chr12
      13 chr13
      14 chr14
      15 chr15
      16 chr16
      17 chr17
      18 chr18
      19 chr19
      2 chr2
      20 chr20
      21 chr21
      22 chr22
      23 chr23
      25 chr25
      3 chr3
      4 chr4
      5 chr5
      6 chr6
      7 chr7
      8 chr8
      9 chr9

      代碼:

       bcftools annotate --rename-chrs chr_rename.txt -Oz -o test2.vcf.gz test1.vcf 
      gzip -d test2.vcf.gz 
      less -S test2.vcf 

      修改后的結(jié)果:

      可以看到,已經(jīng)修改過了。

      3. 修改樣本的名稱

      樣本對(duì)應(yīng)關(guān)系txt文件整理:

      awk '{print $2}' HapMap_3_r3_1.fam |head >sname.txt
      awk '{print $1,"new_"$1}' sname.txt >sname_change.txt

      對(duì)應(yīng)關(guān)系文件內(nèi)容:

      $ head sname_change.txt 
      NA06989 new_NA06989
      NA11891 new_NA11891
      NA11843 new_NA11843
      NA12341 new_NA12341
      NA12739 new_NA12739
      NA10850 new_NA10850
      NA06984 new_NA06984
      NA12877 new_NA12877
      NA12275 new_NA12275
      NA06986 new_NA06986

      代碼:

      bcftools reheader -s sname_change.txt test1.vcf -o test3.vcf.gz

      修改后的vcf:

      4. 提取vcf樣本

      代碼:

      bcftools view -S sname.txt test1.vcf -Ov > test4.vcf

      提取后的文件:

      搞定!

      想要更好的學(xué)習(xí)和交流,快來加入飛哥的知識(shí)星球,這是一個(gè)生物統(tǒng)計(jì)+數(shù)量遺傳學(xué)+GWAS+GS的社區(qū),在這里你可以向飛哥提問、幫你定學(xué)習(xí)計(jì)劃、跟著飛哥一起做實(shí)戰(zhàn)項(xiàng)目,沖沖沖。點(diǎn)擊這里加入吧:飛哥的學(xué)習(xí)圈子


      分割線


      大家好,我是鄧飛,一個(gè)持續(xù)分享的農(nóng)業(yè)數(shù)據(jù)分析師,這里我將自己公眾號(hào)的干貨內(nèi)容挑重點(diǎn)羅列一下,方便大家閱讀和使用。

      1,GWAS學(xué)習(xí)教程(快來領(lǐng)取 | 飛哥的GWAS分析教程更新啦),這個(gè)pdf是我將公眾號(hào)的內(nèi)容進(jìn)行了匯總,更方便從頭學(xué)習(xí)GWAS分析,里面配套了數(shù)據(jù)、代碼和講解,屬于干貨推薦的Number 1。

      2,農(nóng)學(xué)人如何入門數(shù)據(jù)分析資料匯總(飛哥匯總 | 入門數(shù)據(jù)分析資源推薦),里面推薦了免費(fèi)的教程,包括編程、統(tǒng)計(jì)和專業(yè)書籍。

      3,數(shù)量遺傳學(xué)電子書下載(數(shù)量遺傳學(xué),分享幾本書的電子版

      4,R語言電子書線上書籍推薦(學(xué)習(xí)R語言這幾本電子書就夠了!

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章