乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      liftOver 不同版本基因組文件相互轉化

       育種數據分析 2023-05-30 發(fā)布于河南

      大家好,我是鄧飛。前一段時間有小伙伴在星球提問:想將不同版本的SNP數據合并,不想重新call snp,想把綿羊的V2和V4版本的數據合并,具體來說,是V2轉為V4然后與V4合并。

      我建議用liftOver軟件進行處理,并許諾寫篇博客介紹一下。還有小伙伴想把1.2的參考基因組,變?yōu)?.1的,問我如何處理,我還是建議用liftOver,在線網站也可以解決,但是本地編程更快一些。

      1. 不同基因組轉換對應關系原理

      每一次參考基因組的更新,位置信息會有所變化,有些是插入了一些,有些是平移,有些是沒有改變。

      但是,每一個版本的參考基因組,都有對應的關系,如果我們根據對應的關系,就可以把舊版本的更新到新版本的位置。

      應用領域:不同參考基因組call snp的vcf數據,可以通過這種方式轉換為同一基因組版本,然后合并。有些芯片設計時是不同的基因組版本,也可以通過這種形式,進行轉換,然后合并。

      2. liftOver軟件下載

      網址:http://hgdownload.cse./admin/exe/

      有蘋果系統(tǒng)和Linux系統(tǒng),這里以Linux系統(tǒng)為例進行介紹。

      3. 查找物種的基因組版本

      網址:https://hgdownload.soe./downloads.html

      常見的物種都有:

      比如豬的版本有:

      • · V11

      • · V10

      • · V9

      雞的有:

      • · V6

      • · V5

      • · V4

      牛的有:

      • · V9,V8,V7

      人的有:

      • · hg38

      • · hg19

      • · mm39

      • · mm10

      4. 下載不同版本的liftOver數據文件

      比如,這里以雞為例子,進入網站:https://hgdownload.soe./goldenPath/galGal6/liftOver/

      這里由V6變?yōu)閂5,V6變?yōu)閂4:,我們想把V6變?yōu)閂5,可以下載:

      當然,也可以V5變?yōu)閂6,V4變?yōu)閂6,只需要下載對應的chain文件即可:

      注意,下載的gz文件,不要解壓縮。保持壓縮狀態(tài)

      5. 整理位置信息

      我們以plink數據為例,我們想把v5版的map變?yōu)関6版的map,首先將map數據變?yōu)閎ed的格式:

      將位置信息整理為bed文件,可以根據map進行整理,染色體,開始位置,結束位置,沒有行頭。

      只接受BED格式文件,BED格式文件只定義前三列:chr start end,無表頭 注:end不等于start(如果是單位點的話,建議所有end = start+1)

      轉換代碼:

      sed 's/\s\+/ /g' new_v3.map >t1.map
      awk '{print "chr"$1,$4,$4+1}' t1.map >tt.bed

      6. 運行l(wèi)iftOver命令行轉換

      liftOver的語法為:

      liftOver <輸入文件> <chain文件> <輸出文件> <unmapped文件>

      示例代碼:

      將bed的V6版本,變?yōu)閂5版本:

      liftOver tt.bed galGal6ToGalGal5.over.chain.gz re_map.bed re_un_map.bed
      • · 第一個參數,tt.bed,就是bed文件,根據map生成的bed文件

      • · 第二個參數,是根據liftOver網站,下載的壓縮文件,是對應關系,網址:https://hgdownload.soe./goldenPath/galGal5/liftOver/

      • · 第三個參數,是輸出的結果文件

      • · 第四個參數,是沒有匹配的結果文件

      結果會輸出成功轉換的位點,和沒有轉換的位點。

      為了方便我們后續(xù)使用,可以先運行一遍代碼,將沒有轉換成功的位點刪掉,然后再轉換,這樣就是一一對應的了。

        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多