乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      vcf格式文件處理大全(四)

       生物_醫(yī)藥_科研 2019-09-05

      前面介紹過fasq,fastq,bam三種生物數(shù)據(jù)分析中常用的格式。fasta一般作為比對的參考序列,fastq為測序數(shù)據(jù),將fastq比對到fasta則生成bam文件,對bam進行排序建立索引,就可以直接輸出為vcf格式,這個系列我們來詳細介紹一下vcf格式的操作。

      13 Annovar注釋

      annovar也是一款比較有名的變異位點注釋工具,使用起來也非常容易,使用vcf格式就可以進行注釋,軟件會首先對其進行格式轉換,然后進行注釋。

      #生成annovar格式  
      convert2annovar.pl -format vcf4old A1.snps.indel.VQSR.vcf.gz >A1.annovar.input    
      #gene-based注釋  
      annotate_variation.pl --geneanno -buildver hg38 --outfile A1.geneanno.anno A1.annovar.input humandb/ 

      14 clinvar臨床數(shù)據(jù)庫注釋

      clinvar是收集了與人類疾病相關突變位點的數(shù)據(jù)庫,將得到的突變位點與clinvar數(shù)據(jù)庫進行比對即可根據(jù)突變情況進行疾病的預測。使用clinvar數(shù)據(jù)庫首先需要下載clinvar數(shù)據(jù)庫,下載之后可以使用snpEFF后者annovar軟件進行注釋。

      #clinvar注釋  
      convert2annovar.pl -format vcf4old A1.HC.snps.indel.VQSR.vcf.gz >A1.annovar.input  
      annotate_variation.pl --filter -buildver hg38 --outfile A1.clinvar.anno A1.annovar.input -dbtype clinvar_20180603 humandb/ 

      15 一致性序列

      所謂一致性序列,就是一條與參考序列長度一致,但是僅將突變位點進行替換的序列,一致性序列完全根據(jù)參考序列為模板生成,是并不存在的序列,主要用于后面構建系統(tǒng)發(fā)育樹。

      bcftools consensus -f ref.fna -s Sample1 -o Sample1_consensus.fa file.vcf.gz

      16 VQSR

      VQSR是Variant Quality Score Recalibration,是GATK的核心功能,也就是利用機器學習算法對vcf進行過濾。利用機器學習算法對突變位點進行過濾比采用“一刀切”對所有位點處理的方式準確性更高。進行VQSR,首要要準備的已知變異集作為訓練集,可以是Hapmap、OMNI,1000G,dbsnp,瓶中基因組計劃等這些國際性項目的數(shù)據(jù),然后利用訓練集對每一個位點進行過濾。利用VariantRecalibrator工具進行機器學習,ApplyVQSR工具進行處理。VQSR過濾SNP和InDel分別進行,首先處理SNP,得到結果后,在進行InDel處理。具體方法可以參加gatk軟件的VQSR說明部分。

      https://gatkforums./gatk/discussion/39/variant-quality-score-recalibration-vqsr


      ---------- END ----------

        本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多