乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      基因組拼接中常見的名詞解釋

       Seedlings 2012-09-15
      基因組拼接中常見的名詞解釋

      Read:高通量測序平臺產(chǎn)生的序列就稱為reads。

      Contig:拼接軟件基于reads之間的overlap區(qū),拼接獲得的序列稱為Contig(重疊群)。

      Scaffold:基因組de novo測序,通過reads拼接獲得Contigs后,往往還需要構(gòu)建454 Paired-end庫或Illumina Mate-pair庫,以獲得一定大小片段(如3Kb、6Kb、10Kb、20Kb)兩端的序列?;谶@些序列,可以確定一些Contig之間的順序關(guān)系,這些先后順序已知的Contigs組成Scaffold。

      Contig N50:Reads拼接后會(huì)獲得一些不同長度的Contigs。將所有的Contig長度相加,能獲得一個(gè)Contig總長度。然后將所有的Contigs按照從長到短進(jìn)行排序,如獲得Contig 1,Contig 2,Contig 3...………Contig 25。將Contig按照這個(gè)順序依次相加,當(dāng)相加的長度達(dá)到Contig總長度的一半時(shí),最后一個(gè)加上的Contig長度即為Contig N50。舉例:Contig 1+Contig 2+ Contig 3 +Contig 4=Contig總長度*1/2時(shí),Contig 4的長度即為Contig N50。Contig N50可以作為基因組拼接的結(jié)果好壞的一個(gè)判斷標(biāo)準(zhǔn)。

      Scaffold N50:Scaffold N50與Contig N50的定義類似。Contigs拼接組裝獲得一些不同長度的Scaffolds。將所有的Scaffold長度相加,能獲得一個(gè)Scaffold總長度。然后將所有的Scaffolds按照從長到短進(jìn)行排序,如獲得Scaffold 1,Scaffold 2,Scaffold 3...………Scaffold 25。將Scaffold按照這個(gè)順序依次相加,當(dāng)相加的長度達(dá)到Scaffold總長度的一半時(shí),最后一個(gè)加上的Scaffold長度即為Scaffold N50。舉例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold總長度*1/2時(shí),Scaffold 5的長度即為Scaffold N50。Scaffold N50可以作為基因組拼接的結(jié)果好壞的一個(gè)判斷標(biāo)準(zhǔn)。

      測序深度和覆蓋度

      • 測序深度是指測序得到的總堿基數(shù)與待測基因組大小的比值。假設(shè)一個(gè)基因大小為2M,測序深度為10X,那么獲得的總數(shù)據(jù)量為20M。
      • 覆蓋度是指測序獲得的序列占整個(gè)基因組的比例。由于基因組中的高GC、重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域,這部分沒有獲得的區(qū)域就稱為Gap。例如一個(gè)細(xì)菌基因組測序,覆蓋度是98%,那么還有2%的序列區(qū)域是沒有通過測序獲得的。

      轉(zhuǎn)載自:http://www./Tech/Htseq/403

        本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多