乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      Read count、CPM、 RPKM、FPKM和TPM的區(qū)別

       讀博怎么畢業(yè) 2022-05-12

      1. 為什么我們要進(jìn)行Normalization

      • 測(cè)序深度:某些低表達(dá)量的基因只有在較高的測(cè)序深度時(shí)才能檢測(cè)到。一般而言,隨著測(cè)序深度的增加,基因種類以及可變剪接體的數(shù)目也會(huì)增加。同時(shí),測(cè)序深度高的樣本read counts也會(huì)較高。


        樣本A中的基因表達(dá)量是樣本B的兩倍,但這是由于測(cè)序深度引起的結(jié)果,而非真實(shí)存在的差異。
      • 基因長度:由于高通量測(cè)序是將cDNA碎片化后再進(jìn)行測(cè)序的,因此越長的基因產(chǎn)生的碎片也會(huì)更多,在測(cè)序中也會(huì)更加容易被檢測(cè)到。所以對(duì)基因長度的校正也是十分有必要的。

      基因X和Y的真實(shí)表達(dá)量是一致的,但是基因X的reads會(huì)比基因Y要多,這是由于基因X的基因長度較長所致的。

      除了上述兩個(gè)主要因素外,還會(huì)有其他因素對(duì)read counts的檢測(cè)有所影響,例如轉(zhuǎn)錄組的組成,GC含量,random hexamers引起的測(cè)序偏好等等。由于上述因素的存在,導(dǎo)致在不同樣本間使用read counts 進(jìn)行比較是不太現(xiàn)實(shí)的,人們便提出了許多對(duì)read counts進(jìn)行Normalization的方法。

      2. Normalization方法

      1. 學(xué)術(shù)界已經(jīng)不再推薦RPKM、FPKM;
      2. 比較基因的表達(dá)豐度,例如哪個(gè)基因在哪個(gè)組織里高表達(dá),用TPM做均一化處理;
      3. 不同組間比較,找差異基因,先得到read counts,然后用DESeq2或edgeR,做均一化和差異基因篩選;如果對(duì)比某個(gè)基因的KO組和對(duì)照,推薦DESeq2。

      Read count
      數(shù)值概念:比對(duì)到某基因的reads數(shù)。
      用途:用于換算CPM、RPKM、FPRM等后續(xù)其他指標(biāo),同時(shí)作為基因異分析軟件(如DESeq、edgeR和limma)的輸入值。也就是說\color{#ea4335}{差異分析的結(jié)果來自于readcount的計(jì)算},而非CPM、RPKM、 FPKM,表達(dá)定量的結(jié)果主要用于主成分分析、層次聚類分析。

      2.1 CPM:Counts per million

      數(shù)值概念:計(jì)算公式:CPM= A/mapped reads*1000000 A為比對(duì)到某基因的reads數(shù)(read count)。

      用途:在某些情況下,只想了解每個(gè)基因被覆蓋到的相對(duì)reads數(shù),而不希望對(duì)其做長度校正,就會(huì)使用這個(gè)指標(biāo)。

      用總reads進(jìn)行均一化是最簡(jiǎn)單的方法,其基于以下兩個(gè)基本假設(shè):
      1) 絕大多數(shù)的gene表達(dá)量不變;
      2) 高表達(dá)量的gene表達(dá)量不發(fā)生改變;
      但實(shí)際上在轉(zhuǎn)錄組中,一小部分豐度極高的基因往往會(huì)貢獻(xiàn)很多reads,如果這些“位高權(quán)重”的基因還是差異表達(dá)的,就會(huì)影響所有其它基因分配到的reads數(shù)。而且兩個(gè)樣本總mRNA量完全相同的前提假設(shè)也過于理想了。如果想進(jìn)行表達(dá)量的基因間比較,則不得不考慮基因長度的不同。如果進(jìn)一步做長度的均一化,就得到了下面的RPKM、FPKM。

      2.2 RPKM:Reads Per Kilobaseof exon model per Million mapped reads (每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的reads)

      數(shù)值概念:計(jì)算公式:RPKM=(1000000*A)/( mapped reads *gene length/1000)
      A為比對(duì)到某基因的 reads數(shù)(read count)。

      RPKM法能消除基因長度和測(cè)序量差異對(duì)計(jì)算基因表達(dá)的影響,計(jì)算得到的基因表達(dá)量可直接用于比較不同樣品間的基因表達(dá)差異和不同基因間表達(dá)高低的比較。

      用途:用于與基因表達(dá)量相關(guān)的后期分析。基因表達(dá)趨勢(shì)分析、WGCNA共表達(dá)網(wǎng)絡(luò)構(gòu)建,熱圖繪制等都使用。

      2.3 FPKM:Fragments Per Kilobase of exon model per Million mapped fragments(每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的fragments)
      cDNA Fragments:比對(duì)到某一轉(zhuǎn)錄本上的片段數(shù)目,即雙端Reads數(shù)目,針對(duì)雙端數(shù)據(jù);Mapped Fragments (Millions):比對(duì)到轉(zhuǎn)錄本上的片段總數(shù),以百萬為單位,即10^6;Transcript Length(kb):轉(zhuǎn)錄本長度,kb為單位,即10^3。

      FPKM意義與RPKM極為相近。二者區(qū)別僅在于,F(xiàn)ragment與Read。RPKM的誕生是針對(duì)早期的SE測(cè)序,F(xiàn)PKM則是在PE測(cè)序上對(duì)RPKM的校正。只要明確Reads和Fragments的區(qū)別,RPKM和FPKM的概念便易于區(qū)分。Reads即是指下機(jī)后fastq數(shù)據(jù)中的每一條Reads,F(xiàn)ragments則是指每一段用于測(cè)序的核酸片段【雙端序列即使丟棄1端reads,讓按照1個(gè)Fragments計(jì)算】。
      RPKM is for single end RNA-seq
      FPKM is very similar to RPKM, but for paired end RNA-seq.

      2.4 TPM:Transcripts per million

      TPM is like RPKM and FPKM, except the order of operations is switched.

      TPM公式
      先用count值除以基因長度
      count值除以基因長度/每個(gè)樣本的count值除以基因長度的加和

      同RPKM一樣,TPM對(duì)基因的長度進(jìn)行了校正,計(jì)算比對(duì)到基因上的reads/基因長度得到長度校正的表達(dá)量 reads per kilobase (RPK)。再以文庫中RPK之和作為Scale Factor求出TPM。

      相比于RPKM使用read counts之和來作為文庫校正因子,TPM使用RPK之和作為文庫校正因子的好處是考慮了不同樣本間的基因長度的分布。因?yàn)镽PK是一個(gè)對(duì)基因長度進(jìn)行校正后的表達(dá)量單位,所以RPK之和也不會(huì)再帶入基因長度的bias。因此,如果需要比較的樣本之間轉(zhuǎn)錄本分布不一致時(shí)(例如不同物種RNA-seq的比較),使用TPM是一個(gè)較佳的Normalization方案。

      3. 各種值的使用場(chǎng)合??

      • 差異表達(dá)分析:原始count值,算法輸入要求(針對(duì)二代測(cè)序差異分析算法,算法內(nèi)部一般有標(biāo)化方法。)
      • 標(biāo)化后的值:基因表達(dá)值在樣本與樣本之間具有可比性。
        PCA分析,樣本表達(dá)總體分布,生存分析,熱圖繪制,相關(guān)性分析

      更多參考:https://www.jianshu.com/p/cd2888fec66b

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多