乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      OmicShare Forum 專業(yè)的生物信息學(xué)論壇

       ypgao 2019-05-08
      本次在線交流主要內(nèi)容如下:

      問(wèn)1:
      可不可以用DESeq歸一化的normalizedcounts進(jìn)一步計(jì)算RPKM??
      答:可以的。Normalized counts 使用RPKM的換算公式可以直接轉(zhuǎn)化為RPKM值。

      問(wèn)2:下面這張圖怎么理解?
                                                               
      答:這張圖是經(jīng)典的Maplot。每個(gè)點(diǎn)代表一個(gè)基因。Y軸代表的是基因在兩個(gè)樣本的表達(dá)差異倍數(shù)。X軸代表基因在兩個(gè)樣本表達(dá)量的乘積。
      黃色的點(diǎn)代表只在某一特異樣本高表達(dá)的基因。這類基因表達(dá)差異倍數(shù)比較大, Y軸上偏離0。但是乘積又非常小,所以在X軸的數(shù)值較小。所以意味著這類基因在一個(gè)樣本表達(dá)量高一個(gè)樣本表達(dá)量低,即可以理解為這個(gè)基因只在一個(gè)樣本上表達(dá)。
      綠色位置的這些基因表達(dá)量在兩個(gè)樣本都比較高的,因?yàn)樗某朔e也比較大,但在Y軸數(shù)值在零值附近,表達(dá)其沒有差異表達(dá),這類基因一般是看家基因。另外,在樣本間進(jìn)行reads counts校正的參照基因也屬于此類基因。
      其他位置基因還包括一些在Y軸偏離0,但在X軸數(shù)值也較大的基因,表明在兩個(gè)樣本都有比較高表達(dá)量,而且有比較大的差異倍數(shù)的基因。

      問(wèn)2:下面不同比對(duì)方案分別對(duì)應(yīng)的是哪些軟件?
      read count (多重比對(duì)的問(wèn)題)
      丟棄
      平均分配
      利用Unique region估計(jì)并重新分配

      答:此處的分析,不屬于比對(duì)軟件要處理的問(wèn)題。而是屬于后期的處理,可以通過(guò)寫腳本或某些軟件處理。
      當(dāng)reads比對(duì)到多個(gè)地方的時(shí)候,有兩種方法,一種是平均分配,一種是多重比對(duì)的時(shí)候不清楚是屬于誰(shuí),然后將其丟棄。前兩種方法可以通過(guò)寫腳本來(lái)處理。我們發(fā)現(xiàn)這種丟棄的方法在絕大多數(shù)情況下還是相當(dāng)?shù)臏?zhǔn)確和穩(wěn)定的,這也是最早期方法。第三種方法是RSEM與cufflinks這兩種軟件使用的方法(這兩個(gè)軟件一般基于bowtie2或tophat的比對(duì)結(jié)果進(jìn)行處理)。由于存在幾個(gè)轉(zhuǎn)錄本為可變剪切或者存在基因家族,所以有一些同源的區(qū)域完全相似的,必然導(dǎo)致某些reads多重比對(duì)。但是這幾個(gè)轉(zhuǎn)錄本或者編碼基因肯定有些地方是獨(dú)一無(wú)二的,這些位置的地方reads則是唯一比對(duì)的。軟件根據(jù)唯一比對(duì)的reads數(shù)比例,來(lái)重新分配那些多重比對(duì)的reads,即通過(guò)Unique mapping reads來(lái)分配那些multi-mapping比對(duì)的reads。

      問(wèn)3:用fpkm時(shí)做cuffdiff時(shí),不同時(shí)間點(diǎn)的處理,用到的gtf文件是需要把所有樣品的gtf文件merge到一起嗎?
      答:是的。因?yàn)樽詈笥幸粋€(gè)合并的過(guò)程,是需要把所有樣品的gtf文件merge到一起,不然沒有辦法比較表達(dá)量。

      問(wèn)4:請(qǐng)問(wèn)無(wú)參轉(zhuǎn)錄組,利用RSEM計(jì)算的結(jié)果里面是有count,TPM以及FPKM值,這些數(shù)值我是可以直接用于后續(xù)的差異分析的嗎?還是只用count值呢?
      答:如果使用DEseq或edger做差異分析一定要用count來(lái)計(jì)算,因?yàn)閐eseq與edger已經(jīng)考慮到了用count值來(lái)計(jì)算差異表達(dá)更加準(zhǔn)確,而不是用其他。

      問(wèn)5:FKPM只能針對(duì)PE(雙端測(cè)序)的數(shù)據(jù)計(jì)算么?
      答:FKPM實(shí)際上算的是fragment,當(dāng)然是雙端的數(shù)據(jù)算一個(gè)fragment。如果是SE數(shù)據(jù),RPKM與FKPM應(yīng)該是沒有區(qū)別了,因?yàn)槭菃味藴y(cè)序,每個(gè)reads就代表一個(gè)片段,當(dāng)然也是可以計(jì)算FKPM的,因?yàn)橐粭lreads就是一條片段,是等效的。

      問(wèn)6:reads 長(zhǎng)度分布統(tǒng)計(jì)怎么計(jì)算,怎么畫出長(zhǎng)度分布圖呢?
      答:可以寫腳本,長(zhǎng)度分布圖展示方法可以嘗試畫餅圖或者柱形圖來(lái)展示。

      問(wèn)7:RPKM類算法是什么意思?
      答:就是說(shuō)這類算法基本是以mRNA為總量來(lái)計(jì)算基因表達(dá)量的。

      問(wèn)8:RSEM與RPKM的區(qū)別?
      答:兩者是兩個(gè)定義,RSEM是reads count的多重比對(duì)的軟件,核心是怎么算基因的reads count。我們公司目前的無(wú)參轉(zhuǎn)錄組流程也會(huì)用到RSEM,最后我們將算出來(lái)的reads count換算成RPKM來(lái)計(jì)算,所以RSEM更多是種reads counts統(tǒng)計(jì)軟件,基于它的統(tǒng)計(jì)結(jié)果可以換算成RPKM、FPKM或TPM。

      問(wèn)9:請(qǐng)問(wèn)如果用HTseq-count的結(jié)果count做差異分析,可以用Cuffdiff得出的FPKM當(dāng)表達(dá)量畫熱圖或趨勢(shì)分析嗎?
      答:可以得。
      BTW,在做差異分析的時(shí)候用count是合理的,如果用基因長(zhǎng)度做校正后會(huì)掩蓋一些問(wèn)題。因?yàn)椴町惙治鲕浖鋵?shí)考慮到了reads counts給定量帶來(lái)的誤差。理論上如果一個(gè)基因reads數(shù)越多的話,表達(dá)量定量越穩(wěn)定的,誤差越小。反之,count數(shù)越少,定量誤差越大。但如果進(jìn)行RPKM校正后,一個(gè)低reads counts的基因,如果由于其基因長(zhǎng)度較短,則反而會(huì)得到一個(gè)高的RPKM值。這樣相當(dāng)于丟失了原始的reads counts信息。count進(jìn)行差異分析更加合理,所以大部分差異分析軟件采用未進(jìn)行基因長(zhǎng)度校正的reads counts為輸入進(jìn)行差異分析。
      所以做差異分析的時(shí)候,用deseq 或edger用count來(lái)計(jì)算是對(duì)的。但后續(xù)的分析,例如繪制熱圖,依然建議換算成RPKM后進(jìn)行處理。


      更多問(wèn)答整理請(qǐng)下載PDF文檔查看:

        本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多