乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      GO 功能注釋

       追著天使拔毛 2019-10-27

      文章轉(zhuǎn)載于 Original 2017-06-12 liuhui 生信百科

      相似的基因在不同物種中,其功能往往保守的。顯然,需要一個統(tǒng)一的術(shù)語用于描述這些跨物種的同源基因及其基因產(chǎn)物的功能,否則,不同的實(shí)驗(yàn)室對相同的基因的功能的描述不同,將極大限制學(xué)術(shù)的交流。而 Gene Ontology (GO) 項(xiàng)目正是為了能夠使對各種數(shù)據(jù)庫中基因獲基因產(chǎn)物功能描述相一致的努力結(jié)果。

      所謂的 GO,是生物學(xué)功能注釋的一個標(biāo)準(zhǔn)詞匯表術(shù)語(GO term),將基因的功能分為三部分:

      • 基因執(zhí)行的分子功能(Molecular Function)

      • 基因所處的細(xì)胞組分(Cellular Component)

      • 基因以及參與的生物學(xué)過程(Biological Process)

      不同的 GO term 通過有向無環(huán)圖關(guān)聯(lián)起來,如下圖所示:

      可以看出,不同的 GO term 間的關(guān)系由三類:is_apart_of 和 regulates。

      如 regulation of cell projection assembly 是一種生物學(xué)過程,是 regulation of cell projection organization 中的一類(is_a),還調(diào)節(jié)(regulatescell projection assembly;又如 cellular component assembly 是 celluar component biogenesis 的一部分(part_of)。值得注意的是,這些關(guān)系都是有方向的,即反過來不成立,因而叫做有向無環(huán)圖。

      目前,GO 注釋主要有兩種方法:

      • (1)序列相似性比對(BLAST)

      • (2)結(jié)構(gòu)域相似性比對(InterProScan)

      這里以序列相似性比對為例,簡單介紹 GO 注釋的步驟:

      將基因序列與 swiss-prot 蛋白質(zhì)數(shù)據(jù)庫進(jìn)行 BLAST (blastp 或者 blastx,這篇文章介紹了如何做 BLAST 分析:BLAST 知多少?)比對,得到如下結(jié)果:

      c49_g1_i1       RNF13_MOUSE     52.00   50      23      1       17      166     240     288     2e-11   65.5

      c72_g1_i1       RS25_NEUCR      78.72   94      20      0       375     94      1       94      1e-32   116

      c75_g1_i1       POLX_TOBAC      45.28   53      29      0       162     4       457     509     1e-08   55.1

      c86_g2_i1       POLX_TOBAC      46.43   112     60      0       339     4       879     990     2e-30   120

      c91_g1_i1       BUB1_ARATH      55.71   70      28      2       61      264     289     357     1e-14   73.6

      c143_g1_i1      STL1_YEAST      31.98   172     85      4       6       518     407     547     6e-17   82.8

      c150_g1_i1      CST26_YEAST     37.63   93      38      3       223     5       142     234     6e-10   58.2

      c150_g2_i1      YHOE_SCHPO      42.67   75      41      1       227     3       54      126     5e-16   74.7

      c156_g2_i1      EXOL2_ARATH     47.17   53      28      0       299     141     229     281     6e-06   47.0

      c169_g1_i1      SPT5_ASPFU      60.98   82      31      1       20      262     725     806     2e-18   84.0

      其中,第二列 swiss-prot 蛋白質(zhì)數(shù)據(jù)庫序列的 ID(UniProtKB ID)。

      從 ftp://ftp.pir.georgetown.edu/databases/idmapping 下載 idmapping.tb.gz,該文件共有 22 列(tab 鍵分割):

      Q6GZX4  001R_FRG3G      2947773 YP_031579.1     81941549; 49237298              PF04947 GO:0006355; GO:0046782; GO:0006351                      UniRef100_Q6GZX4  UniRef90_Q6GZX4 UniRef50_Q6GZX4 UPI00003B0FD4           654924                          15165820        AY548484        AAT09660.1

      每一列的含義分別為 (可以看出,許多數(shù)據(jù)庫已經(jīng)和GO關(guān)聯(lián)了): 

      1. UniProtKB accession

      2. UniProtKB ID

      3. EntrezGene

      4. RefSeq

      5. NCBI GI number

      6. PDB

      7. Pfam

      8. GO

      9. PIRSF

      10. IPI

      11. UniRef100

      12. UniRef90

      13. UniRef50

      14. UniParc

      15. PIR-PSD accession

      16. NCBI taxonomy

      17. MIM

      18. UniGene

      19. Ensembl

      20. PubMed ID

      21. EMBL/GenBank/DDBJ

      22. EMBL protein_id

      根據(jù)文件 idmapping.tb.gz,將 blast 的結(jié)果,通過 UniProtKB ID,將第八列的 GO 號注釋到對應(yīng)的基因上

      python UniProt2GO_annotate.py idmapping.tb.gz blastout outputfile

      結(jié)果如下:

      c93619_g2_i1    GO:0005506,GO:0016705,GO:0016021,GO:0004497,GO:0020037

      c93619_g2_i3    GO:0009733,GO:0020037,GO:0044550,GO:0016021,GO:0016020,GO:0016711,GO:0009813,GO:0005789,GO:0005506

      c70056_g1_i1    GO:0005737,GO:0019722,GO:0071889,GO:0005829,GO:0001077,GO:0006357,GO:0097720,GO:0000978,GO:0046872,GO:0005634,GO:0006874

      c93748_g1_i1    GO:0006729,GO:0008124

      c107639_g1_i1   GO:0009737,GO:0009738,GO:0005623,GO:0006970,GO:0009651,GO:0045454,GO:0009789

      c106424_g1_i1   GO:0043565,GO:0009555,GO:0003700,GO:0005634,GO:0009793,GO:0006351

      c66585_g1_i1    GO:0005737,GO:0003746,GO:0003924,GO:0005525

      c110618_g1_i8   GO:0015297,GO:0016021,GO:0015238

      c105249_g1_i5   GO:0046872,GO:0043161,GO:0005829,GO:0006915,GO:0032648,GO:0050691,GO:0005654,GO:0070936,GO:0061630,GO:0005634

      c134727_g1_i1   GO:0072546,GO:0030246,GO:0005783

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多