乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      各種癌癥都有自己的細(xì)分亞型(數(shù)據(jù)挖掘可以更進(jìn)一步)

       健明 2021-11-23

      精準(zhǔn)醫(yī)療時(shí)代,對(duì)于癌癥我們最重要的就是分而治之,理論上應(yīng)該是每個(gè)人的癌癥都不一樣,但實(shí)際上的醫(yī)療現(xiàn)實(shí)不允許我們對(duì)每個(gè)癌癥患者都進(jìn)行事無巨細(xì)的科研探索來給他制定個(gè)性化診療方案。能把以前大家混完一談的單一器官癌癥區(qū)分成為不同細(xì)分癌癥,就已經(jīng)是科研界近幾十年的成果了。

      比如是乳腺癌,你可以看lumA,lumB,basal,HER2 等亞型,其中TNBC可以繼續(xù)細(xì)分為3~7種亞型,當(dāng)然了,現(xiàn)在有了單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的加持,細(xì)胞亞型會(huì)越來越清晰。如果要整合多組學(xué)數(shù)據(jù),分類也會(huì)更加復(fù)雜。

      再比如是胃癌,也是有4種分子分型,具體如下:

      • ①愛潑斯坦-巴爾(Epstein-Barr)病毒(EBV)陽性型腫瘤:約占胃癌的9%,表現(xiàn)為較高頻率的PIK3CA基因突變和DNA極度超甲基化,以及JAK2、CD274(也稱PD-L1)和PDCD1LG2(也稱PD-L2)基因擴(kuò)增。

      • 微衛(wèi)星不穩(wěn)定(MSI)型:約占22%,表現(xiàn)為重復(fù)DNA序列突變?cè)黾樱ň幋a靶向致癌信號(hào)蛋白的基因突變。

      • 基因穩(wěn)定(GS)型:約占20%,其組織學(xué)變異彌漫且豐富,RHOA基因突變或RHO家族GTP酶活化蛋白基因融合現(xiàn)象多見。

      • 染色體不穩(wěn)定(CIN)型:此類腫瘤占胃癌的比例近一半,表現(xiàn)為顯著異倍體性及受體酪氨酸激酶的局部擴(kuò)增。

      這里,分享一個(gè)很有意思的R包:CancerSubtypes

      • https:///packages/release/bioc/html/CancerSubtypes.html

      發(fā)表這個(gè)CancerSubtypes包的文章是:(2017). “CancerSubtypes: an R/Bioconductor package for molecular cancer subtype identification, validation, and visualization.” Bioinformatics. https:///10.1093/bioinformatics/btx378.

      它里面集成了6種常見的腫瘤轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的分子分型的算法,包括:

      • Consensus clustering (CC) (Monti et al., 2003)
      • Consensus non-negative matrix factorization (CNMF) (Brunet et al., 2004)
      • Integrative clustering (iCluster) (Shen et al., 2009)
      • Similarity network fusion (SNF) (Wang et al., 2014)
      • Weighted SNF (WSNF) (Xu et al., 2016)

      可以看到其實(shí)都有一定年代了哦!

      大家在分析TCGA數(shù)據(jù)庫的時(shí)候,首先需要下載TCGA的33種癌癥的全部數(shù)據(jù),尤其是表達(dá)量矩陣和臨床表型信息啦,這里我們推薦在ucsc的xena里面下載:https:///datapages/

      GDC TCGA Acute Myeloid Leukemia (LAML) (15 datasets)
      GDC TCGA Adrenocortical Cancer (ACC) (14 datasets)
      GDC TCGA Bile Duct Cancer (CHOL) (14 datasets)
      GDC TCGA Bladder Cancer (BLCA) (14 datasets)
      GDC TCGA Breast Cancer (BRCA) (20 datasets)
      GDC TCGA Cervical Cancer (CESC) (14 datasets)
      GDC TCGA Colon Cancer (COAD) (15 datasets)
      GDC TCGA Endometrioid Cancer (UCEC) (15 datasets)
      GDC TCGA Esophageal Cancer (ESCA) (14 datasets)
      GDC TCGA Glioblastoma (GBM) (15 datasets)
      GDC TCGA Head and Neck Cancer (HNSC) (14 datasets)
      GDC TCGA Kidney Chromophobe (KICH) (14 datasets)
      GDC TCGA Kidney Clear Cell Carcinoma (KIRC) (15 datasets)
      GDC TCGA Kidney Papillary Cell Carcinoma (KIRP) (15 datasets)
      GDC TCGA Large B-cell Lymphoma (DLBC) (14 datasets)
      GDC TCGA Liver Cancer (LIHC) (14 datasets)
      GDC TCGA Lower Grade Glioma (LGG) (14 datasets)
      GDC TCGA Lung Adenocarcinoma (LUAD) (15 datasets)
      GDC TCGA Lung Squamous Cell Carcinoma (LUSC) (15 datasets)
      GDC TCGA Melanoma (SKCM) (14 datasets)
      GDC TCGA Mesothelioma (MESO) (14 datasets)
      GDC TCGA Ocular melanomas (UVM) (14 datasets)
      GDC TCGA Ovarian Cancer (OV) (15 datasets)
      GDC TCGA Pancreatic Cancer (PAAD) (14 datasets)
      GDC TCGA Pheochromocytoma & Paraganglioma (PCPG) (14 datasets)
      GDC TCGA Prostate Cancer (PRAD) (14 datasets)
      GDC TCGA Rectal Cancer (READ) (15 datasets)
      GDC TCGA Sarcoma (SARC) (14 datasets)
      GDC TCGA Stomach Cancer (STAD) (15 datasets)
      GDC TCGA Testicular Cancer (TGCT) (14 datasets)
      GDC TCGA Thymoma (THYM) (14 datasets)
      GDC TCGA Thyroid Cancer (THCA) (14 datasets)
      GDC TCGA Uterine Carcinosarcoma (UCS) (14 datasets)

      這些癌癥目前的分類仍然是太粗糙了,推薦使用 TCGAbiolinks 包獲取各個(gè)癌癥的細(xì)分亞群信息,代碼如下:

      suppressMessages(library(TCGAbiolinks))
      suppressMessages(library(tidyverse))

      #下載數(shù)據(jù)
      phe <- as.data.frame(TCGAquery_subtype(tumor = "brca"))
      table(phe$BRCA_Subtype_PAM50)


       Basal   Her2   LumA   LumB     NA Normal 
         192     82    562    209      2     40 

      也可以簡單檢查一下這個(gè)亞型與其它臨床信息的關(guān)系:

      library(gplots)
      balloonplot(table(
        phe$BRCA_Subtype_PAM50,
        phe$pathologic_stage
      ))

      如下所示:

      這個(gè)亞型與其它臨床信息的關(guān)系

      因?yàn)檫@個(gè)函數(shù)獲取的臨床信息 太多了,我們就不一一舉例啦:

      > colnames(phe)
       [1] "patient"                             "Tumor.Type"                         
       [3] "Included_in_previous_marker_papers"  "vital_status"                       
       [5] "days_to_birth"                       "days_to_death"                      
       [7] "days_to_last_followup"               "age_at_initial_pathologic_diagnosis"
       [9] "pathologic_stage"                    "Tumor_Grade"                        
      [11] "BRCA_Pathology"                      "BRCA_Subtype_PAM50"                 
      [13] "MSI_status"                          "HPV_Status"                         
      [15] "tobacco_smoking_history"             "CNV Clusters"                       
      [17] "Mutation Clusters"                   "DNA.Methylation Clusters"           
      [19] "mRNA Clusters"                       "miRNA Clusters"                     
      [21] "lncRNA Clusters"                     "Protein Clusters"                   
      [23] "PARADIGM Clusters"                   "Pan-Gyn Clusters"                   

      可以看到R語言真的是超級(jí)方便,適合做數(shù)據(jù)挖掘??!比如我的4個(gè)小時(shí)TCGA腫瘤數(shù)據(jù)庫知識(shí)圖譜視頻教程,中共使用了四種算法構(gòu)建模型:

      不管用了那種算法,核心都只是幾句代碼而已。

      其它癌癥類似,只需要變化它里面的縮略詞即可,感興趣的小伙伴可以把全部的癌癥都試一次。

      文末友情推薦

      與十萬人一起學(xué)生信,你值得擁有下面的學(xué)習(xí)班:

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多