文章題目:SystematicIdentification of Non-coding pharmacogenomic landscape in cancer 研究人員:匹茲堡大學(xué)藥物基因組中心、匹茲堡大學(xué)癌癥研究所等 發(fā)表時(shí)間:2018. 08 期刊名稱:Nature Communications 影響因子:12.35研究亮點(diǎn) 研究表明,長(zhǎng)鏈非編碼RNA(lncRNA)在癌癥藥物反應(yīng)中發(fā)揮重要作用。研究人員通過整合1005個(gè)癌細(xì)胞系的多維基因組數(shù)據(jù)和265種抗癌化合物的藥物反應(yīng)數(shù)據(jù)闡述了lncRNA的藥物基因組學(xué)景觀。其建立的lncRNA-藥物預(yù)測(cè)模型可以預(yù)測(cè)癌癥患者的治療結(jié)果,通過共表達(dá)分析表明lncRNA可通過藥物代謝或藥物靶標(biāo)通路調(diào)節(jié)藥物反應(yīng),此外還成功闡述了lncRNA EPIC1的藥物應(yīng)答機(jī)制。 研究背景 個(gè)體對(duì)癌癥治療的異質(zhì)性反應(yīng)主要?dú)w因于腫瘤細(xì)胞的遺傳差異?,F(xiàn)在的精準(zhǔn)癌癥藥物學(xué),主要使用癌癥細(xì)胞系和相應(yīng)的遺傳和藥理反應(yīng)數(shù)據(jù),來理解抗癌藥物的反應(yīng)機(jī)制。如今大規(guī)模高通量的癌癥藥物基因組學(xué)主要集中在蛋白質(zhì)編碼基因組的組成部分,而lncRNA與藥敏性關(guān)系卻未有系統(tǒng)性研究。在這里,研究人員整合了5605個(gè)原發(fā)腫瘤樣本中的2614個(gè)癌癥相關(guān)lncRNA的多維藥物基因組學(xué)數(shù)據(jù)和來自27個(gè)癌癥類型的505個(gè)癌細(xì)胞系,以構(gòu)建針對(duì)265種抗癌劑的基于lncRNA的藥物反應(yīng)模型。進(jìn)一步的彈性網(wǎng)絡(luò)(EN)回歸分析確定了癌細(xì)胞系中27,341個(gè)lncRNA-藥物預(yù)測(cè)對(duì)。值得注意的是,基于lncRNA的EN模型不僅可以預(yù)測(cè)獨(dú)立細(xì)胞系藥物基因組數(shù)據(jù)庫(kù)中的化療反應(yīng),還可以預(yù)測(cè)癌癥患者的化療反應(yīng)。研究人員的計(jì)算分析和實(shí)驗(yàn)驗(yàn)證表明,lncRNAs可能通過藥物代謝和藥物靶點(diǎn)途徑調(diào)節(jié)癌癥藥物反應(yīng)。 研究成果 癌癥細(xì)胞系模型可行性確認(rèn) 藥物敏感性數(shù)據(jù)主要基于癌癥細(xì)胞系篩選,而模型最終是用于實(shí)際的腫瘤數(shù)據(jù)中。因此,研究人員比較了TCGA數(shù)據(jù)庫(kù)中2614種lncRNA與CCLE等細(xì)胞系數(shù)據(jù)庫(kù)中l(wèi)ncRNA變異情況,從拷貝數(shù),表觀和表達(dá)量差異三個(gè)方面對(duì)比,來確認(rèn)癌癥細(xì)胞系是否能代表原發(fā)性腫瘤的lncRNA變異情況。從圖1可看出,以最鄰近匹配算法計(jì)算,三方面綜合一致性高達(dá)94.4%。這說明癌癥細(xì)胞系模型能很好代表實(shí)際原發(fā)性腫瘤中的lncRNA變異情況,從而為模型訓(xùn)練提供很好的數(shù)據(jù)基礎(chǔ)。 圖1 癌細(xì)胞系中l(wèi)ncRNA-藥物相互作用概述 研究人員整合了505個(gè)癌細(xì)胞系的LncRNA表達(dá)譜和265種抗癌藥物反應(yīng)數(shù)據(jù)(包括IC50、AUC值)以鑒定預(yù)測(cè)性lncRNA-藥物對(duì)。結(jié)合彈性網(wǎng)絡(luò)(EN)回歸和自舉聚合(boot-strap aggregating),研究人員為所有細(xì)胞系(泛癌模型)或特定癌癥類型的細(xì)胞系(癌癥特異性模型)的每種藥物建立了lncRNA-藥物反應(yīng)預(yù)測(cè)模型。通過預(yù)測(cè)應(yīng)答與每種藥劑的觀察應(yīng)答之間的相關(guān)性來評(píng)估模型性能。 Bootstraping 自舉模型從圖2b可看出,265種藥物的泛癌模型在自舉時(shí)皮爾森相關(guān)系數(shù)達(dá)到了r = 0.31。而樣本數(shù)量較少的癌癥特異性模型稍低,為r = 0.13。 為了確定每種lncRNA對(duì)藥物反應(yīng)的貢獻(xiàn),模型根據(jù)整個(gè)自舉過程中被EN回歸選擇的頻率為每個(gè)lncRNA分配一個(gè)預(yù)測(cè)分?jǐn)?shù)(PS)。較高的PS表示該lncRNA與相應(yīng)的藥物應(yīng)答具有更好的關(guān)聯(lián),并被定義為lncRNA-藥物預(yù)測(cè)對(duì)。如圖2c,d所示,使用IC50作為應(yīng)答指標(biāo)時(shí),通過泛癌模型鑒定了27,341個(gè)lncRNA-藥物預(yù)測(cè)對(duì)。從圖2e可看出,使用AUC作為藥物反應(yīng)的指標(biāo)時(shí),與IC50預(yù)測(cè)結(jié)果高度一致。這些預(yù)測(cè)對(duì)在CCLE和CTRP數(shù)據(jù)集分別得到了獨(dú)立驗(yàn)證。而且成功識(shí)別了某些已被記錄調(diào)節(jié)藥物應(yīng)答的lncRNA。比如驗(yàn)證的MEG3過表達(dá)和順鉑敏感性相關(guān),即肺癌和卵巢癌患者M(jìn)EG3的過表達(dá)能使順鉑有更好的療效。 從圖2c可看出,相同通路靶向的藥物傾向于預(yù)測(cè)出相似的lncRNA。例如,靶向基因組完整性的藥物顯著共享更多預(yù)測(cè)的lncRNA(圖 2f)。此外,在基因組完整性靶向藥物類中,PARP抑制劑olaparib和talazoparib的預(yù)測(cè)性lncRNA比例顯著高于CHEK抑制劑AZD7762,這表明lncRNA-藥物預(yù)測(cè)對(duì)可能暗示了這些細(xì)胞系中藥物應(yīng)答機(jī)制。 圖2 lncRNA EN模型(LENP)進(jìn)一步,研究人員使用自舉法鑒定的最具預(yù)測(cè)性lncRNA為每種藥物分別構(gòu)建基于lncRNA的EN預(yù)測(cè)模型(LENP)?;贗C50值訓(xùn)練的LENP模型,比起自舉模型在預(yù)測(cè)細(xì)胞系IC50方面表現(xiàn)顯著改善(圖 3a)??傮w而言,泛癌LENP模型皮爾森相關(guān)系數(shù)為r = 0.55,而癌癥特異性LENP模型為r = 0.71(圖 3b)。從圖3c中可以看到,具有更好泛癌表現(xiàn)的藥物往往是具有更廣泛抗癌譜的藥劑。例如,在泛癌模型中,靶向細(xì)胞周期,基因組完整性和有絲分裂的藥物總體上比靶向ABL信號(hào)傳導(dǎo)和IGFR信號(hào)傳導(dǎo)的藥物具有更好的表現(xiàn)(圖 3c)。與自舉模型相似,研究人員分別使用CCLE和CTRP數(shù)據(jù)庫(kù)驗(yàn)證LENP模型,在其中的14種重疊藥物中,9種得到驗(yàn)證,包括紫杉醇和17-AAG,如圖3d、e所示。 圖3 LENP模型預(yù)測(cè)癌癥患者的治療結(jié)果 LENP模型是基于細(xì)胞系數(shù)據(jù)建立的,為了進(jìn)一步確定LENP模型是否能預(yù)測(cè)實(shí)際腫瘤患者的治療效果,研究人員用TCGA腫瘤的lncRNA表達(dá)譜使用了LENP模型。結(jié)論是LENP模型能夠預(yù)測(cè)出不同腫瘤中已知的或是新的敏感性藥物。如圖4a所示,bleomycin是FDA通過用于UCEC、CESC、HNSC的治療藥物,比起其他腫瘤預(yù)測(cè)的平均23.8%的敏感度,這三種腫瘤高得多,分別為95.3%、55.5%、38.5%。而對(duì)于lmatinib這種被FDA通過用于CML的治療藥物,在AML、LGG、GBM等腫瘤上也發(fā)現(xiàn)了較高的藥物敏感度。實(shí)際上,AML和GBM的lmatinib批準(zhǔn)也進(jìn)入了臨床二期實(shí)驗(yàn)。這說明LENP模型能很好的指示拓寬藥物的使用譜。 研究人員還通過模型對(duì)49種FDA批準(zhǔn)藥物預(yù)測(cè)各個(gè)腫瘤中的預(yù)后,若模型對(duì)藥物預(yù)測(cè)結(jié)果為抗性則表示預(yù)測(cè)預(yù)后較差。從圖4b可看出,對(duì)于49種FDA通過的治療藥物,在圖中幾種實(shí)體瘤中有66個(gè)藥物-腫瘤對(duì)是預(yù)測(cè)預(yù)后是較差的(p<> 另外,臨床實(shí)際用藥時(shí),腫瘤患者常常聯(lián)合用藥而不是單單一種。因此,為了更好地預(yù)測(cè)化療應(yīng)答,研究人員綜合每種癌種的FDA批準(zhǔn)一線和二線化療藥物計(jì)算了一個(gè)共識(shí)應(yīng)答分?jǐn)?shù)。用這種啟發(fā)式算法,研究人員發(fā)現(xiàn)THCA、STAD、CRC癌癥更傾向于預(yù)測(cè)出化療抗性,如圖4c所示。 那模型預(yù)測(cè)預(yù)后是否準(zhǔn)確呢?研究人員提取了TCGA中記錄了化療結(jié)果的患者數(shù)據(jù),如圖4d所示,根據(jù)LENP-tamoxifen模型,在OV中預(yù)測(cè)為藥物抗性的患者往往實(shí)際生存率較差(圖中紅色的高IC50表示預(yù)測(cè)為藥物抗性)。在STAD、UCEC中也得到了驗(yàn)證。這些結(jié)果證明了LENP對(duì)化療預(yù)后的預(yù)測(cè)能力。 圖4 LncRNA可通過藥物代謝調(diào)節(jié)耐藥性 多重耐藥性(MDR)是原發(fā)和復(fù)發(fā)腫瘤化療失敗的重要原因。因此研究人員基于熵方法來確定了381個(gè)潛在的獨(dú)立于藥物靶向機(jī)制的MDR相關(guān)lncRNA。通過將這些lncRNA和編碼基因的共表達(dá)數(shù)據(jù)做GSEA分析發(fā)現(xiàn),如圖5b所示,MDR相關(guān)lncRNA與藥物代謝、糖酵解、凋亡相關(guān)通路有顯著關(guān)聯(lián)??偣灿?64種MDR相關(guān)lncRNA與藥物代謝顯著相關(guān)。(圖5c)。這與先前的研究一致,藥物代謝通路基因能調(diào)節(jié)藥物代謝和細(xì)胞內(nèi)藥物濃度,從而導(dǎo)致耐藥性和個(gè)體腫瘤間的藥物差異應(yīng)答。 這里作者以LINC00992 lncRNA做了深入分析,它是一種在多種癌癥中表達(dá)的基因間lncRNA,根據(jù)模型預(yù)測(cè),與118種藥物應(yīng)答有關(guān)(圖5e)。它與CYP2J2、CYP1A1等藥物代謝基因有著顯著的正相關(guān)(圖5d)。高水平表達(dá)LINC00992和CYP系列基因的細(xì)胞系表現(xiàn)出了116(98%)種藥物的耐藥性(圖5e-g)。更進(jìn)一步發(fā)現(xiàn),其高表達(dá)與BRCA、 LIHC、THCA、READ的低生存率顯著相關(guān)(圖5h-i)。而事實(shí)上,LINC00992已被證明是CYP這個(gè)重要化療抗性相關(guān)基因的調(diào)節(jié)劑。這些現(xiàn)象說明LINC00992很可能作為檢測(cè)多重耐藥性的新生物標(biāo)記。 圖5 EPIC1作為BET抑制劑抗性的主要調(diào)節(jié)劑 lncRNA除了和藥物代謝有關(guān),研究人員還發(fā)現(xiàn)lncRNA能直接調(diào)節(jié)藥物靶向通路。研究人員深入研究了iBET的藥物機(jī)制。iBET(BET抑制劑)是一類能破壞BET蛋白家族的小分子,被證明能有效治療許多癌癥。而研究人員用模型預(yù)測(cè)出對(duì)于iBET藥物來說,耐藥性最強(qiáng)的lncRNA是EPIC1——一種基因間lncRNA,在15中癌癥中過表達(dá)。高EPIC1和BRCA 、LIHC、THCA、READ的低生存率顯著相關(guān)。研究人員基于這個(gè)現(xiàn)象,分別在三種癌細(xì)胞系中敲除過表達(dá)的EPIC1,發(fā)現(xiàn)iBET的耐藥結(jié)果與預(yù)測(cè)一致。 當(dāng)EPIC1被敲除時(shí),宮頸癌和乳腺癌細(xì)胞系中4381個(gè)基因的表達(dá)發(fā)生顯著改變,505個(gè)細(xì)胞系中的16/18的EPIC1相關(guān)通路被顯著調(diào)控,且在基因集富集時(shí),MYC通路都是最顯著富集的。模型和實(shí)驗(yàn)結(jié)果證明了EPIC1通過直接作用于MYC蛋白而調(diào)節(jié)MYC轉(zhuǎn)錄活性。其作為一個(gè)重要的致癌lncRNA,通過增強(qiáng)MYC轉(zhuǎn)錄活性而提高iBET類藥物耐藥性。 文章總結(jié) 由于缺乏覆蓋人類基因組非編碼區(qū)的基因組學(xué)/表觀遺傳平臺(tái)以及腫瘤中藥物反應(yīng)信息。在癌癥藥物反應(yīng)中的lncRNA作用的研究尚未獲得太多進(jìn)展。這些瓶頸導(dǎo)致大多數(shù)lncRNA研究使用“自下而上”策略,首先確定每個(gè)個(gè)體lncRNA的下游調(diào)節(jié)功能,然后研究lncRNA對(duì)癌癥中藥物反應(yīng)的調(diào)節(jié)。在這個(gè)項(xiàng)目中,研究人員采用了“自上而下”的方法,該方法整合了來自原發(fā)腫瘤和癌細(xì)胞的藥物基因組學(xué)數(shù)據(jù),構(gòu)建了基于lncRNA的藥物反應(yīng)預(yù)測(cè)模型,并鑒定了可能機(jī)制調(diào)節(jié)藥物應(yīng)答的候選lncRNA。并且證明癌細(xì)胞系可以高度概括原發(fā)腫瘤中l(wèi)ncRNAs的改變。此外,基于癌細(xì)胞系的EN模型,即LENP模型,可以容易地預(yù)測(cè)癌癥患者的化療反應(yīng)。lncRNA和蛋白質(zhì)編碼基因表達(dá)之間的綜合分析進(jìn)一步表明lncRNAs可能通過調(diào)節(jié)藥物代謝或藥物靶標(biāo)途徑來調(diào)節(jié)癌癥藥物反應(yīng)。這是目前第一項(xiàng)系統(tǒng)地將非編碼基因型與癌細(xì)胞系和患者腫瘤中的藥物反應(yīng)表型聯(lián)系起來的研究。在未來,使用深度學(xué)習(xí)算法,通過整合lncRNA,miRNA和PCG等各類穩(wěn)定分子基因組學(xué)以及表觀遺傳變化能夠更全面模擬癌癥藥物反應(yīng)。 在藥物預(yù)測(cè)模型之上,研究人員的特征選擇策略還確定了27,341個(gè)lncRNA-藥物預(yù)測(cè)對(duì),這可能有助于揭示新的lncRNA調(diào)節(jié)因子在癌癥中的藥物反應(yīng)。然而,研究人員在獨(dú)立數(shù)據(jù)庫(kù)(即CCLE和CTRP)中驗(yàn)證這些非編碼藥物基因組關(guān)聯(lián)的能力在很大程度上受到以下因素的限制:(1)使用不同的藥理學(xué)檢測(cè),(2)重疊細(xì)胞系和藥劑的數(shù)量有限,(3)缺乏金標(biāo)準(zhǔn)定義這些藥物基因組學(xué)數(shù)據(jù)庫(kù)之間“真陽性“。因此,研究中的lncRNA-藥物預(yù)測(cè)對(duì)仍然需要實(shí)驗(yàn)驗(yàn)證和機(jī)制研究。在這方面,研究人員已經(jīng)實(shí)驗(yàn)證明,EPIC1是iBET藥物的最高預(yù)測(cè)性lncRNA,通過調(diào)節(jié)MYC轉(zhuǎn)錄活性來引發(fā)耐藥性。 總之,目前的研究建立了27種癌癥類型和265種藥物中l(wèi)ncRNA-藥物預(yù)測(cè)對(duì)的詳細(xì)知識(shí)庫(kù)。這有助于開發(fā)用于癌癥精確醫(yī)學(xué)的新型基因組模型。此外,通過提供有希望的治療靶點(diǎn)來克服癌癥化學(xué)療法抗性,進(jìn)一步鑒定癌癥藥物反應(yīng)的潛在lncRNA主要調(diào)節(jié)因子將為基于lncRNA的癌癥治療在短期內(nèi)鋪平道路。 小編評(píng)論 之前我們介紹了胚系突變和藥敏性之間關(guān)系的研究(詳見 文章解讀 | 藥效好不好,可能是天生的----論胚系突變與藥物敏感性關(guān)系),而這篇?jiǎng)t將目光集中于lncRNA與癌癥藥物應(yīng)答關(guān)系。從基因組學(xué)的角度來看,加上已廣泛應(yīng)用的體細(xì)胞突變與藥敏關(guān)聯(lián)研究,基因組各個(gè)層面都已有建立預(yù)測(cè)藥物反應(yīng)模型的方法。相信對(duì)這些遺傳信息的綜合分析,未來能大大提高癌癥化療的預(yù)后預(yù)測(cè),成為精準(zhǔn)醫(yī)療的又一重要手段。并且在基礎(chǔ)研究中為藥物耐藥機(jī)制研究提供新方法。 參考文獻(xiàn): [1] Da Yang, Min Zhang, et al. Nature Communicationsvolume 9, Article number: 3192 (2018) |
|