做科研有三種痛不能忍,一種是腦袋空空沒思路,二是辛辛苦苦沒成果,三是別人輕輕松松發(fā)文章。今兒先和大家聊聊課題思路方面的事兒,今天主題我們選了基因研究,為啥?生信火,大數(shù)據(jù)火,這兩個(gè)都繞不開基因。 所以你的日常可能是這樣的: 1 花了老大筆錢測了序,篩了一堆讓人傻眼的基因,接下去怎么做? 2 挖了數(shù)據(jù)分析了半天,還是一堆看不出所以然的基因,接下去呢? 3 看文獻(xiàn)相中了一個(gè)感興趣的基因,那我可不可以就做這一個(gè)? 歸納一下就兩個(gè)問題:1、怎么確定一個(gè)基因可以做;2、基因研究該怎么做。 這兩個(gè)問題也是老生常談了,但攻略干貨看起來簡單,回歸到實(shí)際問題還是得文獻(xiàn)數(shù)據(jù)庫來回翻。今天就來解決點(diǎn)實(shí)際問題: 看看如何快速判斷一個(gè)基因是否值得做,怎么做。 用到的一個(gè)懶人工具——基因雷達(dá),非常適合文獻(xiàn)和數(shù)據(jù)庫不對付的親,只要輸入你感興趣的基因,基因的科研熱度,相關(guān)疾病,調(diào)控網(wǎng)絡(luò)和在癌癥中的表達(dá)值四個(gè)層面就全出來了。似乎從此可以脫離苦海了。 1 如何省時(shí)省力確定一個(gè)基因可以做 先看差異表達(dá) 比如說你翻翻翻文獻(xiàn)看到了一個(gè)還不錯(cuò)的基因CCL5(PMID:17914389,乳腺癌),也想研究下,但自己沒有數(shù)據(jù),不知道這個(gè)基因在你研究中的疾病到底是個(gè)什么情況。 不用翻TCGA,你就可以在基因雷達(dá)中中查看CCL5在33種腫瘤中正常組織和癌組織的表達(dá)情況。在工具中輸入CCL5,選擇表達(dá)概況,就可以得到下面的結(jié)果。 (點(diǎn)開看大圖) PS:表達(dá)概況是基于TCGA的RNA-SEQv2數(shù)據(jù)中的標(biāo)準(zhǔn)化數(shù)據(jù)文件中的表達(dá)值進(jìn)行直接使用(數(shù)據(jù)收集時(shí)間為2016年6月)。 CCL5在乳腺癌轉(zhuǎn)移中有重要作用,通過下面數(shù)據(jù)可以推測CCL5在某些腫瘤中高表達(dá)也可能具有轉(zhuǎn)移作用,比如膀胱膀胱尿路上皮癌(BLCA)。 再看研究概況 好,有數(shù)據(jù)依據(jù)了,那CCL5別人都研究到什么程度了呢?這時(shí)你可以通過工具中的研究熱點(diǎn)來看。研究熱點(diǎn)根據(jù)基因在數(shù)據(jù)庫中的注釋情況,從相關(guān)文獻(xiàn)、通路、功能、已驗(yàn)證的靶向miRNA、和疾病五個(gè)角度來統(tǒng)計(jì)和評(píng)價(jià)基因研究情況。 (點(diǎn)開看大圖) PS : 綠色代表目標(biāo)基因,灰色代表了數(shù)據(jù)庫中眾基因在 各個(gè)層面的中位數(shù)。 1. 相關(guān)文獻(xiàn):被文獻(xiàn)報(bào)道的總次數(shù); 2. 通路:即根據(jù)KEGG數(shù)據(jù)庫統(tǒng)計(jì)基因參與的通路的數(shù) 量; 3. 功能:即根據(jù)Go數(shù)據(jù)庫(Gene Ontology,基因本 體學(xué)數(shù)據(jù)庫),統(tǒng)計(jì)基因參與的功能(生物過程)的數(shù) 量。 4. 已驗(yàn)證的靶向microRNA:已經(jīng)有文獻(xiàn)發(fā)表驗(yàn)證的 miRNA的數(shù)量。 5. 疾?。阂呀?jīng)有文獻(xiàn)發(fā)表的疾病數(shù)量。 從上圖綠色包圍灰色的形勢看,這個(gè)CCL5也算研究的熱門了。點(diǎn)擊相應(yīng)的內(nèi)容,可以進(jìn)入到對應(yīng)的數(shù)據(jù)界面。 那CCL5都在哪些疾病中研究過了呢?點(diǎn)擊“disease”就可以跳轉(zhuǎn)到疾病界面,它統(tǒng)計(jì)了基因的研究最多的疾病TOP 20。我們關(guān)注CCL5在癌癥轉(zhuǎn)移方面的研究,找到“癌癥轉(zhuǎn)移”,不算太多,點(diǎn)擊即可進(jìn)入文獻(xiàn)詳情頁面。 (點(diǎn)開看大圖) 好用不?下面解決下第二個(gè)問題。 2 確定基因后如何快速確定下一步怎么做 現(xiàn)在假設(shè)CCL5是可以作為我們后續(xù)的研究對象,在基因?qū)用?,一般的思路是先做基因的功能?yàn)證,再探討基因的作用機(jī)理。前者比較常規(guī),在這不做過多討論,今天來看看如何用基因雷達(dá)快速挖掘出基因可能的調(diào)控網(wǎng)絡(luò)。 畫調(diào)控網(wǎng)絡(luò) 在機(jī)制探索中,找出關(guān)鍵基因后,會(huì)以它為中心展開,看其受到哪些基因調(diào)控,又調(diào)控了哪些基因,就是所謂的找其上下游基因/調(diào)控因子,進(jìn)而摸索出一整個(gè)調(diào)控網(wǎng)絡(luò)。 在基因里雷達(dá)中,調(diào)控網(wǎng)絡(luò)整合了文獻(xiàn)報(bào)道過的TF,miRNA,lncRNA及KEGG數(shù)據(jù)庫中的上下游基因。如CCL5的調(diào)控網(wǎng)絡(luò),不同色塊代表不同的基因?qū)用婧妥饔梅绞?,點(diǎn)擊圖中的某個(gè)點(diǎn)可看到具體的數(shù)據(jù)信息。 (點(diǎn)開看大圖) ps: 1. 轉(zhuǎn)錄因子:已經(jīng)有文獻(xiàn)報(bào)道的相關(guān)轉(zhuǎn)錄因子; 2. miRNA:已經(jīng)有文獻(xiàn)報(bào)道的相關(guān)miRNA; 3. lncRNA:依據(jù)文獻(xiàn)挖掘可能有關(guān)的lncRNA;(準(zhǔn)確性較弱) 4. 上下游相關(guān)基因:依據(jù)KEGG數(shù)據(jù)庫的基因上下游關(guān)系。 圖很炫,但結(jié)果這么多,咋理出一條線來呢?這個(gè)的話就需要結(jié)合具體的研究場景去做篩選了。 如果想找新的被人沒做過的轉(zhuǎn)錄因子,可在基因雷達(dá)中的預(yù)測轉(zhuǎn)錄一因子部分查看。還是CCL5為例,CCL5預(yù)測到的TF只有三個(gè),這樣 (點(diǎn)開看大圖) Ps:基于基因的轉(zhuǎn)錄本通過Transfac數(shù)據(jù)庫進(jìn)行轉(zhuǎn)錄因子預(yù)測,以推薦度來表示預(yù)測出來的轉(zhuǎn)錄因子的科研價(jià)值,推薦度越高越好。 用完只有一種感覺,專門為我這種四體不勤的人準(zhǔn)備的嘛。求鏈接! |
|