作者:麥子 轉(zhuǎn)載請注明:解螺旋·臨床醫(yī)生科研成長平臺 當(dāng)我們資源不足時,自然會想要找一些省錢的辦法來發(fā)文章,窮則思變嘛。生信是個好辦法,可是有些醫(yī)生朋友還是覺得不太熟悉,別說后邊的分析方法了,就連最開始找數(shù)據(jù)都不好找。研究腫瘤的比較有福,腫瘤的數(shù)據(jù)最豐富了,像大名鼎鼎的TCGA、Ocomine等??裳芯科渌膊〉脑趺崔k,有沒有疾病特異性數(shù)據(jù)庫呢? 資源上哪找 隨著研究成果的積累,大大小小的數(shù)據(jù)庫們就冒了出來,駐扎在互聯(lián)網(wǎng)的各個角落,現(xiàn)在已經(jīng)有了上千個。 找數(shù)據(jù)比較權(quán)威的資源集中站,是牛津大學(xué)出版社的Nucleic Acids Research(NAR)雜志。從1994年開始,NAR每年都要出版分子生物學(xué)數(shù)據(jù)庫特輯(database issue),收錄新增的數(shù)據(jù)庫、盤點(diǎn)舊數(shù)據(jù)庫的更新狀況、移除失效鏈接等,做個總結(jié)。目前最新版是第24版,即2017版。 而所有收錄的數(shù)據(jù)庫可以在NAR的網(wǎng)站上找到,下面是一個按字母排序的列表: https://www./nar/database/a/ 不過找起來更方便的可能是按功能分類查找: https://www./nar/database/c/ NAR把數(shù)據(jù)庫分為15個類別(有些數(shù)據(jù)庫會同時被分到好幾個類別): 有些分類下邊還有子類別,可以跟據(jù)自己的目的逐級點(diǎn)開,找到相應(yīng)的資源。比如想找個特定的疾病,就點(diǎn)開Human Genes and Diseases,下邊還有4個子分類,其中癌癥基因數(shù)據(jù)庫是單獨(dú)一個子類(Cancer gene databases),其他的疾病可以點(diǎn)開Gene-, system- or disease-specific databases,就可看到具體數(shù)據(jù)庫列表。 這當(dāng)然只是一部分啦~ 圖中可看到注意力缺陷多動障礙(ADHDgene),自身免疫性淋巴細(xì)胞增生綜合征(ALPSbase),阿茲海默?。ˋlzGene)等等。 點(diǎn)進(jìn)去會有數(shù)據(jù)庫的描述說明,或詳或略。并附有數(shù)據(jù)庫網(wǎng)站鏈接,點(diǎn)進(jìn)去就是了。 注意數(shù)據(jù)庫的質(zhì)量 數(shù)據(jù)庫這么多,也有大小之分,當(dāng)然不是隨便一個數(shù)據(jù)庫拿來就用,用了就能得到非常牢靠的研究成果。 一個成功的數(shù)據(jù)庫背后,要有良好的管理維護(hù)工作。大數(shù)據(jù)庫為什么著名、好用,是因為有一個大集團(tuán)在運(yùn)營。比較著名的機(jī)構(gòu)有美國國家生物技術(shù)信息中心(NCBI)、歐洲分子生物學(xué)實(shí)驗室-歐洲生物信息學(xué)研究所(EMBL-EBI)、瑞士生物信息學(xué)研究所(SIB)、日本國立遺傳學(xué)研究所(NIG)、華大基因(BGI)等。 而一些小團(tuán)隊為自己特定的研究領(lǐng)域創(chuàng)建的數(shù)據(jù)庫,質(zhì)量就參差不齊了,上邊提到的疾病特異性數(shù)據(jù)庫大多屬于此類。 雖然小團(tuán)隊不容易跟大佬競爭,而且有時候同一個領(lǐng)域會有好幾個相似的數(shù)據(jù)庫,NAR也不介意都收錄,只要它們符合一定質(zhì)量條件,且還在運(yùn)營、維護(hù)、為研究者提供服。因為NAR鼓勵良性競爭,讓那些數(shù)據(jù)庫經(jīng)歷時間的考驗證明自己。像研究G蛋白耦聯(lián)受體的GPCRdb和研究碳水化合物活性酶的CAZy就是小團(tuán)隊的成功范例。 對于用戶來說,采用一個數(shù)據(jù)庫做研究之前要多留心,要了解好它的數(shù)據(jù)來源和運(yùn)營維護(hù)情況,是否有及時回應(yīng)用戶的反饋,是否有版本控制;還要多檢索文獻(xiàn),看看這個數(shù)據(jù)庫的使用情況,大家利用它做出了哪些成果,反饋如何等等。必要時可多找?guī)讉€相關(guān)的數(shù)據(jù)庫互相佐證。 參考資料: 1. 生物信息學(xué):基礎(chǔ)及應(yīng)用. 清華大學(xué)出版社. 2014. 2. https://academic./nar 3. The 24th annual Nucleic Acids Research database issue: a look back and upcoming changes |
|