前幾天去南京參加兩年一度的全國大會(huì)CCBSB2014,今年是第六屆,見到許多熟識(shí)的前輩和老朋友,也結(jié)識(shí)了不少新朋友。相比于兩年前在哈爾濱開的第五屆大會(huì),參會(huì)人數(shù)又多了100多。連大會(huì)特邀報(bào)告算上,總共76位學(xué)者做口頭報(bào)告,其中30位學(xué)者我之前并不認(rèn)識(shí),這個(gè)比例正好是40%。領(lǐng)域里的大會(huì)小會(huì),無論何時(shí)、何地,總有約40~50%的學(xué)者我不認(rèn)識(shí),這個(gè)比例近年來恒定不變,咱生信領(lǐng)域發(fā)展速度之快,由此可見一斑。70多位學(xué)者的報(bào)告所涉及的研究方向,大概至少有60多個(gè),兩位或者多位學(xué)者從事一個(gè)小的研究方向的現(xiàn)象,非常少見。昨晚和有11年交情的好友一起吃飯,大家回憶十年前國內(nèi)生信開大會(huì)的場(chǎng)景,想了半天慶華來一句:那會(huì)兒大家好像沒啥可以做的,哪像現(xiàn)在這么多問題??!所以咱生信領(lǐng)域現(xiàn)在真實(shí)的場(chǎng)景是:火打著,油門踩到底,檔掛到頂,一望無際的荒原,使勁的狂奔,一往無前;有條件的開法拉利,沒條件的開樂馳,實(shí)在沒條件的蹬個(gè)三輪兒也行,反正地盤兒有的是,誰搶著算誰的。兄弟我對(duì)這一現(xiàn)象總結(jié):圈地運(yùn)動(dòng)。講這兒估計(jì)有人不高興了:你們生信咋做的這么散呢?這個(gè)不是咱生信想做的散:問題實(shí)在太多,又不缺數(shù)據(jù),自己感興趣的問題都沒解決,哪有時(shí)間管人家的東西???使勁兒的沖就得了。至于即將畢業(yè),或者剛畢業(yè)的同行兄弟們,也別覺得沒肉吃了,大家就算這么裸奔,也遠(yuǎn)沒有涵蓋生信所有的方向,并且一般一個(gè)小領(lǐng)域往少了說能容納10位學(xué)者不算擠,那咱這領(lǐng)域的規(guī)模擴(kuò)大10倍也照樣容得下。所以咱在這兒說一句:歡迎加入圈地運(yùn)動(dòng)(要不改成“生信歡迎您”?)。
*************************************************************************** 講完廢話講正事。話說八號(hào)晚上參會(huì)的學(xué)者們開了一個(gè)“青年沙龍”,形式很活潑,討論了各種問題,其中忘記誰提了個(gè)問題,大致就是怎么評(píng)價(jià)生物信息學(xué)者的水平。大家七嘴八舌說了半天,最后Shirley做總結(jié),眾人一聽,有道理。所以回來之后Shirley就寫了篇博文《Levelsof Bioinformatics Research》,建議同行兄弟們讀讀,推薦指數(shù)五星。因?yàn)樵凵潘闶潜容^新的研究領(lǐng)域,又是交叉學(xué)科,一般來說正統(tǒng)搞計(jì)算的覺得你在方法上沒貢獻(xiàn),搞生物的又覺得你其實(shí)也就是個(gè)修電腦的。話說到這,電話鈴兒響了,二樓打電話讓過去看一下電腦咋黑屏了。好嘛,蹬蹬蹬跑下樓,圍著電腦琢磨了半天,明白了:插頭沒插緊。擺平,回辦公室。因此交叉學(xué)科評(píng)價(jià)這是個(gè)問題,哪邊兒都不討好,給個(gè)醬油級(jí)的評(píng)價(jià)那已經(jīng)算是給面子了。所以同行評(píng)議才合理,好在咱生信現(xiàn)在人也不少,建立同行評(píng)議的機(jī)制并不困難。兄弟我寫博客屬于踩西瓜皮式的寫法,滑哪兒寫哪兒,這篇咱盡量忠于Shirley的原文,不改主要的觀點(diǎn)。 如何成為頂級(jí)的生物信息學(xué)家?看你的研究。所以Shirley將生物信息學(xué)研究(注意,不是生物信息學(xué)者本人)的水平劃分成五個(gè)層次。此外,Shirley不區(qū)分生物信息學(xué)(Bioinformatics)和計(jì)算生物學(xué)(Computational biology),因此這兩個(gè)概念不做區(qū)分。在這里咱再重復(fù)一遍,生物信息學(xué)和計(jì)算生物學(xué)的區(qū)別,就是西紅柿炒蛋和蛋炒西紅柿的區(qū)別,您要覺得有區(qū)別,那看我嘴型:呵呵。 0級(jí) (Level 0):為建模、而建模(modeling for modeling’s sake)。簡稱:渣級(jí)。Shirley在博客里提到說“如果你記得功夫熊貓”,問題是我沒記得這個(gè),腦子里想的是《憨豆的黃金周》里那段nothing, nothing, nothing… 原博舉的例子是,之前有人問:現(xiàn)在數(shù)據(jù)這么多,能建模的東西一大把,那我們?cè)摳牲c(diǎn)啥呢?Shirley就問:你想解決啥問題?答:建模的問題。這就像我坐電梯看見認(rèn)識(shí)的研究生,說小伙最近忙啥呢?答:做水稻呢。繼續(xù)問:具體研究的啥?不高興了,詫異:研究水稻啊!然后給我解釋了半天中國要研究水稻的必要性。我…兄弟我每天吃米飯還固定要研究水稻三遍呢。原文解釋,這個(gè)回答是OK的,如果科學(xué)家僅僅將自己當(dāng)成數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家、計(jì)算機(jī)科學(xué)家、物理學(xué)家,或者像我這樣用嘴巴研究水稻的吃貨,因?yàn)樵谶@些學(xué)者各自的領(lǐng)域里,確實(shí)有許多好的理論建模問題。但如果這些學(xué)者是認(rèn)真對(duì)待生物信息學(xué)的研究,這個(gè)回答不OK。許多0級(jí)生物信息學(xué)家們從來不讀或者不發(fā)表生物學(xué)期刊上的論文,也不參加生物學(xué)的會(huì)議,因此這個(gè)級(jí)別屬于“未入門級(jí)”。根據(jù)人以類聚,物以群分的原則,0級(jí)生物信息學(xué)家們通常只閱讀自己或者其他0級(jí)生物信息學(xué)家的論文,并且,并且引用也是自引或者被同級(jí)別的學(xué)者引用。因此這類研究就是浪費(fèi)資源。 1級(jí)(Level 1):給數(shù)據(jù)、能分析。簡稱:菜鳥級(jí)。這類研究一般是分析自己或者合作者實(shí)驗(yàn)室里未發(fā)表的數(shù)據(jù),并試圖獲得新的生物學(xué)發(fā)現(xiàn)。相比與0級(jí),這已經(jīng)有很大的進(jìn)步,并且是訓(xùn)練生物信息學(xué)者最好的途徑之一??梢跃毩?xí)將已有的生物信息學(xué)技術(shù)來做出真正生物學(xué)發(fā)現(xiàn)的技巧,學(xué)習(xí)更多的生信技術(shù)和生物學(xué)知識(shí),可以啟發(fā)、衍生出2級(jí)和3級(jí)的好課題。評(píng)價(jià)1級(jí)科研的功底和水平要看數(shù)據(jù)有多復(fù)雜, 是否需要生信人員寫一些程序和算法(而不是只用他人的工具),生信分析在整個(gè)研究中的有重要性 (最重要的假設(shè)發(fā)現(xiàn)是不是由生物信息分析出來的,文章中生信圖表的個(gè)數(shù)),實(shí)驗(yàn)與計(jì)算的結(jié)合程度 (實(shí)驗(yàn)與計(jì)算 環(huán)環(huán)相扣,而不是高通量實(shí)驗(yàn)數(shù)據(jù)獲得完跟個(gè)生信分析就拉倒),以及研究中生物學(xué)的發(fā)現(xiàn)是不是真的有意思,等等。因此兄弟我的看法是,1級(jí)雖然是“入門級(jí)”,但非常非常重要,所有生信專業(yè)研究生的必經(jīng)之路,非生信領(lǐng)域的學(xué)者或?qū)W生,能達(dá)到1級(jí)中已可算是高手,進(jìn)階到1級(jí)上那就是鳳毛麟角了。 2級(jí)(Level 2):想新招、玩數(shù)據(jù)。簡稱:肉鳥級(jí)。具有2級(jí)水準(zhǔn)的生信研究有:1) 設(shè)計(jì)方法解決生物醫(yī)學(xué)相關(guān)大數(shù)據(jù)分析中普適、定量的問題。比如咱生信課本里經(jīng)典的用于雙序列比對(duì)的Smith-Waterman算法等等;2) 設(shè)計(jì)算法來分析新的高通量技術(shù)所獲得的數(shù)據(jù),例如華大基因設(shè)計(jì)的用于二代測(cè)序短讀段 (read) 映射到基因組上的SOAP系列工具,這就是典型的2級(jí)工作;3) 從各種公共數(shù)據(jù)中通過整合建立數(shù)據(jù)庫或數(shù)據(jù)資源。這個(gè)太多了,生信領(lǐng)域各種專業(yè)、精心注釋的數(shù)據(jù)庫,都屬于2級(jí)的研究。2級(jí)比1級(jí)高的地方,在于1級(jí)只能幫助一個(gè)實(shí)驗(yàn)室或者固定的、極有限的合作者,而2級(jí)的工作則可以幫助數(shù)百甚至數(shù)千的生物學(xué)家。2級(jí)的工作不必須發(fā)表在頂級(jí)的期刊上,時(shí)間會(huì)證明一切,比如分子進(jìn)化領(lǐng)域的經(jīng)典軟件MEGA,每年幾千的引用跟玩兒一樣。這些方法并不見得必須要非常新,利用已有的統(tǒng)計(jì)或者計(jì)算方法來解決新的生物學(xué)問題已經(jīng)足夠保證其新穎性,但必須盡可能保證用戶的友好性。開發(fā)者一般在發(fā)表之后還需要做非常非常多的工作,比如維護(hù)、升級(jí),即使不在發(fā)表后續(xù)的論文。評(píng)價(jià)2級(jí)的生信研究工作不能數(shù)影響因子,但做的好卻比較容易被領(lǐng)域認(rèn)可(例如,華大基因發(fā)表NCS對(duì)咱搞生信的來說未必認(rèn)可,但人家的SOAP系列做的肯定是專業(yè)水準(zhǔn)的)。此外,2級(jí)的研究要做的好,生物信息學(xué)者一般需要專注于自己特定的方向,從而能夠較好地了解領(lǐng)域內(nèi)相關(guān)的、新的計(jì)算方法和實(shí)驗(yàn)技術(shù)??傮w來說,國內(nèi)生信專業(yè)的博士畢業(yè),一般起碼要做出2級(jí)下水平的工作,總得有點(diǎn)兒新玩意兒,不然想畢業(yè)幾乎是不可能的。而對(duì)于非生信領(lǐng)域的學(xué)者,從1級(jí)進(jìn)階到2級(jí)幾乎是不可能的,咱生信人的飯碗,不是想砸就能砸的了的。所以對(duì)于業(yè)余票友們來說,與其花精力試圖進(jìn)階2級(jí),還不如找專業(yè)學(xué)者合作更劃算。 3級(jí)(Level 3):玩數(shù)據(jù)、作發(fā)現(xiàn)。簡稱:頂級(jí)。3級(jí)的生信研究一般是整合公共的高通量數(shù)據(jù),利用相當(dāng)精致的方法來做出生物學(xué)發(fā)現(xiàn)。因此這樣的工作一般是從數(shù)據(jù)開始,實(shí)驗(yàn)驗(yàn)證結(jié)束。這就需要生物信息學(xué)家具有非常扎實(shí)的生物學(xué)知識(shí),并且能夠自己提出有意思的生物學(xué)問題。生物信息學(xué)家可以領(lǐng)導(dǎo)一個(gè)生物學(xué)的項(xiàng)目,并且實(shí)驗(yàn)學(xué)的合作者能夠相信預(yù)測(cè)的正確性以及意義,并樂意開展實(shí)驗(yàn)驗(yàn)證。這個(gè)級(jí)別的研究一般都需要實(shí)驗(yàn)驗(yàn)證,不然頂級(jí)的期刊不收。對(duì)這類工作的評(píng)價(jià),主要是看生物學(xué)的問題是否有意思,數(shù)據(jù)整合和分析是否有足夠的技巧和合理性,并且也可以根據(jù)雜志發(fā)表期刊的檔次(影響因子)來判斷。例如我在《環(huán)形RNA分子:論開掛在生命科學(xué)研究中的重要性》提到的工作,這是典型的3級(jí)研究。從2級(jí)進(jìn)階到3級(jí)很困難,兄弟我目前正在努力中。 X級(jí)(Level X):玩科學(xué)、講政治。簡稱:神級(jí)。在這個(gè)級(jí)別,生物信息學(xué)家要在巨型項(xiàng)目產(chǎn)生的海量數(shù)據(jù)的整合和模擬中發(fā)揮關(guān)鍵作用。做這個(gè)級(jí)別工作的生物信息學(xué)家一般具有良好的1級(jí)和2級(jí)的研究記錄,并且在團(tuán)隊(duì)研究中要具有非凡的領(lǐng)導(dǎo)才能。這些工作一般都發(fā)表在頂級(jí)的期刊,并且引用極好,在研究過程中要注意協(xié)調(diào)方方面面。盡管有時(shí)生信對(duì)于這些論文的發(fā)表是重要的,但往往數(shù)據(jù)本身可能比方法更重要。例如期刊判斷論文要依據(jù)其數(shù)據(jù)量的大小以及潛在的引用,而不是生信。此外,這類工作更多的是反映第一作者老板們的領(lǐng)導(dǎo)力以及在領(lǐng)域里的地位,而不是第一作者的技術(shù)能力和創(chuàng)造力。所以X級(jí)論文的第一作者們往往并不會(huì)得到足夠的認(rèn)可。因此,這些工作中的一作在獨(dú)立研究之后,往往是必須建立科學(xué)的聲譽(yù),并且與之前X級(jí)工作無關(guān)。學(xué)者參加一些X級(jí)的生信研究無可厚非,因?yàn)檫@些項(xiàng)目的成員一般在各自領(lǐng)域都是頂級(jí)學(xué)者。但如果學(xué)者只開展或者只發(fā)表X級(jí)的工作,那就表明該學(xué)者在政治方面的關(guān)注已經(jīng)超過科學(xué)了。兄弟我舉例:典型的X級(jí)生信研究工作如艾瑞克·蘭德 (Eric Lander) 領(lǐng)銜的人類基因組草圖的公布《Initialsequencing and analysis of the human genome》。艾瑞克是第一作者也是共同通訊作者,因?yàn)檫@篇論文主要是他寫的,所以數(shù)據(jù)也自然主要是他分析的。這篇論文影響深遠(yuǎn),最重要的就是基本確定了基因組學(xué)這類超級(jí)項(xiàng)目的研究范式以及論文的書寫格式,例如這類論文一般不帶后續(xù)的實(shí)驗(yàn)驗(yàn)證,所以也是有爭(zhēng)議。這也就是為什么國內(nèi)老是講華大在灌水的原因,第一,華大顯然是在灌水;第二,這個(gè)灌水模式是老外發(fā)明的;第三,那你很容易就能明白,其實(shí)老外灌的更狠;第四,你老外自己定的游戲規(guī)則,你還玩不過華大,那你得懂“愿賭服輸”這個(gè)道理。 Shirley總結(jié),對(duì)于生物信息學(xué)者來說,一般從1級(jí)的研究開始,學(xué)習(xí)基本的生信技術(shù);等到計(jì)算和生物學(xué)知識(shí)掌握差不多之后,可以嘗試想2級(jí)和3級(jí)進(jìn)階,并且有可能也參與X級(jí)的研究。如果條件允許的話,一般有成就的生物信息學(xué)家的研究會(huì)從1級(jí)做到X級(jí),不會(huì)專注某一個(gè)級(jí)別(所以搞生信研究不能挑食)。也有許多生信學(xué)者包括Shirley本人也在開始做實(shí)驗(yàn)并且產(chǎn)生實(shí)驗(yàn)數(shù)據(jù),這樣實(shí)驗(yàn)的內(nèi)容要拿去跟實(shí)驗(yàn)學(xué)家的工作去比,而計(jì)算部分則可按照上述五個(gè)類別來評(píng)價(jià)。因此,當(dāng)您再讀基因組和生信的論文,可以帶著“這是什么水平的生信工作”這個(gè)問題來閱讀。嘗試客觀的評(píng)價(jià)生信工作,而不是數(shù)論文發(fā)表期刊的影響因子。 注:本篇博文的觀點(diǎn)不代表本人觀點(diǎn),但兄弟我對(duì)這些觀點(diǎn)表示無比的贊同。從1級(jí)到2級(jí),對(duì)于生信專業(yè)的研究生和教師們來說不難,但2級(jí)到3級(jí)卻極其困難,對(duì)于和我年齡相當(dāng)?shù)耐信笥褋碚f,要跨越這一步幾乎是難比登天。以及邁這個(gè)坎的,恭喜;如我般還在苦苦修煉的,也不必心急,武功練到境界了,破關(guān)也就是水到渠成的事情。同勉。 http://blog.sciencenet.cn/blog-404304-834869.html 此文來自科學(xué)網(wǎng)薛宇博客,轉(zhuǎn)載請(qǐng)注明出處。 上一篇:人類蛋白質(zhì)組計(jì)劃:長風(fēng)破浪在此時(shí) 下一篇:青年學(xué)者如何加強(qiáng)學(xué)術(shù)交流 56 陸澤櫞 劉全慧 孫根年 武夷山 周冰蕊 戴德昌 霍艾倫 陳亮 古槿 唐凌峰 史彭慧 蘇光松 雷栗 余黨會(huì) 黃永義 朱朝東 井曉陽 王健玲 沈律 孫學(xué)軍 王偉 彭真明 李萬峰 左永春 許培揚(yáng) 朱高明 劉淼 胡傳圣 施郁 任磊 白樺 曹聰 錢磊 毛秀光 秦逸人 李天成 楊鵬程 強(qiáng)濤 趙鳳光 廖梓龍 張治華 鐘君 馬兆武 趙廣立 王苗 郭月 徐紅梅 武澤峰 魏玉保 fangfeng1979 biofans dachong99 eastHL2008 slytjiaofei doublehelix qingarmy該博文允許注冊(cè)用戶評(píng)論 請(qǐng)點(diǎn)擊登錄 評(píng)論 (36 個(gè)評(píng)論)
|
|