吳軍:透過韓春雨學(xué)術(shù)之爭,我來談?wù)勈裁词菍W(xué)術(shù)的規(guī)矩 來源:作者投稿 作者:吳軍 編輯:學(xué)妹 幾個(gè)月前中國的學(xué)術(shù)界傳來一個(gè)好消息,河北科技大學(xué)副教授韓春雨發(fā)明了一種新的基因編輯的方法,比現(xiàn)在主流的CRISPR Cas基因編輯技術(shù)要好很多,這可稱得上是爆炸性新聞。如果人類徹底掌握了基因編輯技術(shù),并且用于臨床,那么包括癌癥在內(nèi)的很多疾病都能夠得到根治,因此這項(xiàng)研究的意義就不必多言了,各國也因此對它都非常重視。2013年麻省理工學(xué)院(MIT)的華裔科學(xué)家張鋒在CRISPR Cas方面所取得的突破性成果,被《自然》雜志列為當(dāng)年十大科技進(jìn)步之首。幾個(gè)月前MIT理學(xué)院院長Michael Sipser到硅谷介紹MIT的成就,只介紹了兩項(xiàng)成果,其中一項(xiàng)就是張鋒的工作(另一項(xiàng)是不久前證實(shí)引力波的實(shí)驗(yàn)),可見MIT對基因編輯研究的重視。2015年,突破獎(jiǎng)中的生命科學(xué)獎(jiǎng)授予了從事CRISPR工作的兩名女科學(xué)家,美國的詹妮弗·杜德納和法國的艾曼紐·卡彭特,也可見全世界這項(xiàng)研究的關(guān)注。因此,如果韓春雨的成果是真的,即便不能很快得諾貝爾獎(jiǎng),至少獲得突破獎(jiǎng)還是有把握的。 但是,向來樹大就要招風(fēng),韓春雨的技術(shù)既然比現(xiàn)在全世界領(lǐng)先的CRISPR Cas技術(shù)還要好很多,各國科學(xué)家就蜂擁而上,試圖重復(fù)韓春雨的實(shí)驗(yàn)。但是到目前為止,也不知道是韓春雨論文寫得不清楚,還是驗(yàn)證者實(shí)驗(yàn)條件沒搞對,總之尚未有人能夠重復(fù)韓春雨的結(jié)果,于是就有人質(zhì)疑韓教授造假了。
什么是科學(xué) 要談學(xué)術(shù)的規(guī)矩,首先必須稿清楚什么是科學(xué)。國內(nèi)很多人一直把科學(xué)和正確劃等號,其實(shí)科學(xué)最重要的是方法,而不是結(jié)論,科學(xué)恰恰反對永遠(yuǎn)正確,這一點(diǎn)我在《文明之光 第二冊》“科學(xué)時(shí)代”一章中通過很多實(shí)例反復(fù)闡述。人類對世界及其規(guī)律的認(rèn)識并不是一成不變的,而是不斷提高的,開始認(rèn)為正確的結(jié)論,后來可能發(fā)現(xiàn)有局限性。因此科學(xué)的結(jié)論只不過是在當(dāng)前認(rèn)知情況下,通過科學(xué)的方法得到的符合實(shí)驗(yàn)結(jié)果(或者我們的觀察和認(rèn)知)的結(jié)論或者假說。任何科學(xué)的結(jié)論,必須能夠有方法證實(shí)和證偽,尤其是必須能夠證偽。那些無法證實(shí)和證偽的結(jié)論,比如“上帝是存在的”,是宗教信仰,不屬于科學(xué)的范疇。因此,科學(xué)的結(jié)論不能是宗教的口號,不是放之四海而皆準(zhǔn)的,也不能要求所有人都相信它,科學(xué)也不服從于政治。相比科學(xué)的結(jié)論,科學(xué)的方法則重要得多,只有采用科學(xué)的方法,做出來的成就才被學(xué)術(shù)界認(rèn)可,這是學(xué)術(shù)的規(guī)則。
既然科學(xué)重在方法而不是結(jié)論,而任何搞科學(xué)研究的人又必須遵循這些方法,這樣一來科學(xué)研究其實(shí)就成了一個(gè)非常悲催的職業(yè):當(dāng)你提出一種新方法,或者得到一個(gè)前人所不知的結(jié)論時(shí),你其實(shí)就是在向全世界學(xué)術(shù)界在聲明,“現(xiàn)在你們可以來證實(shí)或者證偽我的結(jié)論,可以否定我,指出我的不足之處?!比绻粋€(gè)科學(xué)家不是抱著這種心態(tài)搞研究,而是靠聲音的大?。ê头劢z的多少)來維護(hù)自己的正確性,那么他就不是真正意義上的科學(xué)家,最多算是一個(gè)壓制同行的學(xué)霸。 證實(shí)一個(gè)科學(xué)結(jié)論最簡單的方法,就是讓同行來重復(fù)自己的實(shí)驗(yàn),如果別人在同樣條件下能夠得到同樣的結(jié)果,那么這個(gè)結(jié)論算是初步被證實(shí)了。如果一個(gè)科學(xué)家做出一個(gè)實(shí)驗(yàn)結(jié)果,誰都不能重復(fù),甚至就連他自己第二次可以也得不到同樣的結(jié)果,那么,學(xué)術(shù)界只能認(rèn)定這個(gè)發(fā)明或發(fā)現(xiàn)是無效的,結(jié)論是不成立的,哪怕結(jié)論真的是正確的。事實(shí)上,重復(fù)一個(gè)實(shí)驗(yàn)有時(shí)不是一件非常容易的事情,因?yàn)楫?dāng)今科學(xué)研究的實(shí)驗(yàn)條件非常復(fù)雜,有好多參數(shù),甚至實(shí)驗(yàn)者自己也未必把這些參數(shù)全記錄下來的(MIT兩個(gè)學(xué)生為了解決這個(gè)問題,還專門發(fā)明了一種儀器,自動記錄各種可能被人忽視的實(shí)驗(yàn)參數(shù),現(xiàn)在哈佛大學(xué)和MIT在試用),因此下一次實(shí)驗(yàn)時(shí)忽視了哪個(gè)參數(shù),可能結(jié)果就重復(fù)不出來了,這種事情經(jīng)常發(fā)生,這倒不是實(shí)驗(yàn)者故意造假。但是,如果出現(xiàn)這種情況,對不起,大家只能不認(rèn)可你的結(jié)論,這就是學(xué)術(shù)的規(guī)矩。 作為科學(xué)家,有責(zé)任方便同行證實(shí)自己的科研成果,而最基本的要求是在論文中寫清楚實(shí)驗(yàn)是怎么做的。如果無法在篇幅有限的論文中寫清楚實(shí)驗(yàn)條件的細(xì)節(jié),那么這個(gè)科學(xué)家有義務(wù)為同行答疑,在底下告訴那些試圖重復(fù)他實(shí)驗(yàn)結(jié)果的科學(xué)家很多實(shí)驗(yàn)的細(xì)節(jié)。在我所研究的領(lǐng)域(自然語言處理),一個(gè)科學(xué)家要發(fā)表論文,就要說清楚實(shí)驗(yàn)結(jié)果是使用什么數(shù)據(jù),什么工具,在什么設(shè)備上(比如計(jì)算機(jī))進(jìn)行的,以便大家能夠重復(fù)并進(jìn)行各種方法的比較。很多研究小組,甚至把他們做實(shí)驗(yàn)的源程序免費(fèi)提供給同行(當(dāng)然要簽一些保密協(xié)議)。我本人在做研究時(shí),就用過劍橋大學(xué)、卡內(nèi)基-梅隆大學(xué)、AT&T實(shí)驗(yàn)室的多種工具。如果哪一個(gè)科學(xué)家說,我就是不告訴你實(shí)驗(yàn)是怎么做的,而我這個(gè)結(jié)果就是正確,你做不出來是你水平不夠,那么整個(gè)學(xué)術(shù)圈子只好說,“對不起,我們不帶你玩了?!?/p> 有些實(shí)驗(yàn),因?yàn)槌杀痉浅8?,全世界也沒有第二套實(shí)驗(yàn)設(shè)備,比如發(fā)現(xiàn)希格斯波色子的歐洲核子研究中心(CERN)加速器,這種實(shí)驗(yàn)需要自己重復(fù)進(jìn)行,而且采用不同方法交叉驗(yàn)證,以免觀測到的結(jié)果來自于噪音(事實(shí)上CERN驗(yàn)證了很長時(shí)間才公布結(jié)果的)。再比如今年驗(yàn)證引力波的LIGO,是在相距3000公里處建設(shè)了兩套相同的系統(tǒng),以確定接收到的是來自宇宙的引力波信號,而不是噪音。對于這樣的實(shí)驗(yàn),所有的細(xì)節(jié)也是要公開的,以便其他科學(xué)家查驗(yàn)和質(zhì)疑。 有人可能會說,如果這樣,不就沒有了秘密可言了嗎?能否以保護(hù)商業(yè)機(jī)密、國家利益為理由,不提供實(shí)驗(yàn)的細(xì)節(jié)呢。對不起,這不是學(xué)術(shù)界的規(guī)矩。科學(xué)家們常常不得不在名和利中間選擇,不可能全占了。前面我們提到的基因編輯技術(shù),要用到一種更基本的技術(shù)--內(nèi)切酶,它是一把分子級的剪刀,可以把基因切開。這項(xiàng)技術(shù)的主要發(fā)明人是約翰?霍普金斯醫(yī)學(xué)院的那森斯、史密斯和伯克利的亞伯。我在霍普金斯時(shí),那森斯和史密斯還在學(xué)校,人們說,如果他們二人不發(fā)表論文,去申請專利,他們會進(jìn)入世界富豪排行榜,因?yàn)榻裉旌芏嗌锕こ痰募夹g(shù),包括轉(zhuǎn)基因作物,包括人工合成激素和制造抗癌藥,都離不開內(nèi)切酶。但是,你一旦選擇了發(fā)表論文爭取得諾貝爾獎(jiǎng),就可能和經(jīng)濟(jì)利益說再見了。這也是今天很多公司不發(fā)表很多論文,或者先申請專利,過了一段時(shí)間再發(fā)表論文的原因(當(dāng)然,過了一段時(shí)間常常成果就過時(shí),無法發(fā)表了。) 學(xué)術(shù)論文必須是八股文 說到發(fā)表論文,很多人有一個(gè)疑問,為什么中國科學(xué)家在世界一流雜志和會議發(fā)表論文比較難?是研究水平不夠么?研究水平不夠當(dāng)然無法發(fā)表,但很多時(shí)候中國學(xué)者很多論文本身寫得也有大問題。 我從2000年前后開始,就給我所在領(lǐng)域的一些頂級雜志和主要會議審稿,也擔(dān)任過一些重要會議的程序委員會成員和負(fù)責(zé)人,至今也有十幾年了,因此對什么樣的稿子容易被錄取還是有點(diǎn)發(fā)言權(quán)的。每年,也有一些國內(nèi)的學(xué)者請我?guī)椭薷乃麄兗磳⑼陡宓恼撐?。這么些年看下來,審下來,我不得不說國內(nèi)一些學(xué)者的論文寫得不符合規(guī)范,以致于他們即使有很好的研究成果,論文被拒絕了。 國內(nèi)一些學(xué)者喜歡這樣寫論文,首先講自己研究的重要性,上升到非常高的高度,生怕立意不夠高被拒絕。(很多國內(nèi)學(xué)者在向國家申請經(jīng)費(fèi)時(shí)也喜歡強(qiáng)調(diào),你國家不支持我的研究,就不能矗立于世界民族之林了。)接下來這些學(xué)者會自顧自地講自己的方法怎么好,然后在不提供細(xì)節(jié)的情況下給出一些難以對比的實(shí)驗(yàn)結(jié)果(比如使用自己設(shè)計(jì)的數(shù)據(jù),而不是學(xué)術(shù)界一致采用的),最后宣布自己解決了一個(gè)天大的難題。 其實(shí),論文中那些大話,比如某一項(xiàng)研究怎么能夠改變世界,等等,即便是真的也都是廢話,因?yàn)樵趯W(xué)術(shù)圈子里,同行對這項(xiàng)研究的背景和意義比較清楚,無需費(fèi)太多口舌,不需要像新聞稿那樣一定要上升到什么高度。至于發(fā)明和發(fā)現(xiàn)是否那么重要,一切看結(jié)果就可知道了。那些大話、廢話,除了占用寶貴的篇幅,對論文的錄取沒有幫助,甚至只有副作用。 那么被錄取的論文通常是怎么寫得呢?這其實(shí)和科學(xué)方法本身的特點(diǎn)有很大關(guān)系。 今天的學(xué)術(shù)研究,99%是N+1的工作,不管你怎么吹它的重要性,還是N+1,這也就是說你發(fā)現(xiàn)前人工作可以有改進(jìn)之處,你把這個(gè)問題解決了,這本身足夠有意義。既然是N+1的工作,任何人寫論文時(shí)第一件事情就是要提一下N的工作,也就是同行們以前做過的工作,當(dāng)然,也要指出前人哪些工作沒有完成,這既說明你研究的必要性,也是對前人和同行的認(rèn)可,這部分文字是不能省略。國內(nèi)很多人搞科研,不做詳細(xì)的literature study(文獻(xiàn)研究),上來就談自己的工作,這種論文給人第一印象就不好。 在介紹完別人的工作,或者說自己的工作基礎(chǔ)后,論文才能開始介紹自己的工作。這部分就不多說了。 在論文中,接下來就要比較自己工作的結(jié)果了。既然是N+1的工作,我們?yōu)榱俗C明N+1比原來的N要好,你首先要重復(fù)前面N個(gè)人的工作,這也是為什么在科研上實(shí)驗(yàn)結(jié)果必須能夠重復(fù)的原因。一個(gè)有經(jīng)驗(yàn)的導(dǎo)師,指導(dǎo)博士生做研究時(shí),通常是從重復(fù)前人的實(shí)驗(yàn)開始的,然后才開始自己的改進(jìn)。將來寫成論文時(shí),實(shí)驗(yàn)結(jié)果的第一部分就是重復(fù)前人最成功的實(shí)驗(yàn)(一般被稱為基準(zhǔn)Baseline)。然后,才是自己各種實(shí)驗(yàn)結(jié)果的介紹,以及和前人的比較。 可比性對科學(xué)研究非常重要。為了大家有一個(gè)可以公平比較的平臺,各個(gè)學(xué)科領(lǐng)域都有很多共享的數(shù)據(jù),材料,和工具,供同行們使用。這些是屬于整個(gè)學(xué)術(shù)圈子的財(cái)富,它們有些是各個(gè)實(shí)驗(yàn)室貢獻(xiàn)出來的,有些是政府基金專門建設(shè)的。大家做研究都要用這些共同的東西來驗(yàn)證、比較,這樣才是橘子和橘子的比較,不是拿蘋果和橘子相比。 在自然語言處理領(lǐng)域,有一位大家都知道的科學(xué)家叫馬庫斯,他自己其實(shí)沒有太多的學(xué)術(shù)成就,但是他倡導(dǎo)和建立了一整套供全世界研究人員使用的數(shù)據(jù)庫(LDC),再加上他培養(yǎng)了一大批這個(gè)領(lǐng)域的學(xué)術(shù)骨干(也得益于這數(shù)據(jù)庫),因此大家都尊敬他。 為了建設(shè)一個(gè)給學(xué)術(shù)圈子使用的平臺,有些時(shí)候是要花很多錢的。2015年Google為了讓全世界的大數(shù)據(jù)醫(yī)療研究有一個(gè)可以做對比實(shí)驗(yàn)的基準(zhǔn),拿出1億美元給了斯坦福和杜克兩所大學(xué)的醫(yī)學(xué)院,用5年時(shí)間采樣5000人(各2500人)的全部生理和醫(yī)療數(shù)據(jù),作為將來全世界在相關(guān)領(lǐng)域中搞研究的共同基礎(chǔ)(這個(gè)項(xiàng)目被稱為Baseline,基準(zhǔn))。這樣當(dāng)一個(gè)研究小組發(fā)表實(shí)驗(yàn)結(jié)果,其它研究單位很容易相同的數(shù)據(jù)驗(yàn)證實(shí)驗(yàn)結(jié)果是否可以重復(fù)。 如果一個(gè)科學(xué)家通過實(shí)驗(yàn)證實(shí)了他站在巨人的肩上往前走了一步,恭喜你,同行們很可能會認(rèn)可你的發(fā)明發(fā)現(xiàn)。但是,既然科學(xué)是一個(gè)過程,那么它就要繼續(xù)走下去,既然科學(xué)必須能夠被證偽,那么就會留給后人來否定自己的空間。因此好的論文最后都會從學(xué)術(shù)的角度,講一下自己未完成的工作,這些工作或許是自己正在進(jìn)行的,或許是留給同行的。到此,一篇論文才算完整。從這個(gè)寫作過程可以看出,它似乎就是一篇中規(guī)中矩的八股文,是的,學(xué)術(shù)界對規(guī)矩是非常看重的。 所喜的是,隨著中國越來越開放,很多學(xué)者和海外交流越來越多,加上引進(jìn)海外學(xué)者,這種情況滿滿在好轉(zhuǎn),中國學(xué)者在著名雜志和會議上論文錄取率也在逐年提高。 學(xué)術(shù)圈子很重要 除了看重研究成果的可重復(fù)性和可比性,看重寫論文的格式之外,學(xué)術(shù)界還有很多自己的規(guī)矩,其中有一條就是大家都要維護(hù)自己的學(xué)術(shù)圈子。 雖然歷史上總是有一些卓爾不群的科學(xué)家,比如證明了龐加萊猜想的佩雷爾曼,他們傲視同行,但是因?yàn)樗麄兯綄?shí)在太高,整個(gè)學(xué)術(shù)界只好在他們面前認(rèn)慫。但是,大部分時(shí)候并非如此,一個(gè)科學(xué)家的成功離不開學(xué)術(shù)圈子。既然科學(xué)家的工作是做N 1的事情,那么學(xué)術(shù)圈子就代表N。 既然科學(xué)結(jié)論常常是有條件的,只是相對正確的,既然科學(xué)家很難做出一個(gè)后人難以超越的大發(fā)現(xiàn),那么科學(xué)家的榮譽(yù)常常不是來自于自己的結(jié)論多么正確,而來自同行的認(rèn)可。另一方面,在很多領(lǐng)域,一個(gè)發(fā)明發(fā)現(xiàn),不是那么容易就被客觀驗(yàn)證的,它是否被認(rèn)可,在很大程度上取決于整個(gè)學(xué)術(shù)圈子對它的態(tài)度。比如對于膽固醇作用的認(rèn)識,科學(xué)家們至今沒有一個(gè)定論,那么一個(gè)觀點(diǎn)是否被認(rèn)可,論文能否被發(fā)表,在很大程度上取決于主流學(xué)術(shù)界的態(tài)度。 一個(gè)科學(xué)家進(jìn)入學(xué)術(shù)圈子,很重要的是和圈子里的人互動,這個(gè)互動不僅僅是個(gè)人之間的直接交流,而且表現(xiàn)在寫論文時(shí)相互引用。個(gè)人之間的學(xué)術(shù)觀點(diǎn)可以不同,但是哪怕在論文中駁斥別人的觀點(diǎn),都比忽視前人的工作要好得多。當(dāng)然,如果能在反駁別人觀點(diǎn)時(shí),肯定它對自己的啟發(fā),那么對方會很歡迎這樣的交流。 回到韓春雨的發(fā)明上來,這件事從一開始就受到國外很多學(xué)者的質(zhì)疑,很重要的原因是他長期游離于圈子之外,大家不知道從哪里冒出來這樣一個(gè)人,給了大家一個(gè)完全不同的結(jié)論。我們可以試想一下,如果是張鋒給出同樣的結(jié)論,大家的反應(yīng)或許沒有那么劇烈。這倒不是說張鋒更有名,實(shí)際上張鋒是80后的科學(xué)家,在這個(gè)領(lǐng)域里也算是新人,但是他在圈子里早已被同行認(rèn)可。
導(dǎo)師瓦克斯曼發(fā)明了鏈霉素,但是沒法提煉出副作用小的藥品,學(xué)生沙茨找到了合適的副作用小的菌種,但是瓦克斯曼獨(dú)占了研究成果的利益(專利收入),沙茨后來將導(dǎo)師告上了法庭,并且拿到了自己應(yīng)得的利益,但是從此他便無法在美國學(xué)術(shù)圈子里混了,因?yàn)樗茐牧藢W(xué)術(shù)界當(dāng)時(shí)的規(guī)矩。后來瓦克斯曼獨(dú)享了諾貝爾獎(jiǎng),世界也就將沙茨忘掉了,直到后來英國科學(xué)家威恩萊特在寫抗生素歷史一書時(shí),找到了當(dāng)時(shí)很多實(shí)驗(yàn)記錄,才讓世界了解了沙茨點(diǎn)工作。這時(shí)瓦克斯曼已經(jīng)去世多年,沙茨也已經(jīng)退休了。 如果單純看事實(shí),瓦克斯曼的做法無疑有問題,但是沙茨破壞了當(dāng)時(shí)學(xué)術(shù)圈的規(guī)矩,免不了要受到了來自學(xué)術(shù)圈的懲罰(沙茨曾經(jīng)給很多諾貝爾獎(jiǎng)獲得者寫信求援,但是沒人理他)。這個(gè)規(guī)矩是否合理是一回事,但是一旦成為學(xué)術(shù)界的規(guī)矩,每一個(gè)圈子里的人就不得不遵守。這些規(guī)矩并不是要和誰為難,而是為了讓整個(gè)學(xué)術(shù)圈子能夠形成一種合力,圍繞一個(gè)課題共同的研究探討。維護(hù)這些規(guī)矩,才會有N,也才會有N+1。 自近代以來,科學(xué)能夠不斷地進(jìn)步,人們對世界的認(rèn)識能夠不斷地提高,在很大程度上是因?yàn)榭茖W(xué)家們堅(jiān)持科學(xué)的方法,而不是死守科學(xué)的結(jié)論。而長期以來形成的不成文的學(xué)術(shù)規(guī)矩,則是為了確??茖W(xué)家們能夠堅(jiān)持科學(xué)的方法,發(fā)展科學(xué)。
吳軍:學(xué)者,約翰?霍普金斯大學(xué)博士,計(jì)算機(jī)科學(xué)家,曾任騰訊副總裁、谷歌研究院資深研究員,他的著作《浪潮之巔》《數(shù)學(xué)之美》《文明之光》《大學(xué)之路》廣受讀者歡迎。本文由作者吳軍授權(quán)轉(zhuǎn)載刊發(fā)。 |
|