Nature等30篇文章公布重大成果:基因功能圖譜這估計是本世紀(jì)最重大的生物醫(yī)學(xué)發(fā)現(xiàn)了。今天ENCODE瘋狂的在nature等一次發(fā)了30篇文章。主題只有一個“垃圾DNA不是垃圾”。 ENCODE項目(ENCyclopedia Of DNA Elements)研究組上百位研究人員近期公布了百科全書項目的最新成果——人類基因組中被稱為“垃圾DNA”實際上是一個龐大的控制面板,能調(diào)控數(shù)以百萬計基因的活性。如果沒有這些開關(guān)調(diào)控,基因?qū)⒉荒苷9ぷ?,而這些區(qū)域也許會導(dǎo)致人類換上疾病。由ENCODE公布的這一新數(shù)據(jù)信息非常全面,也很復(fù)雜,因此是以一種新型出版模式公布,這一模式中電子文檔和數(shù)據(jù)集是相互關(guān)聯(lián)的。 正如同人類基因組計劃帶給生物醫(yī)學(xué)研究領(lǐng)域的革新意義,ENCODE項目也將推動生物醫(yī)學(xué)的前進,開辟研究新道路。這一計劃是于2003年啟動,主要目的是建立人類基因組中生物功能關(guān)鍵性元素目錄。 最新這項由美國國家基因組研究院NHGRI,以及歐洲生物信息學(xué)研究所EMBL-EBI的科學(xué)家們領(lǐng)導(dǎo)的研究,公布了一份詳細的基因組功能圖譜,其中包含有四百萬基因的“開關(guān)”,這一重要的參考數(shù)據(jù)將有助于研究人員找到與人類疾病密切相關(guān)的區(qū)域。 目前這一相關(guān)研究成果將在Nature, Genome Biology和Genome Research雜志上,共計30篇開放性論文進行公布。 “我們的基因組就是簡單地通過無數(shù)的開關(guān)進行調(diào)控,這些上百萬的區(qū)域能決定基因是開還是關(guān),”ENCODE項目領(lǐng)銜分析員Ewan Birney 說,“人類基因組計劃HGP表明,基因組中只有2%包含有基因,也就是說能編碼蛋白。從ENCODE項目中,我們可以看到,基因組中剩余的這約80%的區(qū)域其實并沒有閑著,我們發(fā)現(xiàn)基因組這個更大的部分——實際上是一個驚人的數(shù)量——調(diào)控了蛋白何時和何地生成,而不是簡單的其中產(chǎn)生,比簡單地作為構(gòu)建框架”。 “任何疾病的相關(guān)研究人員都可以利用ENCODE數(shù)據(jù),分析他們可能會感興趣的相關(guān)病理,”重要的分析協(xié)調(diào)員Ian Dunham 說,“許多情況下,你可能已經(jīng)想到了哪些基因參與了你正在研究的疾病,但卻不知道其中涉及的開關(guān)。有時這些開關(guān)令人驚訝,因為它們的位置說明它們更有可能與一個完全不同的疾病相關(guān)。 ENCODE為我們提供了一組非常有價值的線索,讓我們能沿著這些線索,發(fā)現(xiàn)與健康和疾病有關(guān)的關(guān)鍵機制,這些將能被用來創(chuàng)建全新的藥物,或重新利用現(xiàn)有的治療方法?!?/p> “ENCODE告訴我們,我們需要把眼光放得更遠一些,而不是局限于基因組整個網(wǎng)絡(luò)如何連接的線性結(jié)構(gòu),”斯坦福大學(xué)教授,ENCODE首席科學(xué)家Michael Snyder評論道,“我們正開始了解全基因組關(guān)聯(lián)研究中所獲取的信息,不僅僅是某個基因定位在哪兒,還有哪些能調(diào)控它們。 因為我們的基因組即復(fù)雜的,又是三維立體的,這些調(diào)控元件有時遠離被調(diào)節(jié)基因,而是通過環(huán)繞得以接觸到。如果沒有ENCODE,我們可能永遠也不會看著這些區(qū)域,這項研究朝著深入了解人類運轉(zhuǎn)邁進了一大步。ENCODE可以幫助我們更深入探討監(jiān)控環(huán)路,這些環(huán)路能指揮所有的零件組裝成一個復(fù)雜的個體?!?/p> 近年來,生物醫(yī)學(xué)研究中獲取并存儲大量的數(shù)據(jù)成為了一項挑戰(zhàn)?,F(xiàn)在,隨著基因組測序成本的下降和測序能力的提高,重點已轉(zhuǎn)移到分析上來——讓這些全基因組關(guān)聯(lián)研究產(chǎn)生的數(shù)據(jù)變得有意義。 ENCODE 合作伙伴已經(jīng)著手于利用全球各實驗室中相同的計算,網(wǎng)絡(luò)實驗室方法,以及試劑進行人類基因組系統(tǒng)分析。 從該項目的規(guī)模意義上來說——ENCODE聯(lián)合了來自英國,美國,西班牙,新加坡和日本的32個實驗室中442名科學(xué)家的努力,他們獲得并分析了超過15兆兆字節(jié)(15萬億字節(jié))的原始數(shù)據(jù),目前已經(jīng)全部公布,并可公開獲得。研究花費了約300年的計算機時間,對147個組織類型進行了分析,以確定哪些能打開和關(guān)閉特定的基因,以及不同類型細胞之間的“開關(guān)”存在什么差異。 9月6日發(fā)表的文章有上百頁的內(nèi)容,但Nature數(shù)字自然出版集團認(rèn)識到這是過去的形式,目前所有的在三個雜志上發(fā)表的ENCODE內(nèi)容都是數(shù)字化連接的,從而讀者可以按照自己的興趣,追溯到原始數(shù)據(jù)。 “將具有最好專業(yè)知識的專家們聚集在一起,這就是這項研究”,Ewan Birney說,“ENCODE項目表明,領(lǐng)先生命科學(xué)家能通過密切合作,進行大規(guī)模研究,為整個社會創(chuàng)造出基礎(chǔ)性資源。” “到目前為止,發(fā)表的數(shù)據(jù)都是各自方面,靜態(tài)刊物的成果,非同一研究團隊的人不知道它的存在,如何利用這些知識呢?”西班牙科學(xué)家Roderic Guigo說,“現(xiàn)在我們有一個互動的百科全書,大家都可以參考,這與之前極大不同?!?/p> Nature 特別專題:ENCODE Encyclopedia of DNA Elements nature.com/encode Bioon 特別專題:ENCODE 人類基因組詳圖問世 bioon.com/encode Presenting ENCODE2001 will always be remembered as the year of the human genome. The availability of its sequence transformed biology, and the exemplary way in which hundreds of researchers came together to form a public consortium paved the way for 'big science' in biology. It was an incredible achievement but it was always clear that knowing the 'code' was only the beginning. To understand how cells interpret the information locked within the genome much more needed to be learnt. This became the task of ENCODE, the Encyclopedia Of DNA Elements, the aim of which was to describe all functional elements encoded in the human genome. Nine years after launch, its main efforts culminate in the publication of 30 coordinated papers, 6 of which are in this issue of Nature. Collectively, the papers describe 1,640 data sets generated across 147 different cell types. Among the many important results there is one that stands out above them all: more than 80% of the human genome's components have now been assigned at least one biochemical function. The implications of the ENCODE findings extend to many fields in biology. In a News & Views Forum on page 52, scientists representing five different areas of research share their views on what the results mean to them and their work. On page 49, Ewan Birney, the leader and coordinator of the ENCODE consortium, discusses the challenges of doing consortium-driven science; related issues are explored in a Careers feature on page 165. Dizzying amounts of data have been produced by the ENCODE project and are openly accessible; countless more analyses are therefore to be expected, in addition to the multitude now being published. Finding a balance between data collection and analysis is the topic of a News Feature on page 46. The papers, which are freely available to all, and the articles in this issue are complemented by an extensive range of online features (nature.com/encode). Among them are interactive figures in the overview ENCODE paper, which also features a virtual machine to allow you to interact more closely with the data and their analyses. In line with the community spirit with which the work was undertaken, we also present online the related papers published in Genome Research and Genome Biology. To help you navigate through the data we have created the Nature ENCODE Explorer and we introduce 'threads', which allow you to explore biological themes between the papers. We hope you enjoy the package. |
|