在線工具 OrthoVenn2
全基因組直系同源基因簇(Orthologousclusters)的分析是比較基因組學(xué)研究的重要步驟,鑒定直系同源簇之間的聚類及構(gòu)建網(wǎng)絡(luò)可以幫助我們解釋跨多個物種的蛋白質(zhì)的功能和進(jìn)化關(guān)系。某一類物種全部基因「泛基因組」可分為三個部分包括核心基因組(core genome),附屬基因組(accessory genome)以及特有基因(specific genes)。核心基因組即所有個體共有的保守基因家族;附屬基因指存在于部分個體中的基因家族,與物種的分化有關(guān),賦予個體競爭優(yōu)勢;特有基因只存在于某一個體中,通常與該個體的獨特表型相關(guān),如對特定環(huán)境的適應(yīng)性或獨特的致病性等。比較分析某一類物種的直系同源簇為了解基因組的動態(tài)、物種進(jìn)化、環(huán)境適應(yīng)性機(jī)制等提出了有用信息。今天要介紹的這款OrthoVenn2工具,可用于多物種全基因組直系同源基因簇比較和注釋,界面友好,結(jié)果豐富。OrthoVenn2 是之前版本OrthoVenn v 1.0的全新升級,性能、數(shù)據(jù)庫、分析及結(jié)果展示方面都有很大的提升。OrthoVenn2基于OrthoMCL啟發(fā)式匹配算法,用DIAMOND進(jìn)行比對,比傳統(tǒng)的BLAST算法速度提高了1萬倍,而且相比之前的版本數(shù)據(jù)庫資源更加豐富,單次在線分析的上限物種數(shù)量提高了一倍(12個)。OrthoVenn2還開發(fā)了本地版本,方便用戶下載使用,且沒有物種數(shù)量限制。訪問網(wǎng)址:https://orthovenn2./home。打開主頁后,點擊Start開始分析。 進(jìn)入開始頁面后,就可以選擇或者上傳需要分析的基因組數(shù)據(jù)了。OrthoVenn2數(shù)據(jù)庫中覆蓋了植物、脊椎動物、細(xì)菌、真菌、原生生物和后生動物代表物種的基因組,選定相應(yīng)數(shù)據(jù)庫后,可以選擇數(shù)據(jù)庫中的物種。 還可以自己上傳本地的基因組蛋白質(zhì)序列(FASTA格式)。 提交后,會自動生成一個任務(wù)號。OrthoVenn2相比其他同類軟件及其之前的版本的亮點之一就是分析速度非??烨医Y(jié)果準(zhǔn)確可靠,比對分析5個普通真菌的基因組只需5分鐘;比對12個大型靈長類動物的基因組,30分鐘左右就可完成任務(wù)。 OrthoVenn2的結(jié)果頁面非常豐富,相比之前的版本增加了不同物種同源基因簇的存在或者缺失情況的直觀顯示及統(tǒng)計信息(綠色表示存在,灰色表示缺失),還可進(jìn)行個性化的結(jié)果展示。頁面右側(cè)匯總了各個參比基因組序列數(shù)、基因家族數(shù)目、單拷貝基因序列數(shù)目??梢韵螺d序列聚類信息表以及同源基因簇的相應(yīng)序列。 韋恩圖展示了不同物種基因家族的交集,其中處于中心的就是所分析物種的核心基因組了,其他為不那么保守的可變基因組。韋恩圖的風(fēng)格可以修改,并且可以下載編輯,插入文章中(提供的圖片格式包括PNG、PDF、SVG)。下面的條形圖展示不同物種所含基因家族數(shù)目的比較,頁面右側(cè)還增加了基于兩兩比對的物種相似性矩陣(以重疊的同源基因數(shù)量作物種聚類)。結(jié)果頁面上統(tǒng)計表以及韋恩圖中的數(shù)字都可以點開,進(jìn)入相應(yīng)部分功能分析的頁面。 點開韋恩圖中的數(shù)字,會跳出詳細(xì)的注釋分析結(jié)果??梢圆榭垂灿性摶蚣易宓奈锓N,下載基因家族聚類信息表以及該共有區(qū)域的相應(yīng)序列,還可以查看下載共有區(qū)域的基因家族功能分析結(jié)果。在下面的列表中有基因家族Swiss-Prot及GO(Gene Ontology)功能注釋及富集分析的結(jié)果。三個餅狀圖展示了所選擇的同源基因簇的三個主要GO功能類別的比例包括生物過程(biological processes)、分子功能(molecular functions)和細(xì)胞成分(cellular components)。 點開基因家族編號 Cluster--,可以看到詳細(xì)的關(guān)于這個基因家族的聚類分析??梢圆榭葱蛄行畔?,以及這個基因家族的相似性網(wǎng)絡(luò)圖,兩條序列(節(jié)點)相似度越高,連線越粗,并且網(wǎng)絡(luò)圖中每條連線和節(jié)點都可以手動進(jìn)行伸展移動。 點開Multiple Sequence Alignment(多序列比對),可以看到序列保守及多樣性情況(可以個性化選擇著色模式和閾值)。MEME程序?qū)υ摶蚣易褰Y(jié)構(gòu)域(motif)進(jìn)行分析,MEME 圖中字母的高度表示在每個位置上每個氨基酸出現(xiàn)的概率。結(jié)構(gòu)域位置圖中“塊”的高度與 p 值成比例。返回注釋分析頁面,繼續(xù)查看其他相關(guān)信息,包括的生物過程(Biologicalprocess)分類匯總、分子功能(Molecular function)匯總以及功能蛋白的細(xì)胞定位(Cellular component)分類匯總。 OrthoVenn2還直接提供便利的GO富集分析。GO富集分析會計算選定區(qū)域的基因與 GO分類中某個特定的分支的分布關(guān)系,并返回一個p-value,p-value越小,與基因組相關(guān)聯(lián)的特定GO分類條目就越顯著。通過對特定范圍內(nèi)基因進(jìn)行GO富集分析,可以揭示物種特異性可能與哪些基因功能直接相關(guān)。 此外,OrthoVenn2還有一個可視化工具ClusterVenn,可以上傳本地的聚類數(shù)據(jù)文件來生成韋恩圖。 展覽館Gallery中展示了OrthoVenn2預(yù)先運行的一些經(jīng)典示例,可以直接點開查看。 總的來說OrthoVenn2 的使用非常方便,不需要下載軟件,網(wǎng)頁頁面十分友好,分析得出的圖片也十分美觀,分析功能相比之前的版本更加強(qiáng)大和豐富,可以讓大家在比較基因組學(xué)分析過程中快速獲取到自己需要的信息。OrthoVenn2的功能如此強(qiáng)大,趕快試試吧!參考文獻(xiàn): Ling Xu, Zhaobin Dong, Lu Fang, Yongjiang Luo, Zhaoyuan Wei, HailongGuo, Guoqing Zhang, Yong Q Gu, Devin Coleman-Derr, Qingyou Xia, Yi Wang,OrthoVenn2: a web server for whole-genome comparison and annotation oforthologous clusters across multiple species, Nucleic Acids Research, Volume 47, Issue W1, 02 July 2019, Pages W52–W58, https:///10.1093/nar/gkz333
關(guān)注后獲取《科研修煉手冊》1、2、3、4、5、6、7、8、9
|