上期我們介紹了稀釋性曲線和Rank Abundance曲線的意義,這期主要介紹物種豐度統(tǒng)計和系統(tǒng)發(fā)育樹的構(gòu)建。 1. 物種豐度統(tǒng)計 16S的數(shù)據(jù)分析,原理是將相似度較高(一般97%以上)的序列進行歸類,并稱之為一個OTU,每一個OTU可以認為是一個菌屬(16S很難精確到種水平)。對每個OTU進行注釋即可知道對應(yīng)的菌屬名稱,注釋的方法是將OTU的代表序列與數(shù)據(jù)庫進行比對,找出其最相近且可信度達80%以上的種屬信息。最后統(tǒng)計每個OTU對應(yīng)的所有序列數(shù)目,將得到的結(jié)果記錄在表格文件中,即可得到每個屬及其對應(yīng)的序列數(shù)目。如下圖,第一二列為物種分類信息,后面1-9每一列是一個樣本。 ![]() 通常我們會將序列數(shù)除以總序列數(shù)得到每個菌的相對豐度,并且繪制累積柱狀圖(如下圖)。圖中NA1-NA7代表7個不同的樣本,每一種顏色代表一種菌,某種顏色占總柱子的百分比顯示了該菌在總菌中所占的百分比,這種柱狀圖可以直觀的比較不同樣本的物種組成。 此外,柱狀圖左側(cè)是樣本的聚類分析結(jié)果,基于樣本的群落組成情況進行聚類(bray-curtis 算法),主要展示樣本的物種組成相似情況。處于同一個分支下的樣本,物種組成相似度較高,距離越遠的樣本物種組成差異越大。 ![]() 2. 系統(tǒng)發(fā)育樹 前面,我們已經(jīng)得到了物種(OTU)注釋信息以及它的豐度,這一步要做的是將物種信息回歸至數(shù)據(jù)庫的分類學(xué)系統(tǒng)關(guān)系樹中,從整個分類系統(tǒng)上全面了解測序的環(huán)境樣品中所有微生物的進化關(guān)系。NCBI數(shù)據(jù)庫提供了已有微生物物種的分類學(xué)信息數(shù)據(jù)庫(ftp://ftp.ncbi.nih.gov/pub/taxonomy/),該數(shù)據(jù)庫還包含了微生物的分類學(xué)系統(tǒng)關(guān)系樹的信息。另外,還可以加上每個物種豐度情況,全面展示物種進化關(guān)系和在不同樣本中的豐度差異。 如下圖所示,圖中的支點表示該處在NCBI 數(shù)據(jù)庫中有相應(yīng)的Taxonomy 記錄,支點出有英文名標記物種分類信息,距離越近的菌表示進化關(guān)系越近。此外,每個支點處都有一個餅狀圖,標示不同樣品的相對豐度差異。圖中四種顏色代表了4個不同的樣本,在最上面一支中,橙色樣本(sample3)的豐度高于其他樣本。 ![]() |
|