在該數(shù)據(jù)庫中,提供了以下9種不同來源和類別的轉(zhuǎn)錄因子信息 1. JASPAR CORE該類別下都是從文獻(xiàn)中收集的,有實(shí)驗(yàn)證據(jù)支持的真核生物轉(zhuǎn)錄因子motif信息,而且經(jīng)過了人工核對(duì),是一個(gè)非冗余的,高質(zhì)量的轉(zhuǎn)錄因子motif數(shù)據(jù)庫,所以也是整個(gè)數(shù)據(jù)庫中的核心。 由于其高質(zhì)量量,非冗余等特性,通常情況下,該類別信息都是我們的第一選擇。每個(gè)motif編號(hào)以 2. Collection CNE該數(shù)據(jù)集包含了233個(gè)調(diào)控人類非編碼基因的轉(zhuǎn)錄因子motif信息,是根據(jù)Xie et al. (PNAS 2007)文章中的數(shù)據(jù)收集整理的,編號(hào)以 3. Collection FAM該類別下保存的是轉(zhuǎn)錄因子的類別class信息,多個(gè)轉(zhuǎn)錄因子可以擁有相同的調(diào)控序列,將調(diào)控序列相同的轉(zhuǎn)錄因子歸為一類。每個(gè)class的編號(hào)以 4. Collection PBM該類別下是運(yùn)用體外技術(shù)分析了104個(gè)小鼠的轉(zhuǎn)錄因子后得到的motif信息,每個(gè)motif編號(hào)以 5. Collection PBM HLH和PBM類似,只不過該類別下是 C. elegans bHLH的19個(gè)轉(zhuǎn)錄因子的信息,物種不同,該類別下的motif編號(hào)以 6. Collection PBM HOMEO該類別下包含的是小鼠的轉(zhuǎn)錄因子motif信息,是從文獻(xiàn)Berger et al (Cell 2008)整理得到的,每個(gè)motif編號(hào)以 7. Collection PHYLOFACTS該類別下分析的是哺乳動(dòng)物進(jìn)化保守基因的轉(zhuǎn)錄因子motif信息,對(duì)應(yīng)的文章為
每個(gè)motif的編號(hào)以 8. Collection POLII該類別包含的是RNA聚合酶結(jié)合區(qū)域的motif序列,每個(gè)motfi編號(hào)以 9. Collection SPLICE該類別包含的是human剪切位點(diǎn)的motif序列,數(shù)據(jù)量很小,一共只有6個(gè)motif, 每個(gè)motif編號(hào)以 每個(gè)collection都是一個(gè)小的子集,core 是整合了所有這些子集,從而構(gòu)建的非冗余數(shù)據(jù)集。在core數(shù)據(jù)集中,將物種分層了一下6大類別 通過官網(wǎng)的檢索功能,可以方便的進(jìn)行檢索,示意圖如下 在檢索出的motif詳情頁面,提供了許多信息,以 1. 基本信息包括名字,編號(hào),類別,對(duì)應(yīng)的物種等信息,示意如下 2. Sequence logomotif每個(gè)bp上堿基的分布,堿基的大小與對(duì)應(yīng)的頻率成正比,頻率越大,對(duì)應(yīng)的字母越大,示意如下 3. position frequency matrix簡稱PFM, motif每個(gè)bp上四種堿基的頻數(shù)分布,提供了多種格式的下載,示意如下 4, Binding sites紅色標(biāo)識(shí)的是motif對(duì)應(yīng)的具體的序列,示意如下 該數(shù)據(jù)庫提供了下載功能,主要是motif對(duì)應(yīng)的PFM矩陣,示意如下 JASPAR數(shù)據(jù)庫是免費(fèi)的,但是相比TRANSFAC數(shù)據(jù)庫, 還是有很多不足之處,首先就是motif數(shù)量的差異,比TRANSFAC數(shù)據(jù)庫少了許多,其次就是信息的類別上,JASPAR只提供了motif信息,并沒有直接的轉(zhuǎn)錄因子調(diào)控的靶標(biāo)基因的信息。 通過JASPAR數(shù)據(jù)庫,我們只能獲取轉(zhuǎn)錄因子的motif信息,然后通過軟件去預(yù)測(cè)和DNA序列的結(jié)合位點(diǎn),即TFBS。 ·end· |
|