《點鼠標就能找啟動子區(qū)的motif》,給出了7種從一段DNA上找某個motif的方法。前提是找到這個轉錄因子的motif文件,如果在JASPAR里查不到,就去footprintDB試試,它可以跟TRANSFAC媲美。 2014年paper原文是這樣描述footprintDB和TRANSFAC的: A survey of the included data sources,organisms and TF families was performed together with proprietarydatabase TRANSFAC, finding that footprintDB has a similar coverageof multicellular organisms, while also containing bacterial regulatorydata. 目前footprintDB收錄了史上最全物種的轉錄因子和motif,每月更新。 http://floresta.eead./footprintdb 包含8600個轉錄因子、12700個motif和27300個DNA binding sites。 包括所有物種,還單獨列出了后生動物(果蠅、線蟲等)和植物; 這么多數據庫,統統收錄進來。 footprintDB能解決哪些實際科研問題呢? 問題一:找某個轉錄因子的motif 回到開頭的問題,用《點鼠標就能找啟動子區(qū)的motif》里的方法,從一段DNA上找某個motif,前提是先找到這個轉錄因子的motif文件。 http://floresta.eead./footprintdb/index.php?search_entries 以p53為例檢索 搜到21個轉錄因子和12個motif 12個motif都是人和擬南芥的。轉錄因子非常保守,即使您感興趣的物種里沒有它的motif,您也可以借用相近物種p53的motif。 藍字都帶鏈接,點開就是motif信息。下面列出的是一個未被JASPAR收錄的motif,只比JASPAR收錄的motif少了個JASPAR 2018的鏈接,需要轉換motif格式。點擊Download下載TRANSFAC格式的motif,用meme自帶的轉換工具變成meme格式的motif,然后就可以用《點鼠標就能找啟動子區(qū)的motif》里的方法三找靶基因了。 問題二:我關心的蛋白質不一定是轉錄因子,它有可能結合哪個motif ? INPUT: a protein sequence of a putative DNA-binding protein OUTPUT: a list of possibly recognized DNA motifs 問題三:這個motif可能被哪些轉錄因子結合? INPUT: a DNA consensus motif or site OUTPUT: a list of DNA-binding proteins (mainly TFs) predicted to bind a similar DNA motif 對后兩個問題感興趣的小伙伴,可自行前往footprintDB嘗試。如果需要小丫寫帖子講解,請留言。 史上最全系列: |
|