測序不要只看價格和參數(shù),測序前采用什么富集技術(shù)或建庫方案、使用哪家的產(chǎn)品、捕獲區(qū)域的大小、測序的深度等都直接關(guān)系到價格;而漂亮參數(shù)背后大都藏有玄機,需要大家對目標(biāo)區(qū)域和自己的研究目的有更深入的了解方可不被表象所迷惑。
外行看熱鬧,內(nèi)行看門道。如何評估和選擇二代測序靶向捕獲基因文庫,你已經(jīng)摸著門道還是就看個熱鬧?
如果你建庫與測序一并外包;如果你困惑于不同廠家的同類捕獲 panel;如果你正在因為價格差異而猶豫不決;如果你癡迷于捕獲效率、覆蓋度;那么你一定要看過來。
大家通常會利用測序的結(jié)果來評估一款捕獲產(chǎn)品的優(yōu)劣,通常關(guān)注的參數(shù)有覆蓋度、同樣測序量下的測序深度、目標(biāo)序列比率(或捕獲效率)等。咱們先看看這些名字解釋,再以市場上幾家公司的外顯子組產(chǎn)品為例教你如何辨識這些參數(shù)。
· 覆蓋度(%coverage):一般是指目標(biāo)區(qū)域中被測序覆蓋 > 1x 的區(qū)域的比例
· 平均測序深度(Sequencing Depth):測序得到的堿基總量與目標(biāo)序列堿基的比值,也可以理解為被測基因組上單個堿基被測序的平均次數(shù)
· 測序深度 > 20x 的覆蓋度:目標(biāo)區(qū)域中測序深度 > 20x 的區(qū)域占總目標(biāo)區(qū)域的比例
· 目標(biāo)序列比率或捕獲效率(% on-target reads):目標(biāo)區(qū)域序列數(shù)與測定的總序列的比值
我們都知道,外顯子組有的區(qū)域 GC 含量低、AT 含量高,探針結(jié)合力弱,捕獲效率低;有的區(qū)域因為存在重復(fù)序列、二級結(jié)構(gòu)等不易設(shè)計探針,即使有探針覆蓋,捕獲效率也不高。而像覆蓋度、捕獲效率這些參數(shù)都與靶標(biāo)的設(shè)計直接相關(guān)。
也就是說,如果想讓這些參數(shù)好看,很簡單,跳過那些捕獲效率低、難設(shè)計探針的區(qū)域,將設(shè)計的靶標(biāo)區(qū)域僅包括那些容易設(shè)計探針、捕獲效率高而均一的區(qū)域。
如果你只關(guān)注上面的參數(shù),僅根據(jù)這些參數(shù)來選擇產(chǎn)品的話,最終的結(jié)果可能是參數(shù)很漂亮,但卻承擔(dān)了丟失真正有意義的靶標(biāo)的風(fēng)險,并且這種風(fēng)險是無法通過提高測序深度來彌補的,因為那些靶標(biāo)根本不在這款外顯子的設(shè)計里!
同樣以全外顯子組為例,評價它的優(yōu)劣首先要以該產(chǎn)品的設(shè)計為出發(fā)點,客觀的比較它對于各大數(shù)據(jù)庫的覆蓋,以及與其它同類產(chǎn)品相比所獨有的有意義的靶點的數(shù)量。這里特別提醒一下,一些廠家在給出捕獲產(chǎn)品的參數(shù)時有時會經(jīng)過「藝術(shù)處理」。
比如,有的廠家給出的捕獲區(qū)域的大小是期望捕獲的區(qū)域而非探針實際覆蓋的區(qū)域[1],在比較數(shù)據(jù)庫的覆蓋度時,這些廠家的數(shù)據(jù)會比較美觀,但當(dāng)我們查看實際測序結(jié)果所反映的捕獲數(shù)據(jù)時,那些經(jīng)過「藝術(shù)處理」的廠家就沒有那么漂亮了。
其實所有廠家都清楚,設(shè)計(design)是一款產(chǎn)品的根基,是產(chǎn)品的關(guān)鍵,如果根基不扎實、不完善,那么后期無論如何努力也是無法彌補這款產(chǎn)品的先天不足的。
安捷倫臨床研究外顯子組 V2 是專門針對臨床研究設(shè)計的一款全外顯子組產(chǎn)品,它以安捷倫全外顯子組 V6 的設(shè)計為基礎(chǔ),新增了美國埃默里大學(xué)和費城兒童醫(yī)院精選的新增靶標(biāo),同時對疾病相關(guān)基因進行了加強覆蓋,是目前市場上極為全面的醫(yī)學(xué)研究外顯子組。
先看一下它與市場上其它同類產(chǎn)品在各大數(shù)據(jù)庫覆蓋上的比較。
表 1. 所選注釋源的覆蓋率比較 表 1. 所選注釋源的覆蓋率比較
* 數(shù)據(jù)采集于 2016 年 5 月
再來看看獨有的有意義的靶點的數(shù)量的差異吧。安捷倫的臨床研究外顯子組 V2 不僅包含更多的獨有的疾病相關(guān)變異,同時含有更多獨有的 ClinVar 致病 / 可能致病變異,而這些 ClinVar 致病 / 可能致病變異意味著更多種類的疾病被安捷倫的這款產(chǎn)品覆蓋。
表 2. 獨有的 ClinVar 變異比較
看完了上述比較,一款捕獲產(chǎn)品的核心競爭力和對用戶的價值一目了然。當(dāng)然,沒有一款產(chǎn)品是完美的,包含的位點越全,設(shè)計難度就越大。盡管如此,憑借在靶向捕獲領(lǐng)域扎實的功底,安捷倫的這款全面的醫(yī)學(xué)研究外顯子組——臨床研究外顯子組 V2 仍舊在覆蓋度和捕獲效率上表現(xiàn)非常出色。 除了選產(chǎn)品本身,別忘了考察一下定制能力。數(shù)據(jù)庫更新的速度非??欤瑥S家推出穩(wěn)定、可靠的商業(yè)化產(chǎn)品的速度無法及時跟上。所以,這里就要強調(diào)定制的重要性了。
安捷倫的 SurePrint 打印技術(shù)提供了非常強的定制能力,它的免費在線設(shè)計工具 SureDesign 就可以在已有目錄 panel 的基礎(chǔ)上按照用戶的要求加入新的基因。這樣一來,新的實驗數(shù)據(jù)既與原先的實驗數(shù)據(jù)保持了很好的一致性,又增加了新的內(nèi)容。
通過以上簡短的介紹后,希望大家都能摸到靶向捕獲基因文庫的門道,不再被表面的熱鬧所迷惑。
最新預(yù)報:
安捷倫即將推出人全外顯子組 V7 版本。V7 版本的設(shè)計針對外顯子組精雕細琢,僅關(guān)注外顯子區(qū)域,設(shè)計大小僅為 48M,減少測序成本。對于最新的數(shù)據(jù)庫有全面的外顯子覆蓋,且包含了難以捕獲的區(qū)域。對于不同 GC 區(qū)域?qū)崿F(xiàn)均一的覆蓋。這一精選版人全外顯子組產(chǎn)品將于 3 月在中國上市。 |
|
來自: noyoa > 《二代測序(NGS)》