小編自語: 基因組選擇,預(yù)測(cè)雜種優(yōu)勢(shì),在水稻可以用,在玉米,高粱中也可以用,在動(dòng)物選擇配套系時(shí)也可以用,根據(jù)加性效應(yīng)和非加性效應(yīng)進(jìn)行預(yù)測(cè),前景廣闊。 這篇文章的作者,有很多大牛:徐世忠老師, 專門做算法的;張啟發(fā)老師, 水稻大牛。 這篇文章本身沒有自己的數(shù)據(jù),但是它使用其他文獻(xiàn)中已有的數(shù)據(jù),去構(gòu)建模型,挖掘信息,預(yù)測(cè)雜交組合表現(xiàn),操作真是666,這才是數(shù)據(jù)分析師應(yīng)該有的范… 文章亮點(diǎn): 1,使用加性,加性+顯性,加性+GbyE互作,考察預(yù)測(cè)的準(zhǔn)確性 2,對(duì)于重測(cè)序數(shù)據(jù),而不是芯片數(shù)據(jù),進(jìn)行的GS,而且針對(duì)于非純合的位點(diǎn),進(jìn)行了編碼,也可以利用這些信息(-0.5,0.5)構(gòu)建G矩陣 3,訓(xùn)練群體是雜交種F1,測(cè)試群體是自交系(純合),然后預(yù)測(cè)這些自交系所有可能的組合,這在育種實(shí)踐中非常有用 4,針對(duì)于SNP非常多時(shí),貝葉斯類的或者RRBLUP就有點(diǎn)吃力,GBLUP非常強(qiáng)健。 可以進(jìn)一步分析或者挖掘的地方: 1,水稻或者玉米等利用雜種優(yōu)勢(shì)的作物,本身自交系是有一定的分群劃分的,可以針對(duì)不同群體的雜交組合構(gòu)建參考群,然后進(jìn)行預(yù)測(cè)所有群體間雜交種的表現(xiàn),準(zhǔn)確性應(yīng)該更高 2,很多經(jīng)濟(jì)性狀,都是有遺傳相關(guān)的,利用多性狀模型比單性狀模型準(zhǔn)確性更高 3,無論是玉米,還是水稻,都是有系譜信息的,畢竟測(cè)序的自交系有限,如果利用系譜+基因組的一步法基因組選擇(SSGBLUP),可以預(yù)測(cè)一些沒有基因組信息,但是有系譜信息的自交系間的雜交種的表現(xiàn),應(yīng)用范圍更廣 1. 參考文獻(xiàn)
2. Genomic hybrid breedingGenomic hybrid breeding is a technology that uses whole genome markers to predict future hybrids. 3. 主要結(jié)果10倍交叉驗(yàn)證(cross validation), 10個(gè)農(nóng)藝性狀的準(zhǔn)確性從0.35~0.92. 4. 雜交優(yōu)勢(shì)利用的難點(diǎn)雜交種, 利用雜種優(yōu)勢(shì), 產(chǎn)量提高20%以上, 但是如何選擇合適的親本進(jìn)行雜交是一個(gè)難點(diǎn). 如果自交系比較多, 那么所有可能的雜交種很多, 進(jìn)行所有可能的雜交不現(xiàn)實(shí), 因此有很多折中的方法, 比如類群劃分, 群間雜交…基因組選擇的出現(xiàn), 可以利用建模的方式模擬預(yù)測(cè)所有可能的雜交種的表現(xiàn), 然后進(jìn)行選擇, 再根據(jù)結(jié)果進(jìn)行實(shí)地種植測(cè)試, 可以節(jié)約很多資源. 5. 利用基因組選擇預(yù)測(cè)雜交種表現(xiàn)利用基因組選擇預(yù)測(cè)雜交種表現(xiàn)很有前景, 因?yàn)榭梢愿鶕?jù)親本信息(基因型和表型)預(yù)測(cè)所有可能的雜交種的表現(xiàn), 這樣在沒有雜交之前就能夠預(yù)測(cè)雜交種的表現(xiàn), 然后根據(jù)結(jié)果進(jìn)行雜交試驗(yàn), 這樣可以節(jié)約大量的資源和成本, 不用做無用的雜交, 不用種植無用的雜交種… 6. 水稻訓(xùn)練群體和測(cè)試群體
7. 模型的PK: BLUP勝利!預(yù)測(cè)雜交種育種值的模型有很多, 比如BLUP, LASSO, BayesB, 經(jīng)驗(yàn)Bayes等. 這些模型的預(yù)測(cè)能力基本類似. 但是, 當(dāng)SNP和樣本數(shù)都很大時(shí), LASSO和其它多元回歸的方法會(huì)跪掉, 因?yàn)檫@些模型能不能估算太多的效應(yīng). 基于BLUP的方法更優(yōu)秀, 因?yàn)?BLUP的方法不需要估計(jì)每個(gè)SNP的效應(yīng)值, 它僅僅利用SNP估算個(gè)體間的親緣關(guān)系矩陣, 然后帶入混合線性方程組中計(jì)算育種值 8. 如何選擇訓(xùn)練群體
9. 試驗(yàn)步驟
10. 預(yù)測(cè)準(zhǔn)確性和遺傳力的關(guān)系大致來說, 預(yù)測(cè)的準(zhǔn)確性 = 遺傳力的平方根: 11. 預(yù)測(cè)的表型值和實(shí)際的表型值12. 綜合選擇指數(shù)
權(quán)重如下: 13. 模型考慮顯性效應(yīng)和基因與環(huán)境互作效應(yīng)模型1 模型2 模型3 結(jié)果顯示, 考慮線性效應(yīng)和基因與環(huán)境互作效應(yīng), 沒有顯著提高預(yù)測(cè)的準(zhǔn)確性. 14. 基因組數(shù)據(jù)處理流程1495雜交種的測(cè)序數(shù)據(jù)
3K 水稻基因組項(xiàng)目測(cè)序數(shù)據(jù)
SNP編碼
15. 數(shù)據(jù)和代碼DNA測(cè)序數(shù)據(jù)再European Nucleotide Archive(www.ebi.ac.uk/ena), 編號(hào)為: ERP005527. |
|