乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      通過基因組選擇預(yù)測(cè)雜交水稻的表現(xiàn)(數(shù)據(jù)挖掘)

       育種數(shù)據(jù)分析 2021-11-18

      小編自語:

      基因組選擇,預(yù)測(cè)雜種優(yōu)勢(shì),在水稻可以用,在玉米,高粱中也可以用,在動(dòng)物選擇配套系時(shí)也可以用,根據(jù)加性效應(yīng)和非加性效應(yīng)進(jìn)行預(yù)測(cè),前景廣闊。

      這篇文章的作者,有很多大牛:徐世忠老師, 專門做算法的;張啟發(fā)老師, 水稻大牛。

      這篇文章本身沒有自己的數(shù)據(jù),但是它使用其他文獻(xiàn)中已有的數(shù)據(jù),去構(gòu)建模型,挖掘信息,預(yù)測(cè)雜交組合表現(xiàn),操作真是666,這才是數(shù)據(jù)分析師應(yīng)該有的范…

      文章亮點(diǎn):

      1,使用加性,加性+顯性,加性+GbyE互作,考察預(yù)測(cè)的準(zhǔn)確性

      2,對(duì)于重測(cè)序數(shù)據(jù),而不是芯片數(shù)據(jù),進(jìn)行的GS,而且針對(duì)于非純合的位點(diǎn),進(jìn)行了編碼,也可以利用這些信息(-0.5,0.5)構(gòu)建G矩陣

      3,訓(xùn)練群體是雜交種F1,測(cè)試群體是自交系(純合),然后預(yù)測(cè)這些自交系所有可能的組合,這在育種實(shí)踐中非常有用

      4,針對(duì)于SNP非常多時(shí),貝葉斯類的或者RRBLUP就有點(diǎn)吃力,GBLUP非常強(qiáng)健。

      可以進(jìn)一步分析或者挖掘的地方:

      1,水稻或者玉米等利用雜種優(yōu)勢(shì)的作物,本身自交系是有一定的分群劃分的,可以針對(duì)不同群體的雜交組合構(gòu)建參考群,然后進(jìn)行預(yù)測(cè)所有群體間雜交種的表現(xiàn),準(zhǔn)確性應(yīng)該更高

      2,很多經(jīng)濟(jì)性狀,都是有遺傳相關(guān)的,利用多性狀模型比單性狀模型準(zhǔn)確性更高

      3,無論是玉米,還是水稻,都是有系譜信息的,畢竟測(cè)序的自交系有限,如果利用系譜+基因組的一步法基因組選擇(SSGBLUP),可以預(yù)測(cè)一些沒有基因組信息,但是有系譜信息的自交系間的雜交種的表現(xiàn),應(yīng)用范圍更廣

      1. 參考文獻(xiàn)

      Cui Y , Li R , Li G , et al. Hybrid Breeding of Rice via Genomic Selection[J]. Plant Biotechnology Journal, 2019.

      2. Genomic hybrid breeding

      Genomic hybrid breeding is a technology that uses whole genome markers to predict future hybrids.

      3. 主要結(jié)果

      10倍交叉驗(yàn)證(cross validation), 10個(gè)農(nóng)藝性狀的準(zhǔn)確性從0.35~0.92.

      4. 雜交優(yōu)勢(shì)利用的難點(diǎn)

      雜交種, 利用雜種優(yōu)勢(shì), 產(chǎn)量提高20%以上, 但是如何選擇合適的親本進(jìn)行雜交是一個(gè)難點(diǎn). 如果自交系比較多, 那么所有可能的雜交種很多, 進(jìn)行所有可能的雜交不現(xiàn)實(shí), 因此有很多折中的方法, 比如類群劃分, 群間雜交…基因組選擇的出現(xiàn), 可以利用建模的方式模擬預(yù)測(cè)所有可能的雜交種的表現(xiàn), 然后進(jìn)行選擇, 再根據(jù)結(jié)果進(jìn)行實(shí)地種植測(cè)試, 可以節(jié)約很多資源.

      5. 利用基因組選擇預(yù)測(cè)雜交種表現(xiàn)

      利用基因組選擇預(yù)測(cè)雜交種表現(xiàn)很有前景, 因?yàn)榭梢愿鶕?jù)親本信息(基因型和表型)預(yù)測(cè)所有可能的雜交種的表現(xiàn), 這樣在沒有雜交之前就能夠預(yù)測(cè)雜交種的表現(xiàn), 然后根據(jù)結(jié)果進(jìn)行雜交試驗(yàn), 這樣可以節(jié)約大量的資源和成本, 不用做無用的雜交, 不用種植無用的雜交種…

      6. 水稻訓(xùn)練群體和測(cè)試群體

      • 訓(xùn)練群體中, 雜交種的表型值需要測(cè)量, 基因型值可以根據(jù)親本的基因型進(jìn)行推斷(親本為純合的, 雜交種為雜合的).

      • 測(cè)試群體中, 可以根據(jù)親本的基因型, 推斷出他們后代雜交種的基因型, 然后根據(jù)模型預(yù)測(cè)該雜交種的表現(xiàn)

      7. 模型的PK: BLUP勝利!

      預(yù)測(cè)雜交種育種值的模型有很多, 比如BLUP, LASSO, BayesB, 經(jīng)驗(yàn)Bayes等. 這些模型的預(yù)測(cè)能力基本類似.

      但是, 當(dāng)SNP和樣本數(shù)都很大時(shí), LASSO和其它多元回歸的方法會(huì)跪掉, 因?yàn)檫@些模型能不能估算太多的效應(yīng). 基于BLUP的方法更優(yōu)秀, 因?yàn)?BLUP的方法不需要估計(jì)每個(gè)SNP的效應(yīng)值, 它僅僅利用SNP估算個(gè)體間的親緣關(guān)系矩陣, 然后帶入混合線性方程組中計(jì)算育種值

      8. 如何選擇訓(xùn)練群體

      • 應(yīng)該具有廣泛的遺傳背景

      • 應(yīng)該是來源于不同的親本的后代

      • 預(yù)測(cè)群體應(yīng)該和參考群有一定的聯(lián)系

      • 新建一個(gè)新的訓(xùn)練群體很費(fèi)錢, 可以充分利用已有的數(shù)據(jù)

      9. 試驗(yàn)步驟

      • POP1:  Huang et al.(2015) 有1495個(gè)雜交種, 兩個(gè)環(huán)境, 測(cè)量了一些農(nóng)藝性狀, 當(dāng)時(shí)用于關(guān)聯(lián)分析和QTL作圖, 這些雜交種來源于一些親本自交系. 對(duì)這些數(shù)據(jù)進(jìn)行建模, 并進(jìn)行交叉驗(yàn)證

      • POP2: 我們從上面的數(shù)據(jù)中選擇100個(gè)雜交種, 來源于21個(gè)親本自交系的不完全雙列雜交(half diallel)進(jìn)行驗(yàn)證上一步模型的好壞, 結(jié)果很好.

      • POP3: Li et al.(2014) 數(shù)據(jù)中三個(gè)類群中獲得3000個(gè)自交系, 預(yù)測(cè)44636個(gè)可能雜交種的表現(xiàn), 然后進(jìn)行排名, 將預(yù)測(cè)表現(xiàn)好的進(jìn)行實(shí)際的測(cè)試.

      10. 預(yù)測(cè)準(zhǔn)確性和遺傳力的關(guān)系

      大致來說, 預(yù)測(cè)的準(zhǔn)確性 = 遺傳力的平方根:
      $$ accur =  \sqrt{h^2} $$

      11. 預(yù)測(cè)的表型值和實(shí)際的表型值

      12. 綜合選擇指數(shù)

      • 1, 將育種值標(biāo)準(zhǔn)化

      • 2, 根據(jù)權(quán)重進(jìn)行加權(quán)(考慮各個(gè)性狀的權(quán)重)

      • 3, 計(jì)算綜合育種值

      權(quán)重如下:

      13. 模型考慮顯性效應(yīng)和基因與環(huán)境互作效應(yīng)

      模型1
      y = u + A

      模型2
      y = u + A + D

      模型3
      y = u + A + GbyE

      結(jié)果顯示, 考慮線性效應(yīng)和基因與環(huán)境互作效應(yīng), 沒有顯著提高預(yù)測(cè)的準(zhǔn)確性.

      14. 基因組數(shù)據(jù)處理流程

      1495雜交種的測(cè)序數(shù)據(jù)

      • 1495個(gè)雜交種, 2層, 96bp雙鏈, 共有2TB數(shù)據(jù)

      • 使用BWA比對(duì)到Geng Nipponbare Version7的參考基因組上

      • 使用samtools 用于檢測(cè)SNP, -q 20 -q 40, 共獲得1.6 millin SNPs

      • 保留平均覆蓋度在0.8~2.5, 缺失少于25%的SNP, 共有232,935個(gè)SNP

      3K 水稻基因組項(xiàng)目測(cè)序數(shù)據(jù)

      • 共有6.9 million SNPs, 3000個(gè)體

      • 和上面SNP交叉的個(gè)數(shù)為: 201,756

      • 使用BEAGLE進(jìn)行填充缺失數(shù)據(jù)

      • MAF >0.1過濾SNP

      • 共有102,795用于基因組選擇的分析

      SNP編碼

      • -1表示為參考基因組位點(diǎn)(純合)

      • 0 表示雜合

      • 1表示為alternative 純合

      15. 數(shù)據(jù)和代碼

      DNA測(cè)序數(shù)據(jù)再European Nucleotide Archive(www.ebi.ac.uk/ena), 編號(hào)為: ERP005527.
      3K SNP 數(shù)據(jù)保存在 Rice SNP-Seek Database(http://snp-seek.g). 所有相關(guān)的數(shù)據(jù)和R代碼, 可以聯(lián)系文章作者索要.

        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評(píng)論

        發(fā)表

        請(qǐng)遵守用戶 評(píng)論公約

        類似文章 更多