乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      統(tǒng)計遺傳學:第一章,基因組基礎概念

       育種數據分析 2022-06-16 發(fā)布于河南

      1. 基因組基礎概念

      大家好,我是飛哥。

      前幾天推薦了這本書,可以領取pdf和配套數據代碼。這里,我將各個章節(jié)介紹一下,總結也是學習的過程。

      引文部分是原書的谷歌翻譯,正文部分是我的理解。

      這本書共有三大部分,分別是:

      • Foundations,基礎
      • Working with Genetic Data,實戰(zhàn)
      • Applications and Advanced Topics,進階

      第一部分基礎,分為六個章節(jié),分別是:

      • 第一章:基因組基礎概念
      • 第二章:統(tǒng)計分析概念
      • 第三章:基因型數據參數
      • 第四章:GWAS分析
      • 第五章:多基因效應
      • 第六章:基因與環(huán)境互作

      今天,介紹第一章的內容,看一下目錄:

      本書寫作的目的

      ?

      2003年,人類基因研究首次對人類基因組進行測序,這在理解和納入研究的方式上引發(fā)了一場革命。隨著計算能力、數據可用性和新技術的進步,這一研究領域打破了我們如何看待疾病和行為的許多傳統(tǒng)。遺傳學現(xiàn)已超越生物學、流行病學、醫(yī)學、心理學、精神病學、統(tǒng)計學和人口學、社會學和經濟學等社會科學。有史以來第一次有可能將大規(guī)模分子遺傳信息整合到跨廣泛主題的研究中。許多人認為,統(tǒng)計遺傳數據分析只適用于數量遺傳或統(tǒng)計研究學科范圍內的廣泛研究團隊和高度專業(yè)化的科學家。這本書的目的是向來自不同學科背景的應用研究人員展示如何理解、應用和處理你自己研究課題的遺傳數據。本書中的知識將使您能夠正確、負責任地理解和解釋數據,并將其作為藍圖應用于您自己的數據和研究。我們還希望,通過使這種類型的數據分析更容易獲得,我們朝著更崇高的目標努力,既要使作為非人道遺傳學研究對象的人多樣化,又要使研究人員本身和所涉及的主題多樣化。

      這本書的目的是向學生和研究人員介紹新興的概念數據,以及統(tǒng)計遺傳數據分析的方法,以一種方便、實用和我們希望參與的方式。這本書是為那些在分子生物學、人類遺傳學或細胞生物學方面沒有很強背景,但希望將遺傳數據整合到研究中的人編寫的。這本書的編寫考慮到了廣泛的可訪問性,將吸引來自多學科背景的學生和研究人員,他們是這一研究領域的新手。在統(tǒng)計學或生物統(tǒng)計學課程的第一級掌握統(tǒng)計方法的基本知識是最好的。我們的方法是實踐和應用的,重點是包裝基本概念,這個“做和不做”,以及如何實際運行和解釋分析。我們只提供材料的基本數學和統(tǒng)計處理,并為那些想深入挖掘的人提供參考??紤]到遺傳學的深遠影響,我們預計來自醫(yī)學和社會科學的學生和研究人員會感興趣,他們將越來越多地將統(tǒng)計與對他們的思維和工作方式進行科學的遺傳數據分析。

      ?

      我本身是學習動植物數量遺傳學的,工作中也經常用到生物統(tǒng)計、數量遺傳學、GWAS和GS,但是對于GWAS,人類上面研究得更系統(tǒng),所以閱讀此書,我認為可以加深對基因組數據分析的理解,畢竟,不同軟件不同代碼只是工具,而理解背后的意義,會“知其然亦知其所以然”。人類的GWAS分析有其特定的概念,比如多基因得分,比如GbyE,對于動植物上面分子標記輔助和基因組選擇,也是非常有幫助的。

      誰適合讀這本書

      ?

      這本書是為當前和有抱負的學生和研究人員準備的,他們來自任何以經驗為導向的醫(yī)學、生物學、行為學或社會科學學科,希望了解人類統(tǒng)計遺傳數據分析的主要概念,同時也是尋求進入和開展這項研究的解決方案的從業(yè)者。讀者可以通過動手電腦練習獲得應用分子遺傳數據分析的藍圖,重點是實體解釋。這是一本介紹性的書,寫給那些在分子生物學、人類遺傳學或統(tǒng)計遺傳學方面沒有很強背景,但希望整合遺傳學的人,他們研究的數據。在非統(tǒng)計或生物統(tǒng)計學課程的第一級掌握統(tǒng)計方法的基本知識是最好的。如果您首先在R和Rstudio中從事一些背景教程工作,并且對于一些更高級的應用程序,您將對Python有一個基本的了解,那么您將從本書中獲得最大的收獲(請參見附錄1)。我們還共同致力于統(tǒng)計遺傳數據分析的基本術語和實踐方面,而不是其背后的數學、統(tǒng)計學和生物學。讀者可以參考進一步閱讀部分和每個章節(jié)中的參考資料了解更多信息

      ?

      這本書的對象可以是:醫(yī)學、生物學、行為學或者社會科學,只要牽涉到基因遺傳數據,就可以用到里面的分析方法。編程語言是R和Python,還有plink、GCTA獨立的軟件。

      第一章節(jié)的主要內容

      ?

      目的了解這本書的動機、目的、目標受眾和結構定義、認識和描述人類基因組研究中使用的基本術語理解人類細胞核中DNA的組織以及術語基因組、基因和染色體概述孟德爾定律。有性生殖和遺傳重組定義了遺傳多態(tài)性和術語等位基因、單核苷酸多態(tài)性次要等位基因頻率和唯一識別物了解單基因、多基因、全基因效應和多基因評分要求掌握基因與蛋白質關系的基本知識掌握分子生物學的中心法則:轉錄和翻譯了解多態(tài)性位點是純合還是雜合的,了解顯性和隱性性狀的遺傳關系認識到遺傳力的意義,常見的誤稱、類型和缺失遺傳性討論

      ?

      染色體、基因、DNA和SNP

      上圖介紹了不同物質的關系,細胞中是染色體,染色體是雙螺旋的DNA構成,一段DNA構成基因,DNA由堿基對構成,SNP的概念。

      孟德爾定律、有性繁殖和基因重組

      孟德爾分離定律和自由組合定律,以及摩爾根的連鎖定律,是遺傳學的三大定律。

      等位基因、SNP和次等位基因頻率(MAF)

      MAF的區(qū)間劃分:

      • MAF < 0.01,稀有變異(rar variants)
      • MAF 在[0.01,0.05],低頻率(low-frequency)
      • MAF > 0.05,正常變異(common)

      基因頻率(MAF)和基因效應(Effect)的區(qū)間劃分。

      單基因、多基因和全基因效應

      • 單基因:Monogenic
      • 多基因:Polygenic
      • 全基因:omnigenic

      純合子、雜合子、顯性隱性基因

      純合子和雜合子是基因是否是純合的,顯性和隱性是表型的變化。

      廣義遺傳力和狹義遺傳力

      廣義遺傳力:

      狹義遺傳力:

      G進一步剖分,下面公式中Vi后面的VG應該是GbyE的部分,這里應該是印刷錯誤。

      關于遺傳力常見的誤區(qū)

      • 第一個:遺傳力與個人無關。比如肥胖的遺傳率是25%,它的意思不是說一個人肥胖的原因是有25%的原因來源于遺傳,75%的原因來源于環(huán)境。而是說明肥胖指標BMI 25%的差異與個體間的遺傳差異有關系。
      • 第二個:單個群體內的參數。遺傳力估計不能用來比較不同群體或國家之間的遺傳差異。例如,身高的可持續(xù)性估計為80%,并不意味著荷蘭和美國之間的平均身高差異主要是由于基因差異造成的。雖然每個特定群體內的變異可能是基因遺傳導致的,但群體之間的差異可能是環(huán)境的。需要注意的是,對于某些表型,例如色素沉著或膚色的差異,他們在很大程度上是遺傳的,雖然肯定有環(huán)境因素。
      • 第三個:這與遺傳不同。遺傳是后代與其親生父母之間的關系。它不僅衡量遺傳因素,而且還衡量家庭成員共享的環(huán)境、文化和其他因素。
      • 第四個:遺傳力很低并不一定意味著遺傳貢獻很小。低遺傳力可歸因于表型相關基因缺乏變異或高的環(huán)境變異。一個直截了當的例子是,盡管頸椎的數量與遺傳成分高度相關,但每個人的頸椎數量都是一樣的。變異很小,因此沒有或很少有遺傳因素引起的變異。

      Family遺傳力,SNP遺傳力和GWAS遺傳力

      「第一種:Family遺傳力」

      MZ:monozygotic,同卵雙胞胎,同卵全同胞

      DZ:異卵全同胞

      假定A是加性方差組分,C是共同環(huán)境,則同卵雙胞胎是A,異卵雙胞胎是A/2,E是殘差方差組分,

      那么:A + C + E =1

      那么遺傳力的計算方法是:

      用它來估算遺傳力,是狹義遺傳力的最高值。

      「第二種:SNP遺傳力」

      是使用全部的SNP估算的狹義遺傳力,可以使用GCTA的GREML進行估計方差組分,計算遺傳力。這里相當于GBLUP中的遺傳力的計算。

      「第三種:GWAS遺傳力」

      這是由GWAS定位出的顯著性的位點或者基因,可以解釋的百分比計算而來,它是最低的。

      消失的遺傳力

      Missing and hidden heritability

      消失的遺傳力,是家系遺傳力和GWAS遺傳力的差,它又可以分為:still-missing和hidden兩部分。它形成的主要原因是:

      • 非加性效應
      • 稀有大效應位點
      • 共同環(huán)境效應

      Still-missing遺傳力,是家系遺傳力和SNP遺傳力的差。主要是由稀有變異以及結構變異(structural variants)導致,會隨著分子標記的發(fā)展而降低。

      Hidden 遺傳力,是SNP遺傳力和GWAS遺傳力的差。主要是由于統(tǒng)計方法,無法檢測出小效應的SNP變異,這部分的變異不是消失了,而是隱藏起來了,主要是因為顯著性的閾值。

      整體而言,hidden遺傳力,會隨著樣本量的增大而降低。still-missing遺傳力會隨著分子標記的發(fā)展(可以捕捉更多的變異)而降低。

      常見性狀的遺傳力

      總結

      ?

      進入數量統(tǒng)計遺傳學的學科領域可能令人望而生畏。在這一章中,我們的目的是提供這一研究領域的主要構建塊和基本概念的直升機視圖。我們認識到這是一篇快速而簡略的文章,并鼓勵有興趣的讀者在你對這些概念更熟悉的時候,進一步深入研究更詳細的文獻。本章將為您提供基本知識,以區(qū)分主要概念,如表型、DNA、基因組、基因、染色體和基本過程。遺傳多態(tài)性為您理解這個主題提供了基礎,包括術語等位基因、單核苷酸多態(tài)性(SNP)和次要等位基因頻率(MAF)。在這本書中,你會發(fā)現(xiàn)我們經常研究的許多復雜性狀都是高度多基因的。掌握基因如何與蛋白質相關的過程以及分子生物學的中心記錄似乎很重要。本書中我們研究的許多主題都是由孟德爾定律和我們對有性生殖過程中基因重組的理解以及顯性和隱性性狀的傳播所決定的。最后,我們總結了遺傳力、常見誤稱、不同類型以及缺失和隱性遺傳力的概述。在下一章中,我們將從人類基因組的基礎知識轉移到一本統(tǒng)計入門,然后介紹人類進化。在這里,我們將遺傳學的基本概念從這一介紹性章節(jié)鏈接到人類傳播和進化的較長歷史所支持的統(tǒng)計概念

      ?

      飛哥總結

      第一章部分,主要介紹基因組數據的基礎概念,包括染色體、基因、DNA,MAF等概念,讓我受到很大啟發(fā)的是對于遺傳力的介紹,包括狹義遺傳力和廣義遺傳力,還介紹了具有人類特色劃分的家系遺傳力、SNP遺傳力和GWAS遺傳力,并將消失的遺傳力分為了兩部分:still-missing和hidden,前者會隨著檢測技術和分子標記的進展而降低,比如將拷貝數變異、結構變異放到模型中。第二個hidden會隨著樣本數的增加而降低,因為這部分主要是受到顯著性閾值的影響。

      想到前幾天發(fā)的番茄處理消失遺傳力的論文,按照這本書中的定義,應該解決的是消失遺傳力中still-missing的部分。

      分割線


      大家好,我是鄧飛,一個持續(xù)分享的數據分析師,這里我將自己公眾號的干貨內容挑重點羅列一下,方便大家閱讀和使用。

      1,快來領取 | 飛哥的GWAS分析教程

      2,飛哥匯總 | 入門數據分析資源推薦

      3,數量遺傳學,分享幾本書的電子版

      4,學習R語言這幾本電子書就夠了!

      5,書籍及配套代碼領取--統(tǒng)計遺傳分析導論

        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多