前言 當(dāng)大多數(shù)人考慮疾病的遺傳基礎(chǔ)時(shí),他們可能會(huì)想到罕見的單基因疾病,如囊性纖維化(CF),苯丙酮尿癥或血友病,甚至可能是具有明顯遺傳成分的癌癥(例如遺傳的乳腺癌)。雖然遺傳性疾病個(gè)別罕見,但它們約占罕見疾病的80%。罕見疾病的絕對(duì)數(shù)量意味著每17個(gè)人中約有1人受新生影響。此外,由于我們DNA的多種差異,我們的遺傳構(gòu)成在包括常見疾病的所有疾病過(guò)程中或多或少地發(fā)揮作用。這些差異中的一些,無(wú)論是單獨(dú)的還是組合的,可能使個(gè)體更容易患一種疾?。ɡ缫环N癌癥),但也可能使同一個(gè)體不易患上無(wú)關(guān)疾?。ɡ缣悄虿。?。環(huán)境(包括生活方式)在許多條件下(例如,與糖尿病相關(guān)的飲食和運(yùn)動(dòng))起著重要作用,但我們對(duì)環(huán)境的細(xì)胞和身體反應(yīng)可能因我們的DNA而異。免疫系統(tǒng)的遺傳學(xué)在人群中存在巨大差異,決定了我們對(duì)病原體感染的反應(yīng)。此外,大多數(shù)癌癥是由個(gè)體一生中發(fā)生的遺傳變化積累造成的,這可能受到環(huán)境因素的影響。顯然,理解遺傳學(xué)和基因組作為一個(gè)整體及其在人類群體中的變異,對(duì)于理解疾病過(guò)程是不可或缺的,而這種理解為治療、有益的治療和補(bǔ)救措施提供了基礎(chǔ)。 由于存在如此多的遺傳性疾病,因此在本次審查中不可能包含一些以上的例子來(lái)說(shuō)明原則。有關(guān)特定條件的更多信息,有許多可搜索的互聯(lián)網(wǎng)資源,這些包括遺傳學(xué)家庭參考(https://ghr.nlm./),基因評(píng)論(https://www.ncbi.nlm./books/NBK1116/),部分國(guó)家人類基因組研究所(https://www./education/)和人類在線孟德爾遺傳(https://www./)。在本綜述中,將對(duì)分子生物學(xué)的基本原理和技術(shù)進(jìn)行理解和認(rèn)識(shí),例如DNA結(jié)構(gòu)和PCR,DNA學(xué)習(xí)中心可提供PCR的解釋和動(dòng)畫(https://www./resources/)。這里的重點(diǎn)將放在人類疾病上,盡管定義我們理解的大部分研究都來(lái)自對(duì)具有相似或相關(guān)基因的動(dòng)物模型的研究。 人類基因組和變異 人類基因組和人類基因組參考序列產(chǎn)生人類的完整編碼信息儲(chǔ)存在我們細(xì)胞中存在的DNA中:人類基因組包含大約30億bp的DNA。來(lái)自世界各地的科學(xué)家們?cè)凇叭祟惢蚪M”計(jì)劃中合作,生成了整個(gè)人類基因組的第一個(gè)DNA序列(2001年出版),并在接下來(lái)的幾年中進(jìn)行了許多補(bǔ)充和修正。人類和許多其他物種的基因組序列信息可通過(guò)多個(gè)門戶網(wǎng)站免費(fèi)獲取,包括國(guó)家生物技術(shù)信息中心(NCBI; https://www.ncbi.nlm./)和Ensembl(http:// www.ensembl.org/)。 我們的大多數(shù)DNA以染色體的形式(核DNA或核基因組)存在于細(xì)胞核內(nèi),但線粒體(mtDNA或線粒體基因組)中也存在少量DNA。大多數(shù)人擁有23對(duì)染色體(圖2),因此大部分DNA以兩個(gè)拷貝存在,一個(gè)來(lái)自我們的母親,一個(gè)來(lái)自我們的父親。 圖2 (G-banding)形成核型 (A)秋水仙素處理中期停滯的培養(yǎng)細(xì)胞,然后進(jìn)行吉姆薩染色以產(chǎn)生特征性的明暗帶。通常,暗帶代表富含AT和基因貧乏的區(qū)域。(B)來(lái)自擴(kuò)散的染色體成對(duì)排列以查看核型,通常使用Cytovision等專業(yè)軟件。(C.)G-banding模式的圖解表示,稱為表意文字,用作參考。表意文字已經(jīng)在著絲點(diǎn)(虛線)對(duì)齊;藍(lán)色陰影區(qū)域變化很大。例如(B)中染色體13,14和15的p臂之間的差異。事實(shí)上,近端著絲粒染色體(13,14,15,21,22)的p臂都具有非常相似的含量,新生包括核仁組織區(qū)或NORs。每個(gè)NOR含有核糖體DNA(rDNA)的串聯(lián)重復(fù)序列,新生編碼rRNA。 人類核基因組編碼大約20000個(gè)蛋白質(zhì)編碼基因,通常由蛋白質(zhì)編碼(外顯子)和非編碼(內(nèi)含子)序列組成。我們的基因組還包含大約22000個(gè)僅編碼RNA分子的基因;這些RNA中的一些形成翻譯機(jī)制的組分(rRNA,tRNA),還有許多在細(xì)胞內(nèi)發(fā)揮作用,包括調(diào)節(jié)其他基因的表達(dá)。事實(shí)上,現(xiàn)在人們認(rèn)為,多達(dá)80%的基因組具有可能影響結(jié)構(gòu)和功能的生物活性。人類基因組還包含超過(guò)14000個(gè)'假基因';這些是蛋白質(zhì)編碼基因的不完美拷貝,它們已經(jīng)失去了編碼蛋白質(zhì)的能力。雖然最初被認(rèn)為是進(jìn)化遺物,現(xiàn)在有證據(jù)表明,有些假基因可能參與調(diào)節(jié)蛋白質(zhì)編碼。另外,假基因與正常基因之間的序列相似性可以促進(jìn)使正??截愂Щ畹闹亟M,如在圍產(chǎn)期致死戈謝病的一些病例中可見。此外,一些假基因有可能在基因治療中被利用以通過(guò)基因編輯方法產(chǎn)生功能基因。染色體之間的基因分布不相等:19號(hào)染色體基因密集,而三體可存活的常染色體(13,18,21)相對(duì)基因貧乏(表1)。 表格1 人類染色體的DNA和基因含量
請(qǐng)注意,盡管這些數(shù)字看起來(lái)非常精確,但它們應(yīng)僅作為指示,因?yàn)椋╥)每個(gè)個(gè)體的染色體將與參考序列不同,并且(ii)人類參考基因組序列不斷更新并進(jìn)行校正(此處的數(shù)據(jù)為來(lái)自GRCh38.p12,它代表了人類基因組的特定“構(gòu)建”。注意,近端著絲粒染色體13,14,15,21,22的數(shù)據(jù)不包括p臂上存在的共有核糖體DNA陣列重復(fù)序列(參見圖2)。來(lái)自Ensembl的數(shù)據(jù),2018年6月。 從人類基因組計(jì)劃的最開始,人們就認(rèn)識(shí)到健康個(gè)體之間存在大量的DNA序列變異,因此沒有所謂“正常”的人類DNA序列。但是,如果我們要描述DNA序列的變化,我們需要根據(jù)某些標(biāo)準(zhǔn)描述這些變化;該標(biāo)準(zhǔn)是人參考基因組序列。 變異與突變 遺傳學(xué)家對(duì)突變的定義是“對(duì)DNA序列的任何遺傳變化”,其中可遺傳指的是體細(xì)胞分裂(組織中細(xì)胞的增殖)和種系遺傳(從父母到兒童)。DNA的這種改變可能沒有影響,但有時(shí)可能會(huì)導(dǎo)致個(gè)體的可觀察到的差異(“表型”)。因此,在過(guò)去,人群中的這種改變,特別是當(dāng)它們與疾病狀態(tài)相關(guān)時(shí),被稱為“突變”。然而,對(duì)于許多人來(lái)說(shuō),這個(gè)術(shù)語(yǔ)具有負(fù)面含義,并且讓人聯(lián)想到科幻小說(shuō)和僵尸電影中出現(xiàn)的“突變體”!因此,現(xiàn)代實(shí)踐,特別是在醫(yī)療服務(wù)的背景下的醫(yī)學(xué)遺傳學(xué),是指將參考序列的差異稱為“變異”。變異可以進(jìn)一步分類為良性(與疾病無(wú)關(guān))或致病性(與疾病相關(guān)),盡管已經(jīng)鑒定出越來(lái)越多的人類DNA變異,我們?nèi)匀徊淮_定其效果;這些被稱為“具有不確定意義的變種”或VUS(表2)。 表2國(guó)際癌癥研究機(jī)構(gòu)變種分類
盡管該系統(tǒng)設(shè)計(jì)用于與癌癥易感性中的潛在作用相關(guān)的變異分類,但它也可用于在新生他情況下對(duì)變異進(jìn)行分類。 當(dāng)群體中存在兩個(gè)(或更多個(gè))不同版本的DNA序列時(shí),它們被稱為“等位基因”:每個(gè)等位基因代表該序列的一個(gè)特定版本(或變異)。通過(guò)分析許多人類基因組,我們可以計(jì)算出特定變異在群體中發(fā)生的頻率,通常表示為“次要等位基因頻率”或MAF。在MAF值至少為1%的情況下,變異可稱為“多態(tài)性”,盡管這是一個(gè)相當(dāng)隨意的標(biāo)準(zhǔn)。 單核苷酸變異:我們基因組中最常見的變異是僅影響一個(gè)堿基對(duì)(bp)的取代,稱為單核苷酸變異(SNV)或單核苷酸多態(tài)性(SNP)(圖1),取決于MAF。據(jù)估計(jì),人類基因組中至少有1100萬(wàn)個(gè)SNP(平均每300bp約1個(gè))。如果我們對(duì)地球上每個(gè)人的基因組進(jìn)行測(cè)序,對(duì)于我們基因組中的大多數(shù)位置,我們也會(huì)發(fā)現(xiàn)至少一個(gè)具有SNV的個(gè)體。 圖1 在人類基因組中發(fā)現(xiàn)的某些類型的變異 涉及一個(gè)或幾個(gè)核苷酸的變異顯示在染色體圖標(biāo)上方,以及下面的結(jié)構(gòu)變異;在每種情況下,相對(duì)于參考序列描述變異。為了描述結(jié)構(gòu)變異,A,B,C和D代表大的DNA片段;Y和Z代表來(lái)自不同染色體的DNA片段。 插入和缺失(插入缺失):小于1000bp的插入或缺失在人類基因組中也相對(duì)常見,越小的插入缺失越多。 結(jié)構(gòu)變異:結(jié)構(gòu)變異定義為影響大于1000bp(1kb)的DNA區(qū)段的變異。它們包括易位,倒位,大缺失和拷貝數(shù)變異(CNV)。CNV是我們基因組的片段,其大小范圍從1000到數(shù)百萬(wàn)bp,并且在健康個(gè)體中,拷貝數(shù)可以從零到幾個(gè)拷貝變化(圖1)。通過(guò)對(duì)許多人類基因組的分析,顯然CNV存在約12%的人類基因組序列。最大的CNV可能包含幾個(gè)完整的基因。當(dāng)CNV的群體頻率達(dá)到1%或更多時(shí),可以將新生稱為拷貝數(shù)多態(tài)性(CNP)。 重復(fù)變異:人類基因組包含大量重復(fù)序列。這些包括構(gòu)成我們基因組大約45%的“散布重復(fù)序列”,并代表移動(dòng)DNA元素(轉(zhuǎn)座子)的殘余。還有幾類'串聯(lián)重復(fù)',其中重復(fù)單元以頭對(duì)尾的方式并排形成相同(或非常相似)序列的重復(fù)陣列。每個(gè)陣列中的重復(fù)數(shù)可以變化,產(chǎn)生多個(gè)等位基因,使得這些基因座在群體內(nèi)具有高度可變性,并且可以用于鑒定個(gè)體(參見下文)。串聯(lián)重復(fù)包括小衛(wèi)星和微衛(wèi)星(圖1 / 表3))。雖然從父母到孩子一般都是穩(wěn)定遺傳(即重復(fù)次數(shù)相同),但某些微衛(wèi)星的擴(kuò)張與疾病有關(guān)。 表3小衛(wèi)星和微衛(wèi)星的比較
參考文獻(xiàn) Maria Jackson, Leah Marks, Gerhard H.W. May, Joanna B. Wilson.The genetic basis of disease[J]Essays In Biochemistry,2018,62(5):643-723;
|
|
來(lái)自: 生物_醫(yī)藥_科研 > 《待分類》