




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
一輪復習
基因組與基因組學一、基因概念的發(fā)展1865年,基因的最初概念是來自孟德爾的遺傳“因子”,認為生物性狀的遺傳是由遺傳因子所控制的,性狀本身是不能遺傳的,控制性狀的遺傳因子才是遺傳的。1909年,丹麥學者W.L.Johannsen提出了“基因”(gene)一詞,代替了孟德爾的遺傳因子,并由此形成了“顆粒遺傳”學說,認為在雜種中等位基因不融合,各自保持其獨立性,這也是孟德爾遺傳規(guī)律的核心。1910年摩爾根等通過果蠅雜交實驗表明,染色體在細胞分裂時的行為與基因行為一致,從而證明基因位于染色體上,并呈直線排列,提出了遺傳學的連鎖交換規(guī)律,證明了性別決定是受染色體支配的?;虻倪B鎖和交換定律的實質(zhì)是:在進行減數(shù)分裂形成配子時,位于同一條染色體上的不同基因,常常連在一起進入配子;在減數(shù)分裂形成四分體時,位于同源染色體上的等位基因有時會隨著非姐妹染色單體的交換而發(fā)生交換,因而產(chǎn)生了基因的重組。1.遺傳“因子”2.染色體是基因的載體1944年Avery等人不僅在體外成功地重復了上述實驗,而且用生物化學方法證明了轉化因子(trans-formingfactor)是DNA,而不是多糖莢膜、蛋白質(zhì)和RNA,而且轉化頻率隨著DNA純度的提高而增加。證明了DNA就是遺傳物質(zhì)。20世紀40年代GW.Beadle和E.L.Tatum通過對粗糙脈孢菌營養(yǎng)缺陷型的研究,提出了一個基因一個酶的假說。1953年Watson和Crick提出了DNA雙螺旋結構模型,明確了DNA在活體內(nèi)的復制方式。1957年由Crick最早提出遺傳信息在細胞內(nèi)的生物大分子間轉移的基本法則,即中心法則,接著在1961年又提出了三聯(lián)遺傳密碼,這樣將DNA分子的結構與生物學功能有機地統(tǒng)一起來,也為揭示基因的本質(zhì)奠定了分子基礎。1957年S.Benzer用大腸桿菌T4噬菌體作為材料,在DNA分子結構的水平上,分析了基因內(nèi)部的精細結構,提出了順反子(cistor)概念,證明基因是DNA分子上的一個特定的區(qū)段。3.DNA是遺傳物質(zhì)4.基因是有功能的DNA片段1961法國分子生物學家F.Jacob和J.Monod通過不同的大腸桿菌乳糖代謝突變體來研究基因的作用,提出了操縱子模型學說(operontheory)。這一學說闡明了基因調(diào)控在乳糖利用中所起的作用。表明人們已認識到基因的功能并不是固定不變的,而是可以根據(jù)環(huán)境的變化進行調(diào)節(jié)。隨之人們發(fā)現(xiàn)無論是真核還是原核生物轉錄調(diào)節(jié)都是涉及到編碼蛋白的基因和DNA上的元件。這一發(fā)現(xiàn)獲得了1965年諾貝爾獎。50年代初,美國遺傳學家B.McClintock在玉米的控制因子的研究中已經(jīng)指出某些遺傳因子是可以轉移位置的。后來的研究發(fā)現(xiàn),在原核生物和真核生物中均發(fā)現(xiàn)有基因轉移的現(xiàn)象,并將這些可轉移位置的成分稱為跳躍基因(jumpinggene),亦稱轉座因子(transposonelement)。此外,傳統(tǒng)的觀點認為,一個結構基因是一段連續(xù)的DNA序列,70年代后期發(fā)現(xiàn)絕大多數(shù)真核生物基因都是不連續(xù)的,其中被一些不編碼序列所隔開,故稱為斷裂基因。1978年,在噬菌體中還發(fā)現(xiàn)了重疊基因,一個基因序列可被包含在另一個基因中,兩個基因序列可能部分重疊。5.操縱子模型6.“跳躍基因”和“斷裂基因”的發(fā)現(xiàn)二、基因的概念從遺傳學的角度看,基因是生物的遺傳物質(zhì),是遺傳的基本單位——突變單位、重組單位和功能單位;從分子生物學的角度看,基因是負載特定遺傳信息的核酸序列,在一定條件下能夠表達某種遺傳信息(其產(chǎn)物為有功能的多肽鏈或功能RNA分子),變成特定的生理功能。“核酸序列”主要指DNA,對于RNA病毒來說則指染色體RNA?!癛NA分子”主要包括tRNA和rRNA。這個定義較確切地表述了基因的本質(zhì)和功能,已經(jīng)被絕大多數(shù)學者所接受。三、基因的分類根據(jù)基因的功能和性質(zhì),可將其分為以下幾類:1.結構基因這類基因不僅可轉錄(tran-scription)成mRNA,而且可翻譯(translation)成多肽鏈,從而構成各種結構蛋白和催化各種生化反應的酶。2.rDNA和tDNA基因:核糖體RNA基因(rRNA基因)與轉運RNA基因(tRNA基因)。這類基因只轉錄產(chǎn)生相應的RNA,而不翻譯成多肽鏈。3.調(diào)節(jié)基因:啟動子(promotor)與操縱基因(operator)前者是轉錄時RNA多聚酶起始與DNA結合的部位;后者是調(diào)節(jié)基因的產(chǎn)物阻遏蛋白質(zhì)或激活蛋白質(zhì)與DNA結合的部位,它們都是不轉錄的DNA區(qū)段,確切說,它們不能稱為基因。但關系到結構基因的活化或鈍化。以上各類基因(或DNA區(qū)段)之間的相互關系如下圖。通過這些基因的相互作用、密切協(xié)作,調(diào)控基因有序地表達,從而使各種生命活動表現(xiàn)出規(guī)律性、和諧性。四、基因的結構基因按照功能的不同分為4個區(qū)域:編碼區(qū):能夠編碼產(chǎn)生蛋白質(zhì)的序列,包括外顯子與內(nèi)含子前導區(qū):位于編碼區(qū)上游,相當于mRNA5’端非編碼區(qū)(非翻譯區(qū))尾部區(qū):位于編碼區(qū)下游,相當于mRNA3’末端非編碼區(qū)(非翻譯區(qū))調(diào)節(jié)區(qū):包括啟動子和增強子等基因編碼區(qū)的兩側也稱為側翼序列1.編碼區(qū):基因中編碼RNA或蛋白質(zhì)的核酸序列原核生物的編碼區(qū)是連續(xù)的真核生物編碼區(qū)由外顯子(編碼序列)和內(nèi)含子(非編碼序列)兩部分組成,編碼序列不連續(xù),稱為斷裂基因GT-AG法則:真核基因中RNA剪接的識別信號內(nèi)含子的5′端以GT開始,3′端以AG結束。2.調(diào)節(jié)區(qū):原核生物基因的調(diào)控序列
啟動子promoter;終止子terminator;操縱元件operator結構基因編碼區(qū)兩側的一段不被翻譯的DNA片段(側翼序列),參與轉錄調(diào)控。
包括啟動子和增強子等基因編碼區(qū)的兩側也稱為側翼序列真核生物基因的調(diào)控序列----順式作用元件順式作用元件:能影響基因表達,但不編碼RNA和蛋白質(zhì)的DNA序列反式作用因子:能識別和結合特定的順式作用元件,并影響基因轉錄的一類蛋白質(zhì)或RNAa.啟動子和上游啟動子元件(II類)TATA盒(TATABox):位于-25~-30bp,TATAAAA/TATATAT,與TFII(RNA聚合酶復合物)結合,啟動基因轉錄。CAAT盒(CAATBox):位于-70~-80bp,GGC/TCAATCT,與CTF結合,決定啟動子轉錄效率。GC盒(GCBox):位于-35bp,GGCGG,與轉錄因子SP1結合,促進轉錄的過程。b.增強子(enhancer)
與轉錄因子特異性結合,增強轉錄活性,在基因任意位置都有效、無方向性。c.Poly(A)加尾信號含有II類啟動子的基因,基因末端保守的AATAAA順序及下游GT或T富含區(qū),被多聚腺苷酸化特異因子識別,在mRNA3′端加約200個A。一個完整的原核基因結構是從基因的5'端啟動子區(qū)域開始,到3'端終止區(qū)域結束。基因的轉錄開始位置由轉錄起始位點確定,轉錄過程直至遇到轉錄終止位點結束,轉錄的內(nèi)容包括5'端非翻譯區(qū)、開放閱讀框及3'端非翻譯區(qū)?;蚍g的準確起止位置由起始密碼子和終止密碼子決定,翻譯的對象即為介于這兩者之間的開放閱讀框ORF。原核生物基因結構:原核生物大多數(shù)基因表達調(diào)控是通過操縱子機制實現(xiàn)的。所謂操縱子通常由調(diào)節(jié)基因、啟動子、操縱基因以及2個以上的編碼序列(結構基因)在原核生物基因組中成簇串聯(lián)組成。其中結構基因的表達受到操縱基因的調(diào)控。調(diào)節(jié)基因能產(chǎn)生作用于操縱基因的阻遏物(一種蛋白質(zhì)),操縱基因靠近它所控制的結構基因,阻遏物與操縱基因的結合能阻止結構基因的轉錄。操縱子模型結構一個完整的真核生物基因,不但包括編碼區(qū)域,還包括5'端和3'端兩側長度不等的特異性序列,雖然這些序列不編碼氨基酸,卻在基因表達的過程中起著重要的作用。所以,嚴格的“基因”這一術語的分子生物學定義是:產(chǎn)生一條多肽鏈或功能RNA所必須的全部核苷酸序列。非翻譯區(qū)(untranslatedregions,UTR):前導區(qū)、尾部區(qū):真核生物基因結構:五、基因組又稱染色體組,是生物體內(nèi)遺傳信息的集合,是某個特定物種細胞內(nèi)或病毒全部DNA分子的總和。
一個物種單倍體的染色體數(shù)目,物種全部遺傳信息的總和;
物種遺傳信息的“總詞典”;
控制發(fā)育的“總程序”;
生物進化歷史的“總檔案”。原核生物和真核生物的基因組都是DNA
染色體基因組
染色體外基因組
如:細菌的質(zhì)粒DNA
真核生物的線粒體DNA或葉綠體DNA病毒基因組有的是DNA,有的是RNA基因組的大小通常以其DNA的含量來表示。進化程度越高的生物其基因組越大DNA含量越高,結構也越復雜。C值(Cvalue):是指一種生物體單倍體基因組DNA的總量。存在反?,F(xiàn)象:許多復雜性相近的生物體其基因組大小卻顯著不同:果蠅的基因組大約是蝗蟲基因組的1/25。
C值悖理-C值生物體的單倍體基因組所含DNA總量稱為C值。每種生物各有其特定的C值,不同物種的c值之間有很大差別。能營獨立生活的最小的生物——支原體(Mycoplasma)的C值不106bp,一些植物和兩棲類動物的C值則可多達1011Mbp,相差10萬倍。在一些低等生物中,當進化增加了生物體的復雜性時,基因組也相應地增大。如蠕蟲的C值大于霉菌、藻類、真菌、細菌和支原體??墒牵谄渌镏袆t看不到這種規(guī)律。顯花植物和兩棲類動物的基因組最大,軟骨魚、硬骨魚甚至昆蟲和軟體動物的基因組都大于包括人類在內(nèi)的哺乳動物的基因組。爬行類和棘皮動物的基因組大小同哺乳動物幾乎相等。
因此,從總體上說,生物基因組的大小同生物在進化上所處地位的高低無關,這種現(xiàn)象稱為C值悖理(C—Valueparadox)。C值悖理-舉例說明在同一類生物中,不同種的基因組大小也有很大差別。比如,兩棲類生物中最小的基因組不足109Mbp,最大的則達1011Mbp,又如昆蟲中的家蠅基因組比果蠅基因組大6倍左右。把每一類生物中的最小基因組作比較,可以看出,每類生物的最小基因組的大小基本上對應于生物在進化上所處地位的高低;進化地位高、形態(tài)結構復雜程度高的一類生物,其最小的基因組也較大。(一)、原核生物基因組1.原核生物基因組特征原核生物基因組DNA較小,一般在106~107bp之間。大腸桿菌基因組DNA由4.6×106bp組成,是人類基因組3×109bp的1‰?;驍?shù)目較少,約含3500個基因。原核生物基因組中只有一個DNA復制起點。①原核生物的類核結構原核生物沒有典型的細胞核結構,基因組DNA位于細胞中央的核區(qū),無核膜將其與細胞質(zhì)隔開,但能在蛋白質(zhì)的協(xié)助下,以一定的組織形式盤曲、折疊包裝,形成類核,也稱擬核。②原核生物的操縱子結構操縱子結構是原核生物基因組的功能單位
原核生物的結構基因大多數(shù)按功能相關性成簇地串聯(lián)排列于染色體上。結構基因連同其上游的調(diào)控區(qū)(包括調(diào)節(jié)基因、啟動基因和操縱基因)以及下游的轉錄終止信號,共同組成了一個基因表達單位,即操縱子結構。什么是多順反子mRNA分子?一個mRNA分子帶有幾種蛋白質(zhì)的遺傳信息。利用共同的啟動子和終止信號,轉錄的mRNA分子可以編碼幾種不同的、但多為功能相關的蛋白質(zhì)。③原核生物的結構基因基因中編碼RNA或蛋白質(zhì)的DNA序列稱為結構基因。結構基因中沒有內(nèi)含子,基因是連續(xù)的,RNA被合成后不需要經(jīng)過剪接加工。多數(shù)是單拷貝基因,只有編碼rRNA和tRNA的基因有多個拷貝,有利于核糖體的快速組裝和蛋白質(zhì)的急需合成。原核生物結構基因的編碼順序一般不重疊。
基因重疊基因組DNA中某些序列被兩個或兩個以上的基因所共用?;蛑丿B現(xiàn)象在病毒基因組中普遍存在。2.質(zhì)粒①什么是質(zhì)粒?細菌細胞染色體以外,能獨立復制并穩(wěn)定遺傳的共價閉合環(huán)狀分子。②質(zhì)粒命名的原則用小寫字母p代表質(zhì)粒,在p字母后面用兩個大寫字母代表發(fā)現(xiàn)這一質(zhì)粒的作者或?qū)嶒炇颐Q。③質(zhì)粒的分類④質(zhì)粒的結構與理化性質(zhì)質(zhì)粒的結構
三種構型:共價閉環(huán)DNA分子半開環(huán)DNA分子線性DNA分子質(zhì)粒的理化性質(zhì)
具有核酸分子的一般理化特性:
可嵌入某些染料(溴化乙錠)
具有較強的抗切割和抗變性的能力⑤質(zhì)粒的生物學特征除酵母殺傷質(zhì)粒為RNA分子外,已知的所有質(zhì)粒都是環(huán)狀超螺旋DNA分子。質(zhì)粒較小,比較穩(wěn)定,在實際操作中不易受物理因素的損傷。a.質(zhì)粒的轉移分子量在2.5×107Da以上的質(zhì)粒可以從供體細胞將一個復本轉移給受體細胞,如F質(zhì)粒和R質(zhì)粒。分子量在1×107Da以下的質(zhì)粒一般無自我轉移能力。b.質(zhì)粒的復制主要由4個遺傳控制系統(tǒng)決定:復制調(diào)控系統(tǒng)、分配系統(tǒng)、細胞分裂控制系統(tǒng)位點特異重組系統(tǒng)嚴緊控制型質(zhì)粒:其復制常與宿主的繁殖偶聯(lián),拷貝數(shù)較少,每個細胞中只有1個到十幾個拷貝。松弛控制型質(zhì)粒:其復制與宿主不偶聯(lián),每個細胞中有幾十到幾百個拷貝。c.質(zhì)粒的選擇性標記抗藥性基因、營養(yǎng)缺陷型基因、抗重金屬基因。最常見的選擇性標記是抗藥性基因,即帶有一種或多種抗生素的抗性基因,可賦予宿主菌抵抗某種抗生素的能力。d.質(zhì)粒的不相容性同一類群的不同質(zhì)粒通常不能在同一菌株內(nèi)穩(wěn)定共存,當細胞分裂時就會分別進入不同的子代細胞,這種現(xiàn)象叫做質(zhì)粒的不相容性。不同群的質(zhì)粒(如F和ColEⅠ)可以在同一菌株內(nèi)穩(wěn)定共存,這些質(zhì)粒具有相容性。3.轉座因子轉座因子又稱轉座元件(transposableelement),是一類在細菌染色體、質(zhì)粒或噬菌體之間自行移動并具有轉位特性的獨立的DNA序列。①轉座子的分類a.插入序列(insertionsequence,IS)
一個轉位酶基因兩側的反向重復序列,長度為700~
2000bp。
2000bp以內(nèi),兩端正向重復序列(directrepeats,DR)、反向重復序列(invertedrepeats,IR),中間1kb左右的編碼序列,僅編碼和轉座有關的轉座酶。b.轉座子(transposon,Tn)(復合型轉座子)大小為4500-20000bp,兩端由一對IS元件組成,具有轉座酶基因、抗性基因等。c.可轉座的噬菌體(transposablephage)具有轉座功能的溫和性噬菌體,能整合到宿主基因組內(nèi)。②轉座子的遺傳效應a.引起突變轉座可引起基因的多種突變(插入失活、轉錄終止、缺失和倒位)b.引入新基因
某些抗生素的抗性基因c.基因重排
產(chǎn)生具有新的生物學功能的蛋白質(zhì)。(二)、病毒基因組病毒:自然界普遍存在的一種結構簡單、不能單獨繁殖,只能在宿主細胞內(nèi)進行復制以保證遺傳信息傳遞的微生物。完整的病毒顆粒是由核酸和蛋白質(zhì)組成。1.病毒基因組特征病毒基因組結構相對簡單,基因數(shù)少,所含信息量也少,不同病毒的基因組大小有較大差異。①基因組的堿基組成②基因組核酸類型雙鏈DNA;單鏈DNA/
雙鏈RNA;單鏈RNA/
環(huán)狀分子;線性分子是指同一段DNA片段能夠參與編碼兩種甚至兩種以上的蛋白質(zhì)分子。這種結構的意義在于使較小的基因組能攜帶較多的遺傳信息,使病毒利用有限的基因,編碼更多的蛋白質(zhì)。這種現(xiàn)象在其它的生物細胞中僅見于線粒體和質(zhì)粒DNA。③基因組中有基因重疊現(xiàn)象基因重疊的方式(1)一個基因完全在另一個基因里面。(2)幾個基因部分重疊。(3)兩個基因之間只有一個堿基重疊。什么是正鏈病毒?什么是負鏈病毒?如果基因組序列與mRNA相同,稱為正鏈DNA(+DNA)或正鏈RNA(+RNA)病毒。如果與mRNA互補,則稱為負鏈DNA(-DNA)或負鏈RNA(-RNA)病毒。單鏈正鏈RNA病毒基因組可直接作為模板功能,翻譯出所編碼的蛋白質(zhì),并復制出病毒核酸,自我組裝成為成熟的病毒顆粒,感染宿主細胞。噬菌體ΦΧ174是單鏈DNA病毒,含A、A*、B、C、D、E、F、G、H、J及K共11個蛋白質(zhì)基因,但這些基因卻只能轉錄成3個mRNA,其中一個從A基因開始,一個從B基因開始,另一個從D基因開始。④基因組中具有操縱子結構病毒基因組的大部分序列具有編碼功能,只有非常小的一部份沒有編碼功能翻譯,這與真核細胞基因組截然不同。病毒基因組的轉錄單元是多順反子。病毒基因組都是單倍體,反轉錄病毒例外,是二倍體2.DNA病毒①DNA病毒基因組的一般特點
a.DNA病毒基因組以雙鏈DNA為常見b.DNA病毒的基因組中,不同基因可以不同的鏈作為轉錄模板c.幾乎所有真核DNA病毒都是在活宿主細胞核內(nèi)復制
d.較大的雙鏈DNA病毒可引起多種嚴重疾病,而較小的DNA病毒會在宿主體內(nèi)誘發(fā)腫瘤。e.有的DNA病毒不能直接通過DNA復制過程進行基因組復制,必須先轉錄出一個RNA中
間體(前基因組),然后通過逆轉錄過程才能完成基因組復制。f.DNA病毒一般比RNA病毒大,生活周期較復雜。②幾種典型的DNA病毒a.SV40病毒基因組SV40也稱猿猴病毒40(simianvirus40,SV40)基因組為雙鏈環(huán)狀DNA,由5243bp組成基因組復制依賴于宿主細胞的酶類而完成基因組中含有早期轉錄基因和晚期轉錄基因b.腺病毒基因組腺病毒(adenovirus)顆粒呈球形,直徑70nm-90nm,無包膜核心是線性雙鏈DNA,全長36kbc.乙型肝炎病毒基因組基因組長3.2kb,是帶有部分單鏈區(qū)的環(huán)狀雙鏈DNA分子,兩條鏈長度不等。長鏈為負鏈:L(-)長度固定,攜帶有病毒全部的編碼信息。短鏈為正鏈:S(+)長度不等,約1.6kb~2.8kb。HBVDNA復制周期3.RNA病毒a.單鏈或雙鏈,但以單鏈RNA為多見
b.所攜帶的遺傳信息一般都在同一條鏈上,因此病毒RNA鏈有正負之分。c.許多哺乳類逆轉錄病毒屬于單正鏈雙體RNA,含有2個相同的(+)RNA,屬于雙倍體。d.RNA病毒變異率很高,平均每103-104個堿基中有一個突變e.RNA病毒的復制和轉錄常常獨立于宿主細胞核f.盡管不同RNA病毒的復制方式不相同,但均需經(jīng)逆轉錄完成其基因組的復制①基因組的一般特點HCV基因組的兩個突出特征:5′末端有一個長度和序列非常穩(wěn)定的非編碼區(qū)(UTR),此區(qū)是整個基因組中最保守的區(qū)域3′端UTR長度取決于病毒的來源②幾種典型的RNA病毒a.丙型肝炎病毒基因組病毒呈球型顆粒,直徑約50nm,有脂質(zhì)包膜基因組為單鏈正鏈RNA病毒,鏈長約9.5kb整個基因組只有一個ORF,編碼3011或3010個氨基酸b.人類免疫缺陷病毒基因組人類免疫缺陷病毒是獲得性免疫缺陷綜合征(AIDS)的病原體,屬于逆轉錄病毒。HIV基因組:由2條相同的正鏈RNA在5′端通過氫鍵互相連接形成二聚體單鏈RNA含9749個核苷酸,共有9個基因:3個為結構基因(gag、pol、env)——編碼病毒毒粒的結構蛋白6個為調(diào)控基因(tat、rev、nef、vif、vpr、vpu)(三)、真核生物基因組真核生物的基因組比較龐大,不同生物種間差異很大,分為:細胞核基因組;細胞質(zhì)基因組1.細胞核基因組及其特點細胞核基因組的DNA與蛋白質(zhì)結合形成染色體。除配子細胞外,體細胞有兩個同源染色體,因此有兩份同源的基因組。染色體位于細胞核內(nèi),是基因組遺傳信息的載體。細胞核基因組的特點①單順反子結構⑤不連續(xù)復制②斷裂基因⑥多態(tài)性③重復序列⑦基因重疊④多基因家族與假基因⑧端粒結構①單順反子結構真核細胞結構基因為單順反子,一個結構基因經(jīng)過轉錄生成一個單順反子mRNA分子,翻譯成一條多肽鏈。②斷裂基因真核細胞的基因為斷裂基因:
基因組的大部分序列屬于非編碼區(qū),不編碼具有生物活性的蛋白質(zhì)或多肽;
編碼區(qū)通常為結構基因,在兩側有非編碼區(qū),而且在基因內(nèi)部也有許多不編碼蛋白質(zhì)的
間隔序列。a.內(nèi)含子與外顯子結構基因由內(nèi)含子(intron)和外顯子(exon)間隔排列組成。內(nèi)含子是非編碼序列,在mRNA的成熟過程中被剪切,對外顯子的正常表達可能具有調(diào)節(jié)作用。外顯子是編碼序列,在mRNA成熟過程中切去內(nèi)含子后拼接成完整的序列,成為成熟的mRNA指導蛋白質(zhì)的生物合成。b.間隔區(qū)DNA(spacerDNA)真核生物基因之間的編碼空白區(qū)或轉錄空白區(qū),一般位于單拷貝的結構基因之側翼?;蚪M愈大,間隔區(qū)DNA所占的比例愈高。③重復序列a.高度重復序列分為反向(倒位)重復序列與衛(wèi)星DNA
重復頻率可達106以上在基因組中所占比例隨種屬而異,約占10%~60%在人類基因組中約占20%復性速率快,復雜度低反向(倒位)重復序列
兩個相同順序的互補拷貝在同一DNA鏈上反向排列而成
發(fā)夾式或“+”字形結構
回文結構衛(wèi)星DNA(satelliteDNA)
一般由2~10bp組成,成串排列
堿基序列不同于其他部份,等密度梯度離心可將其與主體DNA分開高度重復順序的功能參與復制水平的調(diào)節(jié)參與基因表達的調(diào)控參與轉位作用與進化有關與個體特征有關與染色體減數(shù)分裂時染色體配對有關b.中度重復序列重復數(shù)十~數(shù)萬次(<105)復性速度快于單拷貝序列,但慢于高度重復序列大多與單拷貝基因間隔排列,少數(shù)在基因組中成串排列在一個區(qū)域依據(jù)重復序列的長度可分為:短分散片段、長分散片段短分散片段重復序列的平均長度為300bp(一般<500bp)拷貝數(shù)可達10萬左右,如Alu家族、Hinf家族長分散片段平均長度為3500~5000bp,與單拷貝序列間隔排列。大多不編碼蛋白質(zhì)。有些中度重復序列編碼蛋白質(zhì)或rRNA的結構基因,如HLA基因、rRNA基因、tRNA基因、組蛋白基因、免疫球蛋白基因等。c.低度重復序列在單倍體基因組中只出現(xiàn)一次或數(shù)次復性速度慢在基因組中占50%~80%意義:儲存巨大的遺傳信息,編碼各種不同功能的蛋白質(zhì)④多基因家族與假基因多基因家族:由某一祖先基因經(jīng)過重復和變異所產(chǎn)生的一組基因。珠蛋白基因家族:家族的不同成員成簇地分布在不同染色體上,但核酸序列高度同源,編碼一組功能上緊密相關的蛋白質(zhì)。組蛋白基因家族:基因家族成簇地分布在某一條染色體上,它們可同時發(fā)揮作用,合成某些蛋白質(zhì)。
圖人珠蛋白多基因家族假基因:多基因家族中不產(chǎn)生有功能的基因產(chǎn)物的某些成員。假基因與有功能的基因同源,原來可能也是有功能的基因,但由于缺失,倒位或點突變等,使這一基因失去活性,成為無功能基因。傳統(tǒng)假基因加工的假基因⑥多態(tài)性a.限制性片段長度多態(tài)性多態(tài)性出現(xiàn)在限制性核酸內(nèi)切酶的酶切位點序列中,用某個內(nèi)切酶水解基因組的某段序列時,在同種的不同個體之間該段序列可能被酶解成長短不等的幾個DNA片段。b.單核苷酸多態(tài)性單個核苷酸的變異,人群中個體差異最具代表性的DNA多態(tài)性人類基因組中每1kb就有一個SNP位點,共約300萬個變異的4種形式三種顛換:C←→A(G←→T)
C←→G(G←→C)
T←→A(A←→T)一種轉換:C←→T(G←→A)轉換的頻率是顛換的3倍,因此轉換是SNP發(fā)生的主要原因。⑦基因重疊基因組DNA中某些序列被兩個或兩個以上的基因所共用的現(xiàn)象。⑧端粒結構是真核細胞的染色體末端存在著一種由DNA片段和蛋白組成的獨特的結構,對維持染色體的穩(wěn)定性具有重要的作用。組成端粒的DNA是由(TTGGGG)n所組成的非編碼重復序列。組成端粒的蛋白質(zhì)有兩種,一種與單鏈富含G的端粒DNA結合,另一種與雙鏈的端粒DNA結合。端粒的主要作用:維持染色體的穩(wěn)定性,防止染色體的重組及末端被降解。端粒酶:一種核糖蛋白酶,具有逆轉錄酶活性,其本質(zhì)是可催化端粒延長的RNA-蛋白質(zhì)復合物。2.細胞質(zhì)基因組及其特點兩類細胞器能夠攜帶遺傳物質(zhì):線粒體和葉綠體,稱為細胞器基因組。這些遺傳物質(zhì)獨立于細胞核基因組外自行復制和表達,又稱為染色體外基因組。
葉綠體基因組只存在于綠色植物中線粒體基因組存在于幾乎所有的真核生物中。大多數(shù)細胞器基因組是環(huán)狀DNA,某些低等真核生物(如草履蟲、衣滴蟲和幾種酵母)的線粒體DNA是線狀分子。通常每個細胞內(nèi)有許多細胞器,每個細胞器基因組又有許多拷貝。線粒體基因組的一般性質(zhì)真核細胞細胞器,細胞呼吸作用的主要場所。具有獨立于核染色體之外的基因組——mtDNA(mitochondrial
DNA)
以雙鏈超螺旋環(huán)狀分子存在于細胞內(nèi)。(原生動物中的草履蟲及四膜蟲的mtDNA是雙鏈線性分子)。不同生物細胞的mtDNA所含信息量、大小和組成形式上也都有所不同。不同物種的真核生物線粒體基因組大小差異很大。進行三羧酸循環(huán)中的氧化反應、電子傳遞和能量轉換。線粒體有它自己的基因組,編碼細胞器的一些蛋白質(zhì)。mtDNA復制:半保留——D環(huán)復制mtDNA合成的調(diào)節(jié):與細胞內(nèi)核DNA合成的調(diào)節(jié)是彼此獨立的。然而mtDNA的復制仍受核基因的控制,其復制所需的聚合酶是由核DNA編碼,在細胞質(zhì)中合成的。線粒體是半自主性的,其所含有的DNA不僅能復制傳遞給后代,而且還能轉錄所編碼的遺傳信息,合成線粒體某些自身所特有的多肽?,F(xiàn)在已知mtDNA中至少含有tRNA基因,rRNA基因,ATP酶基因,細胞色素氧化酶基因和細胞色素還原酶基因,另外mtDNA上還有一些抗藥性基因。線粒體基因組線粒體DNA的組成不同生物體細胞中線粒體的組成不盡相同,而各具其特點。例:人以及幾種脊椎動物mtDNA全序列結構的共同特點:(1)閉合環(huán)狀DNA,無組蛋白結合,不形成核小體。(2)基因數(shù)目和排列順序相同。2個rRNA基因(12S和16S
rRNA)22個tRNAs13個線粒體膜蛋白基因(+
1個氧化代謝所需基因)(3)一個D環(huán),與mtDNA的復制有關。(4)有2個復制起始點,分別復制H和L鏈。(5)哺乳動物的線粒體基因DNA沒有內(nèi)含子。不存在非編碼的重復序列。(6)某些蛋白質(zhì)的密碼子與核基因通用密碼子不同。高等植物線粒體基因組較大而復雜,基因組成單環(huán)或多環(huán)狀,大小范圍從186-2400Kb。由于植物線粒體基因組所含的基因只比動物多兩倍左右,因此,有很多基因間隔,另外還有很多重復序列和內(nèi)含子。線粒體“小基因組”型(動物型):基因組小,致密,基本上不含非編碼序列。線粒體“大基因組”型(植物型):基因組較大,含有很多非編碼序列為特點。酵母線粒體基因組較哺乳動物線粒體基因組大5倍,基本功能相似,但DNA組成上迥然不同(圖10-6)。在酵母線粒體基因組中:基因間有大段非編碼序列間隔,核糖體大小亞基的兩個rRNA基因相距可達25000kb;某些基因中含有內(nèi)含子,是斷裂基因。如為細胞色素氧化酶亞基Ⅰ編碼的基因以及編碼細胞色素b的基因均有若干個內(nèi)含子。更為顯著的另一特點是酵母線粒體基因的內(nèi)含子具有可以將它們自身從RNA轉錄物中剪切除去的相關序列,這種自我剪接過程是一種RNA所介導的催化作用。3.線粒體的蛋白質(zhì)合成線粒體是半自主性的,其DNA能復制也能傳遞給后代,能轉錄和翻譯其自身編碼的遺傳信息,合成所特有的多肽。線粒體基因組轉錄的mRNA沒有5′端的帽結構,起始密碼常直接位于mRNA的5′端。這一結構特點,表明線粒體蛋白質(zhì)的合成裝置與細胞質(zhì)中核糖體有所不同。不同真核生物線粒體的核糖體是一些55S至80S大小不等的顆粒,由兩個大小不等的亞基組成,每個亞基只有一條由線粒體DNA轉錄而來的rRNA分子。線粒體核糖體蛋白則是由核基因編碼,在細胞質(zhì)核糖體上合成,然后轉運到線粒體中的。在密碼子反密碼子配對上,線粒體基因組的tRNA可以識別反密碼子的第三位置上4個核苷酸(A、U、G、C)中的任何一個,這樣就大大擴大了tRNA對密碼子的識別范圍,因而線粒體基因組中的tRNA就足以用于蛋白質(zhì)的合成。線粒體遺傳密碼與核基因中有某些差異(表10-4)4.人類的線粒體基因病人類受精卵的線粒體幾乎全部來自卵母細胞,這種傳遞方式稱為母系遺傳或母體遺傳。由于mtDNA結構或功能異常所導致的疾病稱為線粒體基因病。到目前為止,100多種不同類型的mtDNA重排和50多種mtDNA點突變已被發(fā)現(xiàn)與人類疾病相關。多種線粒體突變涉及ATP合成,能量需求大的組織、細胞對ATP缺乏較為敏感。因此,線粒體基因病常表現(xiàn)為肌病、心疾病、神經(jīng)系統(tǒng)疾病、貧血、糖尿病等。圖10-7人類線粒體基因病示突變位點引起的細胞疾病MERRF:肌陣孿性癲癇及粗糙紅纖維綜合征LHON:Leber遺傳性視神經(jīng)病NARP:神經(jīng)性肌虛弱PEO:進行性外眼肌麻痹MELAS:線粒體腦肌病MILS:母性遺傳Leigh氏綜合征線粒體基因病的遺傳特點突變mtDNA通過母親卵子傳遞給子女,父源性將其突變mtDNA傳遞給子女則只是散發(fā)的偶然事件。由于細胞質(zhì)內(nèi)包含多個mtDNA分子,當某個特定位置上的突變同時發(fā)生在這些mtDNA的同一基因時,稱為純質(zhì)性(同序性,homoplasmy);若一個細胞內(nèi)多個mtDNA在此特定位置上既有突變基因又有正?;?,則稱為異質(zhì)性(heteroplasmy)。因此,線粒體基因病的癥狀是以突變mtDNA純質(zhì)個體最為嚴重,突變mtDNA異質(zhì)性個體是否受累,則決定于突變mtDNA所占的比例而定。傳遞突變mtDNA的母親既可是純質(zhì)或異質(zhì)性的患者,也可以是表型正常異質(zhì)性的攜帶者。5.線粒體與植物細胞質(zhì)雄性不育(CMS)細胞質(zhì)雄性不育植株表現(xiàn)出多種異常表型:花絲不正常,花粉粒不飽滿,碘染不正常著色,絨氈層發(fā)育不正常,細胞色素氧化酶、ATPase等多種酶活下降;線粒體結構不正常。→推測:由于線粒體DNA發(fā)生某些改變與CMS表型存在一定聯(lián)系育性正常植株與CMS植株的線粒體DNA限制酶酶切圖譜不同,只有大約50%的DNA片段是共同的。用線粒體基因組上的一些基因如atpA、atp6、cob、cox1、cox2、rps12、rrn18、rrn26基因片段作探針,在不育株與可育株之間存在特異片段(RFLP)的差異。發(fā)現(xiàn)多種植物的CMS往往是由于在這些區(qū)域的同源重組產(chǎn)生嵌合基因,成為擾亂花藥發(fā)育的關鍵原因。離體翻譯產(chǎn)物:玉米可育株與不育株存在差異多肽,不育株比可育株多一種21KDa的多肽。轉錄物分析:發(fā)現(xiàn)可育株與不育株轉錄物模式(轉錄物種類、大?。┎煌?。葉綠體遺傳及其分子基礎葉綠體基因組葉綠體基因組也是一個裸露的環(huán)狀雙螺旋分子,高等植物不同物種葉綠體基因組的大小相差不大,一般變動在120
kb至190kb之間,約編碼120個左右基因。通常一個葉綠體中可含有一個至幾十個葉綠體DNA(chloroplast
DNA,ctDNA
or
cpDNA)分子。葉綠體基因組的堿基序列中不含有5′甲基胞嘧啶,這一特點可作為鑒定葉綠體ctDNA提純程度的指標。葉綠體基因組的特點:編碼三大類基因①有關葉綠體遺傳系統(tǒng),包含編碼rRNA、tRNA、核糖體蛋白、起始因子等的基因②編碼光合系統(tǒng)的基因③第三類涉及氨基酸、脂類、色素生物合成基因結構上依其重復序列的特點分為:Ⅰ型:不存在反向重復。如松科、豆科的葉綠體基因組(圖10-10)Ⅱ型:含有大反向重復(5-76Kb),把葉綠體基因組分割為大單拷貝區(qū)(LSC)和小單拷貝區(qū)(SSC)(P398),大部分陸生植物和藻類葉綠體基因組屬此類。Ⅲ型:含有多個串聯(lián)重復和散布重復,例如傘藻、纖細裸藻等葉綠體基因組:以Ⅱ型為例説明葉綠體基因組的結構特點有以下特點:基因組由兩個IR和一個SSC及一個LSC。IRA和IRB,編碼相同,方向相反。cpDNA啟動子和原核生物的相似,基因產(chǎn)生單順反子或多順反子的mRNA;不同cpDNA基因組成和數(shù)目幾乎是相同的,產(chǎn)物多為類囊體的成分或和氧化還原反應有關。其tRNA基因中有內(nèi)含子,有的位于D環(huán)上,這和原核及真核生物核tRNA都不相同;所有葉綠體基因轉錄的mRNA都由葉綠體核糖體翻譯。葉綠體與雄性不育:玉米正常品系與不育品系葉綠體DNA的限制酶譜有微小的差異對可育與不育品系葉綠體蛋白質(zhì)的比較發(fā)現(xiàn)許多作物不育系與正常品系的RuBP羧化酶活性存在明顯差異等等。但葉綠體DNA缺陷、葉綠體蛋白缺陷引起雄性不育的機理目前還不清楚。葉綠體DNA、線粒體DNA與核DNA的關系葉綠體基因組同線粒體基因組一樣,都是細胞里相對獨立的一個遺傳系統(tǒng)--半自主系統(tǒng)(semiautonomous
system)。葉綠體基因組、線粒體基因組都可以自主地進行復制,但同時需要細胞核遺傳系統(tǒng)提供遺傳信息(關系彩圖)。它們之間現(xiàn)已被證明還有遺傳物質(zhì)的交流。3.基因組結構與疾?、偃祟惾旧w與疾病核基因組存在于染色體,人類的染色體組(單倍體)約有3萬個結構基因。染色體發(fā)生數(shù)目異?;蛭⑿〉慕Y構改變,會導致相應的基因數(shù)量與結構的異常,而引起疾病。a.染色體數(shù)目、結構和形態(tài)b.染色體數(shù)目畸變與疾病:多倍體和多倍性;異倍性或非整倍性;三體性和單體性c.染色體結構異常與疾?、诨蚪Y構與疾病基因結構異常一般指基因突變,即基因的核苷酸序列或數(shù)目發(fā)生改變,包括點突變,缺
失、重復、插入等。單基因病多基因病疾病基因與疾病相關基因六、人類基因組計劃1.人類基因組人類基因組包括細胞核內(nèi)的核基因組和細胞質(zhì)內(nèi)的線粒體基因組;正常體細胞(二倍體)基因組包括二個核基因組和多個線粒體基因組。人類基因組的組織特點:
功能相似或相關的基因常常散在地分布在不同的染色體上;基因組中各個基因之間差異極大;各個基因的大小差異很大(從數(shù)百個bp到數(shù)百個kb不等);基因組含重復序列,大多為非編碼,與編碼序列相間排列;每個結構基因都有單獨的調(diào)控序列;美國于1990年10月啟動“人類基因組計劃”
歐洲、日本、韓國、俄羅斯、澳大利亞和中國相繼加入人類基因組計劃的研究行列。中國于1994年啟動人類基因組計劃1996,完成標記密度為0.6cM的人類基因組遺傳圖譜,100kb的物理圖譜;1999年9月起,我國承擔了人類基因組1%的測序任務;2000,完成草圖;2001年8月26日,人類基因組“中國卷”的繪制工作宣告完成;2003年4月14日,中、美、日、德、法、英等6國科學家宣布人類基因組序列圖繪制成功,人類基因組計劃的所有目標全部實現(xiàn),已完成的序列圖覆蓋人類基因組的99%,精確率達到99.99%,進度比原計劃提前兩年多2004年10月,公布人類基因組完成圖2.人類基因組計劃過程3.人類基因組計劃的科學意義確定人類基因組中約數(shù)萬個編碼基因的序列及其在基因組中的物理位置,研究基因的產(chǎn)物及其功能。了解轉錄和剪接調(diào)控元件的結構與位置,從整個基因組結構的宏觀水平上理解基因轉錄與轉錄后調(diào)節(jié)。從整體上了解染色體結構,包括各種重復序列以及非轉錄“框架序列”的大小和組織,了解各種不同序列在形成染色體結構、DNA復制、基因轉錄及表達調(diào)控中的影響與作用。研究空間結構對基因調(diào)節(jié)的作用。發(fā)現(xiàn)與DNA復制、重組等有關的序列。研究DNA突變、重排和染色體斷裂等,了解疾病的分子機制,為疾病的診斷、預防和治療提供理論依據(jù)。確定人類基因組中轉座子、逆轉座子和病毒殘余序列,研究其周圍序列的性質(zhì)。基因組計劃的主要任務是獲得全基因組序列;現(xiàn)在的測序方法每次只能測800-1000bp,大量的測序片段要拼接;要知道序列在染色體上的位置才能正確拼接,因此需構建基因組圖譜。4.人類基因組計劃的工作任務:遺傳圖譜、物理圖譜、轉錄圖譜、序列圖譜A.遺傳圖譜概念:經(jīng)典的遺傳學圖譜:主要用來確定生物體的基因在染色體上的排列,只能標明基因之間的相對位置,無法指明基因在染色體上的具體位置,因此無法按圖直接克隆分離基因。在人類基因組計劃中顯然利用價值不大?,F(xiàn)代遺傳學圖譜:其概念是DavidBotstein等于1980年提出來的,當時由于DNA限制性內(nèi)切酶和連接酶的應用,RFLP成為一種嶄新的DNA多態(tài)性標記。他們提出來利用RFLP作為標記去構建多態(tài)性基因與這些標記連鎖關系,進而確定多態(tài)性基因的位置。其精髓在于將單純的表型研究深入到DNA分子的本質(zhì)上去。又稱連鎖圖,是指采用遺傳學技術構建顯示基因或DNA分子標記在基因組上相應位置和遺傳距離的圖譜。指確定基因或DNA標記在染色體上的相對位置與遺傳距離。它是通過連鎖分析,計算遺傳標記(或基因)間的交換頻率,將某一染色體上的基因呈直線排列,確定基因之間的相對位置,一般用厘摩(cM)表示。1cM大約相當于1000kb。(戴灼華P237)兩點測交、三點測交、著絲粒分析、順序四分子分析、中斷雜交、共轉導作圖遺傳圖譜的構建方法(植物)理論基礎:連鎖與交換基本方法:兩點測驗法和三點測驗法植物遺傳圖譜的構建:選擇親本要求親緣關系遠,遺傳差異大但又不能相差太大以導致引起子代不育。對備選材料進行多態(tài)(差異)性檢測,綜合測定結果,選擇有一定量多態(tài)性的一對或幾對材料作為遺傳作圖親本。遺傳標記的選擇目前用于植物遺傳作圖的遺傳標記主要是DNA分子標記,有RFLP、AFLP、SSR、SNP等。具體選用何種標記、要依據(jù)標記的特點、實驗條件、作圖植物的生長發(fā)育特性、對該植物的研究情況及實驗目的等決定。但一般選擇共顯性的DNA分子標記。(參考戴灼華P239-240)構建分離群體重組近交系雙單倍體親本的選擇直接影響到構建連鎖圖譜的難易程度及所建圖譜的適用范圍。對親本的選擇要考慮親本間的DNA多態(tài)性、親本材料的純度和雜交后代的可育性等問題。①一般,異交作物的多態(tài)性高,自交作物的多態(tài)性低。②育種家常將野生種的優(yōu)良性狀轉育到栽培種中,這種親緣關系較遠的雜交轉育,DNA多態(tài)性非常豐富;③親本材料純度影響試驗結果,純度不高的要自交進一步純化;④親本間的差異太大,減數(shù)分裂受到影響,后代可育性低,影響分離群體的構建,降低所建圖譜的可信度和適用范圍。⑤最后,選配親本時還應對親本及其F1雜種進行細胞學鑒定。防止親本間有染色體易位、缺失及F1染色體異常等現(xiàn)象對作圖的不利影響出現(xiàn)。根據(jù)其遺傳穩(wěn)定性分離群體分為暫時性分離群體和永久性分離群體兩類。在暫時性分離群體中分離單位是個體,經(jīng)自交或近交后其遺傳組成會發(fā)生變化,無法永久使用,這些群體包括F2、F3、F4、BC和三交群體等;在永久性分離群體中分離單位是株系,株系間基因組有差異,而株系內(nèi)個體間的基因型是相同的(純合的),是雜交不分離的,這類群體有重組近交系(recombinantinbredlines,RILs)和雙單倍體(doub-lehaploid,DH)群體等,它們可雜交或近交繁殖后代而不改變?nèi)后w的遺傳組成,可以永久使用。因此,構建DNA連鎖圖譜應根據(jù)具體情況選擇不同類型的分離群體。目前構建遺傳連鎖圖譜主要應用F2群體、RILs和DH群體。F2群體是常用的作圖群體,迄今大多數(shù)植物的DNA標記連鎖圖譜都是用F2群體構建的。其主要優(yōu)點是容易建立F2群體,其不足之處是對于顯性純合與顯性雜合基因型無法識別,造成基因型信息簡并現(xiàn)象的存在。RILs群體是雜種后代經(jīng)過多代自交而產(chǎn)生的一種作圖群體,通常從F2開始,采用單粒傳的方法來建立。自交的作用是使純合的基因型增加,雜合的基因型減少,因此,RILs群體中每個株系都是純合的,因而RILs群體是一種可長期使用的永久性分離群體,又可以進行重復試驗。它除了可用于構建分子標記連鎖圖外,還特別適用于數(shù)量性狀基因座(QTL)的定位研究。DH群體是由植物的單倍體經(jīng)過染色體加倍形成的二倍體即加倍單倍體或雙單倍體(DH)而來。DH群體產(chǎn)生的途徑很多,最常見的方法是通過花藥培養(yǎng),誘導產(chǎn)生單倍體植株,然后對染色體加倍產(chǎn)生DH植株。DH植株是純合的,自交后產(chǎn)生純系,這種純系可以穩(wěn)定繁殖,長期使用,是一種永久群體。DH群體的遺傳結構直接反映了F1配子中基因的分離和重組,因此DH群體作圖效率是最高的。同時,DH群體也適合于QTL作圖(詳見第6章)。由于植物可以很方便地建立和維持較大的分離群體,所以其遺傳圖譜構建工作的發(fā)展速度超過了動物的同類研究。迄今為止,已構建圖譜的植物多達幾十種,其中包括了所有重要的農(nóng)作物,如玉米、番茄、水稻、小麥、大麥、燕麥、大豆、高粱、油菜、萵苣、馬鈴薯等。群體大小的確定遺傳圖譜的分辨率和精度與群體的大小有密切的關系。群體越大,作圖精度越高。但群體太大會增加實驗工作量和費用。因此確定合適的群體大小是十分必要的。一般,構建DNA標記連鎖圖譜所需的群體遠比構建形態(tài)性狀特別是數(shù)量性狀的遺傳圖譜要小,大部分已經(jīng)發(fā)表的分子標記連鎖圖所用的分離群體一般都不足100個單株和家系。在實際工作中,構建分子標記骨架連鎖圖可基于大群體中的一個隨機小群體(如150個單株或家系),當需要精細地研究某個連鎖區(qū)域時,再針對性地在骨架連鎖圖的基礎上擴大群體。連鎖圖譜制作的統(tǒng)計學方法①兩點測驗對兩個基因座位之間的連鎖關系進行檢測,稱為兩點測驗。在進行連鎖測驗之前,必須了解各基因座的等位基因分離是否符合孟德爾分離比例,這是連鎖檢驗的前提。在共顯性條件下,F(xiàn)2群體中一個座位上的基因型分離比例為1:2:1,而BC1和DH群體中分離比例均為1:1;在顯性條件下,F(xiàn)2群體分離比例為3:1,而BC1和DH群體中分離比例仍為1:1。檢驗DNA標記的分離是否偏離孟德爾比例,一般采用x2檢驗。而對基因座位之間的連鎖關系,則采用或然比檢驗的方法,即LOD值的大小來進行重組率的估計從而推斷連鎖是否存在。②多點測驗在構建分子標記連鎖圖譜中,每條染色體都涉及許多標記座位。要確定這些標記座位在染色體上的正確排列順序及彼此間的遺傳距離必須同時對多個基因進行聯(lián)合分析,利用多個基因座間的共分離信息來確定它們的排列順序,進行多點測驗。多點測驗通常也采用或然比檢驗法。先對各種可能的基因排列順序進行最大或然比估計,然后通過或然比檢驗確定出可能性最大的順序。在一條染色體上,經(jīng)過多次多點測驗,就能確定出基因的最佳排列順序,并估計出相鄰基因間的遺傳圖距,從而構建出相應的連鎖圖。DNA標記分離數(shù)據(jù)的處理從分離群體中收集分子標記的分離數(shù)據(jù),獲得不同個體的DNA多態(tài)性信息,是進行連鎖分析的第一步。通常各種DNA標記基因型的表現(xiàn)形式是電泳帶型,將電泳帶型數(shù)字化是DNA標記分離數(shù)據(jù)進行數(shù)學處理的關鍵。進行DNA標記帶型數(shù)字化的基本原則是,必須區(qū)別所有可能的類型和情況,并賦予相應的數(shù)字或符號。例如,用RFLP標記構建遺傳圖譜,假設全部試驗共100個F2單株,檢驗了90個RFLP標記,經(jīng)數(shù)字化處理,可得到一個由90(行)x100(列)的、由簡單數(shù)字組成的RFLP數(shù)據(jù)矩陣。獲得有關數(shù)據(jù)矩陣后,選擇適合的構建DNA標記圖譜的計算機軟件對其進行分析和處理。4.遺傳標記的染色體定位利用遺傳學方法或其它方法將少數(shù)標記錨定在染色體上,作為確定連鎖群的參照系。常用的方法:單體分析、三體分析、代換系分析、附加系分析5.標記間的連鎖分析利用在兩個親本間有多態(tài)性的標記分析分離群體中所有個體的基因型;根據(jù)連鎖交換的情況,確定標記之間的連鎖關系和遺傳距離;計算機軟件進行分析和處理連鎖圖譜制作的統(tǒng)計學方法:兩點測驗;多點測驗。DNA標記分離數(shù)據(jù)的處理:與經(jīng)典遺傳作圖類似,只是統(tǒng)計性狀改為DNA分子標記。(戴灼華P240)來源網(wǎng)絡課件用作參考遺傳標記遺傳學中曾將可識別的等位基因稱為遺傳標記。現(xiàn)代遺傳學將可示蹤染色體、染色體片段、基因等傳遞軌跡的遺傳特性也稱為遺傳標記。形態(tài)標記:是指那些能夠明確顯示遺傳多態(tài)的外觀性狀,如株高、粒色等的相對差異。細胞學標記:是指能夠明確顯示遺傳多態(tài)的細胞學特征。如染色體結構上和數(shù)量上的遺傳多態(tài)性等。蛋白質(zhì)標記:非酶蛋白質(zhì)和酶蛋白質(zhì)。在非酶蛋白質(zhì)中,用得較多的是種子貯藏蛋白;酶蛋白質(zhì)主要是同功酶。DNA標記:也稱DNA多態(tài)性標記、DNA分子標記,是DNA水平上遺傳多態(tài)性的直接反映。這里僅介紹遺傳的分子標記中的幾種DNA分子標記:RFLP、VNTRs、AFLP、RAPD、SSR、STS和SNP。形態(tài)標記形態(tài)性狀:株高、顏色、白化癥等又稱表型標記數(shù)量少很多突變是致死的受環(huán)境、生育期等因素的影響,依據(jù)它進行選擇的準確性差,所需時間較長,選擇效率也較低。最早建立的果蠅連鎖圖,就是利用控制果蠅眼睛的形狀、顏色,軀體的顏色、翅膀的形狀等形態(tài)性狀作為標記,分析它們連鎖關系及遺傳距離,繪制而成的。控制性狀的其實是基因,所以形態(tài)標記實質(zhì)上就是基因標記。果蠅連鎖圖細胞學標記明確顯示遺傳多態(tài)性的染色體結構特征和數(shù)量特征染色體的核型染色體的帶型染色體的結構變異染色體的數(shù)目變異優(yōu)點:不受環(huán)境影響缺點:數(shù)量少、費力、費時、對生物體的生長發(fā)育不利細胞遺傳標記的特點:不易環(huán)境影響,呈孟德爾方式遺傳。多態(tài)性集中表現(xiàn)在染色體高度重復DNA結構的異染色質(zhì)所在的部位。細胞遺傳標記經(jīng)常伴有對生物有害的表型效應,難以獲得相應的標記材料,或者觀測和鑒定比較困難,從而限制了細胞遺傳標記的應用。家豬X、Y染色體G帶示意圖生化標記又稱蛋白質(zhì)標記就是利用蛋白質(zhì)的多態(tài)性作為遺傳標記。如:同工酶、貯藏蛋白優(yōu)點:數(shù)量較多,受環(huán)境影響小。缺點:受發(fā)育時間的影響、有組織特異性、只反映基因編碼區(qū)的信息。同工酶與等位酶同工酶(isozyme):電泳所可區(qū)分的同一種酶(系統(tǒng))的不同變化等位酶(allozyme):由一個位點的不同等位基因編碼的同種酶的不同類型,其功能相同但氨基酸序列不同DNA分子標記:簡稱分子標記,以DNA序列的多態(tài)性作為遺傳標記優(yōu)點:不受時間和環(huán)境的限制;
遍布整個基因組,數(shù)量無限;
不影響性狀表達;
自然存在的變異豐富,多態(tài)性好;
共顯性,能鑒別純合體和雜合體。理想的分子遺傳標記應具備的特點遺傳多態(tài)性高;檢測手段簡單快捷,易于實現(xiàn)自動化;遺傳共顯性,即在分離群中能夠分離出等位基因的3種基因型。標記遍布整個基因組;準確性,能正確反映動物的真實遺傳,即標記是經(jīng)濟性狀基因,還是與影響重要性的性狀連鎖。實驗重復性好(便于數(shù)據(jù)交換);開發(fā)成本和使用成本盡量低廉。遺傳圖譜標記(DNA分子標記)第一代分子標記,單一順序多態(tài)性:RFLP(限制性片段長度多態(tài)性)
RAPD(隨機擴增多態(tài)性)
AFLP(擴增片段長度多態(tài)性)
第二代分子標記,重復順序多態(tài)性:SSLPs(簡單序列長度多態(tài)性)VNTR(可變數(shù)目串聯(lián)重復多態(tài)性)STR(短串聯(lián)重復多態(tài)性)
SSR(簡單序列重復多態(tài)性)第三代分子標記,單核苷酸多態(tài)性:SNP(單核苷酸多態(tài)性)限制性片段長度多態(tài)性(restrictionfragmentlengthpolymorphism,RFLP)作為遺傳標記是DBotstein等人于1980年提出來的,是第一代DNA標記。RFLP是指用限制性內(nèi)切酶切割不同個體的DNA時,會產(chǎn)生長度不同的DNA片段,因為酶切位點的變化使得酶切后的DNA片段長度發(fā)生了改變,從而某位點上的DNA片段在電泳后用克隆探針檢測時就會出現(xiàn)泳動行為上的改變。通過酶切位點產(chǎn)生的不同長度的片段,可以用來鑒定和區(qū)分不同的個體。對RFLP的檢測最初是用Southern雜交的方法進行的。其基本過程是:取得DNA分子樣本后,用特定的酶剪切,然后通過電泳將這些片段按長度分開,再將膠上的片段轉移到硝酸纖維素膜上,最后用放射性標記的專一DNA探針雜交,探針將會雜交到相應的片段上,通過放射自顯影就可以看到該片段并判斷其位置和分子長度。A.RFLP標記B.RAPD標記
基于PCR的DNA標記:隨機引物PCR標記RAPD(randomamplifiedpolymorphicDNA)標記:隨機擴增多態(tài)性DNA,用寡核苷酸隨機短引物(人工合成的9~10個核苷酸組成)進行DNA的PCR擴增。經(jīng)凝膠電泳分離,溴化乙錠染色,顯示出擴增產(chǎn)物DNA片段的多態(tài)性。其分子基礎是模板DNA擴增區(qū)段上引物位點的堿基序列發(fā)生了突變。因此,不同來源的基因組在該區(qū)段(座位)上將表現(xiàn)為擴增區(qū)段產(chǎn)物的有無或擴增片段大小的差異。RAPD標記引物擴增產(chǎn)物所擴增的DNA區(qū)段是事先未知的,具有隨機性和任意性,因此隨機引物PCR標記技術可用于對任何未知基因組的研究。RAPD標記的不足之處是,一般表現(xiàn)為顯性遺傳,不能區(qū)分顯性純合和雜合的基因型,因而提供的信息量不完整。擴增片段長度多態(tài)性(amplifiedfragmentslengthpolymorphism,AFLP)標記,是結合RFLP和PCR的優(yōu)點發(fā)明的一種DNA指紋技術。通過對基因組DNA酶切片段的選擇性擴增來檢測DNA酶切片段長度的多態(tài)性。C.AFLP標記RFLP+接頭+引物+PCR→
AFLPAFLP既是進行酶切位點分析又要對酶切片段進行選擇性擴增,因此它既具備RFLP的準確性又具有PCR的高效性,綜合了兩者的優(yōu)點,并于1993年獲得歐洲專利局專利。D.VNTRs標記真核生物基因組DNA中含有大量的串聯(lián)重復序列,在不同個體間或同一個體的同源染色體間都會產(chǎn)生高度的變異。一般將長16~100個核苷酸為基本單元的串聯(lián)重復序列稱為小衛(wèi)星,而將以2~6個核苷酸為基本單元的簡單串聯(lián)重復序列,例如(CA)n、(GAG)n、(GACA)n等稱為微衛(wèi)星或簡單序列重復(simplesequencerepeats,SSR)。小衛(wèi)星和微衛(wèi)星其多態(tài)性來源于重復序列的核苷酸組成和重復的次數(shù)不同。一般又將小衛(wèi)星和微衛(wèi)星稱作可變數(shù)目串聯(lián)重復(variable
numberoftandemrepeats,VNTRs)。VNTRs標記也呈共顯性遺傳,符合孟德爾遺傳傳遞規(guī)律,因此可以用來進行遺傳分析和作圖(圖18-3)。而且VNTRs在基因組中有廣泛的分布,可檢出的多態(tài)更豐富,出現(xiàn)的頻率更高。(參考戴灼華P235)人類系譜分析表明VNTR等位基因的分離。在系譜中出現(xiàn)6個等位基因(A1~A6),但是任何一個個體僅可能有一個等位基因(純合子)或兩個等位基因(雜合子)第二代分子遺傳標記被稱為簡單序列長度多態(tài)性(singlesequencelengthpolymorphism,SSLP),這種標記實際上是一種串聯(lián)重復DNA序列,和我們在前面介紹過的衛(wèi)星DNA的屬性是一致的。但SSLP又是一類特殊的串聯(lián)重復序列:它們的單位序列的串聯(lián)重復次數(shù)在人群中存在普遍差異(圖14-22a),即不同個體在相同SSLP的基因座上往往攜帶了不同長度的等位基因形式(由于不同重復次數(shù)造成),從而形成了遺傳多態(tài)現(xiàn)象,因此得名。人類基因組的遺傳作圖主要利用了兩類SSLP。第一類是小衛(wèi)星DNA(minisatelliteDNA),重復單位長度一般為6~64bp,總長為0.1~20kb(均小于衛(wèi)星DNA)。小衛(wèi)星DNA在所有染色體上都有分布,但近端粒區(qū)域密度更高,也被稱為數(shù)目變異串聯(lián)重復(variablenumberoftandemrepeat,VNTR)。另一類SSLP是微衛(wèi)星DNA(microsatelliteDNA),顧名思義,微衛(wèi)星DNA長度更小,它的重復單位僅為1~4bp,總長通常不到100bp,也被稱為簡單重復序列(simpletandemrepeat,STR)。(參考劉祖洞P347)上課以此為準顯示的是一例VNTR多態(tài)性,探針1是位于此特殊VNTR多態(tài)性旁的在基因組中獨有的DNA片段,因此利用DNA印跡只能檢測此一位點。對于所檢測的三個個體在這個基因座都呈現(xiàn)雜合性(AB、CD、EF),探針1是目前較常用的一類探針,因為任何兩個非親緣個體攜帶相同的兩個等位基因的機率非常低,除非他們是單卵雙生子;除探針1檢出獨有的VNTR外,探針2是根據(jù)VNTR多態(tài)性本身的串聯(lián)重復序列設計的,因為同樣的串聯(lián)重復序列散布于基因組中(即VNTR多態(tài)性),因此探針2在DNA印跡中將從這些眾多多態(tài)性中檢測到許多帶譜,利用探針2這樣的探針檢測到的復雜譜帶同時顯示出許多多態(tài)基因座,因此在兩個個體中很少一樣,這就是我們前面所說的“DNA指紋”。E.單核苷酸多態(tài)性標記(SNP)(singlenucleotidepolymorphism,SNP),它是目前最有發(fā)展前途的一類新型DNA標記。SNP與RFLP和STR(短串聯(lián)重復)等DNA標記的主要不同是不再以“長度”的差異作為檢測手段,而直接以序列的變異作為標記。我們知道,在一個群體中基因組內(nèi)某一基因座上可以有兩個或兩個以上的等位基因,這是等位基因的多態(tài)性。同樣,在基因組內(nèi)某一特定核苷酸位置上,也可以有不同的核苷酸。基因組中單核苷酸的置換使得群體中基因組的某些位點上存在差別,如同等位基因那樣可以有兩種或兩種以上的不同核苷酸。SNP就是指基因組內(nèi)特定核苷酸位置上存在兩種不同的核苷酸,其中最少一種在群體中的出現(xiàn)頻率不少于1%(低于1%則視為點突變)?;蚪MDNA雙鏈的某個核苷酸位點上,當一條鏈上的核苷酸發(fā)生置換時,其互補鏈的對應位點上同樣也發(fā)生核苷酸置換,此時只計為出現(xiàn)一個單核苷酸多態(tài)?;蚪M中單核苷酸的缺失、插入與重復則不屬于SNP。
由于這一類標記的基礎是各種形式的單堿基突變,理論上任何用于單堿基突變或多態(tài)性的技術都可用于SNP標記的檢測,如RFLP、等位基因特異的寡核苷酸雜交、寡核苷酸連接分析(OLA)、DNA序列分析、單鏈構象多態(tài)性(SSCP)等,這些技術都必須通過凝膠電泳進行檢測,因此費時、效率不高。但隨著微陣列DNA芯片(DNAchip)(圖8-9)等技術的發(fā)展,使得這一類標記的檢測效率大大提高,并且在技術上有可能摒棄遺傳標記分析技術的“瓶頸”--凝膠電泳。微陣列DNA芯片的主要原理是在一塊小硅片(1cm2或更大些)上進行微陣列分析,芯片上鋪有密集的具有特定堿基序列的探針,提取待測目標DNA后,切成長短不一的片段,經(jīng)熒光化學物質(zhì)標記后,注射到嵌有芯片的載片上,由于DNA和探針雜交的程度與熒光強度有關,因此通過激光掃描,即可根據(jù)熒光強弱測出被檢測序列的變異。實現(xiàn)這種分析的關鍵是能在芯片上高密度地原位合成大量不同的寡核苷酸探針,以及實現(xiàn)雜交后的熒光檢測和計算機分析,這種技術已廣泛利用在科研上,微陣列DNA芯片在理論上可以提供足以檢出任何SNP的探針,并通過雜交檢出基因組中的cSNP或SNP。SNP標記的特點高密度
SNP是基因組中最普遍、頻率最高的遺傳標記。單個SNP雖然只有兩個等位基因,多態(tài)信息含量不如微衛(wèi)星位點,但其高密度彌補了其不足。代表性
某些位于基因表達序列內(nèi)的SNP(codingSNP,cSNP),有可能直接影響蛋白質(zhì)結構或表達水平,鑒別cSNP對于復雜表型性狀與基因變異之間的關聯(lián)分析具有重要意義。易實現(xiàn)自動化分析
雙等位標記,檢測時只需“有或無”表示。DNA芯片技術實驗了SNP分析的高通量、微型化和自動化。SNP與RFLP和STR標記的主要不同之處在于,它不再以DNA片段的長度變化作為檢測手段,而直接以序列變異作為標記。B.物理圖譜物理作圖是利用分子生物學技術直接將DNA分子標記、基因或克隆標定在基因組實際位置的作圖方法。相對傳統(tǒng)的遺傳作圖存在以下特點:遺傳作圖分子標記數(shù)量不足,覆蓋面低,分辨率有限(≈599kb)。重組熱點存在影響遺傳作圖精確度,甚至可能出現(xiàn)顛倒,需要其它方法進行檢驗、校正和補充。常用物理作圖法:限制酶作圖:利用不同限制酶酶切片段大小來判斷切點間距(似拼交換)??寺∽鲌D:根據(jù)重疊順序構建疊連群(contig)。熒光標記原位雜交(FISH):熒光探針結合到染色體上定位。序列標簽位點(STS)標記:擴展片段長度多態(tài)性標記序標位,在染色體上定位的序列已知的單拷貝DNA短片段。來源廣泛,RFLP、SSLP、已知基因序列等都可以作為STS(看同時出現(xiàn)概率)。限制酶作圖:求限制酶位點及距離DNA限制性內(nèi)切酶酶切圖譜(restrictionmap)是一種重要的DNA物理圖譜,它由一系列位置確定的多種限制性內(nèi)切酶酶切位點組成,以直線或環(huán)狀圖式表示。限制性內(nèi)切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經(jīng)酶切后就會產(chǎn)生不同長度的DNA片段,由此而構成獨特的酶切圖譜。其主要的步驟是:制備克隆DNA;克隆DNA指紋分析,包括酶切、電泳分離、雜交標記或圖像處理;計算機對克隆的排列和DNA片段的排序;填補空隙,包括分離新克隆、PCR驗證等。構建DNA限制性內(nèi)切酶酶切圖譜有許多方法。通常結合使用多種限制性內(nèi)切酶,通過綜合分析多種酶的單酶切及不同組合的多種酶同時酶切所得到的限制性片段大小來確定各種酶的酶切位點及其相對位置。(參考戴灼華P241)克隆作圖:(疊連群圖譜)(參考戴灼華P241)一組相互兩兩頭尾拼接的可裝配成長片段的DNA序列克隆群稱為疊連群。分辨在基因文庫克隆中疊連群插入片段的順序關系,通過相互鄰接的兩個片段間存在的重疊部分,推斷出各疊連群覆蓋整個染色體的克隆片段在染色體上的順序,最后構建出疊連群圖譜(contigmap)。其具體步驟是將染色體切割成小片段后,克隆并排序,得到由排好序的插入DNA片段克隆組成的疊連群??寺’B連群有多方面的重要應用,是人類基因組計劃物理圖譜的核心部分。使用這些疊連群圖譜可以重新確定克隆片段或其他DNA探針在基因組中的位置,一旦構建成疊連群圖譜,則整個基因組就可以以克隆形式獲得,從而可在堿基序列水平上用這些克隆來分析基因組的任何區(qū)域。克隆疊連群的組建通常采用染色體步移(chromosomalwalking)法。首先從基因文庫中隨機取出一個指定的或隨機克隆,然后在文庫中尋找與之重疊的第二個克隆。在第二個克隆的基礎上再尋找第三個克隆,依次延伸,這便是克隆疊連群圖譜構建的基本原理。從實驗技術上看,一個疊連群是一組克隆電泳后的一系列泳帶序列,這些泳帶序列相互部分重疊,并僅屬于一個疊連群,且每個疊連群至少含有一條泳帶。根據(jù)重疊順序的相對位置,通過原位雜交的方法將各個克隆首尾連接,即構成了一個連續(xù)的序列,其長度即疊連群長度,可達幾百萬堿基對。當今將克隆片段裝配成疊連群,主要依靠計算機來處理。首先計算重疊的可能性,如果重疊的可能性在90%以上,可認為兩個克隆是相鄰的,將之重疊起來,然后再將其他重疊可能性大的克隆找出,這樣可逐步增長,直至形成這個疊連群。質(zhì)粒、BAC、PAC和YAC文庫都能構建疊連群。疊連群圖譜的繪制往往是核苷酸測序的第一步。熒光標記原位雜交(FISH):(細胞遺傳作圖)細胞遺傳學圖譜(cytogeneticmap)是將基因或DNA片段直觀定位于染色體上的物理圖譜,因此也稱為染色體圖譜(chromosomemap)。它是將基因或其他被分離出的DNA片段定位在它所在的染色體區(qū)域,并且粗略地測出它們之間相距的堿基長度。其圖譜的制作主要采用原位雜交技術,將目標基因或特定的DNA片段定位到特定的染色體區(qū)帶上。細胞遺傳學圖譜制作的關鍵是原位雜交探針序列與染色體目標序列的相互作用。目前用得最多的是熒光原位雜交(fluorescenceinsituhybridization,FISH)技術。其基本原理是將DNA探針用特殊修飾的核苷酸分子標記(如生物素biotin-dUTP或地高辛dig-oxigenindUTP),使標記的探針通過堿基互補原位雜交到染色體切片上,再用與熒光素分子偶聯(lián)的單克隆抗體與探針分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年自動駕駛技術對交通管理的影響
- 現(xiàn)場拆遷應急預案
- 培訓中心合同(標準版)
- 泉州體育筆試題目及答案
- 能量滿載綠茶拿鐵行業(yè)跨境出海項目商業(yè)計劃書
- 美容產(chǎn)品線上企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 經(jīng)濟旅游中級題庫及答案
- 2025年山東輕工考試題型及答案
- 醫(yī)學知識培訓后感悟課件
- 執(zhí)業(yè)醫(yī)師報考真題及答案
- 門機控制器調(diào)試手冊
- 湖北省武漢市外國語學校2024-2025學年上學期10月九年級物理試題(含解析)
- 2025年上海市青浦區(qū)中考英語一模試卷
- 初中生物教師培訓講座
- 知識付費合同協(xié)議范本
- 第一單元中國特色社會主義的開創(chuàng)、堅持、捍衛(wèi)和發(fā)展單元測試-2023-2024學年中職高教版(2023)中國特色社會主義
- 學校體育學(唐炎-劉昕版)重點、知識點
- 骨折康復護理的常見問題和處理方法
- 實驗室生物安全手冊-
- 9.2 維護國家安全(分層作業(yè))八年級道德與法治上冊同步備課系列(部編版)
- 高位大直徑大直徑定向鉆孔技術及其配套裝備課件
評論
0/150
提交評論