分子生物學(xué)基因組學(xué)_第1頁
分子生物學(xué)基因組學(xué)_第2頁
分子生物學(xué)基因組學(xué)_第3頁
分子生物學(xué)基因組學(xué)_第4頁
分子生物學(xué)基因組學(xué)_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

組學(xué)黃娟Email:huangjuan@中心法則基因組轉(zhuǎn)錄組蛋白質(zhì)組基因組學(xué)轉(zhuǎn)錄組學(xué)蛋白質(zhì)組學(xué)DNARNAprotein轉(zhuǎn)錄翻譯復(fù)制-omics-omeGenomeTranscriptomeProteomeGenomicsTranscriptomicsProteomics基因組學(xué)genomics基因(gene)基因組(genome)基因組學(xué)(genomics)基因:由不同的DNA片段共同組成的一個完整的表達單元,有一個特定的表達產(chǎn)物,表達產(chǎn)物可以是RNA分子或者是多肽分子?;蛟谌旧w上呈線性排列。分離定律自由組合定律連鎖定律基因組(genome)泛指一個細胞(或病毒)的全部遺傳物質(zhì),它代表了一種生物所具有的全部遺傳信息。真核生物中,基因組表示其從親代所繼承的單套染色體,或稱染色體組。是生物的整套染色體所含有的全部DNA序列。線粒體基因組、葉綠體基因組原核生物基因組包括細胞內(nèi)的染色體和質(zhì)粒DNA。病毒顆粒也帶有遺傳物質(zhì),稱為病毒基因組。C值:指一種生物單倍體基因組DNA的總量。總的趨勢是,隨著生物結(jié)構(gòu)與功能復(fù)雜性的增加,各分類單元中最小基因組的大小隨分類地位的提高而遞增。一些模式生物的基因組大小C值矛盾:指一個有機體的C值和其復(fù)雜性缺乏相關(guān)性。爪蟾的基因組大小和人類相似;兩棲類最小基因組和最大的基因組之間相差約100倍;C值矛盾在進化中的原因和機制尚不清楚。

完整的人類基因組包含:1-22號常染色體核基因組

X和Y染色體

線粒體基因組DNA多態(tài)性每個人之間基因組并不完全相同,稱基因組的多態(tài)性,表現(xiàn)在DNA的序列上。統(tǒng)計表明,任意兩個人之間的DNA核苷酸差異約占基因組的0.01%,就是這基因組中0.01%的差異,決定了人類的遺傳多樣性?;蚪M學(xué)(genomics)是闡明整個基因組的結(jié)構(gòu)、結(jié)構(gòu)與功能的關(guān)系以及基因之間相互作用的科學(xué)。Genomics具體:指以分子生物學(xué)技術(shù)、計算機技術(shù)和信息網(wǎng)絡(luò)技術(shù)為研究手段,以生物體內(nèi)全部基因為研究對象,在全基因背景下和整體水平上探索生命活動的內(nèi)在規(guī)律及其內(nèi)外環(huán)境影響機制的科學(xué)。

包括:對所有基因進行基因組作圖,核苷酸序列分析,基因定位和基因功能分析?;蚪M學(xué)研究的最終目標(biāo)獲得生物體全部基因組序列鑒定所有基因的功能明確基因之間的相互作用關(guān)系闡明基因組的進化規(guī)律

結(jié)構(gòu)基因組學(xué)(structuralgenomics):遺傳圖譜、物理圖譜、序列圖譜以及轉(zhuǎn)錄圖譜的繪制和大規(guī)模DNA測序。功能基因組學(xué)(functionalgenomics):分析鑒定基因組所包含的基因和非基因序列及其功能。比較基因組學(xué)(comparativegenomics):基因組之間比較鑒定,研究生物進化,預(yù)測新基因。三個亞類1、結(jié)構(gòu)基因組學(xué)(structuralgenomics)結(jié)構(gòu)基因組學(xué)著重研究基因組的結(jié)構(gòu)并構(gòu)建高分辨的遺傳圖、物理圖、轉(zhuǎn)錄圖和序列圖;揭示基因組的全部序列及其組成。

主要任務(wù):基因組作圖大規(guī)模測序遺傳圖轉(zhuǎn)錄圖cM

序列圖物理圖kb圖譜標(biāo)記:圖譜構(gòu)建中需要可以鑒別的標(biāo)記(marker)。多態(tài)性:人的DNA序列上平均每幾百個堿基會出現(xiàn)一些變異(variation),并按照孟德爾遺傳規(guī)律由親代傳給子代,從而在不同個體間表現(xiàn)出不同,因而被稱為多態(tài)性(Polymorphism)。遺傳作圖(geneticmapping):就是確定連鎖的遺傳標(biāo)志位點在一條染色體上的排列順序及它們之間的相對遺傳距離,用厘摩爾根(centi-Morgan,cM)表示。1.1遺傳圖(geneticmap)兩對等位基因之間重組互換的頻率即遺傳距離當(dāng)兩個遺傳標(biāo)記之間的重組值為1%時,圖距即為1cM1.1遺傳圖AEDbAEdBAEDbAEdB10%10cMAEdbDBAEAEdbDBAE遺傳圖譜(geneticmap)又稱連鎖圖譜(linkagemap),是以在某個遺傳位點上具有多個等位基因的遺傳標(biāo)記作為“路標(biāo)”,以遺傳學(xué)上的距離即兩個遺傳位點之間進行交換、重組的百分率cM作為“圖距”,反映基因遺傳效應(yīng)的基因組圖。1)以多態(tài)的遺傳標(biāo)記(基因、DNA)為路標(biāo)2)根據(jù)重組頻率來確定基因之間的距離。1.1遺傳圖1.1.1基因標(biāo)記:基因控制性狀的表現(xiàn),利用可鑒別的形態(tài)、生化等表型性狀作標(biāo)記→根據(jù)連鎖交換原理來分析基因之間的連鎖關(guān)系和遺傳距離→繪制連鎖圖譜。缺點:基因標(biāo)記數(shù)目有限,所構(gòu)建的遺傳圖譜不詳細,標(biāo)記間的遺傳距離較大。1.1遺傳圖1.1.2DNA標(biāo)記簡稱分子標(biāo)記,以DNA序列的多態(tài)性作為遺傳標(biāo)記;優(yōu)點:不受時間和環(huán)境的限制遍布整個基因組,數(shù)量無限不影響性狀表達自然存在的變異豐富,多態(tài)性好共顯性,能鑒別純合體和雜合體1.1遺傳圖DNA標(biāo)記①限制性片段長度多態(tài)性(restrictionfragmentlengthpolymorphism,RFLP)②可變數(shù)目串聯(lián)重復(fù)序列(variablenumberoftandemrepeat,VNTR)③單核苷酸多態(tài)性(singlenucleotidepolymorphism,SNP)1.1遺傳圖RFLP(限制性片段長度多態(tài)性)

DNA序列上某個堿基發(fā)生突變,如單個堿基置換,或少數(shù)堿基缺失、重復(fù)、插入,使突變部位的DNA序列產(chǎn)生或丟失某種限制性內(nèi)切酶位點。當(dāng)用該限制性內(nèi)切酶消化此DNA時,酶切片段長度發(fā)生變化,個體之間出現(xiàn)限制性片段長度的差異,這稱為限制性片段長度多態(tài)性。1.1遺傳圖RFLP分析1.1遺傳圖位于染色體上的位置相對固定。同一親本及其子代相同位點上的多態(tài)性特征不變。同一凝膠電泳可以顯示同一位點的不同多態(tài)性片段,具有共顯性特點。分布密度稀疏。需要借助分子雜交顯示,不安全。1.1遺傳圖AFLP(amplifiedfragmentlengthpolymorphism,擴增片段長度多態(tài)性)

基于PCR技術(shù)擴增基因組DNA限制性片段?;蚪MDNA先用限制性內(nèi)切酶切割,然后將雙鏈接頭連接到DNA片段的末端,接頭序列和相鄰的限制性位點序列,作為引物結(jié)合位點。限制性片段用二種酶切割產(chǎn)生,一種是罕見切割酶,一種是常用切割酶。由于AFLP擴增可使某一品種出現(xiàn)特定的DNA譜帶,而在另一品種中可能無此譜帶產(chǎn)生,因此,這種通過引物誘導(dǎo)及DNA擴增后得到的DNA多態(tài)性可做為一種分子標(biāo)記。它結(jié)合了RFLP和PCR技術(shù)特點,具有RFLP技術(shù)的可靠性和PCR技術(shù)的高效性。1.1遺傳圖VNTR(可變數(shù)目串聯(lián)重復(fù)序列)基因組中存在的大量重復(fù)DNA短序列。主要有兩種:小衛(wèi)星DNA(minisatellites)和微衛(wèi)星DNA(microsatellites)。個體之間的差異常常體現(xiàn)在重復(fù)次數(shù)上。微衛(wèi)星序列:重復(fù)單位為1-6個核苷酸,由10-15個重復(fù)單位串聯(lián)組成。小衛(wèi)星序列:重復(fù)單位為數(shù)十個核苷酸。1.1遺傳圖利用PCR的DNA體外擴增技術(shù),實現(xiàn)機器自動化。VNTR具有多等位性,同一遺傳位點數(shù)目變化很大,在群體中也可形成多達幾十種的等位基因,這是其他遺傳標(biāo)記所不能比擬的。1.1遺傳圖SNP(單核苷酸多態(tài)性)SNP是指在基因組水平上由單個核苷酸變異所造成的DNA序列多態(tài)性。SNP不以“長度”的差異作為檢測手段,而是直接以序列的變異作為標(biāo)記。SNP是人類可遺傳的變異中最常見的一種,也是基因組中最為穩(wěn)定的變異。SNP最大限度地代表了不同個體之間的遺傳差異,因而成為研究多基因疾病、藥物遺傳學(xué)及人類進化的重要遺傳標(biāo)記。分布密集檢測需要DNA測序或芯片雜交,程序復(fù)雜。1.1遺傳圖SNP分析:測序1.1遺傳圖SNP分析:雜交1.1遺傳圖遺傳圖的建立為人類疾病相關(guān)基因的分離克隆奠定了基礎(chǔ)1998年,Broman發(fā)表了擁有8000多個分子標(biāo)記的人類全基因組遺傳圖。相當(dāng)于把整個人類基因組劃分為8000多個小區(qū),并分別設(shè)置了“標(biāo)記”。如果在家系中證實該基因與某個標(biāo)記不連鎖(重組率為50%),表明該基因不在這一標(biāo)記附近。如果發(fā)現(xiàn)該基因與某個標(biāo)記有一定程度的“連鎖”(重組率小于50%但大于0),表明它可能位于這個標(biāo)記附近。如果該基因與某標(biāo)記間不發(fā)生重組(重組率等于0),我們就推測該標(biāo)記與所研究的疾病基因可能非常接近。1.1遺傳圖遺傳圖的局限性:分辨率有限高等真核生物子代數(shù)量有限,只有少數(shù)的減數(shù)分裂事件可供研究,連鎖分析的分辨率受很大限制人類基因組測序要求每100kb有一個標(biāo)記,1998年發(fā)表的人類遺傳圖達到每380kb一個標(biāo)記精確度較低假設(shè)交換是隨機發(fā)生的,但由于交換熱點的存在使某一區(qū)段的交換頻率遠高于其它區(qū)段,無法繪制精確的遺傳圖。1.1遺傳圖以DNA分子的序列排列為基礎(chǔ),以堿基對(bp,kb,Mb)作為基本測量單位(圖距)的基因組圖。

1.2物理圖(PhysicalMap)限制性酶切圖(restrictionmap)熒光原位雜交圖(fluorescentinsituhybridizationmap,F(xiàn)ISHmap)連續(xù)克隆系圖(clonecontigmap)非遺傳學(xué)的作圖技術(shù)通稱物理作圖,常用以下三類:1.2物理圖1.2.1限制性酶切圖將限制性酶切位點標(biāo)定在DNA分子的相對位置的圖譜。1.2物理圖識別位點較多的內(nèi)切酶:如NotI,其8個核苷酸出現(xiàn)的頻率為1/48=1/65536bp,而識別位點為6個核苷酸的出現(xiàn)頻率為1/46=1/4096bp。人類基因組中,5’-CG-3’出現(xiàn)的頻率很低:SmaI(CCCGGG)酶切DNA,每78kb只有1個切點。BssHII(GCGCGC)酶切DNA,每390kb只有1個切點。NotI(GCGGCCGC)酶切DNA,每10Mb只有一個切點。1.2物理圖1.2.2熒光原位雜交圖通過熒光標(biāo)記的探針與染色體雜交,雜交信號即探針DNA在染色體上的圖譜位點。探針常選用已知基因的大片段序列。步驟:取處于有絲分裂中期的細胞制片,將染色體變性成單鏈,在將標(biāo)記的DNA探針變性后雜交到染色體上,保溫處理后,顯微鏡下直接觀察。1.2物理圖熒光原位雜交

(fluorescentinsituhybridization,F(xiàn)ISH)1.2物理圖操作困難,一次實驗定位的分子標(biāo)記不超過3-4個,資料積累慢。1.2.3連續(xù)克隆系圖采用酶切位點稀有的限制性內(nèi)切酶或高頻超聲破碎技術(shù)將DNA分解成大片段后,將大片段克隆至載體中,根據(jù)克隆的DNA片段之間的重疊序列構(gòu)建重疊群(contig)。大片段載體重疊群組建1.2物理圖YAC載體裝載量偏大(1~2Mb),自身穩(wěn)定性不夠。BAC具有插入片段較大(幾kb~50kb)、嵌合率低、遺傳穩(wěn)定性好、易于操作等優(yōu)點。制備物理圖譜的大容量載體1.2物理圖重疊群組建染色體步移(chromosomewalking)AABCABCDE克隆指紋(clonefingerprinting)1.2物理圖序列標(biāo)簽位點(STS,sequencetaggedsite)序列標(biāo)簽位點:指染色體定位明確,并且可用PCR擴增的單拷貝序列。已知序列,100-500bp,便于PCR檢測;基因組中僅一個位點,無重復(fù)。1.2物理圖通常每隔100kb距離就有一個標(biāo)志。在STS基礎(chǔ)上構(gòu)建能夠覆蓋每條染色體的大片段DNA連續(xù)克隆系就可繪制精細物理圖譜,為大規(guī)模DNA測序做好了準(zhǔn)備。遺傳圖是以遺傳學(xué)上兩個遺傳位點之間進行交換、重組的百分率cM作為“圖距”,反映基因遺傳效應(yīng)的基因組圖。物理圖是以堿基對(bp,kb,Mb)作為“圖距”,反映DNA分子的序列排列的基因組圖。遺傳圖和物理圖采用不同方法繪制,共同之處是確定基因或DNA分子標(biāo)記在染色體上的排列位置。酵母第三號染色體遺傳圖(右)和物理圖(左)的比較遺傳圖距≠物理圖距女性染色體發(fā)生交換的頻率高于男性。有些標(biāo)記如RFLP標(biāo)記、SSR標(biāo)記及某些基因序列既是遺傳標(biāo)記,又是物理標(biāo)記,借助這些標(biāo)記可以將遺傳圖和物理圖整合起來。ChromosomeMaleFemalecM/Mb0.841.360.831.270.851.260.771.33利用一張遺傳圖,研究人員可將一種特定的遺傳病的遺傳模式同標(biāo)記順序的遺傳模式進行比較,迅速確定引起該遺傳病的基因的位置。然后,計算機把數(shù)據(jù)固定在物理圖框架內(nèi)。遺傳圖與物理圖結(jié)合在一起,就能迅速確定與疾病有聯(lián)系的基因。1.3轉(zhuǎn)錄圖(transcriptionalmap)定義:以EST(expressedsequencetag,表達序列標(biāo)簽)為標(biāo)記,根據(jù)轉(zhuǎn)錄順序的位置和距離繪制的圖譜。即把細胞內(nèi)染色體或DNA上所有基因定位在染色體或DNA基因組的不同位置上,用來表示DNA上哪些核苷酸序列可以編碼蛋白質(zhì)。EST:通過從cDNA文庫中隨機挑選的克隆進行測序所獲得的部分cDNA的5’或3’端序列稱為表達序列標(biāo)簽,一般長300-500bp左右。整個人類基因組中,有1%-5%的序列編碼了蛋白質(zhì),最多可能有(2~2.5)萬個蛋白質(zhì)編碼基因。在成年個體的每一特定組織中,一般只有10%~20%的結(jié)構(gòu)基因表達。大規(guī)模生產(chǎn)EST的主要程序如下:分離特定組織在某一發(fā)展階段或某種生理條件下的總mRNA,合成雙鏈cDNA,克隆到質(zhì)粒中并進行兩端測序。轉(zhuǎn)錄圖所提供的信息,使人們能系統(tǒng)地全面地從mRNA水平了解特定細胞、組織或器官的基因表達模式并解釋其生理屬性,深入認(rèn)識細胞生長、發(fā)育、分化、衰老和疾病發(fā)生的機制。有了一張總的轉(zhuǎn)錄圖,我們就可以:了解某基因在不同的時間、不同組織的表達情況;了解不同組織中不同基因的表達;了解正常條件下與異常狀況下基因表達的差異。1.3轉(zhuǎn)錄圖1.4序列圖(SequenceMap)即核苷酸序列物理圖,是分子水平上最高層次、最詳盡的物理圖。既包括可轉(zhuǎn)錄序列,也包括非轉(zhuǎn)錄序列,是轉(zhuǎn)錄序列、調(diào)節(jié)序列和功能未知序列的總和。全基因組測序和組裝1.4.1DNA測序鏈終止法(Chaintermination)---Sanger焦磷酸測序(pyrosequencing)1.4.2序列組裝作圖法測序和序列組裝鳥槍法測序和序列組裝1.4序列圖PCR反應(yīng)NewphosphodiesterbondSynthesisReactionPPiDirection5’→3’模板DNA、引物、dNTPs、DNA聚合酶1.4序列圖鏈終止法原理:PCR反應(yīng)中合成的互補DNA單鏈可在任意一個堿基位置終止,從而產(chǎn)生所有僅差一個堿基的單鏈分子。每組合成的單鏈分子均攜帶可檢測的信號,經(jīng)聚丙烯酰胺凝膠電泳后,可形成梯形排列的條帶。雙脫氧核糖核苷酸:熒光染料標(biāo)記DNA聚合酶:酶活性高,無5’-3’外切核酸酶活性,無3’-5’外切核酸酶活性1.4序列圖PrincipleofSangersequencingisbasedonthenascentchainterminationofDNAsynthesisduetothelastincorporatedddNTPbeing2-&3-dideoxyribonucleotideImprovementson4-color-tagged-ddNTPs&laserdetector,capillaryelectrophoresis,luminescencedetector5’3’TargetDNASequence鏈終止法12310~20:11.4序列圖1.4序列圖鏈終止法的不足:鏈終止法的技術(shù)關(guān)鍵是終止DNA單鏈的合成,決定了這一方法不能做到連續(xù)測序。鏈終止法測序判讀堿基序列是依靠DNA單鏈最末端的雙脫氧核苷酸的分辨與識別,首先必須將只差一個核苷酸的DNA單鏈通過凝膠電泳分開。隨著測序DNA單鏈長度的增加,凝膠的分辨力逐漸減弱,從而導(dǎo)致DNA的測序長度受到限制。焦磷酸測序原理:反應(yīng)底物有四種脫氧核苷酸,每次反應(yīng)只添加一種。當(dāng)發(fā)生聚合反應(yīng)時,選中的核苷酸連接前一個核苷酸,釋放一個焦磷酸。焦磷酸在三磷酸腺苷硫酸化酶的催化下與反應(yīng)池中的dATP類似物5’-磷酸化硫酸腺苷反應(yīng)生成等摩爾量的ATP。反應(yīng)池中的熒光素酶催化ATP與熒光素反應(yīng)發(fā)光,信號被計算機識別記錄。三磷酸腺苷雙磷酸酶可將未反應(yīng)的dNTP及時清除。1.4序列圖模板引物四種脫氧核苷酸(單獨的,分別添加)5’-磷酸化硫酸腺苷熒光素DNA聚合酶三磷酸腺苷硫酸化酶熒光素酶三磷酸腺苷雙磷酸酶1.4序列圖1.4序列圖焦磷酸法是一種全新的實時連續(xù)DNA測序技術(shù)。單分子測序(single-moleculesequencing,SMS)使單個人類基因組的測序費用降低到1000美元。最終目的:使人類基因組測序能進入常規(guī)的個性化服務(wù),為患者的醫(yī)學(xué)診斷提供依據(jù)。還在處于探索與不斷改善的階段。1.4序列圖基因組測序策略作圖測序:按照大分子DNA克隆繪制的物理圖分別在單個大分子DNA克隆內(nèi)部進行測序與序列組裝,然后將彼此相連的大分子克隆按排列次序搭建支架,最后以分子標(biāo)記為向?qū)⒋罱ê玫闹Ъ苤饌€錨定到基因組整合圖上。鳥槍法測序:將整個基因組DNA打斷成小片段后將其克隆到質(zhì)粒載體中,然后隨機挑取克隆對插入片段進行測序,并以獲得的測序序列構(gòu)建重疊群。在此基礎(chǔ)上進一步搭建序列支架,最后以分子標(biāo)記為向?qū)⑿蛄兄Ъ苠^定到基因組整合圖中。1.4序列圖作圖法鳥槍法基因組測序的覆蓋面:指隨機獲得的序列總長與單倍體基因組序列總長之比。覆蓋面越大,遺漏的序列越少。序列間隙:指測序時遺漏的序列,這些序列仍然保留在尚未被挑選到的克隆中。物理間隙:指構(gòu)建基因組文庫時被丟失的DNA序列。它們從已有的克隆群體中永久性的消失。由于特殊的堿基組成,難以獲得大分子DNA克隆。克隆載體中,高度重復(fù)序列很不穩(wěn)定,在擴增中容易丟失。某些基因的表達產(chǎn)物對宿主菌具有毒性,如果在克隆細胞中表達,可將宿主菌殺死,克隆的DNA也隨之消失。1.4序列圖鳥槍法的優(yōu)點:快無需提供相關(guān)的遺傳圖與物理圖測序覆蓋面大鳥槍法的缺點:對大的基因組,序列組裝的起始階段工作量巨大容易出現(xiàn)錯誤連接存在大量難以填補的間隙1.4序列圖鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列序列組裝的分期標(biāo)準(zhǔn)和等級0級:測序覆蓋面一次的DNA序列。1級:測序覆蓋面4-10次的BAC克隆,BAC及內(nèi)部片段的位置和排列方向未定。2級:測序覆蓋面4-10次的BAC克隆,BAC及內(nèi)部片段的位置和排列方向已定。3級:完成序列,指已測序的每10000個堿基中出現(xiàn)一個差錯且內(nèi)部不存在間隙的DNA序列。1.4序列圖TheHumanGenomeProject(HGP)人類基因組計劃Nosequence,noknowledge!Allbiologyinthefuturewillstartwiththeknowledgeofgenomesandproceedhopefully.--J.D.Watson未來所有生物學(xué)只有以基因組知識(重新)開始才有希望發(fā)展。人類基因組計劃(humangenomeproject,HGP)由美國科學(xué)家于1985年率先提出,于1990年正式啟動。人類基因組計劃曼哈頓原子彈計劃阿波羅登月計劃20世紀(jì)人類科技發(fā)展史上的三大創(chuàng)舉通過基因作圖、構(gòu)建連續(xù)克隆系及大規(guī)模測序等方法,結(jié)合主要模式生物已知基因組DNA序列,輔以生物信息學(xué)和計算生物學(xué)技術(shù),解密人類基因組DNA序列和結(jié)構(gòu)。人類基因組計劃(HumanGenomeProject,HGP)發(fā)展史測序策略科學(xué)意義成果和發(fā)現(xiàn)在HGP中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種“模式生物”。國際人類基因組計劃測序聯(lián)合體(IHGSC)(internationalhumangenomesequencingconsortium)6個國家的16個中心上千名科學(xué)家參加。其中美國占54%的份額,英國占33%,日本占7%,法國約占3%,德國約占2%,中國占1%。HGP的最初目標(biāo):15年內(nèi)(1990-2005)投入30億美元,完成人類24條染色體的30億個核苷酸序列分析,發(fā)現(xiàn)所有人類基因并搞清其在染色體上的位置,破譯人類全部遺傳信息HGP的終極目標(biāo):解碼生命、了解生命、認(rèn)識種屬之間和個體之間存在差異的起因、認(rèn)識疾病產(chǎn)生的機制以及長壽與衰老等生命現(xiàn)象、為疾病的診治提供科學(xué)依據(jù)。Celera公司Celera公司建立于1998年5月,位于美國馬里蘭州的Rockville,由PE公司和CraigVenter博士共同創(chuàng)建。CraigVenter博士曾是基因組研究所(TheInstituteforGenomicResearch,TIGR)的創(chuàng)建者和領(lǐng)導(dǎo)人.Celera的本意來自拉丁語的“快速”,因此Celera公司一直致力于開發(fā)基因組信息并使之商業(yè)化,以加速生物技術(shù)的發(fā)展和應(yīng)用。目前Celera公司已針對已有的功能基因組和蛋白質(zhì)組信息開發(fā)出一套新的數(shù)據(jù)庫及服務(wù)系統(tǒng),為相關(guān)研究工作提供有力的工具和服務(wù)。1990年10月被譽為生命科學(xué)“阿波羅登月計劃”的國際人類基因組計劃啟動。1998年5月Celera遺傳公司組建,與國際人類基因組計劃展開競爭。9月中國獲準(zhǔn)加入人類基因組計劃,負責(zé)測定人類基因組全部序列的1%,即人類3號染色體短臂上約30Mb的測序任務(wù)。12月1日國際人類基因組計劃聯(lián)合研究小組宣布,他們完整地譯出人體第22對染色體的遺傳密碼。發(fā)展史2000年4月末我國科學(xué)家按照國際人類基因組計劃的部署,完成了1%人類基因組的工作框架圖。5月8日由德國和日本等國科學(xué)家組成的國際科研小組宣布,他們已經(jīng)基本完成了人體第21對染色體的測序工作。6月26日值得載入人類自然科學(xué)史冊的一個日子,各國科學(xué)家公布了人類基因組工作草圖。發(fā)展史人類基因組草圖基本信息由31.65億bp組成含3~3.5萬基因與蛋白質(zhì)合成有關(guān)的DNA序列占2%人類基因組人類蛋白質(zhì)61%與果蠅同源43%與線蟲同源46%與酵母同源IHGSCNATURE

15FEBRUARY2001

SCIENCE16FEBRUARY2001CeleraGenomics人類基因組測序結(jié)果發(fā)展史2003年,人類基因組草圖序列中的絕大多數(shù)間隙已被填補,基因組序列的大部分已經(jīng)組裝在為數(shù)不多的重疊群中,單個重疊群的平均長度已超過5000kb。2004年12月,國際人類基因組計劃測序聯(lián)合體發(fā)表了人類基因組完成序列,覆蓋了99%的常染色體區(qū)。發(fā)展史構(gòu)建BAC克隆限制性酶處理獲得指紋根據(jù)指紋重疊方法組建BAC克隆重疊群根據(jù)STS標(biāo)記,將BAC克隆重疊群標(biāo)定在物理圖上每個BAC克隆內(nèi)部采用鳥槍法測序,組裝將BAC插入順序與BAC克隆指紋極重疊群對比,將已閱讀的順序錨定到物理圖上IHGSC測序策略采集5個自愿者的DNA樣品構(gòu)建3種不同插入子大小的基因組文庫2Kb,10Kb和50Kb完成約2700萬次插入子末端測序,總長14800MbGeneBank下載104018個BAC末端順序PFP發(fā)表的公開數(shù)據(jù)主要為BAC克隆的順序,共4443.3Mb序列組裝Celera測序策略Publiceffort-strategy:Celera-strategy:Celera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.測序策略確定人類基因組中編碼基因的序列及其在基因組中的物理位置,研究基因的產(chǎn)物及其功能。了解轉(zhuǎn)錄和剪接調(diào)控原件的結(jié)構(gòu)與位置,從整個基因組結(jié)構(gòu)的宏觀水平上理解基因轉(zhuǎn)錄與轉(zhuǎn)錄后調(diào)節(jié)。從整體上了解染色體結(jié)構(gòu),包括各種重復(fù)序列以及非轉(zhuǎn)錄“框架序列”的大小和組織,了解各種不同序列在形成染色體結(jié)構(gòu)、DNA復(fù)制、基因轉(zhuǎn)錄及表達調(diào)控中的影響和作用。研究空間結(jié)構(gòu)對基因調(diào)節(jié)的作用。有些基因的表達調(diào)控序列與被調(diào)節(jié)基因從直線距離上看,似乎相距甚遠,但若從整個染色體的空間結(jié)構(gòu)上看則恰恰處于最佳的調(diào)節(jié)位置,因此,有必要從三維空間的角度來研究真核基因的表達調(diào)控規(guī)律。科學(xué)意義發(fā)現(xiàn)與DNA復(fù)制、重組等有關(guān)的序列。DNA的忠實復(fù)制保障了遺傳的穩(wěn)定性,正常的重組提供了變異與進化的分子基礎(chǔ)。局部DNA的推遲復(fù)制、異常重組等現(xiàn)象則導(dǎo)致疾病或胚胎不能正常發(fā)育。因此,了解與人類DNA正常復(fù)制和重組有關(guān)的序列及其變化,將對研究人類基因組的遺傳與進化提供重要的結(jié)構(gòu)上的依據(jù)。研究DNA突變、重排和染色體斷裂等,了解疾病的分子機制,包括遺傳性疾病、易感性疾病、放射性疾病甚至感染性疾病引發(fā)的分子病理學(xué)改變及其進程,為這些疾病的診斷、預(yù)防和治療提供理論依據(jù)??茖W(xué)意義確定人類基因組中轉(zhuǎn)座子、逆轉(zhuǎn)座子和病毒殘余序列,研究其周圍序列的性質(zhì),了解有關(guān)病毒基因組侵染人類基因組后的影響,可能指導(dǎo)人類有效的利用病毒載體進行基因治療。研究染色體和個體之間的多態(tài)性。這些知識可被廣泛用于基因診斷、個體識別、親子鑒定、組織配型、發(fā)育進化等許多醫(yī)療、司法和人類學(xué)研究。此外,這些遺傳信息還有助于研究人類歷史進程、人類在地球上的分布與遷移以及人類與其他物種間的比較??茖W(xué)意義HGP的技術(shù)成果:

主要體現(xiàn)在對人類基因組整體結(jié)構(gòu)的認(rèn)識,即人類基因組遺傳圖、物理圖、轉(zhuǎn)錄圖、序列圖的完成,從而奠定了人類結(jié)構(gòu)基因組學(xué)基礎(chǔ)。

1.分析得知:全部人類基因組約有2.91Gbp,約有39000多個基因;平均的基因大小有27kbp。2.基因數(shù)量少得驚人:一些研究人員曾經(jīng)預(yù)測人類約有14萬個基因,但實際上不超過40,000,只是線蟲或果蠅基因數(shù)量的兩倍,人有而鼠沒有的基因只有300個。3.人類基因組中存在“熱點”和大片“荒漠”:在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無用DNA”。在所有的DNA中,只有1%-1.5%DNA能編碼蛋白,在人類基因組中98%以上序列都是所謂的“無用DNA”,分布著300多萬個長片斷重復(fù)序列。成果和發(fā)現(xiàn)4.人類單核苷酸多態(tài)性的比例約為1/1250bp,不同人群僅有140萬個核苷酸差異,人與人之間99.99%的基因密碼是相同的。并且發(fā)現(xiàn),來自不同人種的人比來自同一人種的人在基因上更為相似。在整個基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬”之間并沒有本質(zhì)上的區(qū)別。5.男性的基因突變率是女性的兩倍,而且大部分人類遺傳疾病是在Y染色體上進行的。所以,可能男性在人類的遺傳中起著更重要的作用。

成果和發(fā)現(xiàn)大腸桿菌(1997)、酵母(1996)、線蟲(1998)、果蠅(2000)和小鼠(2002)的全基因組序列已經(jīng)全部完成并發(fā)表公布。模式生物基因組研究成果和發(fā)現(xiàn)雞2004牛2009狗2005蜜蜂2006紫海丹2006恒河猴2007根據(jù)2007年1月的數(shù)據(jù),全球已啟動2296個基因組項目,其中607個項目已經(jīng)完成,已經(jīng)公開發(fā)表481個基因組序列,包括403個細菌基因組,33個古細菌基因組和45個真核生物基因組。其它基因組計劃遺傳圖譜轉(zhuǎn)錄圖譜cM

序列圖譜物理圖譜kb2、比較基因組學(xué)(comparativegenomics)比較基因組學(xué)是基于基因組圖譜和測序基礎(chǔ)上,對已知的基因和基因組結(jié)構(gòu)進行比較,來了解基因的功能、表達機理和物種進化的學(xué)科。研究內(nèi)容:種間的比較基因組學(xué)和種內(nèi)的比較基因組學(xué)比較基因組學(xué)的威力在于它能根據(jù)對一種生物相關(guān)基因的認(rèn)識來理解、詮釋甚至克隆分離另一種生物的基因。遠緣基因組間的比較為認(rèn)識生物學(xué)機制的普遍性,尋找研究復(fù)雜生理和病理過程所需的實驗?zāi)P吞峁┝死碚撘罁?jù),而近緣基因組間的比較則為認(rèn)識基因結(jié)構(gòu)與功能等細節(jié)提供了參數(shù)。通過對不同親緣關(guān)系物種的基因序列對比,能夠鑒定出編碼序列、非編碼調(diào)控序列及給定物種獨有的序列。而基因組范圍的序列對比,可以了解不同物種在核苷酸組成、同線性關(guān)系和基因順序方面的異同,進而得到基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進化關(guān)系等方面的信息。

比較基因組學(xué)的應(yīng)用揭示非編碼功能序列發(fā)現(xiàn)新基因發(fā)現(xiàn)功能性SNP闡述物種間的進化史闡明人類疾病過程的分子機制利用不同物種基因組之間功能區(qū)域順序和組織結(jié)構(gòu)的同源性,可以:一個物種的基因組中相互連鎖的基因,在另一物種的基因組中也是連鎖關(guān)系,而且在兩個物種的遺傳圖上的位置也是相似的。宏觀共線性:遺傳連鎖圖上錨定標(biāo)記排列次序的一致性微觀共線性:物理圖上基因序列的一致排列進化距離非常近的物種間保持很好的微觀共線性在進化過程中,基因共線性被各種因素(轉(zhuǎn)座、插入、染色體重排、區(qū)段加倍和缺失)所破壞,進化距離越遠的物種之間基因共線性越差,兩個物種之間的共線性程度可以作為衡量它們之間進化距離的尺度共線性高度保守和高度變異X染色體極為保守,人類和貓的X染色體具有縱貫全條的共線性在保守性較低的區(qū)段,基因進化速率快于整個基因組的平均進化速率。它們在種間基因組中很少表現(xiàn)共線性,甚至在同一物種的不同生態(tài)型之間這些區(qū)段也會發(fā)生較大變異當(dāng)用基因共線性程度估算物種分化年代時,應(yīng)當(dāng)注意避免高度保守和高度變異的區(qū)段人、貓和鼠的X染色體進化過程中源于同一祖先的分支之間的關(guān)系。同源性直系同源基因(ortholog):因物種形成而被區(qū)分開。若一個基因原先存在于某個物種,而該物種分化為了兩個物種,那么新物種中的基因是直系同源的。旁系同源基因(paralog):因基因復(fù)制(geneduplication)而被區(qū)分開。若生物體中的某個基因被復(fù)制了,那么兩個副本序列就是旁系同源的。直系同源基因通常有相同或相似的功能,但對旁系同源基因則不一定:由于缺乏原始的自然選擇的力量,復(fù)制出的基因副本可以自由的變異并獲得新的功能。預(yù)測新基因功能模式生物基因組特點模式生物基因組一般都比較小,但編碼基因的比例較高,重復(fù)序列和非編碼序列較少,是“壓縮”的基因組。模式生物基因組中G+C%含量高,同時CpG島的比例也比較高。一些模式生物基因組在人的基因組中發(fā)現(xiàn)了重復(fù)。各種不同的物種中,大多數(shù)重要生物學(xué)功能是由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)。同線連鎖的同源基因在不同物種基因組中有相同連鎖關(guān)系。

模式生物基因組研究對人類基因組研究的促進作用1.利用基因序列上的同源性克隆人類疾病基因。定位克隆是一項有效的疾病基因克隆的手段。但是如果僅僅依靠位置信息進行定位克隆,將十分費時費力。當(dāng)人類cDNA與已知功能的模式生物基因高度相關(guān),當(dāng)該表型的候選基因定位于與cDNA相同的位置上,就有助于識別該基因。模式生物基因組研究的結(jié)果被大量地用于人類基因組的研究,成為人類疾病基因克隆的一條捷徑。2.模式生物基因組研究揭示了人類疾病基因的功能。由于某些模式生物基因的功能已知,這就對人類疾病基因的功能研究有很大的促進作用。這一跨種關(guān)系使模式生物基因的有效功能數(shù)據(jù)立刻用于研究它的高等生物的同源體。3.充分利用模式生物實驗系統(tǒng)上的優(yōu)越性模式生物實驗上的優(yōu)越性成為人類疾病狀態(tài)下分子機制的闡明和基因功能分析的有效手段。以酵母為例,它就是一個很好的實驗系統(tǒng)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論