




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于疾病的遺傳學(xué)數(shù)據(jù)分析
前言我們知道進(jìn)行數(shù)據(jù)分析就要從數(shù)據(jù)的倉庫(即數(shù)據(jù)庫)里調(diào)用數(shù)據(jù)來進(jìn)行分析。什么叫數(shù)據(jù)庫(database)?就是用于收集、整理、儲(chǔ)存、加工、發(fā)布和檢索數(shù)據(jù)的系統(tǒng)。它是一切生物信息學(xué)工作的出發(fā)點(diǎn)。什么叫生物信息學(xué)(Bioinformatics)
?生物信息學(xué)(Bioinformatics)是在生命科學(xué)的研究中,以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行數(shù)據(jù)收集、儲(chǔ)存、檢索和分析的科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,同時(shí)也是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。其研究重點(diǎn)主要體現(xiàn)在基因組學(xué)(Genomics)、轉(zhuǎn)錄組學(xué)(transcriptomics)和蛋白質(zhì)組學(xué)(Proteomics)三方面,具體說就是從DNA、RNA和蛋白質(zhì)序列出發(fā),分析序列中表達(dá)的結(jié)構(gòu)功能的生物信息。第一節(jié)人類基因組與遺傳數(shù)據(jù)庫1990年代以來,伴隨著人類基因組等各種基因組測(cè)序計(jì)劃的展開和分子結(jié)構(gòu)測(cè)定技術(shù)的突破和Internet的普及,數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫如雨后春筍般迅速出現(xiàn)和成長(zhǎng)。人類從此進(jìn)入了以生物信息學(xué)為中心的后基因組時(shí)代。一、遺傳數(shù)據(jù)庫的基本概念遺傳數(shù)據(jù)庫(geneticdatabase):是儲(chǔ)存在計(jì)算機(jī)內(nèi)的、有組織的、可共享的遺傳數(shù)據(jù)的集合。與遺傳有關(guān)的數(shù)據(jù)庫種類很多:依據(jù)數(shù)據(jù)的類型,可分為基因組數(shù)據(jù)庫、核酸一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫、蛋白質(zhì)一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫、生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫等;按照數(shù)據(jù)的層次,可分為基本數(shù)據(jù)庫、復(fù)合數(shù)據(jù)庫和二次數(shù)據(jù)庫等;依據(jù)數(shù)據(jù)的來源,可分為原始數(shù)據(jù)庫、衍生數(shù)據(jù)庫、集成數(shù)據(jù)庫和知識(shí)數(shù)據(jù)庫。國際上最權(quán)威、最主要的三大核酸序列數(shù)據(jù)庫:美國國家生物技術(shù)信息中心(NCBI)維護(hù)的GenBank、歐洲分子生物學(xué)研究室(EMBL)下屬的歐洲生物信息學(xué)研究所(EBI)維護(hù)的EMBL-EBI、日本國立遺傳學(xué)研究所維護(hù)的DDBJ。http://www.ebi.ac.uk/emblhttp://www.ddbj.nig.ac.jp/NucleicAcidsResearch自2004年起,每年單獨(dú)發(fā)行一期。“DatabaseIssue”專輯,重點(diǎn)介紹和探討生物信息學(xué)數(shù)據(jù)庫的研究發(fā)展現(xiàn)狀。NucleicAcidsResearch在2019年發(fā)行的“DatabaseIssue”專輯。/nar/issue/47/D1中國科學(xué)院北京基因組研究所(BIG)的大數(shù)據(jù)中心提供了一套數(shù)據(jù)庫資源,支持學(xué)術(shù)界和產(chǎn)業(yè)界的全球研究活動(dòng)。隨著海量多組數(shù)據(jù)以前所未有的規(guī)模和速度生成,大數(shù)據(jù)中心通過大數(shù)據(jù)集成和增值策展,不斷拓展、更新和豐富核心數(shù)據(jù)庫資源。在過去的一年里有重大更新資源的包括BioProject(生物項(xiàng)目庫),BioSample(生物樣品庫),基因組序列存檔(GSA,存儲(chǔ)原始序列和讀取數(shù)據(jù)存儲(chǔ)庫),基因組數(shù)據(jù)庫(一個(gè)集中整合的數(shù)據(jù)庫),基因組變異作圖(基因組變化的公共存儲(chǔ)庫GVM),科學(xué)維基(wiki目錄的生物知識(shí)社區(qū)注釋)和ICFR(水稻信息共享資源)。新發(fā)布的資源包括EWASAtlas(一個(gè)表觀基因組范圍關(guān)聯(lián)研究的知識(shí)庫)、iDog(一個(gè)針對(duì)狗的集成組學(xué)數(shù)據(jù)資源)和RNA編輯資源(分別用于editome-diseaseassociations和plantRNAeditosome)。為促進(jìn)全球生物多樣性和健康大數(shù)據(jù)共享,啟動(dòng)了開放生物多樣性和健康大數(shù)據(jù)(BHBD)倡議。所有這些資源都可以通過公開訪問。數(shù)據(jù)庫主頁/二、常用的人類基因組與遺傳數(shù)據(jù)庫(一)OMIM“OnlineMendelianInheritanceinMan(在線《人類孟德爾遺傳》)”。由美國JohnsHopkins大學(xué)醫(yī)學(xué)院創(chuàng)建和維護(hù);OMIM源自VictorA.McKusick教授主編的MendelianInheritanceinMan:CatologsofHumanGenesandGeneticDisorders,MIM一書。OMIM是遺傳醫(yī)學(xué)最權(quán)威的、最有參考價(jià)值的百科全書和數(shù)據(jù)庫。輸入DMD,DUCHENNEMUSCULARDYSTROPHY/omim/?term=DMD(二)GeneTests最權(quán)威、最常用的有關(guān)遺傳病基因檢測(cè)和基因診斷的數(shù)據(jù)庫,由美國西雅圖華盛頓大學(xué)醫(yī)學(xué)院于1992年創(chuàng)建和維護(hù);囊括了全球經(jīng)標(biāo)準(zhǔn)化資質(zhì)審核之后準(zhǔn)許進(jìn)行基因檢測(cè)和基因診斷的所有遺傳病、基因、醫(yī)院、獨(dú)立醫(yī)學(xué)檢驗(yàn)所、高校實(shí)驗(yàn)室、基因診斷公司等信息;“GeneReviews(基因綜述)”是其一大亮點(diǎn)。/(三)HGMD人類基因突變數(shù)據(jù)庫(TheHumanGeneMutationDatabase,HGMD)是通用型數(shù)據(jù)庫的代表,它全面收集引起人類遺傳疾病或與人類遺傳疾病相關(guān)的核基因突變。由英國威爾士Cardiff大學(xué)醫(yī)學(xué)遺傳學(xué)研究所創(chuàng)建和維護(hù);此數(shù)據(jù)庫建立的初衷是用于突變機(jī)制的分析,但由于它收錄最新的、完整的有關(guān)人類疾病突變譜的參考數(shù)據(jù),HGMD至今已獲得了更為廣泛的應(yīng)用。HGMD系統(tǒng)收錄文獻(xiàn)報(bào)道中的所有致病突變和與疾病相關(guān)的功能多態(tài)并將這些數(shù)據(jù)以易于讀取的格式提供給感興趣的各方面,不管他們是來自學(xué)術(shù)、臨床還是商業(yè)領(lǐng)域。HGMD收集的數(shù)據(jù)包括了單堿基置換(比如編碼序列中的錯(cuò)義突變和無義突變以及調(diào)控和剪切區(qū)域中的點(diǎn)突變)、微缺失(micro-deletions)和微插入(micro-insertions)、缺失/插入(indels)、重復(fù)序列擴(kuò)增以及大的基因損傷(缺失、插入和培增)和復(fù)雜的基因重組。HGMD通過互聯(lián)網(wǎng)()免費(fèi)提供給注冊(cè)的(registered)學(xué)術(shù)和非盈利用戶,但此公共網(wǎng)站只提供那些已收錄三年以上的數(shù)據(jù)。最新的數(shù)據(jù)可從HGMD專業(yè)版(HGMDProfessional)通過我們的商業(yè)合作伙伴BIOBASEGmbH以付費(fèi)的形式獲得。除了最新的突變數(shù)據(jù),HGMD專業(yè)版還提供公共網(wǎng)站上不具有的功能強(qiáng)大的搜索工具以及與基因和突變有關(guān)的特別信息。HGMD專業(yè)版每三個(gè)月更新一次。Stensonetal.(2017)TheHumanGeneMutationDatabase:towardsacomprehensiverepositoryofinheritedmutationdataformedicalresearch,geneticdiagnosisandnext-generationsequencingstudies.HumGenet136:665-677.doi:10.1007/s00439-017-1779-6[PubMed]http://www.hgmd.cf.ac.uk
書表1-2(四)GeneCards信息量非常豐富、完整的強(qiáng)大人類基因綜合數(shù)據(jù)庫,提供簡(jiǎn)明的基因組、蛋白質(zhì)組、轉(zhuǎn)錄組、遺傳和功能上所有已知和預(yù)測(cè)的人類基因等數(shù)據(jù)。由WeizmannInstituteofScienceinIsrael于1997年創(chuàng)建和維護(hù);包括指向疾病的關(guān)系,突變和多態(tài)性,基因表達(dá),基因功能,信號(hào)通路,蛋白與蛋白的互作,相關(guān)藥物及化合物和切割等研究抗體的試劑和工具,重組蛋白、克隆、表達(dá)分析和RNAi試劑等信息。https://www.GeneC/PTEN抑癌基因(人類第十號(hào)染色體上的磷酸酶和張力蛋白同源基因)第二節(jié)疾病的病因分析什么叫病因(causeofdisease)
?是指能引起疾病發(fā)生并決定疾病特異性的體內(nèi)外因素。致病的因素有:①生物性因素,主要是各種病原微生物;②理化因素③營(yíng)養(yǎng)性因素④先天性因素⑤免疫因素⑥精神、心理、社會(huì)因素⑦遺傳性因素:指引起疾病發(fā)生的遺傳基礎(chǔ)。一、疾病發(fā)生機(jī)制的遺傳學(xué)基礎(chǔ)遺傳病包括染色體病、單基因病、復(fù)雜疾?。ǘ嗷虿。Ⅲw細(xì)胞遺傳病和線粒體基因病。疾病發(fā)生的遺傳學(xué)基礎(chǔ)
--染色體畸變(chromosomeaberration)
--基因突變(genemutation)
--表觀遺傳變異(epigeneticvariation)
--遺傳易感性(geneticsusceptibility)二、遺傳數(shù)據(jù)分析在遺傳病診治中的應(yīng)用臨床基因診斷的先進(jìn)技術(shù)第二代測(cè)序技術(shù)(next-generationsequencing,NGS):全基因組測(cè)序(WGS)、全外顯子組測(cè)序(WES)、靶向目標(biāo)序列測(cè)序、轉(zhuǎn)錄組測(cè)序、甲基化測(cè)序等。第三代DNA測(cè)序的技術(shù):為單分子測(cè)序(single-moleculesequencing,SMS)染色體病診斷的先進(jìn)技術(shù)染色體芯片分析(chromosomemicroarrayanalysis,CMA):檢測(cè)CNV(拷貝數(shù)變異)。既覆蓋到全基因組,又可提供染色體變異位點(diǎn)的精確定位。SNP分型芯片:可以用于疾病篩查(如心血管疾病、癌癥、病原菌)2015年,美國醫(yī)學(xué)遺傳學(xué)會(huì)
(ACMG)、美國分子病理學(xué)協(xié)會(huì)(AMP)、美國病理學(xué)家學(xué)協(xié)會(huì)(CAP)頒布《遺傳變異的分類標(biāo)準(zhǔn)與指南》孟德爾病相關(guān)的基因變異劃分為5個(gè)等級(jí):①
臨床致病性(pathogenic)變異②
臨床可能致病性(likelypathogenic)變異③
臨床意義不明確的(uncertainsignificance)變異④
可能良性的(likelybenign)變異⑤
良性(benign)變異隨著高通量測(cè)序的廣泛應(yīng)用、測(cè)序設(shè)備自動(dòng)化程度的提高,測(cè)序數(shù)據(jù)正成幾何增長(zhǎng),這無疑會(huì)對(duì)數(shù)據(jù)計(jì)算能力提出挑戰(zhàn)。據(jù)測(cè)算,一個(gè)人一生與健康相關(guān)的數(shù)據(jù)整合起來大約10TB,一百萬人的數(shù)據(jù)量約為10EB。此外,還有大量動(dòng)植物基因組、轉(zhuǎn)錄組、微生物基因組及宏基因組測(cè)序分析等科研服務(wù)項(xiàng)目,數(shù)據(jù)類型和數(shù)量異常龐大。而且,測(cè)序儀運(yùn)行產(chǎn)生的原始數(shù)據(jù)并不能直接提供關(guān)于疾病的信息,測(cè)序企業(yè)需要依據(jù)生物信息學(xué)的方法,對(duì)海量的測(cè)序數(shù)據(jù)進(jìn)行復(fù)雜的過濾、比對(duì)、拼接和處理、數(shù)據(jù)分析等重重步驟,才能獲得基因組上的變異信息,再結(jié)合遺傳學(xué)、病理學(xué)以及其他組學(xué)等信息共同分析,最終才能轉(zhuǎn)化為人們可理解的生物學(xué)數(shù)據(jù),為疾病的診療提供參考和指導(dǎo)。在醫(yī)學(xué)診斷與治療過程中,臨床檢測(cè)始終扮演著無法替代的角色。從最簡(jiǎn)單的判斷ABO血型,到為糖尿病人測(cè)量血糖濃度,再到基于某些腫瘤生物標(biāo)記物的存在與否進(jìn)而預(yù)測(cè)特定靶向治療藥物的療效,臨床檢測(cè)結(jié)果的準(zhǔn)確性直接會(huì)影響臨床診斷的結(jié)果與后續(xù)治療方案
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 33953-2025鋼筋混凝土用耐蝕鋼筋
- 2025安徽宿州市立醫(yī)院招聘編外人員42人模擬試卷及一套參考答案詳解
- 2025昆明市第三人民醫(yī)院重癥醫(yī)學(xué)科見習(xí)護(hù)理人員招聘(7人)考前自測(cè)高頻考點(diǎn)模擬試題含答案詳解
- 2025甘肅臨夏州永靖縣人力資源和社會(huì)保障局招聘城鎮(zhèn)公益性崗位人員考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解一套
- 2025江西省人民醫(yī)院鄱陽醫(yī)院-鄱陽縣第二人民醫(yī)院招聘編制外衛(wèi)生專業(yè)技術(shù)人員15人模擬試卷及答案詳解(各地真題)
- 2025春季河南新鄉(xiāng)工商職業(yè)學(xué)院招聘模擬試卷附答案詳解(突破訓(xùn)練)
- 2025廣東深圳大學(xué)人文學(xué)院謝曉霞教授博士后招聘1人模擬試卷及答案詳解(全優(yōu))
- 2025年中國化妝品用吡羅克酮醇胺行業(yè)市場(chǎng)分析及投資價(jià)值評(píng)估前景預(yù)測(cè)報(bào)告
- 2025年中國化纖消光劑行業(yè)市場(chǎng)分析及投資價(jià)值評(píng)估前景預(yù)測(cè)報(bào)告
- 2025年陜西新華出版?zhèn)髅郊瘓F(tuán)新華書店分公司招聘筆試考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(各地真題)
- 高速公路工作人員安全教育培訓(xùn)
- 精神科老年人皮膚護(hù)理
- 物流園區(qū)衛(wèi)生管理制度
- 汽車廢電池管理制度
- JG/T 368-2012鋼筋桁架樓承板
- 塔吊合同終止協(xié)議書
- 挖機(jī)干活合同協(xié)議
- 《2025年CSCO結(jié)直腸癌診療指南》解讀
- 課件:《馬克思主義基本原理概論》(23版):第五章 資本主義的發(fā)展及其趨勢(shì)
- 2024年新人教版七年級(jí)上冊(cè)數(shù)學(xué)教學(xué)課件 第二章 有理數(shù)的運(yùn)算 綜合與實(shí)踐 進(jìn)位制的認(rèn)識(shí)與探究
- 東莞市普洱茶干倉倉貯技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論