生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估_第1頁
生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估_第2頁
生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估_第3頁
生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估_第4頁
生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物醫(yī)學(xué)大數(shù)據(jù)與精準(zhǔn)風(fēng)險評估2015年奧巴馬在國情咨文宣布將精準(zhǔn)醫(yī)療列入重點 工程。2016年2月25日,美國啟動精準(zhǔn)醫(yī)療計劃。2015年3月,中國首次精準(zhǔn)醫(yī)學(xué)戰(zhàn)略專家會議, 規(guī)劃在2030年前精準(zhǔn)醫(yī)療投入600億。健康大數(shù)據(jù)與數(shù)據(jù)科學(xué)個人健康大數(shù)據(jù)生物大分子數(shù)據(jù)臨床健康數(shù)據(jù)數(shù) 據(jù) 科 學(xué)分析 建 模信息檢索機器學(xué)習(xí)數(shù)據(jù)挖掘精準(zhǔn)醫(yī)療的三大應(yīng)用領(lǐng)域精準(zhǔn)治療及用藥(腫瘤靶向藥)精準(zhǔn)預(yù)防(個性化疾病風(fēng)險評估與管理)精準(zhǔn)診斷(ctDNA, cfDNA)上醫(yī)治未病,中醫(yī)治欲病,下醫(yī)治已病。- 黃帝內(nèi)經(jīng)重大疾病預(yù)防的現(xiàn)狀健康管理需求疾病預(yù)防需求目前的健康管理手段:常規(guī)體檢分子生物學(xué)檢測在精準(zhǔn)醫(yī)療中的應(yīng)用斯

2、坦福大學(xué)分子生物學(xué)教授 Michael Snyder 最初通過基因組測序,得知他患糖尿病 的風(fēng)險很高。而呼吸道合胞病毒的感染,觸發(fā)他患上了2型糖尿病。之后他檢測了自 己20個不同時間所采栠的血樣,得到基因組學(xué)、代謝組學(xué)以及蛋白質(zhì)組學(xué)的生化數(shù) 據(jù),描繪出自身免疫系統(tǒng)、代謝和基因活動的狀態(tài)。經(jīng)過6個月的飲食調(diào)整和積極鍛 煉,使得血糖恢復(fù)到正常水平。好萊塢紅星安吉麗娜朱莉(Angelina Jolie)通過基因檢測發(fā)現(xiàn)自身帶有家族性的BRCA1基因突變,這也意昧著她擁有87%和50%的幾率罹患乳腺癌和卵巢癌。朱莉擁有癌癥家族史,家族中一共有三位女性親人都死千女性相關(guān)癌癥。朱莉?qū)θ橄佟?卵巢和輸卵管進

3、行了預(yù)防性切除,使其患乳腺癌的幾率從87%下降到5%以下。生物醫(yī)學(xué)大數(shù)據(jù)大數(shù)據(jù)時代的機遇與挑戰(zhàn)機器 視覺機器 學(xué)習(xí)圖像 處理信息 檢索數(shù)據(jù) 挖掘模式 識別SubjecveImplicitIndirectInconsistentLaboriousTedious生物信息分析及大數(shù)據(jù)挖掘技術(shù)力有預(yù)測利用生物信息學(xué)的方法,通過計算機模擬和計算來 預(yù)測DNA、RNA以及蛋白質(zhì)序列的結(jié)構(gòu)和力有信息, 了解各個基因所要表達的生物學(xué)意義,真的的揭開 遺傳的奧秘。全基因組關(guān)聯(lián)分析應(yīng)用全基因組中數(shù)以百萬計的SNP位點為分子遺傳 標(biāo)記,進行全基因組水平上的對照分析及關(guān)聯(lián)分析, 發(fā)現(xiàn)并鑒定與復(fù)雜性狀相關(guān)聯(lián)的遺傳變異。

4、易感基因疾病遺傳風(fēng)險評估DNA檢測:基因芯片 + 二代高通量測序根據(jù)評價發(fā)病率(IR,incident rate) 和人均壽命(T)估算評價終身患病風(fēng) 險(LR,lifetime risk)根據(jù)疾病相關(guān)位點比值比( OR,odd ratio)計算個人終身患病風(fēng)險使用個人終身患病風(fēng)險與平均終身患 病風(fēng)險計算相對患病風(fēng)險多種生物分子數(shù)據(jù)整合、大尺度建模分析蛋白質(zhì)組、結(jié)構(gòu)、網(wǎng)絡(luò)通路數(shù)據(jù)糖組測序、結(jié)構(gòu)數(shù)據(jù)腫瘤、微生物基因檢測P. Aloy, and R. Russell, Nat Rev Mol Cell Biol. 7(3) 2006臨床健康數(shù)據(jù)疾病風(fēng)險評估Framingham risk score

5、: 對冠心病、高血壓、心力衰竭、陂行、 中風(fēng)、心房顫動、糖尿病、心血管疾病8類項目進行風(fēng)險預(yù)測ClinRisk提供癌癥、糖尿病、骨折、腎病、心血管疾病未 來1-10內(nèi)的風(fēng)險預(yù)測。復(fù)雜臨床影像數(shù)據(jù)CBIR:基于內(nèi)容的醫(yī)學(xué)影像檢索病理切片顯微圖像r1r2r3r4r5q1q2 q3q4復(fù)雜醫(yī)學(xué)影像數(shù)據(jù)存儲與處理單張組織切片圖像 超過10-20G分割識別需要矩陣 運算和復(fù)雜處理海量病理圖像內(nèi)容 檢索MasterSlaveSlaveSlaveSlaveTaskResultLocal ProcessesCached in RAM/DiskLocal/Shared File SystemHDFSDriver

6、ExecutorExecutorExecutorExecutor在生物數(shù)據(jù)科學(xué)領(lǐng)域核心方法研究1)多組學(xué)數(shù)據(jù)整合 Integrative omics data analysis3)物數(shù)據(jù)挖掘 Big bio-data mining智能語義識別挖掘系統(tǒng)蛋組代謝組互作組綜合分析平臺人工智能生物信息學(xué) 分析建模技術(shù)a. 關(guān)聯(lián)規(guī)則挖掘(association rule mining)b. 數(shù)據(jù)分析平臺(Hadoop,spark)深度機器學(xué)習(xí)開發(fā)系統(tǒng)(semi-supervised, unsupervised feature-, sparse-, multi-task learning)a. 信息檢索索

7、引技術(shù)平臺b. 數(shù)據(jù)分析平臺(Hadoop,spark)a. 云計算批量數(shù)據(jù)計算系統(tǒng)b. 云計算數(shù)據(jù)集成系統(tǒng)轉(zhuǎn)錄組基因組 4)深度機器學(xué)習(xí)deep machine learning5)基于內(nèi)容信息檢Content-based Information Retrieval6)并云計算Parallel cloud computing2)本語義挖 Semantic text mining一組在校大學(xué)生人群的基因檢測分布- 上萬例樣本,11項目17個位點SNP分型- 分析數(shù)據(jù)栠包括學(xué)生檢測者來自10種類型高校SNP rs4680 A/G分型檢測師范類、醫(yī)藥類、財經(jīng)類學(xué)校記憶力非常好的學(xué)生占比較大COMT

8、和CLOCK基因SNP分型檢測注意力栠中學(xué)生占比最高的是醫(yī)藥類大學(xué),其次師范類大學(xué)上萬例樣本精準(zhǔn)疾病風(fēng)險評估模型11.08%11.01%10.37%10.23%9.63%9.54%8.72%胃癌 睪丸癌 鼻咽癌 肺癌 結(jié)直腸 甲狀腺 肝癌癌癌癌癥類疾病11.26%9.60%7.66%6.53%6.09%5.70%5.45%心腦血管及內(nèi)分泌系統(tǒng)疾病高危人群占比大的4類疾病具有調(diào)查問卷的基本信息11.60%10.01%9.29%8.52%8.46%7.68%7.39%呼吸及免疫系統(tǒng)疾病17.14%10.92%10.87%10.61%強直性脊柱炎子宮內(nèi)膜異位 男性不育癥偏頭痛骨科女性疾病男性疾病神經(jīng)

9、系統(tǒng)其他4種疾病80% 100%高血壓_fam腫瘤_fam糖尿病_fam呼吸系統(tǒng)疾病_fam遺傳病_fam其他_fam家族患病史人數(shù)統(tǒng)計0%20% 40% 60%患病未患病80%100%高血壓呼吸系統(tǒng)疾病糖尿病腫瘤遺傳病其他個人患病史人數(shù)統(tǒng)計0%20%40%60%患病 未患病基因+臨床數(shù)據(jù)整合分析建模:患病風(fēng)險評估1546基因位點SNP+ 30項臨床特征向量7項疾病患病歷史 特征向量XYm樣本n 基因編碼+臨床數(shù)據(jù)!x11 !x1 j !x1n#xi1 !xij !xin#xmj !xmn xm1yy ym1m 樣本l 項疾病患病史y11 !y1k !y1l#i1 !ik !yil#!ymk

10、!yml !group 1Group 3RelaQonship?0TE Y X x x 1 min2N0T22j1p F / 2 yi xi 1Fj 2 i1NMul-task sparse learning (LASSO & Ridge)X YFit the model by solving:特征提取連續(xù)性變量的離散化、定 性變量的重新編碼SNP位點數(shù)據(jù)則根據(jù)該位點 等位基因頻率進行編碼y共包括7個變量:高血壓 病史、糖尿病史、呼吸系 統(tǒng)疾病史、腫瘤病史、遺 傳病史、其他以及無疾病。模型評估結(jié)論 LASSO模型,優(yōu)化Lambda得 到 最 小 cross validaQon standard

11、 error 0.043生物大數(shù)據(jù)整合分析技術(shù)在轉(zhuǎn)化醫(yī)學(xué)中的應(yīng)用自閉癥轉(zhuǎn)錄組疾病機制研究與風(fēng)險因素評估Protein isoform structural analysis aids AS eects onAuQsm transcriptome data晶體結(jié)構(gòu)數(shù)據(jù)整合輔助自閉癥轉(zhuǎn)錄組大數(shù)據(jù)建模精準(zhǔn)健康管理系統(tǒng)四大核心功能恤.們. _ 谷匾- ,.Ill!. _. 111!11 一!11 墨 ,* 跁合荎因數(shù)據(jù)、基礎(chǔ)信息往 期評估等 系統(tǒng) 啟動進行 準(zhǔn)評估哩可定期評估丘動態(tài)監(jiān)測明確 紐畫風(fēng)險疾病._.,_咖 討渚5報告通俗易.全面的基因體檢報告_,盲 ,血i一”卓蘭括1iQQ余種疾病虐 全面了解自身疾病的發(fā)生風(fēng)險

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論