基因芯片課程總復(fù)習(xí)_第1頁(yè)
基因芯片課程總復(fù)習(xí)_第2頁(yè)
基因芯片課程總復(fù)習(xí)_第3頁(yè)
基因芯片課程總復(fù)習(xí)_第4頁(yè)
基因芯片課程總復(fù)習(xí)_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DNA芯片與基因表達(dá)緒論技術(shù)路線數(shù)據(jù)可靠性分析基因差異表達(dá)分析芯片數(shù)據(jù)層級(jí)聚類(lèi)和可視化基因注釋與功能分析基因芯片的應(yīng)用緒論基因:指攜帶遺傳信息的DNA序列,是控制性狀的基本遺傳單位亦即一段具有功能性的DNA序列。基因通過(guò)指導(dǎo)蛋白質(zhì)的合成來(lái)表達(dá)自己所攜帶的遺傳信息,從而控制生物個(gè)體的性狀表現(xiàn)?;虮磉_(dá):基因中的DNA序列生產(chǎn)出蛋白質(zhì)的過(guò)程。步驟大致從DNA轉(zhuǎn)錄成mRNA開(kāi)始,一直到對(duì)于蛋白質(zhì)進(jìn)行后翻譯修飾為止?;蚪M:在生物學(xué)中,一個(gè)生物體的基因組是指包含在該生物的DNA(部分病毒是RNA)中的全部遺傳信息?;蚪M包括基因和非編碼DNA。更精確地講,一個(gè)生物體的基因組是指一套染色體中的完整的DNA序列。緒論基因組學(xué):研究生物基因組和如何利用基因的一門(mén)學(xué)問(wèn)。該學(xué)科提供基因組信息以及相關(guān)數(shù)據(jù)系統(tǒng)利用,試圖解決生物,醫(yī)學(xué)和工業(yè)領(lǐng)域的重大問(wèn)題。功能基因組學(xué):運(yùn)用遺傳技術(shù),以功能不明的基因作為起點(diǎn),通過(guò)識(shí)別這個(gè)基因在一個(gè)或多個(gè)生物模型中的作用來(lái)認(rèn)識(shí)新發(fā)現(xiàn)基因的功能。轉(zhuǎn)錄組學(xué):轉(zhuǎn)錄組學(xué)是分子生物學(xué)的分支,負(fù)責(zé)研究在單個(gè)細(xì)胞或一個(gè)細(xì)胞群的特定細(xì)胞類(lèi)型內(nèi)所生產(chǎn)的mRNA分子。轉(zhuǎn)錄組學(xué)的研究,也被稱為“表達(dá)譜”,探討在一個(gè)特定的細(xì)胞群內(nèi)的基因表達(dá)水平。通常采用基于DNA芯片技術(shù)的高通量技術(shù)。透過(guò)使用新一代測(cè)序技術(shù)來(lái)研究在核苷酸水平的轉(zhuǎn)錄物組,被稱為“RNA-Seq”。緒論生物芯片(bio-chip):主要指微陣列芯片(microarray),包括基因芯片、蛋白芯片、細(xì)胞芯片和組織芯片等微型生化反應(yīng)檢測(cè)和分析系統(tǒng),其本質(zhì)是利用生物分子相互間(如DNA分子之間、蛋白分子之間以及DNA與蛋白分子之間等)的特異識(shí)別作用,對(duì)生物信號(hào)進(jìn)行平行處理和分析?;蛐酒夹g(shù):基因芯片技術(shù)實(shí)際上是一種大規(guī)模集成的固相雜交技術(shù),即在固相支持物上原位合成寡核苷酸或直接將多種預(yù)先制備的探針以顯微的方式有序地固定于支持物表面,然后與標(biāo)記的樣本雜交,通過(guò)對(duì)雜交信號(hào)的檢測(cè)分析,得出樣品的遺傳信息(基因序列及表達(dá)信息)。芯片上固定的探針除了DNA,也可以是cDNA、寡核苷酸或來(lái)自基因組的基因片段,且這些探針固定于芯片上形成基因探針陣列。緒論雜交(hybridization):把目的基因或基因組/PCR片段的酶切產(chǎn)物轉(zhuǎn)移到固相支持物上,用標(biāo)記的探針與之結(jié)合印跡法(blotting):一種用于從凝膠中轉(zhuǎn)移DNA、RNA、蛋白質(zhì)到硝化纖維、尼龍膜等支持物上但是保持原有的物理分離狀態(tài)的技術(shù)固相雜交技術(shù):Southern、Northern、Western樣本(sample):

實(shí)驗(yàn)中用于研究的對(duì)象探針(probe):帶有可檢測(cè)標(biāo)記(同位素,生物素或熒光染料等)的一小段已知序列的寡核苷酸,用于探測(cè)樣本和樣本核酸信息的互補(bǔ)序列(這里主要指Southernblot和Northernblot中的探針)緒論Northernblotting過(guò)程和原理緒論Southern過(guò)程和原理緒論為什么Northern和Southernblotting中要轉(zhuǎn)膜?會(huì)擴(kuò)散;膠容易碎,膜比較堅(jiān)韌且對(duì)核酸的結(jié)合更加有效;探針獲得難度大,在膠上需要用的探針量大基因組的生物信息學(xué)分析

探針的設(shè)計(jì)與合成芯片的設(shè)計(jì)芯片的打印打印后處理芯片成品細(xì)胞樣品的處理RNA的提取反轉(zhuǎn)錄及cDNA的標(biāo)記標(biāo)記樣品的純化雜交掃描數(shù)據(jù)處理綜合信息分析技術(shù)路線信號(hào)讀取技術(shù)路線-基因組的生物信息學(xué)分析基因組的生物信息學(xué)分析:病毒基因組酶切圖譜,基因組的物理圖譜,mapunitDNA芯片探針:

用于探測(cè)樣本DNA信息的互補(bǔ)序列。在傳統(tǒng)雜交技術(shù)中通常標(biāo)記探針,而在基因芯片中是指固定于基因芯片基質(zhì)表面、能與樣本DNA互補(bǔ)的核酸分子,不進(jìn)行熒光標(biāo)記。類(lèi)型:cDNA探針(用于基因表達(dá)譜研究)寡核苷酸探針(可以用于所有研究領(lǐng)域,目前廣泛應(yīng)用于基因表達(dá)譜、基因分型和SNP研究)基因組DNA探針(比較基因組學(xué)研究)技術(shù)路線-

探針的設(shè)計(jì)與合成技術(shù)路線-

探針的設(shè)計(jì)與合成cDNA探針的制備:

cDNA文庫(kù)

→PCR擴(kuò)增

→電泳

→PCR產(chǎn)物濃縮

→濃度均一化

→打印探針基因組DNA探針的制備:

基因組DNA經(jīng)限制性內(nèi)切酶片段化→分別構(gòu)建文庫(kù)

→打印探針寡核苷酸探針的制備:

直接合成DNA探針→打印探針探針設(shè)計(jì)的原則:長(zhǎng)度為50-70mer(此長(zhǎng)度考慮了靈敏度和特異性之間的平衡);在基因組中和目標(biāo)區(qū)域外的序列相似性不超過(guò)15nt和其他物種同源性在源ORF內(nèi)為相對(duì)最低的之一,具體的表現(xiàn)為,BLAST分值(bits)在40以內(nèi)(即一般不超過(guò)20個(gè)核苷酸的與其他已知序列或位點(diǎn)同源);G+C含量為40%-60%;連續(xù)相同的核苷酸不超過(guò)6個(gè);二級(jí)結(jié)構(gòu):使oligo形成二聚體或者發(fā)夾結(jié)構(gòu)的連續(xù)核苷酸數(shù)不超過(guò)6個(gè);離poly(A)的距離相對(duì)近技術(shù)路線-

探針的設(shè)計(jì)與合成寡核苷酸探針(60meroligo

)相對(duì)于cDNA

探針的優(yōu)點(diǎn):每一條序列都經(jīng)過(guò)了優(yōu)化,減少非特異性的雜交,能夠有效地區(qū)分同源序列的基因;雜交溫度均一,雜交效率高;減少二級(jí)結(jié)構(gòu);合成的產(chǎn)物濃度均一,避免因?yàn)闃悠窛舛鹊牟町惗斐牲c(diǎn)樣差異;無(wú)需擴(kuò)增,防止因?yàn)閿U(kuò)增失敗而影響實(shí)驗(yàn)技術(shù)路線-

探針的設(shè)計(jì)與合成空白對(duì)照:控制芯片制備過(guò)程的污染情況;陽(yáng)性內(nèi)參:對(duì)實(shí)驗(yàn)陽(yáng)性結(jié)果的說(shuō)明;陰性內(nèi)參:對(duì)實(shí)驗(yàn)陰性結(jié)果的說(shuō)明;技術(shù)路線-芯片的設(shè)計(jì)技術(shù)路線-芯片的打印指放置探針到陣列表面的過(guò)程。一般都是通過(guò)針式點(diǎn)樣儀或者是噴墨點(diǎn)樣儀進(jìn)行的。技術(shù)路線-芯片的打印基片(substrate):二維陣列中用于固定探針的固相支持物(基質(zhì))。經(jīng)過(guò)特殊處理打印:放置探針到陣列表面的過(guò)程,一般是通過(guò)針式點(diǎn)樣儀或噴墨式點(diǎn)樣儀打印原位合成法(insitusynthesised)(Affymetrix

是原來(lái)用于電子芯片制作的光刻法(Photolithography),轉(zhuǎn)為核酸序列的合成技術(shù)。利用光罩控制反應(yīng)位置,將核苷酸分子依序列一個(gè)一個(gè)接上去;可大量生產(chǎn)超高密度的芯片。由于制程與光罩成本等因素,這種方法做出的探針長(zhǎng)度約在25-mer以下;因此同一個(gè)基因需要多個(gè)探針對(duì)應(yīng),以避免誤判。Stanford型:

由美國(guó)斯坦福大學(xué)開(kāi)發(fā)的cDNAarray的制作方法,將預(yù)先合成好的核酸探針布放于玻片載體上。優(yōu)點(diǎn):設(shè)計(jì)較長(zhǎng)的探針長(zhǎng)度可增加專(zhuān)一性。缺點(diǎn):芯片密度較光罩法低,并須有良好的保存設(shè)計(jì)。技術(shù)路線-RNA的提取TotalRNA制備:TRIZOL法RNA樣本的質(zhì)量:16S和18SRNA(80%)很多,中間有smear帶RIN檢測(cè)法(RNAIntegrityNumber):

主要通過(guò)毛細(xì)管電泳進(jìn)行檢測(cè)表達(dá)譜芯片中最廣泛應(yīng)用的標(biāo)記方法是熒光標(biāo)記法,其基本原理是利用標(biāo)記分子在特定的波長(zhǎng)范圍內(nèi)被激發(fā)光源激發(fā)產(chǎn)生熒光的特點(diǎn),從而能夠?qū)袠?biāo)記分子的樣本進(jìn)行檢測(cè)靈敏度高,定量檢測(cè)常用熒光標(biāo)記物是花青素(cyanine)cyanine激發(fā)波長(zhǎng)(nm)發(fā)射波長(zhǎng)(nm)Cy3550570Cy5649670技術(shù)路線–反轉(zhuǎn)錄及cDNA的標(biāo)記技術(shù)路線–反轉(zhuǎn)錄及cDNA的標(biāo)記靶DNA(targetDNA):

通常稱待檢測(cè)的核酸為靶DNA,又稱靶序列,在基因芯片中標(biāo)記的是靶DNA。反向雜交ProbesmRNASample正向雜交ProbemRNAsamples技術(shù)路線–反轉(zhuǎn)錄及cDNA的標(biāo)記

為什么基因芯片中只采用反向雜交,而不用正向雜交?DNAmicroarrayProbesmRNASampleabc技術(shù)路線–反轉(zhuǎn)錄及cDNA的標(biāo)記當(dāng)探針量的濃度一定(且過(guò)量)時(shí),熒光信號(hào)強(qiáng)度在一定范圍內(nèi)與靶DNA量呈線性關(guān)系;對(duì)于表達(dá)譜芯片,兩種不同標(biāo)記的靶cDNA混合后對(duì)同一張芯片進(jìn)行雜交,雜交后兩種熒光信號(hào)的比值就代表了該基因在兩種組織中的表達(dá)差異技術(shù)路線–雜交技術(shù)路線–清洗清洗:雜交后必需步驟(可以用搖床)當(dāng)熒光標(biāo)記的樣品同探針結(jié)合后,就被固定在芯片的特定位置上。當(dāng)用激發(fā)光激發(fā)熒光素發(fā)射熒光后,就可用激光掃描熒光顯微鏡、激光共聚焦掃描顯微鏡、電荷偶聯(lián)攝影像機(jī)(CCD)相機(jī)改進(jìn)型熒光顯微鏡以及光纖傳感器微陣列等儀器檢測(cè)芯片上熒光的位置和強(qiáng)弱。再經(jīng)計(jì)算機(jī)記錄和相關(guān)軟件分析處理,就將熒光信號(hào)轉(zhuǎn)換成數(shù)據(jù)。技術(shù)路線–掃描

當(dāng)探針量的濃度一定(且過(guò)量時(shí)),熒光信號(hào)強(qiáng)度在一定范圍內(nèi)與靶DNA量呈線性關(guān)系技術(shù)路線–掃描芯片上一個(gè)熒光點(diǎn)面積約為0.005cm2,每個(gè)位點(diǎn)有106-107探針細(xì)胞中rRNA(80%)和tRNA(15%)轉(zhuǎn)錄本的拷貝數(shù)最多,mRNA(5%),最多的mRNA數(shù)量也不超過(guò)107個(gè),所以芯片中的探針數(shù)量是冗余的Cy3灰度圖Cy5灰度圖Cy3偽彩圖Cy5偽彩圖Cy3和Cy5疊加圖技術(shù)路線–掃描圖像處理:這個(gè)過(guò)程開(kāi)始于通過(guò)熒光掃描儀等信號(hào)檢測(cè)設(shè)備產(chǎn)生的包含微陣列中每個(gè)探針的信號(hào)強(qiáng)度信息的灰度圖象,然后通過(guò)專(zhuān)業(yè)的軟件對(duì)獲得的灰度圖像進(jìn)行信號(hào)提取,這樣就可以得到微陣列中每個(gè)探針的絕對(duì)信號(hào)值(其中包括背景信號(hào)值、總體信號(hào)值等),再獲得這些數(shù)據(jù)之后還可以進(jìn)行下面一些數(shù)據(jù)分析:按照不同算法計(jì)算每個(gè)探針的真實(shí)信號(hào)值、不同通道之間的歸一化稀疏、探針的倍性變化、散點(diǎn)圖等。技術(shù)路線–數(shù)據(jù)處理劃格:將事先根據(jù)芯片型號(hào)定義好行列數(shù)的格子覆蓋到芯片上,以確定樣點(diǎn)的位置.技術(shù)路線–數(shù)據(jù)處理分割:將雜交的熒光信號(hào)像素與背景像素分開(kāi)技術(shù)路線–數(shù)據(jù)處理信息提取(intensityextraction):包括計(jì)算熒光信號(hào)強(qiáng)度和背景強(qiáng)度,扣除背景,用一定的統(tǒng)計(jì)量衡量樣點(diǎn)的質(zhì)量以及對(duì)結(jié)果進(jìn)行校正數(shù)據(jù)可靠性分析基因差異表達(dá)分析芯片數(shù)據(jù)層級(jí)聚類(lèi)和可視化基因注釋與功能分析基因芯片的應(yīng)用數(shù)據(jù)可靠性分析誤差:來(lái)自實(shí)驗(yàn)對(duì)象的誤差:生物學(xué)誤差(biologicalvariation)→生物學(xué)重復(fù)(biologicalreplication)來(lái)自實(shí)驗(yàn)者的誤差:技術(shù)誤差(technicalvariation)→技術(shù)重復(fù)(technicalreplication)來(lái)自實(shí)驗(yàn)技術(shù)本身的誤差:系統(tǒng)誤差(platformvariation)→有效的對(duì)照試驗(yàn)(control)基因芯片數(shù)據(jù)系統(tǒng)誤差來(lái)源:

探針,點(diǎn)樣,雜交,清洗,反轉(zhuǎn)錄成cDNA時(shí)熒光標(biāo)記的效率,測(cè)量Cy3和Cy5的熒光強(qiáng)度自身比較實(shí)驗(yàn)(self-comparisonexperiment,SCE):實(shí)驗(yàn)組和對(duì)照組的RNA來(lái)自同一份樣本,在雙色熒光標(biāo)記系統(tǒng)中,兩種熒光標(biāo)記同一RNA,從理論上講,所有基因的信號(hào)比值應(yīng)該為1,在散點(diǎn)圖上形成一條斜率為1的直線。數(shù)據(jù)可靠性分析歸一化(normalization):

是指在微陣列數(shù)據(jù)分析過(guò)程中,通過(guò)某種算法校正微陣列數(shù)據(jù)使不同樣本之間具有可比性的過(guò)程。1.

片內(nèi)歸一化(內(nèi)參:actin、hsp等):指對(duì)每張芯片進(jìn)行獨(dú)立的歸一化,包括位置和離散度的歸一化。數(shù)據(jù)可靠性分析2.片間歸一化:對(duì)多張芯片的數(shù)據(jù)進(jìn)行歸一化,使得不同實(shí)驗(yàn)之間可以進(jìn)行比較。1.

片內(nèi)歸一化(內(nèi)參:actin、hsp等):指對(duì)每張芯片進(jìn)行獨(dú)立的歸一化,包括位置和離散度的歸一化。106cells+VirusReferencesampleExperimentalsampleTotalRNAextractionRNAsampleRNAsampleFlorescencelabelingCy5-labeledcDNACy3-labeledcDNAHybridization,scanMerge數(shù)據(jù)可靠性分析106cells+Virus12hpi24hpi48hpi72hpiTotalRNAextractionRNAsampleRNAsampleRNAsampleRNAsampleFlorescencelabelingLabeledcDNALabeledcDNALabeledcDNALabeledcDNAHybridization片間歸一化加等量的Spike-inRNA數(shù)據(jù)可靠性分析數(shù)據(jù)可靠性分析RNAspike-in:AnRNAspike-inisanRNAtranscriptusedtocalibratemeasurementsinaDNAmicroarrayexperiment.Eachspike-inisdesignedtohybridizewithaspecificcontrolprobeonthetargetarray.ManufacturersofcommerciallyavailablemicroarraystypicallyoffercompanionRNAspike-inkits.

KnownamountsofRNAspike-insaremixedwiththeexperimentsampleduringpreparation.Subsequentlythemeasureddegreeofhybridizationbetweenthespike-insandthecontrolprobesisusedtonormalizethehybridizationmeasurementsofthesampleRNA.以λDNA為模板,通過(guò)體外轉(zhuǎn)錄合成的帶有PolyATail的約1kb的RNA片段,具有同芯片系列上點(diǎn)樣的λDNA片段(λDNA-A)互補(bǔ)的堿基序列熒光標(biāo)記反應(yīng)時(shí),將適當(dāng)量的本制品加入到RNA樣品中進(jìn)行標(biāo)記雜交,可以觀察標(biāo)記、雜交的效果。如果將等量的本制品分別加入到對(duì)照RNA樣品和檢測(cè)RNA樣品中,可以對(duì)雜交反應(yīng)后的信號(hào)強(qiáng)度進(jìn)行校正。λ

polyA+

RNA-A:數(shù)據(jù)可靠性分析

實(shí)驗(yàn)中要用多個(gè)外參基因,且各外參基因的濃度不一樣。一次芯片實(shí)驗(yàn)至少做3塊平衡的芯片(技術(shù)重復(fù))(生物學(xué)重復(fù)是指做幾次重復(fù)實(shí)驗(yàn),以解決實(shí)驗(yàn)對(duì)象產(chǎn)生誤差)基因芯片檢測(cè)結(jié)果的驗(yàn)證Northern

blotRT-PCRqRT-PCR數(shù)據(jù)可靠性分析差異表達(dá)基因的確定陽(yáng)性基因:差異表達(dá)的基因,包括上調(diào)表達(dá)基因和下調(diào)表達(dá)基因

通常采用基因在實(shí)驗(yàn)組和對(duì)照組中信號(hào)的比值衡量基因在兩種狀態(tài)下基因表達(dá)的差異

在雙色熒光系統(tǒng)中,若Cy5標(biāo)記試驗(yàn)組樣本,Cy3標(biāo)記對(duì)照組樣本,則用Cy5/Cy3的值來(lái)衡量基因的表達(dá)差異基因差異表達(dá)分析log2R

log2G散點(diǎn)圖:

對(duì)于表達(dá)譜芯片,兩種不同標(biāo)記的靶cDNA混合后對(duì)同一張芯片進(jìn)行雜交,雜交后兩種熒光信號(hào)就代表了該基因在兩種組織中的表達(dá)差異(縱坐標(biāo)和橫坐標(biāo)分別是對(duì)照和實(shí)驗(yàn)組各基因的表達(dá)量)

用來(lái)表示在cDNA芯片中兩個(gè)組織中基因表達(dá)量的比例信息,圖中的x軸和y軸分別為Cy3和Cy5的熒光信號(hào)強(qiáng)度值或其log值。M-A散點(diǎn)圖:

將散點(diǎn)圖坐標(biāo)軸旋轉(zhuǎn)45度,橫軸為A=1/2log2RG,縱軸為M=log2R–log2G,該圖反映了差異表達(dá)隨強(qiáng)度的分布,并且更易觀察到兩種熒光強(qiáng)度之間的一些非線性特征基因差異表達(dá)分析倍數(shù)法比值大于2或者小于0.5即認(rèn)為表達(dá)有差異。大于2的是上調(diào)表達(dá)的基因,小于0.5的是下調(diào)表達(dá)的基因(事實(shí)上,判定差異表達(dá)基因的標(biāo)準(zhǔn)是人為確定,可以根據(jù)自己的研究設(shè)定適合的閾值)ScatterplotmapM-AplotmapA=1/2log2RG基因差異表達(dá)分析真陽(yáng)性(truepositive)假陽(yáng)性(falsepositive)真陰性(truenegative)假陰性(falsenegative)真實(shí)改變并檢測(cè)到?jīng)]有改變但檢測(cè)結(jié)果認(rèn)為改變了真實(shí)改變但沒(méi)有檢測(cè)到?jīng)]有改變且檢測(cè)結(jié)果一致的為什么芯片中信號(hào)亮度有差異?統(tǒng)計(jì)方法的靈敏度(公式):真陽(yáng)性/(真陽(yáng)性+假陰性)基因差異表達(dá)分析106cellssamesamplesamesampleTotalRNAextractionRNAsampleRNAsampleFlorescencelabelingCy5-labeledcDNACy3-labeledcDNAHybridization,scanMerge噪聲:芯片本身生物學(xué)本身基因差異表達(dá)分析芯片數(shù)據(jù)聚類(lèi)分析和可視化為什么要對(duì)表達(dá)模式類(lèi)似的基因進(jìn)行聚類(lèi)?

基因芯片數(shù)據(jù)分析的核心問(wèn)題就是要鑒別出具有共同表達(dá)模式的基因,因?yàn)楸磉_(dá)模式相近的基因往往具有相近或相似的特征(如共同的調(diào)節(jié)元件,共有的生物功能,或者共同的細(xì)胞起源),按表達(dá)模式把基因分成不同的種類(lèi)可以探索一些基因的功能(如基因調(diào)控途徑和網(wǎng)絡(luò)),并得到對(duì)其生物機(jī)能及關(guān)聯(lián)性的深入了解。另外,在醫(yī)學(xué)研究中,通過(guò)對(duì)表達(dá)譜相近的樣品進(jìn)行聚類(lèi)也有助于對(duì)病例進(jìn)行分析。是不是所有生物學(xué)通路的變化都可以通過(guò)基因芯片檢測(cè)得到??聚類(lèi)分析:

聚類(lèi)分析是將一批樣品或變量,按照他們的性質(zhì)上的親疏程度進(jìn)行分類(lèi),把相似的個(gè)體劃分到相同的組別,把不相似的個(gè)體劃分到不同組別。在沒(méi)有關(guān)于數(shù)據(jù)的先驗(yàn)知識(shí)的情況下,可以對(duì)不同的樣本或?qū)嶒?yàn)間的相似性進(jìn)行研究。對(duì)于基因表達(dá)數(shù)據(jù)陣列來(lái)說(shuō),聚類(lèi)的對(duì)象包括基因、樣本和陣列芯片數(shù)據(jù)聚類(lèi)分析和可視化層級(jí)聚類(lèi)(hierarchicalcluster)

先將n個(gè)樣本看成n類(lèi),計(jì)算類(lèi)間的距離,在將相似性最高的兩類(lèi)合并為一個(gè)新類(lèi),得n–1類(lèi),再重新計(jì)算關(guān)系矩陣,不斷重復(fù)這個(gè)過(guò)程,直至所有的基因融合成為一個(gè)大類(lèi)。這種聚類(lèi)方法得到類(lèi)似于進(jìn)化分析的系統(tǒng)樹(shù)圖,具有相似表達(dá)譜的基因彼此臨近,它們可能具有相似的功能。評(píng)判聚類(lèi)方法好壞的標(biāo)準(zhǔn):

適用于大數(shù)據(jù)量;能應(yīng)付不同的數(shù)據(jù)類(lèi)型;能夠發(fā)現(xiàn)了不同類(lèi)型的聚類(lèi);使用專(zhuān)業(yè)知識(shí)要求到最低;能應(yīng)付臟數(shù)據(jù);ProfilesofindividualclustersAcMNPV-infectedSf9cellsorBmNcells芯片數(shù)據(jù)聚類(lèi)分析和可視化K-MEANS聚類(lèi)(K-MEANScluster)

接受輸入量k;然后將n個(gè)數(shù)據(jù)對(duì)象劃分為k個(gè)聚類(lèi)以便使得所獲得的聚類(lèi)滿足:同一聚類(lèi)中的對(duì)象相似度較高;而不同聚類(lèi)中的對(duì)象相似度較小。聚類(lèi)相似度是利用各聚類(lèi)中對(duì)象的均值所獲得一個(gè)“中心對(duì)象”(引力中心)來(lái)進(jìn)行計(jì)算的。芯片數(shù)據(jù)聚類(lèi)分析和可視化層級(jí)聚類(lèi)和K-MEAN的區(qū)別:層級(jí)聚類(lèi)不需要先驗(yàn)知識(shí),可以細(xì)分出更多小類(lèi);K-MEANS需要先驗(yàn)知識(shí)芯片數(shù)據(jù)聚類(lèi)分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論