




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
聚類(lèi)分析具體操作步驟如何聚類(lèi)第1頁(yè),共19頁(yè)。(優(yōu)選)聚類(lèi)分析具體操作步驟如何聚類(lèi).第2頁(yè),共19頁(yè)。俗語(yǔ)說(shuō),物以類(lèi)聚、人以群分。但什么是分類(lèi)的根據(jù)呢?舉例:要想把中國(guó)的縣分成若干類(lèi),就有很多種分類(lèi)法;可以按照自然條件來(lái)分,比如考慮降水、土地、日照、濕度等各方面;也可以考慮收入、教育水準(zhǔn)、醫(yī)療條件、基礎(chǔ)設(shè)施等指標(biāo);既可以用某一項(xiàng)來(lái)分類(lèi),也可以同時(shí)考慮多項(xiàng)指標(biāo)來(lái)分類(lèi)。第3頁(yè),共19頁(yè)。聚類(lèi)分析概述(一)概念(1)聚類(lèi)分析是統(tǒng)計(jì)學(xué)中研究“物以類(lèi)聚”的一種方法,屬多元統(tǒng)計(jì)分析方法.例如:細(xì)分市場(chǎng)、消費(fèi)行為劃分聚類(lèi)分析是建立一種分類(lèi),是將一批樣本(或變量)按照在性質(zhì)上的“親疏”程度,在沒(méi)有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類(lèi)的方法.其中:類(lèi)內(nèi)個(gè)體具有較高的相似性,類(lèi)間的差異性較大.第4頁(yè),共19頁(yè)。(二)“親疏”程度的衡量(1)衡量指標(biāo)相似性:數(shù)據(jù)間相似程度的度量距離:數(shù)據(jù)間差異程度的度量.距離越近,越“親密”,聚成一類(lèi);距離越遠(yuǎn),越“疏遠(yuǎn)”,分別屬于不同的類(lèi)(2)衡量對(duì)象個(gè)體間距離個(gè)體和小類(lèi)間、小類(lèi)和小類(lèi)間的距離第5頁(yè),共19頁(yè)。兩個(gè)距離概念按照遠(yuǎn)近程度來(lái)聚類(lèi)需要明確兩個(gè)概念:一個(gè)是點(diǎn)和點(diǎn)之間的距離,一個(gè)是類(lèi)和類(lèi)之間的距離。點(diǎn)間距離有很多定義方式。最簡(jiǎn)單的是歐式距離,還有其他的距離。當(dāng)然還有一些和距離相反但起同樣作用的概念,比如相似性等,兩點(diǎn)越相似度越大,就相當(dāng)于距離越短。由一個(gè)點(diǎn)組成的類(lèi)是最基本的類(lèi);如果每一類(lèi)都由一個(gè)點(diǎn)組成,那么點(diǎn)間的距離就是類(lèi)間距離。但是如果某一類(lèi)包含不止一個(gè)點(diǎn),那么就要確定類(lèi)間距離,類(lèi)間距離是基于點(diǎn)間距離定義的:比如兩類(lèi)之間最近點(diǎn)之間的距離可以作為這兩類(lèi)之間的距離,也可以用兩類(lèi)中最遠(yuǎn)點(diǎn)之間的距離作為這兩類(lèi)之間的距離;當(dāng)然也可以用各類(lèi)的中心之間的距離來(lái)作為類(lèi)間距離。在計(jì)算時(shí),各種點(diǎn)間距離和類(lèi)間距離的選擇是通過(guò)統(tǒng)計(jì)軟件的選項(xiàng)實(shí)現(xiàn)的。不同的選擇的結(jié)果會(huì)不同,但一般不會(huì)差太多。第6頁(yè),共19頁(yè)。SPSS中聚類(lèi)分析分類(lèi)(一)按分類(lèi)對(duì)象
對(duì)變量的聚類(lèi)稱(chēng)為R型聚類(lèi)
對(duì)觀測(cè)值聚類(lèi)稱(chēng)為Q型聚類(lèi)
這兩種聚類(lèi)在數(shù)學(xué)上是對(duì)稱(chēng)的,沒(méi)有什么不同。(二)按聚類(lèi)的方法分類(lèi)
分層聚類(lèi)或系統(tǒng)聚類(lèi)分析快速聚類(lèi)分析兩步聚類(lèi)分析:新型的第7頁(yè),共19頁(yè)。事先不用確定分多少類(lèi):分層聚類(lèi)分層聚類(lèi)或系統(tǒng)聚類(lèi)(hierarchicalcluster)。開(kāi)始時(shí),有多少點(diǎn)就是多少類(lèi)。它第一步先把最近的兩類(lèi)(點(diǎn))合并成一類(lèi),然后再把剩下的最近的兩類(lèi)合并成一類(lèi);這樣下去,每次都少一類(lèi),直到最后只有一大類(lèi)為止。顯然,越是后來(lái)合并的類(lèi),距離就越遠(yuǎn)。再對(duì)飲料例子來(lái)實(shí)施分層聚類(lèi)。第8頁(yè),共19頁(yè)。對(duì)于一個(gè)數(shù)據(jù),人們既可以對(duì)變量(指標(biāo))進(jìn)行分類(lèi)(相當(dāng)于對(duì)數(shù)據(jù)中的列分類(lèi)),也可以對(duì)觀測(cè)值(事件,樣品)來(lái)分類(lèi)(相當(dāng)于對(duì)數(shù)據(jù)中的行分類(lèi))。比如學(xué)生成績(jī)數(shù)據(jù)就可以對(duì)學(xué)生按照理科或文科成績(jī)(或者綜合考慮各科成績(jī))分類(lèi),當(dāng)然,并不一定事先假定有多少類(lèi),完全可以按照數(shù)據(jù)本身的規(guī)律來(lái)分類(lèi)。第9頁(yè),共19頁(yè)??焖倬垲?lèi)k-均值聚類(lèi)(k-meanscluster,也叫快速聚類(lèi),quickcluster)卻要求你先說(shuō)好要分多少類(lèi)??雌饋?lái)有些主觀假定你說(shuō)分3類(lèi),這個(gè)方法還進(jìn)一步要求你事先確定3個(gè)點(diǎn)為“聚類(lèi)種子”(SPSS軟件自動(dòng)為你選種子);也就是說(shuō),把這3個(gè)點(diǎn)作為三類(lèi)中每一類(lèi)的基石。然后,根據(jù)和這三個(gè)點(diǎn)的距離遠(yuǎn)近,把所有點(diǎn)分成三類(lèi)。再把這三類(lèi)的中心(均值)作為新的基石或種子(原來(lái)的“種子”就沒(méi)用了),重新按照距離分類(lèi)。如此疊代下去,直到達(dá)到停止疊代的要求.適合處理大樣本數(shù)據(jù)。第10頁(yè),共19頁(yè)。特點(diǎn)聚類(lèi)分析前所有個(gè)體所屬的類(lèi)別是未知的,類(lèi)別個(gè)數(shù)一般也是未知的,分析的依據(jù)只有原始數(shù)據(jù),可能事先沒(méi)有任何有關(guān)類(lèi)別的信息可參考嚴(yán)格地,聚類(lèi)分析并不是純粹的統(tǒng)計(jì)技術(shù),不象其他多元分析,需要從樣本去推斷總體一般不涉及統(tǒng)計(jì)量分布,也不需顯著性檢驗(yàn)聚類(lèi)分析更象是一種建立假設(shè)的方法,而對(duì)相關(guān)假設(shè)的檢驗(yàn)還需要借助其他統(tǒng)計(jì)方法第11頁(yè),共19頁(yè)。注意聚類(lèi)分析主要用于探索性研究,其分析結(jié)果可提供多個(gè)可能的解,最終解的選擇需要研究者的主觀判斷和后續(xù)分析聚類(lèi)分析的解完全依賴(lài)于研究者所選擇的聚類(lèi)變量,增加或刪除一些變量對(duì)最終解都可能產(chǎn)生實(shí)質(zhì)性的影響不管實(shí)際數(shù)據(jù)中是否存在不同的類(lèi)別,利用聚類(lèi)分析都能得到分成若干類(lèi)別的解第12頁(yè),共19頁(yè)。下面以對(duì)觀測(cè)值聚類(lèi)即Q型聚類(lèi)為例演示用spss進(jìn)行聚類(lèi)分析的具體步驟:對(duì)一個(gè)班的數(shù)學(xué)水平進(jìn)行聚類(lèi)第13頁(yè),共19頁(yè)。Q型聚類(lèi),對(duì)樣本也就是觀察個(gè)案的聚類(lèi)第14頁(yè),共19頁(yè)。單擊“方法”按鈕彈出對(duì)話框下拉框指定的是小類(lèi)之間的距離計(jì)算方法7種供用戶(hù)選擇第15頁(yè),共19頁(yè)。度量標(biāo)準(zhǔn)計(jì)算樣本距離的方法第16頁(yè),共19頁(yè)。點(diǎn)擊“繼續(xù)”接下來(lái)指定SPSS分析圖形輸出
屬性圖以
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 誰(shuí)有端午節(jié)龍舟賽活動(dòng)策劃方案
- 有關(guān)網(wǎng)絡(luò)營(yíng)銷(xiāo)推廣方案
- 2025年教師資格證《小學(xué)》(統(tǒng)考)考試題庫(kù)(附答案)
- 公司行政部門(mén)個(gè)人工作方案
- 幼兒園綜合活動(dòng)策劃方案
- 幼兒園安全防范工作方案計(jì)劃
- 市場(chǎng)基礎(chǔ)知識(shí)培訓(xùn)資料課件
- 第二十五章 概率初步 預(yù)習(xí)練(含解析)初中數(shù)學(xué)人教版九年級(jí)上冊(cè)
- PICC導(dǎo)管的留置與長(zhǎng)期護(hù)理
- 巫溪消防知識(shí)培訓(xùn)課件
- WST856-2025安全注射標(biāo)準(zhǔn)解讀
- 2025年國(guó)有企業(yè)管理崗競(jìng)聘筆考試試題庫(kù)及答案
- 醫(yī)美項(xiàng)目規(guī)劃方案(3篇)
- 2025年全國(guó)反詐騙知識(shí)競(jìng)賽試題含答案
- 2069-3-3101-002WKB產(chǎn)品判定準(zhǔn)則-外發(fā)
- 華西二院婦產(chǎn)科進(jìn)修總結(jié)
- fog-106單軸光纖陀螺儀技術(shù)協(xié)議
- 全國(guó)學(xué)校藝術(shù)教育總體規(guī)劃1989~2000年
- GB∕T 10715-2021 帶傳動(dòng) 多楔帶、聯(lián)組V帶及包括寬V帶、六角帶在內(nèi)的單根V帶 抗靜電帶的導(dǎo)電性:要求和試驗(yàn)方法
- 藥學(xué)英語(yǔ)詞匯匯總
- 吉利集團(tuán)績(jī)效管理創(chuàng)新與實(shí)踐
評(píng)論
0/150
提交評(píng)論