第10章-多維標度分析_第1頁
第10章-多維標度分析_第2頁
第10章-多維標度分析_第3頁
第10章-多維標度分析_第4頁
第10章-多維標度分析_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

主編:費宇中國人民大學出版社2023/2/3主編:費宇1第10章多維標度分析10.1

多維標度法的基本思想10.2

古典多維標度法多維標度法的幾個基本概念;

已知距離矩陣時CMDS解;

已知相似系數(shù)矩陣時CMDS解;10.3

非度量多維標度法10.4案例分析與R實現(xiàn)2023/2/3主編:費宇2第10章多維標度分析2023/2/3主編:費宇310.1

多維標度法的基本思想多維標度法:是用低維空間

Rk(k<p)中的n個點去重新標度和展示高維空間Rp中n個點(的某種距離或某種相似性),將高維空間中的研究對象(樣本或變量)簡化到低維空間中進行定位、歸類和分析且有效保留研究對象間原始關系的多元數(shù)據分析技術的總稱.是一種維數(shù)縮減方法,主要思想是在降維的同時讓新得到的n個點與原來的n個點保持較高的相似度(如位置關系、距離、類別等).2023/2/3主編:費宇4多維標度法起源于上世紀40年代的心理測度.1958年Torgerson正式提出了這一方法.目前應用廣泛,內容豐富,方法較多.主要分為兩類:度量分析法,非度量分析法.它與主成分分析有相通之處:

共同點:均先降維,再做簡明有效的分析;

不同點:主成分法按包含信息大小選取主成

分;多維標度法按標度前后距離陣

盡量接近或相似來構造擬合點.10.2

古典多維標度分析2023/2/3主編:費宇5例10.1在地圖上重新標度我國八個城市,使得它們之間的距離盡量接近于表10.1中的距離.

北京天津濟南青島鄭州上海杭州南京北京0

天津1180

濟南4393630

青島6685713620

鄭州7147294437720

上海125911458867769840

杭州132811918728289622030

南京1065936626617710322305010.2.1

多維標度法的幾個基本概念2023/2/3主編:費宇6古典多維標度(CMDS)解的定義對于距離陣,多維標度法的目的是要尋找較小的k和Rk中的n個點,記,表示xi與xj在Rk中的歐氏距離,使得與在某種意義下盡量接近,記稱為的一個古典多維標度(CMDS)解,稱xi為的一個擬合構造點,稱為的擬合構圖,稱為的擬合距離陣.2023/2/3主編:費宇7特別,當時,稱xi為的一個構造點,稱為的構圖,注意的構圖不唯一.2023/2/3主編:費宇8幾個相關矩陣構造:2023/2/3主編:費宇9

距離陣為歐氏距離陣的充要條件:從歐氏距離陣D出發(fā)得到構圖

X的步驟:見下面例10.2.2023/2/3主編:費宇10例10.2

由D求

X的過程示例2023/2/3主編:費宇11例10.2(續(xù))

由D求

X的過程示例2023/2/3主編:費宇1210.2.2

已知距離矩陣時CMDS解上面求解CMDS解的實現(xiàn)過程,可使用stats包中的cmdscale函數(shù);也可使用MASS包中isoMDS函數(shù).

例10.3對表10.1給出的我國八個城市間的距離矩陣D,利用R軟件stats包中的cmdscale函數(shù)求

的CMDS解,給出擬合構圖

及擬合構造點.2023/2/3主編:費宇13例10.3(續(xù))#打開數(shù)據文件eg10.3.xls,選取C2:K10后復制>eg10.3=read.table("clipboard",header=T)#讀入數(shù)據>D10.3=cmdscale(eg10.3,k=2,eig=T);D10.3#k取為2,并給出B的前兩個特征向量和所有特征值>sum(abs(D10.3$eig[1:2]))/sum(abs(D10.3$eig))#j算a1.2>sum((D10.3$eig[1:2])^2)/sum((D10.3$eig)^2)#算a2.2>x=D10.3$points[,1];y=D10.3$points[,2]>plot(x,y,xlim=c(-700,800),ylim=c(-300,600))#根據兩個特征向量的分量大小繪散點圖>text(x,y,labels=s(eg10.3),adj=c(0,-0.5),cex=0.8)#將擬合點用行名標出2023/2/3主編:費宇14圖10.1我國八城市距離陣的擬合構圖:2023/2/3主編:費宇152023/2/3主編:費宇1610.2.3

已知相似系數(shù)陣陣時CMDS解2023/2/3主編:費宇17例10.4

六門課程之間的相關系數(shù)矩陣C(它也為相似系數(shù)矩陣),求C的CMDS解,并給出擬合構圖

及擬合構造點.2023/2/3主編:費宇18

2023/2/3主編:費宇19例10.4(續(xù))#打開數(shù)據文件eg10.4.xls,選取A10:G16,然后復制>eg10.4=read.table("clipboard",header=T)#讀入數(shù)據>D10.4=cmdscale(eg10.4,k=2,eig=T);D10.4>sum(abs(D10.4$eig[1:2]))/sum(abs(D10.4$eig))#算a1.2>sum((D10.4$eig[1:2])^2)/sum((D10.4$eig)^2)#算a2.2>x=D10.4$points[,1]>y=D10.4$points[,2]>plot(x,y,xlim=c(-0.6,0.8),ylim=c(-0.6,0.7))#繪擬合圖>text(x,y,labels=s(eg10.4),adj=c(0,-1),cex=0.8)可看出:算術、代數(shù)、幾何較為接近,英語和蓋爾語較為相近,而歷史課程與其他課程的差異較大2023/2/3主編:費宇202023/2/3主編:費宇2110.4案例分析與R實現(xiàn)案例10.1表10.5給出了2010年我國31個省市自治區(qū)農村居民家庭人均生活消費支出的統(tǒng)計數(shù)據.一共選取八個指標:x1為食品消費;x2為衣著消費;x3為居住消費;x4為家庭設備用品及服務;x5為交通通訊;x6為文教娛樂用品及服務;x7為醫(yī)療保?。粁8為其他商品和服務支出.試用多維標度法對其進行統(tǒng)計分析,并對分析結果的實際意義進行解釋.2023/2/3主編:費宇22案例10.1(續(xù))本案例我們采用MASS包中的isoMDS函數(shù)來實現(xiàn)#打開數(shù)據文件case10.1.xls,選取區(qū)域A2:I33,然后復制>case10.1<-read.table("clipboard",header=T)#讀入數(shù)據>D1=as.matrix(case10.1)#需要將數(shù)據轉換成矩陣形式>D=dist(D1)#求距離陣>library(MASS)#載入MASS包,使用isoMDS函數(shù)>fit=isoMDS(D,k=2);fit>x=fit$points[,1];>y=fit$points[,2]>plot(x,y)#畫散點圖>text(x,y,labels=s(case10.1),adj=c(0.5,1.5),cex=0.7)#設置標簽位置大小>abline(h=0,v=0,lty=3)#采用虛線劃分四個象限2023/2/3主編:費宇232023/2/3主編:費宇24從圖10.3可以比較直觀地看出,在總支出方面,上海、北京、廣東、浙江、江蘇、天津、福建等沿海地區(qū),是我國傳統(tǒng)的經濟發(fā)達地帶,又是改革開放的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論