2025年SPSS期末復(fù)習(xí)筆記_第1頁
2025年SPSS期末復(fù)習(xí)筆記_第2頁
2025年SPSS期末復(fù)習(xí)筆記_第3頁
2025年SPSS期末復(fù)習(xí)筆記_第4頁
2025年SPSS期末復(fù)習(xí)筆記_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SPSS四種輸出成果:樞相表/輕量表、文本格式、記錄圖表、模型

SPSS四種窗口:語法窗口、輸出窗口、數(shù)據(jù)窗口、腳本窗口

SPSS三種運(yùn)行方式:命令行方式、批程序方式、菜單對話框

SPSS默認(rèn)文獻(xiàn)類型:

數(shù)據(jù)文獻(xiàn)*.sav:此為SPSS軟件默認(rèn)的數(shù)據(jù)文獻(xiàn)格式,雙擊可由SPSS直接讀取。

命令文獻(xiàn)*.spg:可在語法編輯程序(syntax)中先編寫或貼上欲執(zhí)行之分析指令,并將其存貯

起來,供后來反復(fù)使用或檢查之用。

輸出文獻(xiàn)*.spo:容許直接加以編輯或轉(zhuǎn)貼到其他編輯軟件,SPSS16.0版之后將輸出文獻(xiàn)的

默認(rèn)格式改為*.sp|。

數(shù)據(jù)文獻(xiàn)清洗一一多出反復(fù)的數(shù)據(jù)篩選清晰,將確實(shí)的數(shù)據(jù)補(bǔ)充完整,將錯誤的數(shù)據(jù)糾正或

刪除。數(shù)據(jù)一標(biāo)識反復(fù)個案標(biāo)識異常個案

問題的答案被稱作變量的取值。將答案轉(zhuǎn)變成可用手記錄分析的數(shù)據(jù),需要通過一種被稱作

“編碼coding”的過程。

數(shù)據(jù)陣/數(shù)據(jù)文獻(xiàn):n個案例、m個變量構(gòu)成的陣列

SPSS對數(shù)據(jù)的處理是以變量為基礎(chǔ)的。

因此,數(shù)據(jù)錄入前一定先定義變量及其屬性,包括指定名稱、(存儲)類型、寬度、小數(shù)、

標(biāo)簽、值、缺失、列(寬)、對齊、度量原則和角色。這也被稱作建立數(shù)據(jù)框架。

變量名必須以字母、中文或字符@開頭,數(shù)字不可以,其他字符可以是任何字母、數(shù)字或_、

@、#、$等符號。變最名中標(biāo)能有空白字符或其他特殊字符(如等)|。

變量名根終一種字符不能是英文句號(.)。

在SPSS中不辨別大小寫。例如,HXH、hxh或Hxh對SPSS而言,均被視為同一種變量。

SPSS的保留字不能作為變量的名稱,如ALL、AND、BY、EQ、GE、GT、LT、NE、NOT、OR、

TO、WITH等。

SPSS中變量有3種基本類型:數(shù)值型、字符型(辨別大小寫)和日期型“

但根據(jù)不一樣的顯示方式,數(shù)值型又被辨別成:數(shù)值、逗號、圓點(diǎn)、科學(xué)計(jì)數(shù)法、美元、(顧

客)設(shè)定貨幣等6個子類型。不過,只有數(shù)值(N)最為常用。

默認(rèn)狀態(tài)下,所有變量的類型均為數(shù)值型,且寬度是8位、小數(shù)位是2位。

對話框界面可修改寬度和小數(shù)位,然后“確定”,但寬度必須不小F小數(shù)位。

變量標(biāo)簽是對變量名的深入描述,可長達(dá)120個字符

SPSS有兩類缺失值:系統(tǒng)默認(rèn)缺失值和顧客定義缺失政,

對于數(shù)值型變量值,系統(tǒng)默認(rèn)缺失值為圓點(diǎn),而字符型變量值的系統(tǒng)默認(rèn)缺失值為空

字符串(什么也沒有)。

指定“列”實(shí)際上是設(shè)定變量的顯示寬度,默認(rèn)為8個字符的寬度。

記錄學(xué)中,按照對事物描述的精確程度,將度量原則從低到高辨別為4種類型:

定類尺度:&名義叫僅能測定類別差,不能比較大小,各類之間沒有次序和等級,只能計(jì)算

頻數(shù)頻率比例,可以使用數(shù)值型變量,也可以是字符型變量。要符合窮盡和互斥的原則。

定序尺度:d序號⑼可比較優(yōu)劣或排序,但數(shù)值不代表絕對數(shù)量大小,可以是數(shù)值型變量,

可以是字符型變量。可以計(jì)算頻數(shù)、頻率和合計(jì)頻率、合計(jì)頻數(shù)。

定距尺度:d崖畫S)不僅能辨別不一樣類型并排序,還能指出類別之間的差距是多少,最經(jīng)

典的是溫度。嚴(yán)格來說只能加減。具。值沒有物埋含義,沒的絕對的“0”點(diǎn),故不能做乘、

除運(yùn)算。

定比尺度:/度數(shù)對測算兩個測度值之間比值,與定距變量相比差異是有一種固定的絕對“零

點(diǎn)”。0在定距變量中僅是?種測量值,而定比變量真正表達(dá)沒有??梢约訙p乘除。Eg重

量、年齡

可以將高層次測量尺度的成果轉(zhuǎn)換為低層次測量尺度的測量成果,但不能把低層次的轉(zhuǎn)化為

高層次的。

半開放題的處理:指定變量時,可以使用兩個變量,第1個變量中,''其他”作為一種選項(xiàng);

第2個變量將“其他”中“請注明”的內(nèi)容作為一種單獨(dú)的開放題,而將沒有選擇“其他”

一項(xiàng)的案例在此變量上的取值作為系統(tǒng)缺失值。為使得變量名之間具有一定的邏輯聯(lián)絡(luò),可

以考慮將第二個變量的名稱設(shè)置為由第一種變量名稱后直接加“a”之類的字符。

多選題的處理:

①多重二分法:編碼時,將每一種選項(xiàng)定義成一種變量,有幾種選項(xiàng)就有幾種變量,且均以

取值等于1表達(dá)選了該項(xiàng)、以取值等于0表達(dá)未選該項(xiàng)。(原則處理方式)

②多重分類法:也是運(yùn)用多種變量來對一種多選題的答案進(jìn)行編碼。應(yīng)當(dāng)用多少個變尾,取

決于實(shí)際也許給出的最多答案的數(shù)目而定。這多種變量必須為數(shù)值型變量,所有變量采用同

一套取值標(biāo)簽。

Excel、txt的文獻(xiàn)讀取之后要保留為SPSS的文獻(xiàn)。插入終止線時,開始(即。歹U)處和結(jié)

尾(最終一列)處必須插入,否則會少變量

F4.0AlF是數(shù)值型A是字符串F4.0就是數(shù)值型寬度是4小數(shù)是0

什么是固定寬度的,什么是分隔符等分開的?

數(shù)據(jù)管理

轉(zhuǎn)換一變量級別的

一計(jì)算新變量:compute

(NT):不等于

l(or):或

?(NOD:非

一已經(jīng)有變量值的分組合并:recode(重新編碼為不一樣7相似變量)

將度量變量重新分組為序號變量,或者將序號變量、名義變量的不一樣取值加以歸類合并

“重新編碼為相似變量”:對既有變量直接進(jìn)行編碼,俁留該變量,只是根據(jù)設(shè)定的規(guī)則替

代掉本來的取值。

“重新編碼為不一樣變量”:根據(jù)既有變量的取值生成一種新變置來保留重新編碼的成果。

包括端點(diǎn)??!

一持續(xù)變量的離散化

假如想進(jìn)行的分組是比較有規(guī)律的,例如,等距分組,或等樣本量分組,可以使用SPSS提

供的“可視離散化”過程進(jìn)行分組。

SPSS提供了兩種可視離散化:需顧客自行判斷設(shè)定的沅視離散化和基本全自動的最優(yōu)離散

化。

提議生成分割點(diǎn)的時候先填第一種分割點(diǎn)的位置和個數(shù),然后自動生成寬度。

一變量的自動重編碼與數(shù)值移動

自動重編碼:自動按照原變量取值的大小或字符次序生成新變量,而新變量的值就是原變量

值大小的序號或先后序次。

個案排秩:變量的排秩實(shí)際上就是根據(jù)某個變量的取值大小來對個案排次序,同步將得到的

排序成果保留到一種新變量中。雖然效果同樣都是基于某個變量對個案進(jìn)行排序,但“個案

排秩”過程比“自動重新編碼”過程更為靈活。結(jié):碰到相似取值怎樣給序號值

默認(rèn)為最常用的秩:新變量的值等于原變量取值的序號

成績均值低高唯一值

901111

893一4■

893242

893242

875553

846664

數(shù)值型上溶中,一種X式是以算蟠”過程運(yùn)用Lag()函數(shù)、Lead”函數(shù)來

實(shí)現(xiàn)lag函數(shù)是返回之前的,取前面的數(shù)(滯后),在朵項(xiàng)里面;lead函數(shù)是返回背面的,

取背面的數(shù)(提前)|,不過計(jì)算變量里面沒有l(wèi)ead函數(shù)了

轉(zhuǎn)換一轉(zhuǎn)換值

—“轉(zhuǎn)換”菜單中的其他功能

“對個案內(nèi)的值計(jì)數(shù)”過程用于標(biāo)識某個變量中與否出現(xiàn)了某個值或某個范圍的值,也可以

計(jì)算一組變量中出現(xiàn)特定取值的變量個數(shù)。

數(shù)據(jù)一文獻(xiàn)級別的

一排序個案

顧客所指定的變量被稱作排序變量

排序個案vs個案排秩區(qū)別:與否產(chǎn)生新變量;個案相對位置與否變動。

一拆分文獻(xiàn)可以和選捧個案到達(dá)同樣的目的

按照不一樣組分別匯總記錄成果”按組組織輸出”

拆分文獻(xiàn)一旦設(shè)出,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,并且會被

另存在數(shù)據(jù)集里。

一選擇個案(篩選)

除了拆分文獻(xiàn)的功能,尚有并不想對所有個案進(jìn)行分析,而只是想對其中的一部分進(jìn)行分析,

這也需要用到“選擇個案”過程。

過濾掉未選中個案:默認(rèn)未選中個案不包括在分析中,但保留在數(shù)據(jù)中;并在數(shù)據(jù)文獻(xiàn)中生

成名為的變量加以標(biāo)識,取值1表達(dá)被選中,。表達(dá)未被選中;數(shù)據(jù)視圖最左端未

被選中個案處會標(biāo)以反斜杠。

選擇個案一旦設(shè)定,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,并且會被

另存在數(shù)據(jù)集里。

隨機(jī)個案樣本精確背面的兩個框框:

第一種框表達(dá)樣本的容量,

第二個框表達(dá)樣本的范圍,也就是從第一種個案開始到第多少個個案

老師隨機(jī)抽選同學(xué)回答問題就是這樣做的。

一加權(quán)個案

給不一樣個案賦以不一樣的權(quán)重,以變化個案在記錄分析中的重要性。一般兩種狀況下會用

到這一過程:以頻數(shù)形式錄入的數(shù)據(jù);不等概率樣本數(shù)據(jù)。

加權(quán)個案一旦設(shè)定,除非另行取消,否則將在后續(xù)的數(shù)據(jù)處理和分析中一直有效,并且會被

另存在數(shù)據(jù)集里。(同樣的尚有選擇個案和拆分文獻(xiàn)〉

一分類匯總

按指定的分類變量對個案進(jìn)行分組,并按分組對變顯求指定的描述性記錄最,成果可以另存

為新數(shù)據(jù)文獻(xiàn),也可以直接(生成新變量)添加到目前數(shù)據(jù)文獻(xiàn)。

個案數(shù):定義一種新變量,其取值等于每一分組下的個案數(shù)目

上方、下方都是開區(qū)間

內(nèi)部:取值不小于等于a且不不小于等于b

外部:取值不不小于a或不小于b

分類匯總與拆分文獻(xiàn)兩個過程有何異同:

分類匯總還對變量做了描述性記錄,而拆分文獻(xiàn)只是對變量做了分類匯總,對變量進(jìn)行描述

還需要深入的操作。

一數(shù)據(jù)文獻(xiàn)的重組(指的是長、寬格式之間的轉(zhuǎn)換)

數(shù)據(jù)錄入的默認(rèn)格式每一案例占一行、每一變量占一列。這種數(shù)據(jù)被稱作寬格式數(shù)據(jù)

某些特殊狀況卜,例如反復(fù)測量數(shù)據(jù),進(jìn)行分析時需要采用長格式數(shù)據(jù),即:按照每一觀測

(observation)占一行、同一種案占多行的格式排列的數(shù)據(jù)。(標(biāo)識符變量、索引變量)

①長一寬將選定個案重組為變量

轉(zhuǎn)換后原文獻(xiàn)中的數(shù)據(jù)被直接替代,但文獻(xiàn)名沒有變。

②寬一長將選定變量重組為個案

一數(shù)據(jù)文獻(xiàn)的合并

①縱向拼接/垂直合并添加的是個案

②橫向合并/水平合并添加的是變量

若使用關(guān)鍵變量(指定橫向合并時按照什么樣的規(guī)則進(jìn)行對應(yīng))進(jìn)行橫向合并,則各數(shù)據(jù)文

獻(xiàn)都必須事先按照關(guān)鍵變量取值進(jìn)行升序排列,否則會出錯。為便于以SPSS進(jìn)行橫向合并,

各數(shù)據(jù)文獻(xiàn)中,表達(dá)不一樣含義的變量盡量采用不一樣的變量名稱。

單變量描述記錄:

集中趨勢測量(中心性、中心測量)一眾數(shù)(合用于任何測量等級的變量:名義、序號和

尺度變量)

中位數(shù)(只合用于序號、尺度變量,而不合用于名義

變量,序號變量要還原到數(shù)字本來代表的意思,有二分之一的被調(diào)查對象的…在…如下/上)

均值(均值是數(shù)據(jù)分布的平衡點(diǎn)。只合用于尺度變量,

而不合用于名義、序號變量。此外,均值對變量的取值大小很敏感,故,對于存在極端值的

情形,均值不適宜用作反應(yīng)變量分布集中趨勢的指標(biāo),更好的選擇是中位數(shù)。)

左偏(負(fù)偏態(tài)):均值〈中位數(shù)《眾數(shù)

右偏(正偏態(tài)):眾數(shù)〈中位數(shù)〈均值(平均數(shù)受偏高數(shù)值影響較大)

若要分析不一樣都市的中位數(shù)等的成果,可以先拆分文就再進(jìn)行分析

離散趨勢測量(尺度記錄量)一方差(總體:樣本:'一"1單位是變

量原始測量單位的平方樣本方差,也被稱作樣本修正方差,它是總體方差的無偏估計(jì)。這

也是為何需要在計(jì)算樣本方差時除以n-1的原因)、原則差、異眾比例(I-眾數(shù)組所占比例)、

范圍(全距/極差)

分布形狀測量一峰態(tài)(峰點(diǎn)陡緩程度通過計(jì)算峰度kurtosis系數(shù)來測量,多峰分布往往意味

著群體內(nèi)部存在分化)

偏態(tài)(分布與否對稱通過計(jì)算偏度skewness系數(shù)來測量,SK是無量綱的量,

取值一般在-3到+3之間,其絕對值越大,表明偏斜程度越大。當(dāng)分布呈右偏態(tài)時,SKX),

故也稱正偏態(tài);當(dāng)分布為左偏態(tài)時,SK<0,故也稱負(fù)偏態(tài)。)

峰度峰度系數(shù)

窄峰

>0

態(tài)峰0

闊峰

:0

記錄學(xué)=描述記錄+推斷記錄(參數(shù)檢查&非參數(shù)檢查)

推斷記錄:參數(shù)估計(jì)+假設(shè)檢查(由樣本來認(rèn)識總體H勺兩種方式)

參數(shù)估計(jì)=點(diǎn)估計(jì)+區(qū)間估計(jì)

描述記錄的目的在于:簡叱或概括數(shù)據(jù)(信息)。采用何種描述記錄工具取決于變量的測量

水平。

數(shù)據(jù)分析的兩個任務(wù):描述樣本推斷總體

判斷與否正態(tài)(尺度變量):

措施一:通過考察偏度和峰度系數(shù)

措施二:通過考察正態(tài)P-P圖

措施三:通過正態(tài)性非參數(shù)檢查(分析一非參數(shù)檢查一單樣本“使用定制字段分派”)

除了考察變量取值分布的集中趨勢、離散趨勢、分布形狀之外,還可以考察某些位置記錄量,

如:四分位數(shù)、百分位數(shù)等

對于尺度變量的描述記錄,可以采用分析一描述記錄一頻率過程,也可以采用分析

一描述記錄—描述過程,還可以用分析-描述記錄一探索過程

IQR:四分位距=第三四分位數(shù)-第一四分位數(shù)中間50%案例的取值范圍,反應(yīng)取值分布的

離散程度

樣本均值的原則誤SE=%

原則誤:抽樣分布(若反復(fù)抽樣規(guī)模為n=N的樣本,將所有也許樣木均窮盡,每一種樣本記

錄量(如均值)的值便構(gòu)成了一種新的分布,叫做抽樣分布)的原則差

單總體均值(比例是特殊的均值)的假設(shè)檢查:t檢查

<Jy(J!yjnS/

分析一比較均值一單樣本T檢查

結(jié)論舉例:由于95%置信區(qū)間并未包括。值,故應(yīng)拒絕零假設(shè)。并無足夠證據(jù)支持平均收入

為0美元的說法,故應(yīng)認(rèn)為收入不等于0美元。

二總體均值差異的假設(shè)檢查

分析一比較均值一獨(dú)立樣本T檢查

小樣本,總體方差未知,兩個方差不等,非參數(shù)檢查。

小樣本,總體方差未知,但已知兩個方差相等:T檢查

大樣本同樣可以用T檢查,由于n增大時,t與Z不停迫近,且更保守。

八(曰二("/)7()

平+工

兩獨(dú)立樣本t檢查的零假設(shè)為:兩總體均值之間不存在明顯差異,即ul-從2=0

詳細(xì)分兩步來完畢:

第一,運(yùn)用F檢查判斷兩總體的方差與否相似【此為進(jìn)行均值差檢查的前提條件】

第二,根據(jù)第一步選擇t記錄量和自由度計(jì)算公式,進(jìn)而對T檢查的結(jié)論作出判斷。

結(jié)論舉例:表明男性和女中的收入存在記錄上明顯的差異?!庇涗浬厦黠@”的含義:基于樣

本觀測到的男性和女性之間收入的差異并非是由隨機(jī)抽樣導(dǎo)致的,而是總體中兩性間收入確

實(shí)存在著差異。

①獨(dú)樣本

②配對樣本

針對同同樣本搜集接受“處置”前后兩個時點(diǎn)上的數(shù)據(jù)。注意,這與前面兩個獨(dú)立樣本時狀

況不一樣,這時屬于配對樣本研究。(配對樣本T檢查)

將差值作為新的記錄量(兩次觀測來自正態(tài)總體,不規(guī)定方差相等),檢查差值與否為0。

表明起始薪水與付前薪水具有記錄上明顯的差異。

比例的話編碼應(yīng)當(dāng)編成0和1,例如均值想表達(dá)男性比例,男性就是1;均值想表達(dá)女性比

例,女性就是1。

多總體均值差異的假設(shè)檢查:F檢查方差分析(AN0VA)是對T檢查的一般化

原因(factor):要檢查的對象水平:原因的詳細(xì)體現(xiàn)

線性回歸是方差分析的一般化,方差分析是T檢查的一股化

置信度小,會增大假設(shè)檢查中犯I類錯誤(棄真錯誤)的風(fēng)險

置信水平/置信度/置信系數(shù)95%99%90%求置信區(qū)間:探索或者單樣本t檢查

置信區(qū)間的含義:一般來說,95%置信區(qū)間的意思是我們估計(jì)的目的參數(shù)有95%的也許性落

入某區(qū)間。而老式的記錄和貝葉斯學(xué)派對置信區(qū)間的解釋是有區(qū)別的。前者的95席置信區(qū)間

精確的解釋應(yīng)當(dāng)是反復(fù)抽樣100次,大概有95次所估計(jì)的參數(shù)會落入該區(qū)間。而后者對置

信區(qū)間的解釋更靠近于我們一般的理解。即有95%的也許落入該區(qū)間。

假設(shè)檢查所根據(jù)就是小概率原理(記錄上),只是把小概率a的原則定得更為詳細(xì)和數(shù)量化

而已,例如0.05、0.01等。邏輯.上根據(jù)的是反證法。

可以將第一類錯誤記為“錯殺好人”,把第二類錯誤記為“放走壞人”

方差齊性是方差分析AN0VA措施的基本假定之一

方差分析成果往往意味著:不一樣組別群體與否來自同一種更大規(guī)模的(正態(tài))總體

應(yīng)用方差分析,因滿足如下假定條件:

被檢查變量(因變量)為尺度變量

樣本通過隨機(jī)抽樣得到(獨(dú)立性)

尺度變量在分類變量各類別上服從正態(tài)分布(正態(tài)性)

尺度變量在分類變量各類別上具有相似方差(方差齊性)(假如不齊,如存在展現(xiàn)出更大

變異(方差更大)的大規(guī)模組,則組內(nèi)變異(WSS)會被夸張后果:犯【類錯誤也許性變

大)

方差齊性的假設(shè)H0:一:地indcxl的方差相等111:三地indoxl的方差不完全相等

方差分析的假設(shè)H0:三地的均值相等H1:三地均值不一樣或不完全相似

原假設(shè)是想反對的

Sig.=0.139>0.05,故接受零假設(shè),即三地居民在消物信心上不存在明顯的差異。

單側(cè)檢查:

備擇假設(shè)〃<a是左側(cè)檢套計(jì)算出雙側(cè)sig值之后除以2,再和0.05比較

備擇假設(shè)〃)a是右側(cè)檢直計(jì)算出雙側(cè)sig值之后除以2,再拿1減去這個數(shù),再和0.05

比較

左側(cè)檢查就是拒絕域在左邊

誤差二隨機(jī)誤差(原因的同一水平下各觀測值之間的差異)+系統(tǒng)誤差(原因的不一樣水平下

各觀測值之間的差異)

組內(nèi)方差只包括隨機(jī)誤差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差

SST=SSE+SSA

MSA

~MSE

交叉表與卡方檢查針對分類變量(包括名義和序號)之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論