




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人事測評的質(zhì)量評價1可編輯ppt人事測評的質(zhì)量評價1可編輯ppt一、誤差2可編輯ppt一、誤差2可編輯ppt(一)誤差的含義兩層含義:其一,誤差是由與測量目的無關(guān)的變因引起的;其二,誤差是不準(zhǔn)確或不一致的測量結(jié)果。3可編輯ppt(一)誤差的含義兩層含義:3可編輯ppt一種是隨機(jī)誤差,又叫可變誤差,這是由與測量目的無關(guān)的偶然因素引起而不易控制的誤差,它使多次測量產(chǎn)生不一致的結(jié)果。這類誤差的方向和大小的變化完全是隨機(jī)的,無規(guī)律可循。(二)誤差的主要表現(xiàn)形式另一種是系統(tǒng)誤差,又稱常定誤差,這是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng),穩(wěn)定地存在于每一次測量中,此時雖然測值一致,但不正確??梢?,系統(tǒng)誤差只影響測值的準(zhǔn)確性,而隨機(jī)誤差既影響準(zhǔn)確性又影響一致性。4可編輯ppt一種是隨機(jī)誤差,又叫可變誤差,這是由與測量目的無關(guān)的偶然因素(三)人事測評的誤差類型第一類是來源于人事測評工具本身的誤差;第二類是來源于測評實(shí)施過程的誤差;第三類是來源于測評實(shí)施者的誤差;第四類是來源于應(yīng)試者的誤差。5可編輯ppt(三)人事測評的誤差類型第一類是來源于人事測評工具本身的誤差1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越科學(xué),則誤差越??;反之則誤差越大。人事測評不像物理、化學(xué)測量,人的才能、個性、品德等許多特性都是無法直接測量的,而且人事測評常常有主觀的因素。因此,人事測評工具和方法造成的誤差比物理化學(xué)測量要大得多。6可編輯ppt1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越測評工具和方法造成誤差的因素(1)測評工具所測評的行為和特性與目標(biāo)上所欲測評的行為和特性之間的不一致。比如,測評情緒穩(wěn)定性的所有測評題目都應(yīng)該只測評情緒穩(wěn)定性,而實(shí)際上,有的題目還測了情緒穩(wěn)定性以外的特性,這些特性就成了干擾因素,是測評誤差的來源。7可編輯ppt測評工具和方法造成誤差的因素(1)測評工具所測評的行為和特性(2)測評指標(biāo)和測題抽樣的代表性一般來說,測評指標(biāo)、測題越多,則代表性越好,誤差也就越少。因?yàn)榻?jīng)濟(jì)、可行性等原因,不可能把所有與測評目的有關(guān)的所有指標(biāo)都作為測評的指標(biāo),也不可能把所有相關(guān)的全部測題都選作測試題目,只能選有代表性的指標(biāo)、有代表性的測題樣本用來作測評之用。測題的內(nèi)容和難度分布是測題代表性的重要指標(biāo)。8可編輯ppt(2)測評指標(biāo)和測題抽樣的代表性一般來說,測評指標(biāo)、測題越多(3)測題的格式和用詞、測評程序等因素有的題目格式(如是非題)具有可猜測性;有的題目格式(所有的主觀題)其評分具有主觀性;測題的用詞有歧義或用詞不是很準(zhǔn)確這些都是引起測評誤差的來源。9可編輯ppt(3)測題的格式和用詞、測評程序等因素有的題目格式(如是非題2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用,測評實(shí)施已經(jīng)越來越標(biāo)準(zhǔn)化,有測評實(shí)施造成的誤差也越來越少。但是,測評的具體實(shí)施過程中還是會有許多不可預(yù)期的偶然因素。10可編輯ppt2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用,不可預(yù)期的偶然因素種類(1)環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、噪音、照明、突然斷電等因素,都可以產(chǎn)生誤差。(2)測評紀(jì)律的控制不好。測評紀(jì)律控制不嚴(yán)格,出現(xiàn)有人作弊(如代考、抄襲、相互交流等)、泄露測評題目等,也會造成測評誤差。(3)錯誤操作。誤讀指導(dǎo)語、對指導(dǎo)語錯誤理解、誤答(如自己答的答案是A,卻選了C)、記錄錯誤、記分錯誤等因素。11可編輯ppt不可預(yù)期的偶然因素種類(1)環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、3、被測評者因素被測評者因素被測評者是活生生的人,人是非常復(fù)雜的,諸多生理、心理因素都可以成為干擾人事測評目的的因素??蓪?dǎo)致人事測評誤差的被測評者因素大致有:(1)生理因素。身體健康因素、饑餓與過飽、疲勞程度、生理周期等都可以影響人格測試的結(jié)果。12可編輯ppt3、被測評者因素被測評者因素被測評者是活生生的人,人是非常復(fù)(2)動機(jī)水平每個被測評者都有參加測評的目的,這個目的可以導(dǎo)致被測評者故意掩飾自己,采取裝好或裝壞的傾向性回答,其結(jié)果就不能反映出被測評者的真實(shí)情況。不同的被測評者其動機(jī)水平不一樣,因而掩飾程度也會有所不同。13可編輯ppt(2)動機(jī)水平13可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài),動機(jī)過分強(qiáng)烈會引起被測評者產(chǎn)生測評焦慮,而動機(jī)不足則會引起被測評者對測評采取敷衍了事的態(tài)度,。在人格、態(tài)度、動機(jī)等測評中,被測評者的動機(jī)水平常常會是測評被測評者因素產(chǎn)生誤差的最重要的因素。14可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài),動機(jī)過分強(qiáng)烈會(3)受教育程度、價值觀等文化因素。被測評者受教育程度不同,其成長的文化背景不同,價值觀不同,會造成被測評者對測題的理解、答題態(tài)度、答題偏好等的不同,從而造成測評誤差。15可編輯ppt(3)受教育程度、價值觀等文化因素。被測評者受教育程度不同,(4)有關(guān)經(jīng)驗(yàn)。如果在測評之前,被測評者已經(jīng)具有與測評有關(guān)的經(jīng)驗(yàn),比如已經(jīng)經(jīng)歷過類似的或同一類型的測試從而掌握了有關(guān)的答題策略,就可能對測評結(jié)果產(chǎn)生較大的影響。有人曾做過試驗(yàn),讓5名熟悉、已知其智力水平的學(xué)生進(jìn)行知覺和圖形推理的大量練習(xí),然后再進(jìn)行瑞文圖形智力測試,結(jié)果測得的結(jié)果比他們的實(shí)際智力高出不少。16可編輯ppt(4)有關(guān)經(jīng)驗(yàn)。如果在測評之前,被測評者已經(jīng)具有與測評有關(guān)的4、主試因素主試以貌取人、對被測評者有偏見,可以造成測評誤差。主試不良的言行舉止對被試的心理狀態(tài)干擾、暗示、誤導(dǎo),可以造成誤差。主試評分的標(biāo)準(zhǔn)不一致,先緊后松、先松后緊、忽高忽低,或有意無意地修改評分標(biāo)準(zhǔn),對某些人特別照顧,都可以引起誤差。17可編輯ppt4、主試因素主試以貌取人、對被測評者有偏見,可以造成測評誤差總結(jié)測評的誤差一般可以被分為兩大類:隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由偶然因素造成的,其產(chǎn)生是隨機(jī)的、無規(guī)律的,因此其數(shù)值大小也是隨機(jī)變化、不確定的。它是引起測評不一致的變因,與測評信度有關(guān)。18可編輯ppt總結(jié)測評的誤差一般可以被分為兩大類:隨機(jī)誤差和系統(tǒng)誤差。18系統(tǒng)誤差,又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引起的一種恒定的、系統(tǒng)的變化,其數(shù)值大小具有一定的規(guī)律性和穩(wěn)定性。它與測評的效度有關(guān)。習(xí)慣上,把隨機(jī)誤差稱為觀察誤差或測評誤差。從這個意義上講,測評誤差這個概念所指誤差只是測評分?jǐn)?shù)所包含的誤差(隨機(jī)誤差和系統(tǒng)誤差)的一部分(即隨機(jī)誤差)。19可編輯ppt系統(tǒng)誤差,又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引二、信度分析20可編輯ppt二、信度分析20可編輯ppt(一)信度的基本概念信度又叫可靠性程度,用于分析一種測評方法所得結(jié)果的前后一致性水平,并以這種一致性程度為指標(biāo)來判斷測評的可靠性。測驗(yàn)結(jié)果的可靠性與測驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。在人才測評中誤差是不可避免的,只能盡可能追求高的精度,把誤差控制在一個有規(guī)律的范圍以內(nèi),這樣測量得到的結(jié)果才比較穩(wěn)定可靠。信度實(shí)際上就是隨機(jī)誤差的一種度量。21可編輯ppt(一)信度的基本概念信度又叫可靠性程度,用于分析一種測評方法(二)信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。信度系數(shù)是同一樣本在兩種不同時間、不同情境條件或兩組不同評價材料評定結(jié)果之間的相關(guān)系數(shù)。針對不同的誤差來源,信度可有不同的確定方法。一般有以下幾種類型:重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度。22可編輯ppt(二)信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。221.重測信度重測信度又稱為穩(wěn)定性系數(shù),它是估計(jì)測評跨時間的一致性程度,即用同一測驗(yàn),在兩個不同時間里對同一群體施測兩次,這兩次測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)就是重測系數(shù)。一個測驗(yàn)的重測系數(shù)越高,說明測評的穩(wěn)定性越好,測評受隨機(jī)因素的影響越小。23可編輯ppt1.重測信度重測信度又稱為穩(wěn)定性系數(shù),它是估計(jì)測評跨時間的一在獲得重測系數(shù)時,最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控制合理的時間間隔。時間間隔長了,被試的心理特征就會因?yàn)閷W(xué)習(xí)、經(jīng)歷、教育培訓(xùn)等因素而發(fā)展變化,使相關(guān)系數(shù)降低;時間間隔短了,又會使首次測評時的練習(xí)效果和記憶效果的影響增大,從而造成了假性的高相關(guān)。24可編輯ppt在獲得重測系數(shù)時,最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差等各方面與原測評一樣的測評,即功能等值但題目內(nèi)容不同。兩個等值的測驗(yàn)互為復(fù)本。復(fù)本信度又稱為等值性系數(shù),它是代表測評跨形式的一致性,即在對被試進(jìn)行測評以后間隔一定的時間,運(yùn)用復(fù)本再測評一次所獲得的復(fù)本相關(guān)系數(shù)。復(fù)本信度的高低反映了兩個測驗(yàn)復(fù)本在內(nèi)容上的等值性程度。25可編輯ppt2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差復(fù)本信度的優(yōu)點(diǎn):適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)成績影響,同時減少了輔導(dǎo)或作弊的可能性。當(dāng)然,復(fù)本相關(guān)系數(shù)也有局限性:一方面,在現(xiàn)實(shí)中,編制理想的復(fù)本常常很難,有許多測評都沒有復(fù)本。另一方面,復(fù)本測評也會受練習(xí)的影響。26可編輯ppt復(fù)本信度的優(yōu)點(diǎn):適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù),都需測評兩次,不但要花較多的精力,而且受測者會受練習(xí)的影響使第二次測評失真。內(nèi)部一致性系數(shù)則不同,它只需要測評一次,它通過分析同一測評內(nèi)部各測評項(xiàng)目之間的相關(guān)系數(shù)的方法來估計(jì)信度系數(shù)。27可編輯ppt3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù),都需測評兩次內(nèi)部一致性系數(shù)反映的是跨測題的一致性,即測評內(nèi)部各部分之間是否具有同質(zhì)性。內(nèi)部一致性信度又分為分半信度、同質(zhì)性信度和α系數(shù)。28可編輯ppt內(nèi)部一致性系數(shù)反映的是跨測題的一致性,即測評內(nèi)部各部分之間是(1)分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,再求出這兩個分?jǐn)?shù)的相關(guān)系數(shù),從而來估計(jì)整個測評的信度。因?yàn)榉职胂禂?shù)只是根據(jù)原測題的一半題目而來,而信度的大小又與測驗(yàn)的長度有關(guān),所以分半系數(shù)常常要比原測驗(yàn)的信度低。29可編輯ppt(1)分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為為了校正這個差異,常運(yùn)用斯皮爾曼-布朗公式:
rxx=2rhh/(1+rhh)
其中,rhh:兩半測驗(yàn)的相關(guān)系數(shù);rxx:估計(jì)或修正后的信度。30可編輯ppt為了校正這個差異,常運(yùn)用斯皮爾曼-布朗公式:30可編輯ppt(2)同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半,它是指測驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。所謂的同質(zhì)性是指所有的測驗(yàn)題目測量的只是單一的特質(zhì)或內(nèi)容,表現(xiàn)為所有測驗(yàn)題目得分的一致性。常用的計(jì)算方法是庫德-理查遜估計(jì)方法。計(jì)算公式有庫德-理查遜20號公式(簡稱KR20)和21號公式(KR21)。31可編輯ppt(2)同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半,它是指測驗(yàn)內(nèi)KR20公式n為測驗(yàn)題目數(shù),pi為通過i題的人數(shù)比例;qi為未通過該題的人數(shù)比例;pi+qi=1;∑piqi為所有題目答對與答錯人數(shù)百分比乘積的總和。庫德-理查遜信度系數(shù)的運(yùn)用需要滿足幾個條件:所有測題都采用二分法記分,即都采用0,1記分,答對記1分,答錯記0分;測驗(yàn)的項(xiàng)目難度比較接近;項(xiàng)目間的組間相關(guān)相等。32可編輯pptKR20公式n為測驗(yàn)題目數(shù),pi為通過i題的人數(shù)比例;qi為(3)α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分(如人格測驗(yàn)、態(tài)度量表),庫德-理查遜信度就無法運(yùn)用。克倫巴赫提出了適用于各種記分情況的α系數(shù)來估計(jì)信度。具體公式如下:其中,Si為每一項(xiàng)目的方差;Sx為測驗(yàn)總分方差。33可編輯ppt(3)α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分(如人格測驗(yàn)、態(tài)度量表),4、評分者信度在人事測評中,不同的評分者其觀察角度、注意力、對被試的偏見等都會使評分的結(jié)果不一致,因此,評分者的評判也是誤差的來源之一。評分者信度就是指不同評分者對同樣對象進(jìn)行評定的一致性。具體方法是:由兩名評分者對同一個被試樣組進(jìn)行評分,再求兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級相關(guān)方法。34可編輯ppt4、評分者信度在人事測評中,不同的評分者其觀察角度、注意力、如果評分者在三人以上,而且又采用等級記分時,就要用肯德爾和諧系數(shù)來求評分者信度。公式為:其中,K為評分者人數(shù),N為被評定的人數(shù)或答卷數(shù);Ri為每一個對象被評等級。35可編輯ppt如果評分者在三人以上,而且又采用等級記分時,就要用肯德爾和諧(三)影響信度系數(shù)的主要因素1.測驗(yàn)長度:在其他條件相等的情況下,測驗(yàn)長度(題目的多少)越長,信度值越高。因?yàn)闇y驗(yàn)越長,題目取樣或內(nèi)容取樣就越充分,結(jié)果就越可靠,同時也避免猜測題目的影響。2.樣本團(tuán)體的性質(zhì):一般而言,在其他條件不變的情況下,樣本團(tuán)體的分?jǐn)?shù)分布范圍越大,變異性越大,信度系數(shù)將越大。樣本團(tuán)體的異質(zhì)性越大,信度系數(shù)就越高。36可編輯ppt(三)影響信度系數(shù)的主要因素1.測驗(yàn)長度:在其他條件相等3.測驗(yàn)難度:測驗(yàn)難度對信度也會產(chǎn)生影響。如果一個測驗(yàn)的難度太低,大多數(shù)被試都可以輕而易舉地答對題目,測驗(yàn)分?jǐn)?shù)會非常集中并聚在高分端;如果測驗(yàn)的難度太高,多數(shù)被試都只能憑猜測答題,所有分?jǐn)?shù)都集中在低分端。這樣都會使測量到的分?jǐn)?shù)分布太窄,導(dǎo)致信度降低。37可編輯ppt3.測驗(yàn)難度:測驗(yàn)難度對信度也會產(chǎn)生影響。37可編輯ppt三、效度38可編輯ppt三、效度38可編輯ppt(一)效度的含義人事測量的效度就是指測量的有效性,即所采用的測評工具對其所要測評的特性測量到什么程度的估計(jì)。一是效度是針對測驗(yàn)結(jié)果的。二是效度是針對某種特定的測評目的而存在的。三是效度是連續(xù)性的,是一個關(guān)于程度的估計(jì)。39可編輯ppt(一)效度的含義人事測量的效度就是指測量的有效性,即所采用(二)效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和效標(biāo)關(guān)聯(lián)效度三類,這三類效度是相互聯(lián)系的,一個好的測評通常可以用一種或一種以上的效度來表示。40可編輯ppt(二)效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的代表性取樣的指標(biāo),即是說指標(biāo)與標(biāo)準(zhǔn)是否符合該類人員的功能特征。要素的設(shè)計(jì)與標(biāo)準(zhǔn)的編制成為鑒定測評效度的內(nèi)容。常見方法:(1)通過對照內(nèi)容范圍來估計(jì)(2)評分者信度(3)統(tǒng)計(jì)分析41可編輯ppt1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程度。所謂的構(gòu)思是指一些抽象的假設(shè)性的概念、特性或變量。如智力、創(chuàng)造力、言語流暢性、焦慮、動機(jī)等。構(gòu)思不能直接測量,需要借助一定的測評工具來反映。構(gòu)思效度的估計(jì)方法有許多,總的來說,可以分為測驗(yàn)內(nèi)部的方法和測驗(yàn)間方法兩大類。42可編輯ppt2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)系數(shù)來表示測評效度的高低的,表現(xiàn)進(jìn)行預(yù)測的有效性程度。這里效標(biāo)是指考察測驗(yàn)效用的外在參照標(biāo)準(zhǔn),是一種可以直接、獨(dú)立測量的行為。43可編輯ppt3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)通常情況下,對一般職工來講,其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量;對于科技人員應(yīng)以發(fā)明、創(chuàng)造及技術(shù)成果的數(shù)量和效益為效標(biāo);對管理人員應(yīng)以工作效率、職工積極性調(diào)動程度和經(jīng)濟(jì)效益為效標(biāo);對領(lǐng)導(dǎo)人員應(yīng)以開發(fā)人才、開創(chuàng)局面和社會、經(jīng)濟(jì)效益為效標(biāo)。44可編輯ppt通常情況下,對一般職工來講,其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量;對于科技人(三)影響效度的主要因素(1)受測樣本一個測驗(yàn)施測于不同的樣本,由于受測者在年齡、文化程度以及經(jīng)驗(yàn)背景上的差別,效度就會隨之不同,因此,受測樣本的選取是用來考察效度所依據(jù)的重要因素。樣本容量的大小與效度系數(shù)的高低也有一定關(guān)系。樣本容量越大,測量誤差就會有相互抵消的趨勢,由此會有助于提高測驗(yàn)和效標(biāo)測量的信度,同時有助于提高效度系數(shù)。45可編輯ppt(三)影響效度的主要因素(1)受測樣本45可編輯ppt(2)效標(biāo)選擇適當(dāng)?shù)男?biāo)是統(tǒng)計(jì)效度的先決條件。一個測驗(yàn)由于采用的效標(biāo)不同,其效度可能會大相徑庭。甚至,由于效標(biāo)選擇不當(dāng),可能導(dǎo)致無法衡量測驗(yàn)的效度。46可編輯ppt(2)效標(biāo)46可編輯ppt通過以上的分析,我們可以看出信度與效度的分析是直接對測評結(jié)果質(zhì)量的考查,而一個測驗(yàn)的信度和效度在很大程度上取決于該測驗(yàn)的題目參數(shù)(難度和區(qū)分度),編制和篩選具有適當(dāng)參數(shù)的題目是改善測驗(yàn)信度和效度的前提。我們根據(jù)試題結(jié)果對組成測驗(yàn)的各個題目進(jìn)行分析,從而評價題目好壞。四、難度分析47可編輯ppt通過以上的分析,我們可以看出信度與效度的分析是直接對測評結(jié)果(一)難度的概念難度是指測驗(yàn)題目的難易程度,也是試題對被試知識和能力水平的適合程度的指標(biāo)。難度是一個相對的概念,難度的高低與被試的水平直接相關(guān)。我們在說測量的難易程度時,應(yīng)該針對具體的被試。48可編輯ppt(一)難度的概念難度是指測驗(yàn)題目的難易程度,也是試題對被試知(二)難度的計(jì)算1、以答對百分比來估計(jì)難度如果試題為二分法反應(yīng)記分項(xiàng)目,P值可以采用通過率公式計(jì)算。公式為:P=R/N其中,P為試題難度;R為答對試題的人數(shù);N為參加測驗(yàn)的總?cè)藬?shù)。49可編輯ppt(二)難度的計(jì)算1、以答對百分比來估計(jì)難度49可編輯ppt當(dāng)被試人數(shù)較多時,可以采用極端分組法求試題的難度,先按測驗(yàn)總分的高低進(jìn)行排序,然后將被試分成三組:分?jǐn)?shù)高的27%被試為高分組,分?jǐn)?shù)最低的27%的被試為低分組,中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過率,再求試題的難度。P=(PH+PL)/2其中,PH和PL分別代表高分組和低分組的通過率。50可編輯ppt當(dāng)被試人數(shù)較多時,可以采用極端分組法求試題的難度,先按測驗(yàn)總(三)難度對測驗(yàn)的影響1.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)測驗(yàn)的難度就越大,測驗(yàn)分?jǐn)?shù)就越是集中在低分段,其分?jǐn)?shù)分布呈正偏態(tài);相反,分?jǐn)?shù)分布呈現(xiàn)負(fù)偏態(tài)。2.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度測驗(yàn)分?jǐn)?shù)過高或過低,測驗(yàn)分?jǐn)?shù)就會高度集中,測驗(yàn)分?jǐn)?shù)的離散程度就變小了。3.測驗(yàn)難度影響測驗(yàn)的鑒別能力51可編輯ppt(三)難度對測驗(yàn)的影響1.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)(四)測驗(yàn)難度的確定確定合理的測驗(yàn)難度才能使試題產(chǎn)生區(qū)分不同程度被試的最大效果。但題目的難度水平究竟多高合適,依賴于測驗(yàn)的目的、性質(zhì)、和題目形式。一般來說,我們進(jìn)行測驗(yàn)的目的是要了解被試個體間的差異,所以在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50—0.20之間。此外,對于不同的題型應(yīng)該有各自適宜的難度。如是非題難度值應(yīng)為0.75,而對于四擇一題目,難度值約為0.63。52可編輯ppt(四)測驗(yàn)難度的確定確定合理的測驗(yàn)難度才能使試題產(chǎn)生區(qū)分不同五、區(qū)分度分析53可編輯ppt五、區(qū)分度分析53可編輯ppt
(一)區(qū)分度的概念區(qū)分度又稱鑒別度,它是指測驗(yàn)項(xiàng)目對不同水平的被試反應(yīng)的鑒別能力和區(qū)分程度。若項(xiàng)目鑒別力高,則能力強(qiáng)、水平高的被試得分高,能力弱、水平低的被試得分低,否則就沒有鑒別力。它是評價測題質(zhì)量,篩選測題的主要指標(biāo)和依據(jù)。54可編輯ppt(一)區(qū)分度的概念區(qū)分度又稱鑒別度,它是指測驗(yàn)項(xiàng)目對不同水(二)區(qū)分度的估計(jì)方法1.鑒別度指數(shù)鑒別度指數(shù)是衡量區(qū)分度的一種最常用,也是最簡便的方法,它是比較得分高和得分低的兩組被試在項(xiàng)目通過率上的差值。55可編輯ppt(二)區(qū)分度的估計(jì)方法1.鑒別度指數(shù)55可編輯ppt一般思路為,當(dāng)成績是連續(xù)變量時,可從分?jǐn)?shù)分布的兩端各選擇27%的被試組成高、低分組,再分別計(jì)算兩組每道題目上的通過率,二者之差就是各題目的鑒別度指數(shù)D。公式:D=PH-PL其中,PH為高分組答對該題的人數(shù)比率;PL為低分組答對該題的人數(shù)比率。56可編輯ppt一般思路為,當(dāng)成績是連續(xù)變量時,可從分?jǐn)?shù)分布的兩端各選擇272.方差法方差表示一組數(shù)據(jù)離散程度。方差大,數(shù)據(jù)分散。被試在某一試題上的得分越分散,則該題的鑒別力越大。在進(jìn)行實(shí)際的項(xiàng)目分析中,被試一般不能少于30人,這樣使用下面公式才有效。57可編輯ppt2.方差法方差表示一組數(shù)據(jù)離散程度。方差大,數(shù)據(jù)分散。被試在3.內(nèi)部一致性系數(shù)計(jì)算區(qū)分度一般以總分來衡量被試能力的高低,當(dāng)被試總分高時,在某個項(xiàng)目上的得分也高;總分低時,項(xiàng)目上的得分也低,說明該項(xiàng)目和總分有一致性。在標(biāo)準(zhǔn)化和大規(guī)模的測驗(yàn)中,通過考察項(xiàng)目和總分的相關(guān),來測驗(yàn)各項(xiàng)目所測查內(nèi)容的一致性。如果項(xiàng)目與總分高相關(guān),項(xiàng)目的鑒別力也就高。58可編輯ppt3.內(nèi)部一致性系數(shù)計(jì)算區(qū)分度一般以總分來衡量被試能力的高低,4.項(xiàng)目與外部準(zhǔn)則的相關(guān)—項(xiàng)目效度分析項(xiàng)目效度分析是考察被試在項(xiàng)目上反應(yīng)和在效標(biāo)上表現(xiàn)的關(guān)系,即每個測題所測查的行為是否反映了被試在效標(biāo)上的表現(xiàn)。相關(guān)系數(shù)就是項(xiàng)目通過率與效標(biāo)成績的相關(guān)系數(shù)。相關(guān)越高,表明項(xiàng)目越具有區(qū)分的能力。59可編輯ppt4.項(xiàng)目與外部準(zhǔn)則的相關(guān)—項(xiàng)目效度分析項(xiàng)目效度分析是考察被試(三)合理區(qū)分度的確定在上面已經(jīng)談到不同的計(jì)算方法會帶來不同的區(qū)分度值,也就是說區(qū)分度的值具有相對性。此外,區(qū)分度還與受測團(tuán)體的同質(zhì)程度有關(guān),同質(zhì)性越強(qiáng),區(qū)分度就越小。所以,在確定合理的區(qū)分度時,我們既要考慮采用哪種區(qū)分度指標(biāo),以及樣本大小和特性外,還要考慮測驗(yàn)的目的、性質(zhì)和功能。60可編輯ppt(三)合理區(qū)分度的確定在上面已經(jīng)談到不同的計(jì)算方法會帶來不同人事測評的質(zhì)量評價61可編輯ppt人事測評的質(zhì)量評價1可編輯ppt一、誤差62可編輯ppt一、誤差2可編輯ppt(一)誤差的含義兩層含義:其一,誤差是由與測量目的無關(guān)的變因引起的;其二,誤差是不準(zhǔn)確或不一致的測量結(jié)果。63可編輯ppt(一)誤差的含義兩層含義:3可編輯ppt一種是隨機(jī)誤差,又叫可變誤差,這是由與測量目的無關(guān)的偶然因素引起而不易控制的誤差,它使多次測量產(chǎn)生不一致的結(jié)果。這類誤差的方向和大小的變化完全是隨機(jī)的,無規(guī)律可循。(二)誤差的主要表現(xiàn)形式另一種是系統(tǒng)誤差,又稱常定誤差,這是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng),穩(wěn)定地存在于每一次測量中,此時雖然測值一致,但不正確??梢?,系統(tǒng)誤差只影響測值的準(zhǔn)確性,而隨機(jī)誤差既影響準(zhǔn)確性又影響一致性。64可編輯ppt一種是隨機(jī)誤差,又叫可變誤差,這是由與測量目的無關(guān)的偶然因素(三)人事測評的誤差類型第一類是來源于人事測評工具本身的誤差;第二類是來源于測評實(shí)施過程的誤差;第三類是來源于測評實(shí)施者的誤差;第四類是來源于應(yīng)試者的誤差。65可編輯ppt(三)人事測評的誤差類型第一類是來源于人事測評工具本身的誤差1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越科學(xué),則誤差越??;反之則誤差越大。人事測評不像物理、化學(xué)測量,人的才能、個性、品德等許多特性都是無法直接測量的,而且人事測評常常有主觀的因素。因此,人事測評工具和方法造成的誤差比物理化學(xué)測量要大得多。66可編輯ppt1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越測評工具和方法造成誤差的因素(1)測評工具所測評的行為和特性與目標(biāo)上所欲測評的行為和特性之間的不一致。比如,測評情緒穩(wěn)定性的所有測評題目都應(yīng)該只測評情緒穩(wěn)定性,而實(shí)際上,有的題目還測了情緒穩(wěn)定性以外的特性,這些特性就成了干擾因素,是測評誤差的來源。67可編輯ppt測評工具和方法造成誤差的因素(1)測評工具所測評的行為和特性(2)測評指標(biāo)和測題抽樣的代表性一般來說,測評指標(biāo)、測題越多,則代表性越好,誤差也就越少。因?yàn)榻?jīng)濟(jì)、可行性等原因,不可能把所有與測評目的有關(guān)的所有指標(biāo)都作為測評的指標(biāo),也不可能把所有相關(guān)的全部測題都選作測試題目,只能選有代表性的指標(biāo)、有代表性的測題樣本用來作測評之用。測題的內(nèi)容和難度分布是測題代表性的重要指標(biāo)。68可編輯ppt(2)測評指標(biāo)和測題抽樣的代表性一般來說,測評指標(biāo)、測題越多(3)測題的格式和用詞、測評程序等因素有的題目格式(如是非題)具有可猜測性;有的題目格式(所有的主觀題)其評分具有主觀性;測題的用詞有歧義或用詞不是很準(zhǔn)確這些都是引起測評誤差的來源。69可編輯ppt(3)測題的格式和用詞、測評程序等因素有的題目格式(如是非題2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用,測評實(shí)施已經(jīng)越來越標(biāo)準(zhǔn)化,有測評實(shí)施造成的誤差也越來越少。但是,測評的具體實(shí)施過程中還是會有許多不可預(yù)期的偶然因素。70可編輯ppt2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用,不可預(yù)期的偶然因素種類(1)環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、噪音、照明、突然斷電等因素,都可以產(chǎn)生誤差。(2)測評紀(jì)律的控制不好。測評紀(jì)律控制不嚴(yán)格,出現(xiàn)有人作弊(如代考、抄襲、相互交流等)、泄露測評題目等,也會造成測評誤差。(3)錯誤操作。誤讀指導(dǎo)語、對指導(dǎo)語錯誤理解、誤答(如自己答的答案是A,卻選了C)、記錄錯誤、記分錯誤等因素。71可編輯ppt不可預(yù)期的偶然因素種類(1)環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、3、被測評者因素被測評者因素被測評者是活生生的人,人是非常復(fù)雜的,諸多生理、心理因素都可以成為干擾人事測評目的的因素??蓪?dǎo)致人事測評誤差的被測評者因素大致有:(1)生理因素。身體健康因素、饑餓與過飽、疲勞程度、生理周期等都可以影響人格測試的結(jié)果。72可編輯ppt3、被測評者因素被測評者因素被測評者是活生生的人,人是非常復(fù)(2)動機(jī)水平每個被測評者都有參加測評的目的,這個目的可以導(dǎo)致被測評者故意掩飾自己,采取裝好或裝壞的傾向性回答,其結(jié)果就不能反映出被測評者的真實(shí)情況。不同的被測評者其動機(jī)水平不一樣,因而掩飾程度也會有所不同。73可編輯ppt(2)動機(jī)水平13可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài),動機(jī)過分強(qiáng)烈會引起被測評者產(chǎn)生測評焦慮,而動機(jī)不足則會引起被測評者對測評采取敷衍了事的態(tài)度,。在人格、態(tài)度、動機(jī)等測評中,被測評者的動機(jī)水平常常會是測評被測評者因素產(chǎn)生誤差的最重要的因素。74可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài),動機(jī)過分強(qiáng)烈會(3)受教育程度、價值觀等文化因素。被測評者受教育程度不同,其成長的文化背景不同,價值觀不同,會造成被測評者對測題的理解、答題態(tài)度、答題偏好等的不同,從而造成測評誤差。75可編輯ppt(3)受教育程度、價值觀等文化因素。被測評者受教育程度不同,(4)有關(guān)經(jīng)驗(yàn)。如果在測評之前,被測評者已經(jīng)具有與測評有關(guān)的經(jīng)驗(yàn),比如已經(jīng)經(jīng)歷過類似的或同一類型的測試從而掌握了有關(guān)的答題策略,就可能對測評結(jié)果產(chǎn)生較大的影響。有人曾做過試驗(yàn),讓5名熟悉、已知其智力水平的學(xué)生進(jìn)行知覺和圖形推理的大量練習(xí),然后再進(jìn)行瑞文圖形智力測試,結(jié)果測得的結(jié)果比他們的實(shí)際智力高出不少。76可編輯ppt(4)有關(guān)經(jīng)驗(yàn)。如果在測評之前,被測評者已經(jīng)具有與測評有關(guān)的4、主試因素主試以貌取人、對被測評者有偏見,可以造成測評誤差。主試不良的言行舉止對被試的心理狀態(tài)干擾、暗示、誤導(dǎo),可以造成誤差。主試評分的標(biāo)準(zhǔn)不一致,先緊后松、先松后緊、忽高忽低,或有意無意地修改評分標(biāo)準(zhǔn),對某些人特別照顧,都可以引起誤差。77可編輯ppt4、主試因素主試以貌取人、對被測評者有偏見,可以造成測評誤差總結(jié)測評的誤差一般可以被分為兩大類:隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由偶然因素造成的,其產(chǎn)生是隨機(jī)的、無規(guī)律的,因此其數(shù)值大小也是隨機(jī)變化、不確定的。它是引起測評不一致的變因,與測評信度有關(guān)。78可編輯ppt總結(jié)測評的誤差一般可以被分為兩大類:隨機(jī)誤差和系統(tǒng)誤差。18系統(tǒng)誤差,又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引起的一種恒定的、系統(tǒng)的變化,其數(shù)值大小具有一定的規(guī)律性和穩(wěn)定性。它與測評的效度有關(guān)。習(xí)慣上,把隨機(jī)誤差稱為觀察誤差或測評誤差。從這個意義上講,測評誤差這個概念所指誤差只是測評分?jǐn)?shù)所包含的誤差(隨機(jī)誤差和系統(tǒng)誤差)的一部分(即隨機(jī)誤差)。79可編輯ppt系統(tǒng)誤差,又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引二、信度分析80可編輯ppt二、信度分析20可編輯ppt(一)信度的基本概念信度又叫可靠性程度,用于分析一種測評方法所得結(jié)果的前后一致性水平,并以這種一致性程度為指標(biāo)來判斷測評的可靠性。測驗(yàn)結(jié)果的可靠性與測驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。在人才測評中誤差是不可避免的,只能盡可能追求高的精度,把誤差控制在一個有規(guī)律的范圍以內(nèi),這樣測量得到的結(jié)果才比較穩(wěn)定可靠。信度實(shí)際上就是隨機(jī)誤差的一種度量。81可編輯ppt(一)信度的基本概念信度又叫可靠性程度,用于分析一種測評方法(二)信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。信度系數(shù)是同一樣本在兩種不同時間、不同情境條件或兩組不同評價材料評定結(jié)果之間的相關(guān)系數(shù)。針對不同的誤差來源,信度可有不同的確定方法。一般有以下幾種類型:重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度。82可編輯ppt(二)信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。221.重測信度重測信度又稱為穩(wěn)定性系數(shù),它是估計(jì)測評跨時間的一致性程度,即用同一測驗(yàn),在兩個不同時間里對同一群體施測兩次,這兩次測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)就是重測系數(shù)。一個測驗(yàn)的重測系數(shù)越高,說明測評的穩(wěn)定性越好,測評受隨機(jī)因素的影響越小。83可編輯ppt1.重測信度重測信度又稱為穩(wěn)定性系數(shù),它是估計(jì)測評跨時間的一在獲得重測系數(shù)時,最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控制合理的時間間隔。時間間隔長了,被試的心理特征就會因?yàn)閷W(xué)習(xí)、經(jīng)歷、教育培訓(xùn)等因素而發(fā)展變化,使相關(guān)系數(shù)降低;時間間隔短了,又會使首次測評時的練習(xí)效果和記憶效果的影響增大,從而造成了假性的高相關(guān)。84可編輯ppt在獲得重測系數(shù)時,最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差等各方面與原測評一樣的測評,即功能等值但題目內(nèi)容不同。兩個等值的測驗(yàn)互為復(fù)本。復(fù)本信度又稱為等值性系數(shù),它是代表測評跨形式的一致性,即在對被試進(jìn)行測評以后間隔一定的時間,運(yùn)用復(fù)本再測評一次所獲得的復(fù)本相關(guān)系數(shù)。復(fù)本信度的高低反映了兩個測驗(yàn)復(fù)本在內(nèi)容上的等值性程度。85可編輯ppt2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差復(fù)本信度的優(yōu)點(diǎn):適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)成績影響,同時減少了輔導(dǎo)或作弊的可能性。當(dāng)然,復(fù)本相關(guān)系數(shù)也有局限性:一方面,在現(xiàn)實(shí)中,編制理想的復(fù)本常常很難,有許多測評都沒有復(fù)本。另一方面,復(fù)本測評也會受練習(xí)的影響。86可編輯ppt復(fù)本信度的優(yōu)點(diǎn):適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù),都需測評兩次,不但要花較多的精力,而且受測者會受練習(xí)的影響使第二次測評失真。內(nèi)部一致性系數(shù)則不同,它只需要測評一次,它通過分析同一測評內(nèi)部各測評項(xiàng)目之間的相關(guān)系數(shù)的方法來估計(jì)信度系數(shù)。87可編輯ppt3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù),都需測評兩次內(nèi)部一致性系數(shù)反映的是跨測題的一致性,即測評內(nèi)部各部分之間是否具有同質(zhì)性。內(nèi)部一致性信度又分為分半信度、同質(zhì)性信度和α系數(shù)。88可編輯ppt內(nèi)部一致性系數(shù)反映的是跨測題的一致性,即測評內(nèi)部各部分之間是(1)分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,再求出這兩個分?jǐn)?shù)的相關(guān)系數(shù),從而來估計(jì)整個測評的信度。因?yàn)榉职胂禂?shù)只是根據(jù)原測題的一半題目而來,而信度的大小又與測驗(yàn)的長度有關(guān),所以分半系數(shù)常常要比原測驗(yàn)的信度低。89可編輯ppt(1)分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為為了校正這個差異,常運(yùn)用斯皮爾曼-布朗公式:
rxx=2rhh/(1+rhh)
其中,rhh:兩半測驗(yàn)的相關(guān)系數(shù);rxx:估計(jì)或修正后的信度。90可編輯ppt為了校正這個差異,常運(yùn)用斯皮爾曼-布朗公式:30可編輯ppt(2)同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半,它是指測驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。所謂的同質(zhì)性是指所有的測驗(yàn)題目測量的只是單一的特質(zhì)或內(nèi)容,表現(xiàn)為所有測驗(yàn)題目得分的一致性。常用的計(jì)算方法是庫德-理查遜估計(jì)方法。計(jì)算公式有庫德-理查遜20號公式(簡稱KR20)和21號公式(KR21)。91可編輯ppt(2)同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半,它是指測驗(yàn)內(nèi)KR20公式n為測驗(yàn)題目數(shù),pi為通過i題的人數(shù)比例;qi為未通過該題的人數(shù)比例;pi+qi=1;∑piqi為所有題目答對與答錯人數(shù)百分比乘積的總和。庫德-理查遜信度系數(shù)的運(yùn)用需要滿足幾個條件:所有測題都采用二分法記分,即都采用0,1記分,答對記1分,答錯記0分;測驗(yàn)的項(xiàng)目難度比較接近;項(xiàng)目間的組間相關(guān)相等。92可編輯pptKR20公式n為測驗(yàn)題目數(shù),pi為通過i題的人數(shù)比例;qi為(3)α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分(如人格測驗(yàn)、態(tài)度量表),庫德-理查遜信度就無法運(yùn)用??藗惏秃仗岢隽诉m用于各種記分情況的α系數(shù)來估計(jì)信度。具體公式如下:其中,Si為每一項(xiàng)目的方差;Sx為測驗(yàn)總分方差。93可編輯ppt(3)α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分(如人格測驗(yàn)、態(tài)度量表),4、評分者信度在人事測評中,不同的評分者其觀察角度、注意力、對被試的偏見等都會使評分的結(jié)果不一致,因此,評分者的評判也是誤差的來源之一。評分者信度就是指不同評分者對同樣對象進(jìn)行評定的一致性。具體方法是:由兩名評分者對同一個被試樣組進(jìn)行評分,再求兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級相關(guān)方法。94可編輯ppt4、評分者信度在人事測評中,不同的評分者其觀察角度、注意力、如果評分者在三人以上,而且又采用等級記分時,就要用肯德爾和諧系數(shù)來求評分者信度。公式為:其中,K為評分者人數(shù),N為被評定的人數(shù)或答卷數(shù);Ri為每一個對象被評等級。95可編輯ppt如果評分者在三人以上,而且又采用等級記分時,就要用肯德爾和諧(三)影響信度系數(shù)的主要因素1.測驗(yàn)長度:在其他條件相等的情況下,測驗(yàn)長度(題目的多少)越長,信度值越高。因?yàn)闇y驗(yàn)越長,題目取樣或內(nèi)容取樣就越充分,結(jié)果就越可靠,同時也避免猜測題目的影響。2.樣本團(tuán)體的性質(zhì):一般而言,在其他條件不變的情況下,樣本團(tuán)體的分?jǐn)?shù)分布范圍越大,變異性越大,信度系數(shù)將越大。樣本團(tuán)體的異質(zhì)性越大,信度系數(shù)就越高。96可編輯ppt(三)影響信度系數(shù)的主要因素1.測驗(yàn)長度:在其他條件相等3.測驗(yàn)難度:測驗(yàn)難度對信度也會產(chǎn)生影響。如果一個測驗(yàn)的難度太低,大多數(shù)被試都可以輕而易舉地答對題目,測驗(yàn)分?jǐn)?shù)會非常集中并聚在高分端;如果測驗(yàn)的難度太高,多數(shù)被試都只能憑猜測答題,所有分?jǐn)?shù)都集中在低分端。這樣都會使測量到的分?jǐn)?shù)分布太窄,導(dǎo)致信度降低。97可編輯ppt3.測驗(yàn)難度:測驗(yàn)難度對信度也會產(chǎn)生影響。37可編輯ppt三、效度98可編輯ppt三、效度38可編輯ppt(一)效度的含義人事測量的效度就是指測量的有效性,即所采用的測評工具對其所要測評的特性測量到什么程度的估計(jì)。一是效度是針對測驗(yàn)結(jié)果的。二是效度是針對某種特定的測評目的而存在的。三是效度是連續(xù)性的,是一個關(guān)于程度的估計(jì)。99可編輯ppt(一)效度的含義人事測量的效度就是指測量的有效性,即所采用(二)效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和效標(biāo)關(guān)聯(lián)效度三類,這三類效度是相互聯(lián)系的,一個好的測評通??梢杂靡环N或一種以上的效度來表示。100可編輯ppt(二)效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的代表性取樣的指標(biāo),即是說指標(biāo)與標(biāo)準(zhǔn)是否符合該類人員的功能特征。要素的設(shè)計(jì)與標(biāo)準(zhǔn)的編制成為鑒定測評效度的內(nèi)容。常見方法:(1)通過對照內(nèi)容范圍來估計(jì)(2)評分者信度(3)統(tǒng)計(jì)分析101可編輯ppt1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程度。所謂的構(gòu)思是指一些抽象的假設(shè)性的概念、特性或變量。如智力、創(chuàng)造力、言語流暢性、焦慮、動機(jī)等。構(gòu)思不能直接測量,需要借助一定的測評工具來反映。構(gòu)思效度的估計(jì)方法有許多,總的來說,可以分為測驗(yàn)內(nèi)部的方法和測驗(yàn)間方法兩大類。102可編輯ppt2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)系數(shù)來表示測評效度的高低的,表現(xiàn)進(jìn)行預(yù)測的有效性程度。這里效標(biāo)是指考察測驗(yàn)效用的外在參照標(biāo)準(zhǔn),是一種可以直接、獨(dú)立測量的行為。103可編輯ppt3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)通常情況下,對一般職工來講,其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量;對于科技人員應(yīng)以發(fā)明、創(chuàng)造及技術(shù)成果的數(shù)量和效益為效標(biāo);對管理人員應(yīng)以工作效率、職工積極性調(diào)動程度和經(jīng)濟(jì)效益為效標(biāo);對領(lǐng)導(dǎo)人員應(yīng)以開發(fā)人才、開創(chuàng)局面和社會、經(jīng)濟(jì)效益為效標(biāo)。104可編輯ppt通常情況下,對一般職工來講,其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量;對于科技人(三)影響效度的主要因素(1)受測樣本一個測驗(yàn)施測于不同的樣本,由于受測者在年齡、文化程度以及經(jīng)驗(yàn)背景上的差別,效度就會隨之不同,因此,受測樣本的選取是用來考察效度所依據(jù)的重要因素。樣本容量的大小與效度系數(shù)的高低也有一定關(guān)系。樣本容量越大,測量誤差就會有相互抵消的趨勢,由此會有助于提高測驗(yàn)和效標(biāo)測量的信度,同時有助于提高效度系數(shù)。105可編輯ppt(三)影響效度的主要因素(1)受測樣本45可編輯ppt(2)效標(biāo)選擇適當(dāng)?shù)男?biāo)是統(tǒng)計(jì)效度的先決條件。一個測驗(yàn)由于采用的效標(biāo)不同,其效度可能會大相徑庭。甚至,由于效標(biāo)選擇不當(dāng),可能導(dǎo)致無法衡量測驗(yàn)的效度。106可編輯ppt(2)效標(biāo)46可編輯ppt通過以上的分析,我們可以看出信度與效度的分析是直接對測評結(jié)果質(zhì)量的考查,而一個測驗(yàn)的信度和效度在很大程度上取決于該測驗(yàn)的題目參數(shù)(難度和區(qū)分度),編制和篩選具有適當(dāng)參數(shù)的題目是改善測驗(yàn)信度和效度的前提。我們根據(jù)試題結(jié)果對組成測驗(yàn)的各個題目進(jìn)行分析,從而評價題目好壞。四、難度分析107可編輯ppt通過以上的分析,我們可以看出信度與效度的分析是直接對測評結(jié)果(一)難度的概念難度是指測驗(yàn)題目的難易程度,也是試題對被試知識和能力水平的適合程度的指標(biāo)。難度是一個相對的概念,難度的高低與被試的水平直接相關(guān)。我們在說測量的難易程度時,應(yīng)該針對具體的被試。108可編輯ppt(一)難度的概念難度是指測驗(yàn)題目的難易程度,也是試題對被試知(二)難度的計(jì)算1、以答對百分比來估計(jì)難度如果試題為二分法反應(yīng)記分項(xiàng)目,P值可以采用通過率公式計(jì)算。公式為:P=R/N其中,P為試題難度;R為答對試題
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC 23008-12:2025/Amd 1:2025 EN Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 12: Image File Format - Amendment
- 2025年楚雄技師學(xué)院云南現(xiàn)代職業(yè)技術(shù)學(xué)院高層次人才和急需緊缺招聘模擬試卷完整答案詳解
- 2025年甘肅武威古浪縣八步沙林場招聘財(cái)會、水利專業(yè)人員考前自測高頻考點(diǎn)模擬試題及答案詳解(網(wǎng)校專用)
- 2025年合肥廬陽科技創(chuàng)新集團(tuán)有限公司招聘6人考前自測高頻考點(diǎn)模擬試題及答案詳解(名校卷)
- 安全培訓(xùn)行業(yè)調(diào)研報(bào)告課件
- 安全培訓(xùn)行業(yè)收入課件
- 安全培訓(xùn)落實(shí)安全責(zé)任課件
- 2025年西安航天基地公辦學(xué)校教職工招聘(74人)模擬試卷及一套答案詳解
- 2025年濰坊諸城市公開招聘部屬公費(fèi)師范畢業(yè)生(5名)模擬試卷帶答案詳解
- 2025年河南中醫(yī)藥大學(xué)招聘高層次人才83人+考前自測高頻考點(diǎn)模擬試題及答案詳解(名校卷)
- GB/T 79-2007內(nèi)六角圓柱端緊定螺釘
- GB/T 4854.7-2008聲學(xué)校準(zhǔn)測聽設(shè)備的基準(zhǔn)零級第7部分:自由場與擴(kuò)散場測聽的基準(zhǔn)聽閾
- GB/T 12755-2008建筑用壓型鋼板
- OTN技術(shù)與應(yīng)用(阿法迪)
- 高標(biāo)準(zhǔn)基本農(nóng)田建設(shè)項(xiàng)目電力施工組織設(shè)計(jì)
- 財(cái)富沙盤流程課件
- 隧道運(yùn)營養(yǎng)護(hù)管理手冊-下冊
- 旋挖鉆樁基施工方案
- 鋼結(jié)構(gòu)監(jiān)理實(shí)施細(xì)則(新)
- 某某大學(xué)數(shù)字化校園建設(shè)項(xiàng)目可行性研究報(bào)告
- 高邊坡施工危險(xiǎn)源辨識及風(fēng)險(xiǎn)評價一覽表
評論
0/150
提交評論