人事測評測評的質(zhì)量評價課件

上傳人：x*** IP屬地：貴州上傳時間：2022-12-10 格式：PPT 頁數(shù)：120 大?。?79.72KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩115頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人事測評的質(zhì)量評價1可編輯ppt人事測評的質(zhì)量評價1可編輯ppt一、誤差2可編輯ppt一、誤差2可編輯ppt(一）誤差的含義兩層含義：其一，誤差是由與測量目的無關(guān)的變因引起的；其二，誤差是不準(zhǔn)確或不一致的測量結(jié)果。3可編輯ppt(一）誤差的含義兩層含義：3可編輯ppt一種是隨機(jī)誤差，又叫可變誤差，這是由與測量目的無關(guān)的偶然因素引起而不易控制的誤差，它使多次測量產(chǎn)生不一致的結(jié)果。這類誤差的方向和大小的變化完全是隨機(jī)的，無規(guī)律可循。(二）誤差的主要表現(xiàn)形式另一種是系統(tǒng)誤差，又稱常定誤差，這是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)，穩(wěn)定地存在于每一次測量中，此時雖然測值一致，但不正確?？梢?，系統(tǒng)誤差只影響測值的準(zhǔn)確性，而隨機(jī)誤差既影響準(zhǔn)確性又影響一致性。4可編輯ppt一種是隨機(jī)誤差，又叫可變誤差，這是由與測量目的無關(guān)的偶然因素（三）人事測評的誤差類型第一類是來源于人事測評工具本身的誤差；第二類是來源于測評實(shí)施過程的誤差；第三類是來源于測評實(shí)施者的誤差；第四類是來源于應(yīng)試者的誤差。5可編輯ppt（三）人事測評的誤差類型第一類是來源于人事測評工具本身的誤差1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越科學(xué)，則誤差越??；反之則誤差越大。人事測評不像物理、化學(xué)測量，人的才能、個性、品德等許多特性都是無法直接測量的，而且人事測評常常有主觀的因素。因此，人事測評工具和方法造成的誤差比物理化學(xué)測量要大得多。6可編輯ppt1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越測評工具和方法造成誤差的因素（1）測評工具所測評的行為和特性與目標(biāo)上所欲測評的行為和特性之間的不一致。比如，測評情緒穩(wěn)定性的所有測評題目都應(yīng)該只測評情緒穩(wěn)定性，而實(shí)際上，有的題目還測了情緒穩(wěn)定性以外的特性，這些特性就成了干擾因素，是測評誤差的來源。7可編輯ppt測評工具和方法造成誤差的因素（1）測評工具所測評的行為和特性（2）測評指標(biāo)和測題抽樣的代表性一般來說，測評指標(biāo)、測題越多，則代表性越好，誤差也就越少。因?yàn)榻?jīng)濟(jì)、可行性等原因，不可能把所有與測評目的有關(guān)的所有指標(biāo)都作為測評的指標(biāo)，也不可能把所有相關(guān)的全部測題都選作測試題目，只能選有代表性的指標(biāo)、有代表性的測題樣本用來作測評之用。測題的內(nèi)容和難度分布是測題代表性的重要指標(biāo)。8可編輯ppt（2）測評指標(biāo)和測題抽樣的代表性一般來說，測評指標(biāo)、測題越多（3）測題的格式和用詞、測評程序等因素有的題目格式（如是非題）具有可猜測性；有的題目格式（所有的主觀題）其評分具有主觀性；測題的用詞有歧義或用詞不是很準(zhǔn)確這些都是引起測評誤差的來源。9可編輯ppt（3）測題的格式和用詞、測評程序等因素有的題目格式（如是非題2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用，測評實(shí)施已經(jīng)越來越標(biāo)準(zhǔn)化，有測評實(shí)施造成的誤差也越來越少。但是，測評的具體實(shí)施過程中還是會有許多不可預(yù)期的偶然因素。10可編輯ppt2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用，不可預(yù)期的偶然因素種類（1）環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、噪音、照明、突然斷電等因素，都可以產(chǎn)生誤差。（2）測評紀(jì)律的控制不好。測評紀(jì)律控制不嚴(yán)格，出現(xiàn)有人作弊（如代考、抄襲、相互交流等）、泄露測評題目等，也會造成測評誤差。（3）錯誤操作。誤讀指導(dǎo)語、對指導(dǎo)語錯誤理解、誤答（如自己答的答案是A，卻選了C）、記錄錯誤、記分錯誤等因素。11可編輯ppt不可預(yù)期的偶然因素種類（1）環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、3、被測評者因素被測評者因素被測評者是活生生的人，人是非常復(fù)雜的，諸多生理、心理因素都可以成為干擾人事測評目的的因素?？蓪?dǎo)致人事測評誤差的被測評者因素大致有：（1）生理因素。身體健康因素、饑餓與過飽、疲勞程度、生理周期等都可以影響人格測試的結(jié)果。12可編輯ppt3、被測評者因素被測評者因素被測評者是活生生的人，人是非常復(fù)（2）動機(jī)水平每個被測評者都有參加測評的目的，這個目的可以導(dǎo)致被測評者故意掩飾自己，采取裝好或裝壞的傾向性回答，其結(jié)果就不能反映出被測評者的真實(shí)情況。不同的被測評者其動機(jī)水平不一樣，因而掩飾程度也會有所不同。13可編輯ppt（2）動機(jī)水平13可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài)，動機(jī)過分強(qiáng)烈會引起被測評者產(chǎn)生測評焦慮，而動機(jī)不足則會引起被測評者對測評采取敷衍了事的態(tài)度，。在人格、態(tài)度、動機(jī)等測評中，被測評者的動機(jī)水平常常會是測評被測評者因素產(chǎn)生誤差的最重要的因素。14可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài)，動機(jī)過分強(qiáng)烈會（3）受教育程度、價值觀等文化因素。被測評者受教育程度不同，其成長的文化背景不同，價值觀不同，會造成被測評者對測題的理解、答題態(tài)度、答題偏好等的不同，從而造成測評誤差。15可編輯ppt（3）受教育程度、價值觀等文化因素。被測評者受教育程度不同，（4）有關(guān)經(jīng)驗(yàn)。如果在測評之前，被測評者已經(jīng)具有與測評有關(guān)的經(jīng)驗(yàn)，比如已經(jīng)經(jīng)歷過類似的或同一類型的測試從而掌握了有關(guān)的答題策略，就可能對測評結(jié)果產(chǎn)生較大的影響。有人曾做過試驗(yàn)，讓5名熟悉、已知其智力水平的學(xué)生進(jìn)行知覺和圖形推理的大量練習(xí)，然后再進(jìn)行瑞文圖形智力測試，結(jié)果測得的結(jié)果比他們的實(shí)際智力高出不少。16可編輯ppt（4）有關(guān)經(jīng)驗(yàn)。如果在測評之前，被測評者已經(jīng)具有與測評有關(guān)的4、主試因素主試以貌取人、對被測評者有偏見，可以造成測評誤差。主試不良的言行舉止對被試的心理狀態(tài)干擾、暗示、誤導(dǎo)，可以造成誤差。主試評分的標(biāo)準(zhǔn)不一致，先緊后松、先松后緊、忽高忽低，或有意無意地修改評分標(biāo)準(zhǔn)，對某些人特別照顧，都可以引起誤差。17可編輯ppt4、主試因素主試以貌取人、對被測評者有偏見，可以造成測評誤差總結(jié)測評的誤差一般可以被分為兩大類：隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由偶然因素造成的，其產(chǎn)生是隨機(jī)的、無規(guī)律的，因此其數(shù)值大小也是隨機(jī)變化、不確定的。它是引起測評不一致的變因，與測評信度有關(guān)。18可編輯ppt總結(jié)測評的誤差一般可以被分為兩大類：隨機(jī)誤差和系統(tǒng)誤差。18系統(tǒng)誤差，又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引起的一種恒定的、系統(tǒng)的變化，其數(shù)值大小具有一定的規(guī)律性和穩(wěn)定性。它與測評的效度有關(guān)。習(xí)慣上，把隨機(jī)誤差稱為觀察誤差或測評誤差。從這個意義上講，測評誤差這個概念所指誤差只是測評分?jǐn)?shù)所包含的誤差（隨機(jī)誤差和系統(tǒng)誤差）的一部分（即隨機(jī)誤差）。19可編輯ppt系統(tǒng)誤差，又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引二、信度分析20可編輯ppt二、信度分析20可編輯ppt（一）信度的基本概念信度又叫可靠性程度，用于分析一種測評方法所得結(jié)果的前后一致性水平，并以這種一致性程度為指標(biāo)來判斷測評的可靠性。測驗(yàn)結(jié)果的可靠性與測驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。在人才測評中誤差是不可避免的，只能盡可能追求高的精度，把誤差控制在一個有規(guī)律的范圍以內(nèi)，這樣測量得到的結(jié)果才比較穩(wěn)定可靠。信度實(shí)際上就是隨機(jī)誤差的一種度量。21可編輯ppt（一）信度的基本概念信度又叫可靠性程度，用于分析一種測評方法（二）信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。信度系數(shù)是同一樣本在兩種不同時間、不同情境條件或兩組不同評價材料評定結(jié)果之間的相關(guān)系數(shù)。針對不同的誤差來源，信度可有不同的確定方法。一般有以下幾種類型：重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度。22可編輯ppt（二）信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。221.重測信度重測信度又稱為穩(wěn)定性系數(shù)，它是估計(jì)測評跨時間的一致性程度，即用同一測驗(yàn)，在兩個不同時間里對同一群體施測兩次，這兩次測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)就是重測系數(shù)。一個測驗(yàn)的重測系數(shù)越高，說明測評的穩(wěn)定性越好，測評受隨機(jī)因素的影響越小。23可編輯ppt1.重測信度重測信度又稱為穩(wěn)定性系數(shù)，它是估計(jì)測評跨時間的一在獲得重測系數(shù)時，最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控制合理的時間間隔。時間間隔長了，被試的心理特征就會因?yàn)閷W(xué)習(xí)、經(jīng)歷、教育培訓(xùn)等因素而發(fā)展變化，使相關(guān)系數(shù)降低；時間間隔短了，又會使首次測評時的練習(xí)效果和記憶效果的影響增大，從而造成了假性的高相關(guān)。24可編輯ppt在獲得重測系數(shù)時，最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差等各方面與原測評一樣的測評，即功能等值但題目內(nèi)容不同。兩個等值的測驗(yàn)互為復(fù)本。復(fù)本信度又稱為等值性系數(shù)，它是代表測評跨形式的一致性，即在對被試進(jìn)行測評以后間隔一定的時間，運(yùn)用復(fù)本再測評一次所獲得的復(fù)本相關(guān)系數(shù)。復(fù)本信度的高低反映了兩個測驗(yàn)復(fù)本在內(nèi)容上的等值性程度。25可編輯ppt2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差復(fù)本信度的優(yōu)點(diǎn)：適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)成績影響，同時減少了輔導(dǎo)或作弊的可能性。當(dāng)然，復(fù)本相關(guān)系數(shù)也有局限性：一方面，在現(xiàn)實(shí)中，編制理想的復(fù)本常常很難，有許多測評都沒有復(fù)本。另一方面，復(fù)本測評也會受練習(xí)的影響。26可編輯ppt復(fù)本信度的優(yōu)點(diǎn)：適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù)，都需測評兩次，不但要花較多的精力，而且受測者會受練習(xí)的影響使第二次測評失真。內(nèi)部一致性系數(shù)則不同，它只需要測評一次，它通過分析同一測評內(nèi)部各測評項(xiàng)目之間的相關(guān)系數(shù)的方法來估計(jì)信度系數(shù)。27可編輯ppt3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù)，都需測評兩次內(nèi)部一致性系數(shù)反映的是跨測題的一致性，即測評內(nèi)部各部分之間是否具有同質(zhì)性。內(nèi)部一致性信度又分為分半信度、同質(zhì)性信度和α系數(shù)。28可編輯ppt內(nèi)部一致性系數(shù)反映的是跨測題的一致性，即測評內(nèi)部各部分之間是（1）分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為等值的兩半，并分別計(jì)算每位被試在兩半測驗(yàn)上的得分，再求出這兩個分?jǐn)?shù)的相關(guān)系數(shù)，從而來估計(jì)整個測評的信度。因?yàn)榉职胂禂?shù)只是根據(jù)原測題的一半題目而來，而信度的大小又與測驗(yàn)的長度有關(guān)，所以分半系數(shù)常常要比原測驗(yàn)的信度低。29可編輯ppt（1）分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為為了校正這個差異，常運(yùn)用斯皮爾曼-布朗公式：

rxx=2rhh/(1+rhh)

其中，rhh：兩半測驗(yàn)的相關(guān)系數(shù)；rxx：估計(jì)或修正后的信度。30可編輯ppt為了校正這個差異，常運(yùn)用斯皮爾曼-布朗公式：30可編輯ppt（2）同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半，它是指測驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。所謂的同質(zhì)性是指所有的測驗(yàn)題目測量的只是單一的特質(zhì)或內(nèi)容，表現(xiàn)為所有測驗(yàn)題目得分的一致性。常用的計(jì)算方法是庫德-理查遜估計(jì)方法。計(jì)算公式有庫德-理查遜20號公式（簡稱KR20）和21號公式（KR21）。31可編輯ppt（2）同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半，它是指測驗(yàn)內(nèi)KR20公式n為測驗(yàn)題目數(shù)，pi為通過i題的人數(shù)比例；qi為未通過該題的人數(shù)比例；pi+qi=1；∑piqi為所有題目答對與答錯人數(shù)百分比乘積的總和。庫德-理查遜信度系數(shù)的運(yùn)用需要滿足幾個條件：所有測題都采用二分法記分，即都采用0，1記分，答對記1分，答錯記0分；測驗(yàn)的項(xiàng)目難度比較接近；項(xiàng)目間的組間相關(guān)相等。32可編輯pptKR20公式n為測驗(yàn)題目數(shù)，pi為通過i題的人數(shù)比例；qi為（3）α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分（如人格測驗(yàn)、態(tài)度量表），庫德-理查遜信度就無法運(yùn)用。克倫巴赫提出了適用于各種記分情況的α系數(shù)來估計(jì)信度。具體公式如下：其中，Si為每一項(xiàng)目的方差；Sx為測驗(yàn)總分方差。33可編輯ppt（3）α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分（如人格測驗(yàn)、態(tài)度量表），4、評分者信度在人事測評中，不同的評分者其觀察角度、注意力、對被試的偏見等都會使評分的結(jié)果不一致，因此，評分者的評判也是誤差的來源之一。評分者信度就是指不同評分者對同樣對象進(jìn)行評定的一致性。具體方法是：由兩名評分者對同一個被試樣組進(jìn)行評分，再求兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法，也可以采用斯皮爾曼等級相關(guān)方法。34可編輯ppt4、評分者信度在人事測評中，不同的評分者其觀察角度、注意力、如果評分者在三人以上，而且又采用等級記分時，就要用肯德爾和諧系數(shù)來求評分者信度。公式為：其中，K為評分者人數(shù)，N為被評定的人數(shù)或答卷數(shù)；Ri為每一個對象被評等級。35可編輯ppt如果評分者在三人以上，而且又采用等級記分時，就要用肯德爾和諧（三）影響信度系數(shù)的主要因素1.測驗(yàn)長度：在其他條件相等的情況下，測驗(yàn)長度（題目的多少）越長，信度值越高。因?yàn)闇y驗(yàn)越長，題目取樣或內(nèi)容取樣就越充分，結(jié)果就越可靠，同時也避免猜測題目的影響。2.樣本團(tuán)體的性質(zhì)：一般而言，在其他條件不變的情況下，樣本團(tuán)體的分?jǐn)?shù)分布范圍越大，變異性越大，信度系數(shù)將越大。樣本團(tuán)體的異質(zhì)性越大，信度系數(shù)就越高。36可編輯ppt（三）影響信度系數(shù)的主要因素1.測驗(yàn)長度：在其他條件相等3.測驗(yàn)難度：測驗(yàn)難度對信度也會產(chǎn)生影響。如果一個測驗(yàn)的難度太低，大多數(shù)被試都可以輕而易舉地答對題目，測驗(yàn)分?jǐn)?shù)會非常集中并聚在高分端；如果測驗(yàn)的難度太高，多數(shù)被試都只能憑猜測答題，所有分?jǐn)?shù)都集中在低分端。這樣都會使測量到的分?jǐn)?shù)分布太窄，導(dǎo)致信度降低。37可編輯ppt3.測驗(yàn)難度：測驗(yàn)難度對信度也會產(chǎn)生影響。37可編輯ppt三、效度38可編輯ppt三、效度38可編輯ppt（一）效度的含義人事測量的效度就是指測量的有效性，即所采用的測評工具對其所要測評的特性測量到什么程度的估計(jì)。一是效度是針對測驗(yàn)結(jié)果的。二是效度是針對某種特定的測評目的而存在的。三是效度是連續(xù)性的，是一個關(guān)于程度的估計(jì)。39可編輯ppt（一）效度的含義人事測量的效度就是指測量的有效性，即所采用（二）效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和效標(biāo)關(guān)聯(lián)效度三類，這三類效度是相互聯(lián)系的，一個好的測評通常可以用一種或一種以上的效度來表示。40可編輯ppt（二）效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的代表性取樣的指標(biāo),即是說指標(biāo)與標(biāo)準(zhǔn)是否符合該類人員的功能特征。要素的設(shè)計(jì)與標(biāo)準(zhǔn)的編制成為鑒定測評效度的內(nèi)容。常見方法：（1）通過對照內(nèi)容范圍來估計(jì)（2）評分者信度（3）統(tǒng)計(jì)分析41可編輯ppt1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程度。所謂的構(gòu)思是指一些抽象的假設(shè)性的概念、特性或變量。如智力、創(chuàng)造力、言語流暢性、焦慮、動機(jī)等。構(gòu)思不能直接測量，需要借助一定的測評工具來反映。構(gòu)思效度的估計(jì)方法有許多，總的來說，可以分為測驗(yàn)內(nèi)部的方法和測驗(yàn)間方法兩大類。42可編輯ppt2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)系數(shù)來表示測評效度的高低的，表現(xiàn)進(jìn)行預(yù)測的有效性程度。這里效標(biāo)是指考察測驗(yàn)效用的外在參照標(biāo)準(zhǔn)，是一種可以直接、獨(dú)立測量的行為。43可編輯ppt3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)通常情況下，對一般職工來講，其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量；對于科技人員應(yīng)以發(fā)明、創(chuàng)造及技術(shù)成果的數(shù)量和效益為效標(biāo)；對管理人員應(yīng)以工作效率、職工積極性調(diào)動程度和經(jīng)濟(jì)效益為效標(biāo)；對領(lǐng)導(dǎo)人員應(yīng)以開發(fā)人才、開創(chuàng)局面和社會、經(jīng)濟(jì)效益為效標(biāo)。44可編輯ppt通常情況下，對一般職工來講，其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量；對于科技人（三）影響效度的主要因素(1)受測樣本一個測驗(yàn)施測于不同的樣本，由于受測者在年齡、文化程度以及經(jīng)驗(yàn)背景上的差別，效度就會隨之不同，因此，受測樣本的選取是用來考察效度所依據(jù)的重要因素。樣本容量的大小與效度系數(shù)的高低也有一定關(guān)系。樣本容量越大，測量誤差就會有相互抵消的趨勢，由此會有助于提高測驗(yàn)和效標(biāo)測量的信度，同時有助于提高效度系數(shù)。45可編輯ppt（三）影響效度的主要因素(1)受測樣本45可編輯ppt(2)效標(biāo)選擇適當(dāng)?shù)男?biāo)是統(tǒng)計(jì)效度的先決條件。一個測驗(yàn)由于采用的效標(biāo)不同，其效度可能會大相徑庭。甚至，由于效標(biāo)選擇不當(dāng)，可能導(dǎo)致無法衡量測驗(yàn)的效度。46可編輯ppt(2)效標(biāo)46可編輯ppt通過以上的分析，我們可以看出信度與效度的分析是直接對測評結(jié)果質(zhì)量的考查，而一個測驗(yàn)的信度和效度在很大程度上取決于該測驗(yàn)的題目參數(shù)(難度和區(qū)分度)，編制和篩選具有適當(dāng)參數(shù)的題目是改善測驗(yàn)信度和效度的前提。我們根據(jù)試題結(jié)果對組成測驗(yàn)的各個題目進(jìn)行分析，從而評價題目好壞。四、難度分析47可編輯ppt通過以上的分析，我們可以看出信度與效度的分析是直接對測評結(jié)果（一）難度的概念難度是指測驗(yàn)題目的難易程度，也是試題對被試知識和能力水平的適合程度的指標(biāo)。難度是一個相對的概念，難度的高低與被試的水平直接相關(guān)。我們在說測量的難易程度時，應(yīng)該針對具體的被試。48可編輯ppt（一）難度的概念難度是指測驗(yàn)題目的難易程度，也是試題對被試知（二）難度的計(jì)算1、以答對百分比來估計(jì)難度如果試題為二分法反應(yīng)記分項(xiàng)目，P值可以采用通過率公式計(jì)算。公式為：P=R/N其中，P為試題難度；R為答對試題的人數(shù)；N為參加測驗(yàn)的總?cè)藬?shù)。49可編輯ppt（二）難度的計(jì)算1、以答對百分比來估計(jì)難度49可編輯ppt當(dāng)被試人數(shù)較多時，可以采用極端分組法求試題的難度，先按測驗(yàn)總分的高低進(jìn)行排序，然后將被試分成三組：分?jǐn)?shù)高的27%被試為高分組，分?jǐn)?shù)最低的27%的被試為低分組，中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過率，再求試題的難度。P=（PH+PL）/2其中，PH和PL分別代表高分組和低分組的通過率。50可編輯ppt當(dāng)被試人數(shù)較多時，可以采用極端分組法求試題的難度，先按測驗(yàn)總（三）難度對測驗(yàn)的影響1.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)測驗(yàn)的難度就越大，測驗(yàn)分?jǐn)?shù)就越是集中在低分段，其分?jǐn)?shù)分布呈正偏態(tài)；相反，分?jǐn)?shù)分布呈現(xiàn)負(fù)偏態(tài)。2.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度測驗(yàn)分?jǐn)?shù)過高或過低，測驗(yàn)分?jǐn)?shù)就會高度集中，測驗(yàn)分?jǐn)?shù)的離散程度就變小了。3.測驗(yàn)難度影響測驗(yàn)的鑒別能力51可編輯ppt（三）難度對測驗(yàn)的影響1.測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)（四）測驗(yàn)難度的確定確定合理的測驗(yàn)難度才能使試題產(chǎn)生區(qū)分不同程度被試的最大效果。但題目的難度水平究竟多高合適，依賴于測驗(yàn)的目的、性質(zhì)、和題目形式。一般來說，我們進(jìn)行測驗(yàn)的目的是要了解被試個體間的差異，所以在選擇題目時，最好使試題的平均難度接近0.50，而各題難度在0.50—0.20之間。此外，對于不同的題型應(yīng)該有各自適宜的難度。如是非題難度值應(yīng)為0.75，而對于四擇一題目，難度值約為0.63。52可編輯ppt（四）測驗(yàn)難度的確定確定合理的測驗(yàn)難度才能使試題產(chǎn)生區(qū)分不同五、區(qū)分度分析53可編輯ppt五、區(qū)分度分析53可編輯ppt

（一）區(qū)分度的概念區(qū)分度又稱鑒別度，它是指測驗(yàn)項(xiàng)目對不同水平的被試反應(yīng)的鑒別能力和區(qū)分程度。若項(xiàng)目鑒別力高，則能力強(qiáng)、水平高的被試得分高，能力弱、水平低的被試得分低，否則就沒有鑒別力。它是評價測題質(zhì)量，篩選測題的主要指標(biāo)和依據(jù)。54可編輯ppt（一）區(qū)分度的概念區(qū)分度又稱鑒別度，它是指測驗(yàn)項(xiàng)目對不同水（二）區(qū)分度的估計(jì)方法1.鑒別度指數(shù)鑒別度指數(shù)是衡量區(qū)分度的一種最常用，也是最簡便的方法，它是比較得分高和得分低的兩組被試在項(xiàng)目通過率上的差值。55可編輯ppt（二）區(qū)分度的估計(jì)方法1.鑒別度指數(shù)55可編輯ppt一般思路為，當(dāng)成績是連續(xù)變量時，可從分?jǐn)?shù)分布的兩端各選擇27%的被試組成高、低分組，再分別計(jì)算兩組每道題目上的通過率，二者之差就是各題目的鑒別度指數(shù)D。公式：D=PH-PL其中，PH為高分組答對該題的人數(shù)比率；PL為低分組答對該題的人數(shù)比率。56可編輯ppt一般思路為，當(dāng)成績是連續(xù)變量時，可從分?jǐn)?shù)分布的兩端各選擇272.方差法方差表示一組數(shù)據(jù)離散程度。方差大，數(shù)據(jù)分散。被試在某一試題上的得分越分散，則該題的鑒別力越大。在進(jìn)行實(shí)際的項(xiàng)目分析中，被試一般不能少于30人，這樣使用下面公式才有效。57可編輯ppt2.方差法方差表示一組數(shù)據(jù)離散程度。方差大，數(shù)據(jù)分散。被試在3.內(nèi)部一致性系數(shù)計(jì)算區(qū)分度一般以總分來衡量被試能力的高低，當(dāng)被試總分高時，在某個項(xiàng)目上的得分也高；總分低時，項(xiàng)目上的得分也低，說明該項(xiàng)目和總分有一致性。在標(biāo)準(zhǔn)化和大規(guī)模的測驗(yàn)中，通過考察項(xiàng)目和總分的相關(guān)，來測驗(yàn)各項(xiàng)目所測查內(nèi)容的一致性。如果項(xiàng)目與總分高相關(guān)，項(xiàng)目的鑒別力也就高。58可編輯ppt3.內(nèi)部一致性系數(shù)計(jì)算區(qū)分度一般以總分來衡量被試能力的高低，4.項(xiàng)目與外部準(zhǔn)則的相關(guān)—項(xiàng)目效度分析項(xiàng)目效度分析是考察被試在項(xiàng)目上反應(yīng)和在效標(biāo)上表現(xiàn)的關(guān)系,即每個測題所測查的行為是否反映了被試在效標(biāo)上的表現(xiàn)。相關(guān)系數(shù)就是項(xiàng)目通過率與效標(biāo)成績的相關(guān)系數(shù)。相關(guān)越高，表明項(xiàng)目越具有區(qū)分的能力。59可編輯ppt4.項(xiàng)目與外部準(zhǔn)則的相關(guān)—項(xiàng)目效度分析項(xiàng)目效度分析是考察被試（三）合理區(qū)分度的確定在上面已經(jīng)談到不同的計(jì)算方法會帶來不同的區(qū)分度值，也就是說區(qū)分度的值具有相對性。此外，區(qū)分度還與受測團(tuán)體的同質(zhì)程度有關(guān)，同質(zhì)性越強(qiáng)，區(qū)分度就越小。所以，在確定合理的區(qū)分度時，我們既要考慮采用哪種區(qū)分度指標(biāo)，以及樣本大小和特性外，還要考慮測驗(yàn)的目的、性質(zhì)和功能。60可編輯ppt（三）合理區(qū)分度的確定在上面已經(jīng)談到不同的計(jì)算方法會帶來不同人事測評的質(zhì)量評價61可編輯ppt人事測評的質(zhì)量評價1可編輯ppt一、誤差62可編輯ppt一、誤差2可編輯ppt(一）誤差的含義兩層含義：其一，誤差是由與測量目的無關(guān)的變因引起的；其二，誤差是不準(zhǔn)確或不一致的測量結(jié)果。63可編輯ppt(一）誤差的含義兩層含義：3可編輯ppt一種是隨機(jī)誤差，又叫可變誤差，這是由與測量目的無關(guān)的偶然因素引起而不易控制的誤差，它使多次測量產(chǎn)生不一致的結(jié)果。這類誤差的方向和大小的變化完全是隨機(jī)的，無規(guī)律可循。(二）誤差的主要表現(xiàn)形式另一種是系統(tǒng)誤差，又稱常定誤差，這是由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)，穩(wěn)定地存在于每一次測量中，此時雖然測值一致，但不正確?？梢?，系統(tǒng)誤差只影響測值的準(zhǔn)確性，而隨機(jī)誤差既影響準(zhǔn)確性又影響一致性。64可編輯ppt一種是隨機(jī)誤差，又叫可變誤差，這是由與測量目的無關(guān)的偶然因素（三）人事測評的誤差類型第一類是來源于人事測評工具本身的誤差；第二類是來源于測評實(shí)施過程的誤差；第三類是來源于測評實(shí)施者的誤差；第四類是來源于應(yīng)試者的誤差。65可編輯ppt（三）人事測評的誤差類型第一類是來源于人事測評工具本身的誤差1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越科學(xué)，則誤差越??；反之則誤差越大。人事測評不像物理、化學(xué)測量，人的才能、個性、品德等許多特性都是無法直接測量的，而且人事測評常常有主觀的因素。因此，人事測評工具和方法造成的誤差比物理化學(xué)測量要大得多。66可編輯ppt1、測評工具和方法的因素物理、化學(xué)測評工具越精密、測評方法越測評工具和方法造成誤差的因素（1）測評工具所測評的行為和特性與目標(biāo)上所欲測評的行為和特性之間的不一致。比如，測評情緒穩(wěn)定性的所有測評題目都應(yīng)該只測評情緒穩(wěn)定性，而實(shí)際上，有的題目還測了情緒穩(wěn)定性以外的特性，這些特性就成了干擾因素，是測評誤差的來源。67可編輯ppt測評工具和方法造成誤差的因素（1）測評工具所測評的行為和特性（2）測評指標(biāo)和測題抽樣的代表性一般來說，測評指標(biāo)、測題越多，則代表性越好，誤差也就越少。因?yàn)榻?jīng)濟(jì)、可行性等原因，不可能把所有與測評目的有關(guān)的所有指標(biāo)都作為測評的指標(biāo)，也不可能把所有相關(guān)的全部測題都選作測試題目，只能選有代表性的指標(biāo)、有代表性的測題樣本用來作測評之用。測題的內(nèi)容和難度分布是測題代表性的重要指標(biāo)。68可編輯ppt（2）測評指標(biāo)和測題抽樣的代表性一般來說，測評指標(biāo)、測題越多（3）測題的格式和用詞、測評程序等因素有的題目格式（如是非題）具有可猜測性；有的題目格式（所有的主觀題）其評分具有主觀性；測題的用詞有歧義或用詞不是很準(zhǔn)確這些都是引起測評誤差的來源。69可編輯ppt（3）測題的格式和用詞、測評程序等因素有的題目格式（如是非題2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用，測評實(shí)施已經(jīng)越來越標(biāo)準(zhǔn)化，有測評實(shí)施造成的誤差也越來越少。但是，測評的具體實(shí)施過程中還是會有許多不可預(yù)期的偶然因素。70可編輯ppt2、測評的具體實(shí)施過程中的偶然因素隨著電腦等測評工具的使用，不可預(yù)期的偶然因素種類（1）環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、噪音、照明、突然斷電等因素，都可以產(chǎn)生誤差。（2）測評紀(jì)律的控制不好。測評紀(jì)律控制不嚴(yán)格，出現(xiàn)有人作弊（如代考、抄襲、相互交流等）、泄露測評題目等，也會造成測評誤差。（3）錯誤操作。誤讀指導(dǎo)語、對指導(dǎo)語錯誤理解、誤答（如自己答的答案是A，卻選了C）、記錄錯誤、記分錯誤等因素。71可編輯ppt不可預(yù)期的偶然因素種類（1）環(huán)境干擾。測評環(huán)境的溫度、通風(fēng)、3、被測評者因素被測評者因素被測評者是活生生的人，人是非常復(fù)雜的，諸多生理、心理因素都可以成為干擾人事測評目的的因素?？蓪?dǎo)致人事測評誤差的被測評者因素大致有：（1）生理因素。身體健康因素、饑餓與過飽、疲勞程度、生理周期等都可以影響人格測試的結(jié)果。72可編輯ppt3、被測評者因素被測評者因素被測評者是活生生的人，人是非常復(fù)（2）動機(jī)水平每個被測評者都有參加測評的目的，這個目的可以導(dǎo)致被測評者故意掩飾自己，采取裝好或裝壞的傾向性回答，其結(jié)果就不能反映出被測評者的真實(shí)情況。不同的被測評者其動機(jī)水平不一樣，因而掩飾程度也會有所不同。73可編輯ppt（2）動機(jī)水平13可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài)，動機(jī)過分強(qiáng)烈會引起被測評者產(chǎn)生測評焦慮，而動機(jī)不足則會引起被測評者對測評采取敷衍了事的態(tài)度，。在人格、態(tài)度、動機(jī)等測評中，被測評者的動機(jī)水平常常會是測評被測評者因素產(chǎn)生誤差的最重要的因素。74可編輯ppt不同的動機(jī)水平可以引起被測評者不同的應(yīng)激狀態(tài)，動機(jī)過分強(qiáng)烈會（3）受教育程度、價值觀等文化因素。被測評者受教育程度不同，其成長的文化背景不同，價值觀不同，會造成被測評者對測題的理解、答題態(tài)度、答題偏好等的不同，從而造成測評誤差。75可編輯ppt（3）受教育程度、價值觀等文化因素。被測評者受教育程度不同，（4）有關(guān)經(jīng)驗(yàn)。如果在測評之前，被測評者已經(jīng)具有與測評有關(guān)的經(jīng)驗(yàn)，比如已經(jīng)經(jīng)歷過類似的或同一類型的測試從而掌握了有關(guān)的答題策略，就可能對測評結(jié)果產(chǎn)生較大的影響。有人曾做過試驗(yàn)，讓5名熟悉、已知其智力水平的學(xué)生進(jìn)行知覺和圖形推理的大量練習(xí)，然后再進(jìn)行瑞文圖形智力測試，結(jié)果測得的結(jié)果比他們的實(shí)際智力高出不少。76可編輯ppt（4）有關(guān)經(jīng)驗(yàn)。如果在測評之前，被測評者已經(jīng)具有與測評有關(guān)的4、主試因素主試以貌取人、對被測評者有偏見，可以造成測評誤差。主試不良的言行舉止對被試的心理狀態(tài)干擾、暗示、誤導(dǎo)，可以造成誤差。主試評分的標(biāo)準(zhǔn)不一致，先緊后松、先松后緊、忽高忽低，或有意無意地修改評分標(biāo)準(zhǔn)，對某些人特別照顧，都可以引起誤差。77可編輯ppt4、主試因素主試以貌取人、對被測評者有偏見，可以造成測評誤差總結(jié)測評的誤差一般可以被分為兩大類：隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由偶然因素造成的，其產(chǎn)生是隨機(jī)的、無規(guī)律的，因此其數(shù)值大小也是隨機(jī)變化、不確定的。它是引起測評不一致的變因，與測評信度有關(guān)。78可編輯ppt總結(jié)測評的誤差一般可以被分為兩大類：隨機(jī)誤差和系統(tǒng)誤差。18系統(tǒng)誤差，又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引起的一種恒定的、系統(tǒng)的變化，其數(shù)值大小具有一定的規(guī)律性和穩(wěn)定性。它與測評的效度有關(guān)。習(xí)慣上，把隨機(jī)誤差稱為觀察誤差或測評誤差。從這個意義上講，測評誤差這個概念所指誤差只是測評分?jǐn)?shù)所包含的誤差（隨機(jī)誤差和系統(tǒng)誤差）的一部分（即隨機(jī)誤差）。79可編輯ppt系統(tǒng)誤差，又稱為常定誤差或偏差。它是由與測驗(yàn)?zāi)康臒o關(guān)的因子引二、信度分析80可編輯ppt二、信度分析20可編輯ppt（一）信度的基本概念信度又叫可靠性程度，用于分析一種測評方法所得結(jié)果的前后一致性水平，并以這種一致性程度為指標(biāo)來判斷測評的可靠性。測驗(yàn)結(jié)果的可靠性與測驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。在人才測評中誤差是不可避免的，只能盡可能追求高的精度，把誤差控制在一個有規(guī)律的范圍以內(nèi)，這樣測量得到的結(jié)果才比較穩(wěn)定可靠。信度實(shí)際上就是隨機(jī)誤差的一種度量。81可編輯ppt（一）信度的基本概念信度又叫可靠性程度，用于分析一種測評方法（二）信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。信度系數(shù)是同一樣本在兩種不同時間、不同情境條件或兩組不同評價材料評定結(jié)果之間的相關(guān)系數(shù)。針對不同的誤差來源，信度可有不同的確定方法。一般有以下幾種類型：重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度。82可編輯ppt（二）信度系數(shù)及估計(jì)方法信度指標(biāo)都用信度系數(shù)的形式呈現(xiàn)。221.重測信度重測信度又稱為穩(wěn)定性系數(shù)，它是估計(jì)測評跨時間的一致性程度，即用同一測驗(yàn)，在兩個不同時間里對同一群體施測兩次，這兩次測驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)就是重測系數(shù)。一個測驗(yàn)的重測系數(shù)越高，說明測評的穩(wěn)定性越好，測評受隨機(jī)因素的影響越小。83可編輯ppt1.重測信度重測信度又稱為穩(wěn)定性系數(shù)，它是估計(jì)測評跨時間的一在獲得重測系數(shù)時，最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控制合理的時間間隔。時間間隔長了，被試的心理特征就會因?yàn)閷W(xué)習(xí)、經(jīng)歷、教育培訓(xùn)等因素而發(fā)展變化，使相關(guān)系數(shù)降低；時間間隔短了，又會使首次測評時的練習(xí)效果和記憶效果的影響增大，從而造成了假性的高相關(guān)。84可編輯ppt在獲得重測系數(shù)時，最需要注意的是必須根據(jù)測驗(yàn)的性質(zhì)和目的來控2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差等各方面與原測評一樣的測評，即功能等值但題目內(nèi)容不同。兩個等值的測驗(yàn)互為復(fù)本。復(fù)本信度又稱為等值性系數(shù)，它是代表測評跨形式的一致性，即在對被試進(jìn)行測評以后間隔一定的時間，運(yùn)用復(fù)本再測評一次所獲得的復(fù)本相關(guān)系數(shù)。復(fù)本信度的高低反映了兩個測驗(yàn)復(fù)本在內(nèi)容上的等值性程度。85可編輯ppt2.復(fù)本信度復(fù)本是指在內(nèi)容、數(shù)量、格式、難度、平均數(shù)、標(biāo)準(zhǔn)差復(fù)本信度的優(yōu)點(diǎn)：適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)成績影響，同時減少了輔導(dǎo)或作弊的可能性。當(dāng)然，復(fù)本相關(guān)系數(shù)也有局限性：一方面，在現(xiàn)實(shí)中，編制理想的復(fù)本常常很難，有許多測評都沒有復(fù)本。另一方面，復(fù)本測評也會受練習(xí)的影響。86可編輯ppt復(fù)本信度的優(yōu)點(diǎn)：適用于在長期追蹤研究或調(diào)查某些干涉變量對測驗(yàn)3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù)，都需測評兩次，不但要花較多的精力，而且受測者會受練習(xí)的影響使第二次測評失真。內(nèi)部一致性系數(shù)則不同，它只需要測評一次，它通過分析同一測評內(nèi)部各測評項(xiàng)目之間的相關(guān)系數(shù)的方法來估計(jì)信度系數(shù)。87可編輯ppt3.內(nèi)部一致性信度用重測相關(guān)系數(shù)和復(fù)本相關(guān)系數(shù)，都需測評兩次內(nèi)部一致性系數(shù)反映的是跨測題的一致性，即測評內(nèi)部各部分之間是否具有同質(zhì)性。內(nèi)部一致性信度又分為分半信度、同質(zhì)性信度和α系數(shù)。88可編輯ppt內(nèi)部一致性系數(shù)反映的是跨測題的一致性，即測評內(nèi)部各部分之間是（1）分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為等值的兩半，并分別計(jì)算每位被試在兩半測驗(yàn)上的得分，再求出這兩個分?jǐn)?shù)的相關(guān)系數(shù)，從而來估計(jì)整個測評的信度。因?yàn)榉职胂禂?shù)只是根據(jù)原測題的一半題目而來，而信度的大小又與測驗(yàn)的長度有關(guān)，所以分半系數(shù)常常要比原測驗(yàn)的信度低。89可編輯ppt（1）分半信度獲得分半信度系數(shù)的方法是把一個測評分成兩個最為為了校正這個差異，常運(yùn)用斯皮爾曼-布朗公式：

rxx=2rhh/(1+rhh)

其中，rhh：兩半測驗(yàn)的相關(guān)系數(shù)；rxx：估計(jì)或修正后的信度。90可編輯ppt為了校正這個差異，常運(yùn)用斯皮爾曼-布朗公式：30可編輯ppt（2）同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半，它是指測驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。所謂的同質(zhì)性是指所有的測驗(yàn)題目測量的只是單一的特質(zhì)或內(nèi)容，表現(xiàn)為所有測驗(yàn)題目得分的一致性。常用的計(jì)算方法是庫德-理查遜估計(jì)方法。計(jì)算公式有庫德-理查遜20號公式（簡稱KR20）和21號公式（KR21）。91可編輯ppt（2）同質(zhì)性信度同質(zhì)性信度不需要把測評分為兩半，它是指測驗(yàn)內(nèi)KR20公式n為測驗(yàn)題目數(shù)，pi為通過i題的人數(shù)比例；qi為未通過該題的人數(shù)比例；pi+qi=1；∑piqi為所有題目答對與答錯人數(shù)百分比乘積的總和。庫德-理查遜信度系數(shù)的運(yùn)用需要滿足幾個條件：所有測題都采用二分法記分，即都采用0，1記分，答對記1分，答錯記0分；測驗(yàn)的項(xiàng)目難度比較接近；項(xiàng)目間的組間相關(guān)相等。92可編輯pptKR20公式n為測驗(yàn)題目數(shù)，pi為通過i題的人數(shù)比例；qi為（3）α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分（如人格測驗(yàn)、態(tài)度量表），庫德-理查遜信度就無法運(yùn)用?？藗惏秃仗岢隽诉m用于各種記分情況的α系數(shù)來估計(jì)信度。具體公式如下：其中，Si為每一項(xiàng)目的方差；Sx為測驗(yàn)總分方差。93可編輯ppt（3）α系數(shù)當(dāng)測驗(yàn)項(xiàng)目采用多重記分（如人格測驗(yàn)、態(tài)度量表），4、評分者信度在人事測評中，不同的評分者其觀察角度、注意力、對被試的偏見等都會使評分的結(jié)果不一致，因此，評分者的評判也是誤差的來源之一。評分者信度就是指不同評分者對同樣對象進(jìn)行評定的一致性。具體方法是：由兩名評分者對同一個被試樣組進(jìn)行評分，再求兩個評判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法，也可以采用斯皮爾曼等級相關(guān)方法。94可編輯ppt4、評分者信度在人事測評中，不同的評分者其觀察角度、注意力、如果評分者在三人以上，而且又采用等級記分時，就要用肯德爾和諧系數(shù)來求評分者信度。公式為：其中，K為評分者人數(shù)，N為被評定的人數(shù)或答卷數(shù)；Ri為每一個對象被評等級。95可編輯ppt如果評分者在三人以上，而且又采用等級記分時，就要用肯德爾和諧（三）影響信度系數(shù)的主要因素1.測驗(yàn)長度：在其他條件相等的情況下，測驗(yàn)長度（題目的多少）越長，信度值越高。因?yàn)闇y驗(yàn)越長，題目取樣或內(nèi)容取樣就越充分，結(jié)果就越可靠，同時也避免猜測題目的影響。2.樣本團(tuán)體的性質(zhì)：一般而言，在其他條件不變的情況下，樣本團(tuán)體的分?jǐn)?shù)分布范圍越大，變異性越大，信度系數(shù)將越大。樣本團(tuán)體的異質(zhì)性越大，信度系數(shù)就越高。96可編輯ppt（三）影響信度系數(shù)的主要因素1.測驗(yàn)長度：在其他條件相等3.測驗(yàn)難度：測驗(yàn)難度對信度也會產(chǎn)生影響。如果一個測驗(yàn)的難度太低，大多數(shù)被試都可以輕而易舉地答對題目，測驗(yàn)分?jǐn)?shù)會非常集中并聚在高分端；如果測驗(yàn)的難度太高，多數(shù)被試都只能憑猜測答題，所有分?jǐn)?shù)都集中在低分端。這樣都會使測量到的分?jǐn)?shù)分布太窄，導(dǎo)致信度降低。97可編輯ppt3.測驗(yàn)難度：測驗(yàn)難度對信度也會產(chǎn)生影響。37可編輯ppt三、效度98可編輯ppt三、效度38可編輯ppt（一）效度的含義人事測量的效度就是指測量的有效性，即所采用的測評工具對其所要測評的特性測量到什么程度的估計(jì)。一是效度是針對測驗(yàn)結(jié)果的。二是效度是針對某種特定的測評目的而存在的。三是效度是連續(xù)性的，是一個關(guān)于程度的估計(jì)。99可編輯ppt（一）效度的含義人事測量的效度就是指測量的有效性，即所采用（二）效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和效標(biāo)關(guān)聯(lián)效度三類，這三類效度是相互聯(lián)系的，一個好的測評通?？梢杂靡环N或一種以上的效度來表示。100可編輯ppt（二）效度的類型及估計(jì)方法一般把效度分為內(nèi)容效度、構(gòu)思效度和1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的代表性取樣的指標(biāo),即是說指標(biāo)與標(biāo)準(zhǔn)是否符合該類人員的功能特征。要素的設(shè)計(jì)與標(biāo)準(zhǔn)的編制成為鑒定測評效度的內(nèi)容。常見方法：（1）通過對照內(nèi)容范圍來估計(jì)（2）評分者信度（3）統(tǒng)計(jì)分析101可編輯ppt1.內(nèi)容效度內(nèi)容效度是檢查測驗(yàn)內(nèi)容是否是所欲測量的行為領(lǐng)域的2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程度。所謂的構(gòu)思是指一些抽象的假設(shè)性的概念、特性或變量。如智力、創(chuàng)造力、言語流暢性、焦慮、動機(jī)等。構(gòu)思不能直接測量，需要借助一定的測評工具來反映。構(gòu)思效度的估計(jì)方法有許多，總的來說，可以分為測驗(yàn)內(nèi)部的方法和測驗(yàn)間方法兩大類。102可編輯ppt2.構(gòu)思效度構(gòu)思效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)思或特質(zhì)的程3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)系數(shù)來表示測評效度的高低的，表現(xiàn)進(jìn)行預(yù)測的有效性程度。這里效標(biāo)是指考察測驗(yàn)效用的外在參照標(biāo)準(zhǔn)，是一種可以直接、獨(dú)立測量的行為。103可編輯ppt3、效標(biāo)關(guān)聯(lián)效度效標(biāo)關(guān)聯(lián)效度是以測評分?jǐn)?shù)和效度準(zhǔn)則之間的相關(guān)通常情況下，對一般職工來講，其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量；對于科技人員應(yīng)以發(fā)明、創(chuàng)造及技術(shù)成果的數(shù)量和效益為效標(biāo)；對管理人員應(yīng)以工作效率、職工積極性調(diào)動程度和經(jīng)濟(jì)效益為效標(biāo)；對領(lǐng)導(dǎo)人員應(yīng)以開發(fā)人才、開創(chuàng)局面和社會、經(jīng)濟(jì)效益為效標(biāo)。104可編輯ppt通常情況下，對一般職工來講，其效標(biāo)應(yīng)為產(chǎn)量與質(zhì)量；對于科技人（三）影響效度的主要因素(1)受測樣本一個測驗(yàn)施測于不同的樣本，由于受測者在年齡、文化程度以及經(jīng)驗(yàn)背景上的差別，效度就會隨之不同，因此，受測樣本的選取是用來考察效度所依據(jù)的重要因素。樣本容量的大小與效度系數(shù)的高低也有一定關(guān)系。樣本容量越大，測量誤差就會有相互抵消的趨勢，由此會有助于提高測驗(yàn)和效標(biāo)測量的信度，同時有助于提高效度系數(shù)。105可編輯ppt（三）影響效度的主要因素(1)受測樣本45可編輯ppt(2)效標(biāo)選擇適當(dāng)?shù)男?biāo)是統(tǒng)計(jì)效度的先決條件。一個測驗(yàn)由于采用的效標(biāo)不同，其效度可能會大相徑庭。甚至，由于效標(biāo)選擇不當(dāng)，可能導(dǎo)致無法衡量測驗(yàn)的效度。106可編輯ppt(2)效標(biāo)46可編輯ppt通過以上的分析，我們可以看出信度與效度的分析是直接對測評結(jié)果質(zhì)量的考查，而一個測驗(yàn)的信度和效度在很大程度上取決于該測驗(yàn)的題目參數(shù)(難度和區(qū)分度)，編制和篩選具有適當(dāng)參數(shù)的題目是改善測驗(yàn)信度和效度的前提。我們根據(jù)試題結(jié)果對組成測驗(yàn)的各個題目進(jìn)行分析，從而評價題目好壞。四、難度分析107可編輯ppt通過以上的分析，我們可以看出信度與效度的分析是直接對測評結(jié)果（一）難度的概念難度是指測驗(yàn)題目的難易程度，也是試題對被試知識和能力水平的適合程度的指標(biāo)。難度是一個相對的概念，難度的高低與被試的水平直接相關(guān)。我們在說測量的難易程度時，應(yīng)該針對具體的被試。108可編輯ppt（一）難度的概念難度是指測驗(yàn)題目的難易程度，也是試題對被試知（二）難度的計(jì)算1、以答對百分比來估計(jì)難度如果試題為二分法反應(yīng)記分項(xiàng)目，P值可以采用通過率公式計(jì)算。公式為：P=R/N其中，P為試題難度；R為答對試題

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

人事測評測評的質(zhì)量評價課件

文檔簡介

溫馨提示

最新文檔

評論

中文字字幕乱码视频,亚洲av无码乱码在线观看富二代,亚洲乱妇亚洲乱妇xinglu,亚洲日韩乱码中文无码蜜桃臀,亚洲精品无码久久久久久久

人事測評測評的質(zhì)量評價課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔