第七章 人事测量的关键技术:信度
信度是标准化人事测量的基本要求之一。
一、人事测量的可靠性——信度
(一)信度的定义
1、信度主要是指测量结果的可靠性或一致性。
2、卡尺作为一种量具是有一定精度限制的,也就是说,量具本身有误差,这种误差是必然的,但却是有规律的。这种误差叫做系统误差。
3、我们每一次测量都可能有操作上的差异,或者由于不可预见的外界因素的影响,从而造成误差,这些误差也是难免的,但却是毫无规律的。这种误差叫做随机误差。
4、在研究信度时,主要应考虑两方面的问题:一方面是稳定性问题涉及:
(1)测验分数一致性的程度,即不同时间、不同测验条件下所得分数之间的一致性有多大;
(2)一个人的获得分数与“真实分数”之间接近程度如何;
(3)测验的测量一致性是否可以达到实际应用的程度等问题。
另一方面是影响稳定性的原因,即分数不稳定、不一致的原因:
(1)什么因素造成了这种差异;
(2)这些效应的相对作用如何。
(二)信度的作用
1、信度高低指标通常以相关系数表示,称为信度系数。信度系数一般是同一样本所得的两组资料的相关,在理论上表示为实得分数与真实分数相关的平方:rxx=rxr2=ST2/SX2
其中,rxr=ST/SX有时也称为信度指数,它是真实分数标准差与实得分数标准差的比率。
2、误差的大小与测验的信度有直接关系:两次测验分数的差异越大,信度就越低。
3、在人事测量中,对信度系数进行确定通常有以下两方面的作用:
(1)解释真实分数与实得分数的相关。应该注意的是,信度系数的分布是从0.00~1.00的正数范围,代表了从缺乏信度到完全可信的所有状况。
(2)说明可以接受的信度水准。一般来说,当rxx 小于0.70时,不能用测验对个人做评价,也不能在团体间作比较;当rxx 大于0.70时,可用于团体间比较;rxx大于0.85时,可用于鉴别个人。
二、如何评估人事测量的信度
(一)重测信度
1、重测信度又称为稳定性系数,它的计量方法是采用重测法:用同一测验,在不同时间对同一群体施测两次,这两次测量分数的相关系数即为重测系数。根据重测相关系数的高低,可以得知测量结果在经过一段时间之后的稳定程度。重测信度越高,说明测量的结果越一致、越可靠。
2、在评估重测间隔的时间。间隔时间太短,被试对测试题记忆犹新,必然会造成假性高相关;而间隔时间太长,测验结果又会受应该者的身心特质改变的影响,使相关系数降低。重测间隔时间的长短,必须根据测验的性质和目的来确定。
3、对于人格测验,重测间隔在两周到六个月之间比较合适。
4、在进行重测信度的评估时,还应注意以下两个重要问题:
(1)重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化。
(2)不同的行为受随机误差影响不同。
(二)复本信度
1、复本信度又称等值性系数,它是以两个测验复本来测量同一个群体,然后求得应试者在这两个测验上得分的相关系数。复本信度的高代反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为复本。
2、计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。
3、复本信度的主要优点在于:
(1)能够避免重测信度的一些问题,如记忆效果、练习效应等;
(2)适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响;
(3)减少了辅导或作弊的可能性。
4、复本信度的缺点:
(1)如果测量的行为易受练习的影响,则复本信度只能减少而不能消除这种影响;
(2)有些测验的性质会由于重复而发生改变,例如某些问题解决型号的测验,如果掌握了解题原则,就有可能产生迁移;
(3)有些测验很难找到合适的复本。
(三)内部一致性信度
重测信度和复本信度分别注重考虑测量跨时间的一致性和跨形式的一致性,而内部一致通过性信度系数主要反映的是测验内部题目之间的关系,考察测验的各个题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。
1、分半信度
(1)分半信度系数是通过将测验分成两半,计算这两半测验之间的相关性而获得的信度系数。
(2)一般采用奇偶分半的方法,即将测验按奇数题和偶数题分成两半。
2、同质性信度
(1)同质性是指所有测验题目测量的只是单一特质或内容,表现为所有测验题目得分的一致性。
(2)同质性信度是指测验内部的各题目在多大程度上考察了同一内容。同质性也可以作为效度的一种指标。
(四)评分者信度
1、评分者的评判也是误差的来源之一。
2、评分者信度是指不同评分者对同样对象进行评定时的一致性。
各种信度系数相应的误差来源
信度系数类型 误差方差来源
重测信度 时间取样
复本信度
(连续施测) 内容取样
重测复本信度 时间和内容取样
分半信度 内容取样
同质性信度 内容的异质性
评分者信度 评分者差异
一般情况下,间隔施测的复本信度值最低;修正后的分半信度值最高。
三、影响信度的因素
对测验的信度造成影响的因素主要有:样本团体的性、测验的长度、测验难度。
1、样本团体的性质
样本团体的性质对信度的影响主要有以下三个方面:
(1)样本团体的分数分布。任何以相关系数表示的信度系数都会受样本团体分数颁布的影响。分数分布越广,信度系数就相对越高,分数分布越窄,信度系数就会越低。
(2)样本团体的异质性。信度系数还会受到样本团体异质性的影响。一般来说,取样团体的异质性越大,信度系数就相对越高。
(3)不同团体间能力水平的差异。测验所施测的团体的平均能力水平的不同也会对信度产生影响。例,在斯坦福-比奈量表中,不同年龄组的信度从0.83~0.98不等。
2、测验的长度
一般来说,测验越长,信度值越高。一方面,测验越长,题目取样或内容取样就越充分,结果就越可靠。
另一方面,较长的测验也不容易受到猜测的影响。
3、测验的难度
(1)如果一个测验的难度太低,测验分数会非常集中并聚在高分端,即出现天花板效应。或者难度太大,所有分数都集中在低分端,出现地板效应。
(2)当所有被试的平均分为测验总分的一半(50%),并且分数从零分到满分分布时,测量的信度最高。
声明:
(一)由于考试政策等各方面情况的不断调整与变化,本网站所提供的考试信息仅供参考,请以权威部门公布的正式信息为准。
(二)本网站在文章内容来源出处标注为其他平台的稿件均为转载稿,免费转载出于非商业性学习目的,版权归原作者所有。如您对内容、版权等问题存在异议请与本站联系,我们会及时进行处理解决。
相关推荐
2023年10月浙江自考《教育科学研究方法》复习笔记(4)
06-012023年4月浙江自考新闻学概论复习笔记:资本主义新闻事业
11-282023年4月浙江自考外国文学史复习资料:浪漫主义文学的兴起
02-062023年4月浙江自考中外教育简史复习笔记:美国近代教育制度
12-08自考辅导资料:2021年10月《马克思主义哲学原理》—辩证唯物主义的过程论
06-102023年4月浙江自考中外教育简史复习笔记:西欧中世纪教会学校
12-102023年10月浙江自考商业伦理导论复习资料汇总
05-152023年4月浙江自考英美文学选读复习笔记:Alfred Tennyson
12-092023年4月浙江自考英语国家概况复习资料十二
01-122023年4月浙江自考语言学概论复习资料第五章(3)
11-25