心理测量学的可靠性和一致性

填满答案气泡
卡恩·坦曼/盖蒂图片

当我们称呼某人或某事可靠时,我们的意思是,它们是一致的和可靠的。可靠性也是一个好的心理测试的重要组成部分。毕竟,如果测试不一致,并且每次都产生不同的结果,那么测试就不会非常有价值。心理学家如何定义可靠性?它对心理测试有什么影响??

可靠性指度量的一致性。如果我们重复获得相同的结果,则认为测试是可靠的。例如,如果测试被设计为测量一个特性(例如内向)然后每次对受试者进行测试时,结果应该大致相同。不幸的是,不可能精确地计算可靠性,但是可以用许多不同的方法来估计。

再测试可靠性

测验重测信度是心理测验或评估的一致性的度量。这种可靠性用于确定测试在时间上的一致性。测试重测可靠性最好用于随时间变化的稳定的情况,如智力.

通过在两个不同的时间点执行两次测试来测量重新测试可靠性。这种类型的可靠性假设被测量质量或结构不会发生变化。

在大多数情况下,在测试之间经过的时间很少时,可靠性将更高。

测试-再测试法只是用来确定测量可靠性的方法之一。可以使用的其他技术包括等级间可靠性,内部一致性,并联形式的可靠性。

重要的是要注意,测试-重测可靠性仅指测试的一致性,不一定有效性结果。

等级间可靠性

这种类型的可靠性通过让两个或更多的独立法官在测试中得分来评估。然后比较评分以确定评分者估计的一致性。

测试评级机构间可靠性的一种方法是让每个评级机构为每个测试项目分配一个分数。例如,每个评分者可以对从1到10的项目进行评分。下一步,您将计算两个评级之间的相关性,以确定评级人之间的可靠性水平。

测试评级机构间可靠性的另一种方法是让评级机构确定每个观察属于哪个类别,然后计算评级机构之间的一致百分比。所以,如果评分者10次中有8次同意,该测试具有80%的评级间可靠性率。

并行形式的可靠性

平行表单可靠性是通过比较使用相同内容创建的两个不同测试来测量的。这是通过创建大量测试项池来完成的,这些测试项可以测量相同的质量,然后随机地将这些项划分为两个独立的测试。然后两个测试应该同时给予相同的受试者。

内部一致性可靠性

这种形式的可靠性用于判断同一测试项目之间结果的一致性。基本上,您正在比较测量相同结构的测试项,以确定测试内部一致性。当你看到一个看起来非常类似于另一个测试问题的问题时,它可能表明这两个问题正被用于评估可靠性。因为这两个问题很相似,设计用来测量相同的东西,考生回答两个问题应该相同,这表明测试具有内部一致性。

影响可靠性的因素

有许多不同的因素可以影响测量的可靠性。首先,也许是最明显的,重要的是,被测量的东西要相当稳定和一致。如果测量的变量是有规律变化的,试验结果不一致。

测试情况的各个方面也可能影响可靠性。例如,如果在非常热的房间进行测试,受访者可能会分心,无法尽其所能完成测试。这会影响测量的可靠性。其他的事情比如疲劳,强调,疾病,动机,糟糕的指令和环境干扰也会损害可靠性。

可靠性VS有效性

重要的是要注意,仅仅因为测试具有可靠性,并不意味着它具有有效性。有效性是指测试是否真正测量它声称要测量的内容。把可靠性看作精确性的度量,把有效性看作精确性的度量。在某些情况下,测试可能是可靠的,但无效。例如,假设求职者正在参加一个测试,以确定他们是否拥有特殊人格特征.虽然测试可能产生一致的结果,它实际上可能不是测量它声称要测量的特性。

这页有用吗??