更新时间:2022-08-25 14:45
在信号检测的实验中,被试对呈现的刺激的判定标准的差别。被试的判定标准往往会随着信号和噪音各自出现的先验概率不同而变化;随着对被试反应的不同奖惩办法而变化;随着被试的个性特点不同而变化等等。正因为上述各种不同因素,影响着被试主观上的判定标准:在不同被试之间由于其个性特点等的不同,对呈现的同一强度的刺激,有的被试倾向于回答“有”信号:有的被试倾向于回答“无”信号。这些不同的回答正反映着他们的主观判定标准的差别,即反应偏向。
反应偏向可由二种方法计算:一种是似然比值,另一种是报告标准。
1.似然比β
似然比β的数学定义为:区分”信号”与”噪音”反应的心理感受水平Xc 所对应的信号分布纵轴与噪音分布纵轴之比。但是在信号检测论实验中,没有办法直接掌握心理感受水平Xc ,因此β是通过间接方法计算得出的。
一般认为,β>1说明被试者掌握的标准较严。β值接近或等于1,说明被试者掌握的标准不严也不松
2.报告标准C
信号检测论中用以表示反应偏向的另一个指标是报告标准(report criterion)。在数学上,反应标准的另一种表示方法是感受经验强度,用符号C表示。C是横轴上的判定标准位置。
总之,在人格测验中,回答“是”的默认倾向确实存在,但其涉及的范围尚不确定。而默认能否算作是一种人格特质尚存争议。不过,在对测验结果进行解释时,要注意测验分数可能受到默认倾向的影响,而不完全是由测验内容决定。
“社会赞许性”(social desirability)是指被试在对测验内容的反应上按社会所期望的行为方式作答的倾向,使其能得到“好”的社会评价。比如,对于“我总是尽力避免惹麻烦”这样的题目,多数人都会回答“是”。社会赞许性与“作假”不同,因为前者是一种潜意识的反应偏向,而后者是有意而为的。
在爱德华(Alien Edwards)早期的一项研究中(1953b),他请评估者在一个9点量表上对140个题目的社会赞许性进行评定。每一个题目的平均评定得分可以作为其社会赞许性的指标,然后他请一组被试判断哪些题目中的描述与自己的性格相符。结果发现,评估者的评定与赞同这些题目的被试人数之间的相关高达O.87。显然,在人格测验中,被试受社会赞许性的影响很大,甚至有人(Nunnally,1978,557-559)质疑过自陈量表的价值。不过,农纳利(Nunnally)认为,尽管都受到社会赞许性的影响,但不同个体受影响的程度各不相同,他强调自陈量表仍不失为人格测验的最佳方法。
人们一般认为,人格变态者会对题目的内容做出异常的反应。根据偏常反应假说(deviant—response hypothesis,Berg,1955),这一群体确实倾向于做出非常规的反应,但这种反应与测验内容无关。据此,伯格(I.A.Berg)提出,只需数出偏常反应的数目,而不必考虑其具体内容,即可确定一个人是否人格异常。
多数测查偏常反应的研究都要求被试在“非常喜欢一非常厌恶”这一维度上选择答案。伯格认为。人格异常者会选择那些多数人不会选择的答案。而且,在所有的测验中均如此。为了消除或减小内容的影响,伯格设计了知觉反应测验(PRT)和单词反应测验(WRT)。其中,PRT由60个几何图形组成,同样也要求被试在喜欢一厌恶的维度上作评定。
对于伯格偏常反应假设的评价褒贬不一。汉密尔顿(David Hamilton,1968)基本上赞成伯格的观点。在一篇综述中,他指出偏常反应倾向具有内部一致性,不易随时间而改变,而且在不同测验上的表现也较一致。此外,他还认为这种反应倾向与不能容忍模糊情境及固执等个性特征存在相关。但是还有一些学者,比如西克雷斯特和杰克逊(Lee Sechrest&Douglas Jackson,1963)认为,在判断偏常反应中题目内容也是一个重要的影响因素。他们认为PRT和WRT等测验并不能完全排除题目内容的影响。而农纳利(1978)认为,实际上所有的测验都能区分精神病人与“正常人”。困扰不安的个体往往会胡乱作答,比起适应能力良好的个体来说,他们更可能做出异常的反应。
在认知和情感测验中都存在投机(gambling)反应。如果不对猜测进行矫正,有些人为了获得高分就会进行猜测。 谨慎是猜测倾向的对立面。在人格量表中,除“同意”、“不同意”外,可能还有“无所谓”、“不确定”及“?”这样的中间选项。在测验中,选择大量的中间项代表什么含义还不清楚。由于这种谨慎倾向具有跨量表的一致性,因而就对信度和效度构成了影响。此外,也有人认为(J.P.Guilford,1954)选择中间项过多意味着谨慎、寡断及观察力较差。
在利克特量表和态度量表中,选项往往是诸如“非常同意”、“同意”、“不确定”、“反对”及“非常反对”等程度副词。不同人对这些表示程度的词的理解不同。比如一个人所认为的“非常同意”就可能与另一个人的“同意”甚至“反对”是等同的,这种现象就是语义理解偏向(semantics)。再比如有这样一道题目,题干为“你常喝酒吗?”,其选项是“一直”、“经常”、“有时候”、“很少”、“从来不”。至少,在对“经常”和“有时候”的区分上就存在问题。一个人所指的“有时候”可能和另一个人的“经常”或者“很少”是同一个意思,而这种理解上的个体差异会使测验的效度降低。
作假(falsification)是指被试为了给人留下一个好印象而故意“装好”。比如,那些即将成为教师或心理学工作者的人,就算他们真的不喜欢与人打交道,恐怕也不敢承认。在态度和兴趣量表中,作假相对容易一些;但在人格量表中,可运用一些技巧将题目真正的意图掩饰起来,使被试不易作假。
冲动(impulsion)的反应偏向往往出现在检选量表中。这种量表要求被试从一系列描述人格特质的词语当中选出与自己性格相符的来,有些人只要觉得某个词和自己有一点相像就会选:而有些人则比较谨慎,回想起自己几年前曾有过一次不礼貌的举动,他们就不会选“礼貌”这个词。在这样的测验中,冲动的被试选的词语较多,因而总分就很高,也就会获得一个较好的评价。即使词表中也有如“自私”、“冷漠”这样的消极词汇,他们对描述积极品质的词汇更可能“头脑发热”,觉得自己恰好具有这种品质。在论文测验中,冲动的被试往往想起来什么就写什么,结果写得很长,得分一般也比写得短的人要高。
吉尔福特(Guilford,1954)将反应偏向的一般特征总结如下:
(1)反应偏向具有时间上的稳定性和跨测验的一致性,因而可提高信度。
(2)反应偏向会使测验分数的含义不明。测验不能够测到想要测的特质,因而效度降低。
(3)当测验题目表述不清或者测验结构不良时,就容易出现反应偏向。