几位研究人员从大量评判者的估测结果中得到了许多数量关系的主观概率分布。这些概率分布表明存在着大量的对适当校准的系统性背离。在多数研究中,問題有大约30%的情况下,估测数量的真值或者小于或者大于。这就是说,受试者规定了过度狭窄的置信区间,该置信区间比他们根据自己有关估测数量的知识所做的判断带有更多的确定性。这種偏差对于天真的受试者和老练的受试者都是常见的,而且无法通过引入适当的记分规则(这鼓励了客观校准)加以消除。至少在部分程度上,这種效应可归结为锚定效应。
例如,为道琼斯平均指数选择值,开始很自然地先考虑某个受试者对道琼斯指数所做的最佳估测,然后再向上调整该值。如果这種调整象大多数其他情况一样是不充分的,那么,就不是充分的误差范围。与此相似的锚定效应会發生在对的选择中,通过向下调整某个受试者的最佳估测结果可能得到该值。因而,与之间的置信区间会太过于狭窄,而且所估测的概率分布也太过紧密。主观概率可以通过某種程序进行系统地调整,这支持了上面的解释。在该程序中,某个受试者的最佳估测结果不再成为锚定。
给定数量(比如,道琼斯平均指数)的主观概率分布可以通过两条不同的途径得到:(1)要求受试者选择与其概率分布指定的百分数相符合的道琼斯指数值;(2)要求受试者估测道琼斯指数的真值会超过某些指定数值的概率。这两種程序在形式上是等价的,而且应该产生同一種分布。然而,研究人员建议对不同的锚定采用不同的调整模式。在程序(1)中,自然的起点是某个受试者对数量的最佳估测结果。另一方面,在程序(2)中,受试者会锚定在問題给出的数值上。受试者可能会锚定在对等的机率(即,50:50的机会)上,两者可选其一。该机率是估测概率时自然的起点。对于这两種情况,程序(2)应比程序(1)产生较小的偏差机率。
为了对比这两種程序,研究人员为一组受试者提供了由24種数量(比如,新德里与北京之间的空中距离)组成的系列,他们就每一个問題或者估测或者估测。另一组受试者得到第一组对这24種数量中每種的判定结果的中值,要求他们估测给定数值超出相关数量真值的机率。在没有任何偏差时,第二组应该再次得到指定给第一组的机率,即9:1。然而,如果平均机率或者给定的值成为锚定,第二组的机率的偏差就应该较小,即,更接近1:1。事实上,对于所有的問題该组给定的机率中值为3:1。在对这两组的判断进行客观校准检验时,发现第一组受试者的太过激进,这与早期的研究结果相吻合。他们所定义的概率为0.10的事件实际上在24%的情况下發生了。与此相对,第二组受试者太过保守。他们分配的平均概率为0.34的事件实际上在26%的情况下發生了。这些实验结果说明了校准的程度决定于导出程序的方式。
注:subject--专业术语应为“被试”,文中为通俗起见译做“受试者”。与此相对的是experimenter“主试”。
说明:文中空白处的符号分别为:
X90,X90,
Xn,X01,X99,X01,X99,
X01,X99,
X90,X10,X90,X10,X10,X90,
X10,X90
其中,数字为下标。