我曾名为一个整数所困扰,七年来,这个数即出现在我个人的实验数据中,又见之于最出名的心理学刊物,令我困惑不已,难以释怀。这个整数有种伪装形式,有时稍大些,有时又略小些,但从未变得不可识别;由此观见,它这种令我困惑的稳定性,远不是一种随机现象。用一名知名参议院的话来说,它背后有一种谋划,有种支配表面现象的模式。看来,这个数或者确实反映了某些异乎寻常的东西,否则就是我徒受幻造之谜。
判断实验,但历史的变故却要求这些实验重新命名,我们现在称之为人传递信息能力的实验。由于这些实验室在信息论出现于心理学中以后进行的,而且是用信息论的概念来分析其结果,因此在讨论前,我应对这个理论稍作说明。
我要向你们谈谈某些实验。并以此说明我久已思考的问题。这些实验证明了人能多么准确地确定一个刺激的不同方面的数量,在心理学传统的语言中,通常称这些实验为绝对一、信息测量
信息量与我们多年来所说的"变异量完全是相同的概念。所用的方程尽管不同,但我们若恪守凡能使变异量扩大的因素,也会使信息量增大这一思想,则不会远离正。
这种讨论变异量的新方法,其优越性相当明显。变异量总是用测量单位来表示,如英寸、磅、伏特等,而信息量却是一种无量细的量。由于信息在一种不连续的统计分布中与测量单位无关,因此在没有任何度量单位可资采用,我们通常也不会想到应用变异量这一概念的情况下,却可以使用信息量的概念。信息量概念使我们能对在完全不同的实验情境中获得的结果作出比较,否则要比不同度量得出的变异,显然是无意义的。由此可见,采用这一新概念甚为必要。
对变异量与信息量的类似性,可作如下解释:当变异量很大时,我们就极难料到将发生些什么事。如果我们十分无知,通过观察我们就将获得许多信息;反之,如变异量很小,我们事先就会知道会观察到什么,所以由观察所获得的信息也就很少。
请设想一个通信系统,则可明白,这个系统输入、输出的变异性都是很大的。所以两者都可以用变异(或信息)来表示。可是如果这是良好的通信系统,则输入与输出之间必存在着有规则的联系。换言之,输出将取决于输入,或者说输出与输入相关。若测定其相关程度,我们即能说出输出的变异在多大程度上是由于输入,又在多大程度上是由于传递过程中由系统导入的随机波动或“噪音”所引起的。可见,测量所传递的信息,亦即测量输入、输出间的相关关系。
这里应遵循两条简单的规则:凡我谈到信息量时,你们应理解可变异量,而说到所传递的信息量时,则应理解为协变量或相关关系。
这种情况可图解为两只部分相系的圆。左边的圆可看作是输入的变异,右边的圆则为输出的变异,相系部分则是输入、输出的协变量。下面我要谈到分别表示输入、输出信息量的左、右边的圆,以及作为传递信息量的相系部分。
在绝对判断实验中,可视被试为一信息通道。那末,左边的圆就表示刺激的信息量,右边的圆则是被试反应的信息量,而相系部分就是用传递信息量来表示的刺激——反应的相关程度。实验的内容是增大输入信息量并测定传递的信息量。若被试的绝对判断十分准确,则说明输入的信息几乎都传递了过去并在反映中再现出来。若被试的反应中出现了差错,就说明传递的信息要比输入的小得多。我们预期输入信息量不断增加,被试就会出现越来越多的差错,这样就能测起被试作准确绝对判断的限度。若被试系一正常的通信系统,则增大输入信息量时,传递的信息一开始亦将增加,而最后将逼近一渐近值。我们视这一渐近值为被试的通道容量,它表示被试作某种绝对判断时,接受刺激后能反应出的最大信息。通道容量是被试绝对判断广度的上限。在这一限度内,被试可将他的反应与我们给予的刺激作出比较。
现在要解释一下比特这一概念,然后再来看某些实验数据。一比特(bit) 信息即是对两个有同样可能的选择对象作出决断所需的信息量。我们倘要判定某人是低于还是高于6英尺两种机遇各为50%,则需要有一比特的信息。请注意,这种信息单位并不指英尺、英寸、厘米等长度单位,但若要测定人的高度,仍然需要恰好是一比特的信息。
2比特信息能使我们在4个同样可能的选择对象中作出抉择。3比特信息能使我们在8个同样可能(即等概率)的选择对象中作出抉择, 4比特信息可诀定在16个选择对象中的选择。5比特决定32个中的选择,余可类推。这就是说,若有32个同样可能的选择对象我们须连续作5次二进位的判定,才能正确判断选择对象,而每作一次判定都相当于一比特信息。所以,总规则相当简单明瞭,即选择对象每增加一倍,就增加一比特信息。
增加输入信息量有两种方法。一种是提高向被试发送信息的速率,增大单位时间内的信息量,另一种则完全不考虑时间变量,而以增加选择刺激的数目来增大输入信息量。在绝对判断实验中,我们感兴趣的是第二种方法。实验中我们仅增加选择刺激的数目,而对被试作出反应所需要的时间则不作限制。在被试辨别这些选择刺激的过程中,我们注意在什么时候开始出现混乱。可以看到,在接近我们称为通道容易的那一点,就开始出现揭乱。
二、对单维刺激的绝对判断
我们现在来看看对纯音作出绝对判断时的情况。波洛克(pollack) 要求收听者在识别纯音时为它们指定一纯音后,说出一个号数作为回答,然后被告以正确的答案。仅用2.3个纯音时,收听者决不会把它们混淆,用4个纯音, 混淆亦极少,但用5个或更多的纯音时,混淆就会频频出现,当用到14个不同的纯音时,收听者反应中就出现许多差错。
实验数据绘于图1。图中底线代表输入的信息,用比特/刺激表示。当选择纯音由2个增加到14个时,输入信息就由1 比特提高到3.8 比特。纵座标是传递的信息量。由图可知,传递信息量的变化正如我们对信息运转情况的估计那样。传递的信息量起初直线上升,至2比特左右即折向约在2.5 比特处的渐近线,故2.5 比特这个数值即是我们所说的收昕者对音高绝对判断的通道容量。
得到的2.5 比特这个数值意味着什么呢?首先要指出2.5 比特约相当于6个有同样可能的选择对象。其次,实验结果还表明:要使收听者不发生混淆,或者说,不管要求被试判别多少个不同纯音,我们能得到的最好结果,也只能是让被试把这些纯音正确地归入6个不同的等级而不出现差错。换言之,若己知有N个选择刺激, 则被试的判断能使我们把特定的刺激归结成N/6 个等级中的一个。
许多人对6 这样小的数颇感惊讶。当然,音乐修养极高的人对音高作绝对判断时,能正确无误地辨别50~60个不同的音高。幸而我现在无暇讨论这些引人注意的特例,说“幸而”,是因为我还不知道该怎样解释他们这种极好的成绩,因此我还是着重研究这样一种普遍现象,即大部分人只能准确无误地辨别5.6 个音高。
量表。波洛克的实验结果表明:至少对音高来说,这种直觉是相当正确的。
有趣的是:长期以来,心理学家根据直觉知道,要想把评定分为更细的等级事实上不会有多大效果,因此一直使用着七点等级你也许要问:这个结果的可重复性如何?它是否取决于这些纯音的间隔或作判断时不同的条件?波洛克用几种方式变换过这些条件。他以约20 的倍数改变纯音的频率,却基本上使传递信息量没有出现超过一个很小百分数的变化。对音高的不同组合使传递的信息有所减少,但相差并不多。如,若你从一组音高中可辨别出五个高音,而在另一组音高中又辨别出5个低音,那末自然会也想到,若把这十个音合为一组,你仍能遥个辨别而不发生差错。可你试过后却发现并非如此。对音高的绝对判断来说,通道容量约为6 ,这是你所能得到的最好结果了。
图2 加纳的实验得到的资料:听觉响度绝对判断的通道容量。
关于纯音的实验,我们再来看加纳(Garner) 就响度所作的研究工作。加纳的实验结果简示于图2。在15~110分贝的强度范围内,加纳设法取得了纯音间可能是最好的间隔大小。实验中,他采用4 、5 、6 、7 、10与20这些不同的刺激强度。实验结果如图2所示,其中已考虑到被试之间的区别与前一判断的影响。我们再次发现似乎有一极限值,即响度绝对判断的通道容量为2.3 比特,约相当于五个可以完全辨别的选择对象。
由于这两项研究是在不同的实验室做的,而且实验技术与分析方法又略有不同,所以我们很难证明5种响度与6种音高是否有显著差异。这种区别也许是真的,即音高的绝对判断确实比响度的绝对判断稍微准确些,但重要的是两项结果属于同一数量级。
图3 根据毕比-赛恩恃、罗杰斯、奥康内尔的实验得到的资料:咸度绝对判断的通道容量
同样还就味觉强度作了实验。图3所示是毕比一赛恩特(Beebe一Center) 罗杰斯( Rogers)与奥康内尔(O'Connell)在食盐溶液浓度绝对判断的实验中取得的结果。浓度按主观上相等的级差在0.3-34.7gmNaCl/l00cc 自来水范围内变化。他们分别采用3, 5 、9 与17 种不同的浓度作实验,得到1. 9 比特的通道容量,约相当于4种不同的浓度。
图4 啥克、加纳的实验得到的资料:在一个直线间隔中对一个指示点位置绝对判断的通道容量。
由此可见,味觉强度比听觉刺激辨别稍难,但二者量级相差不大。另一方面,判断视觉位置的通道容量似乎大得多。哈克(Hake) 与加纳要求观察者在2 个标记之间指出呈现过的点的位置。实验结果如图4 所示。他们用两种方法作这个试验。一种方法是,尽管他们分别只在5 、10 、20 与50 个不同位置呈现刺激,但却让观察者用。0~100 中任一个数来标示。用这种一不限制反应的技术得到的结果在图上以里点表示。另一种方法是把观察者的反应限制在报告那些可能的刺激值。这就是说,在第二种方法中,观察者可以作出的不反应数与主试所呈现的不同刺激数完全相同。用限制反应的技术得到的结果示在图上以小圈表示。图上黑点与小固的函数极为相似,由比可得出结论,观察者可用的反应数的多少并不影响3.25 比特的通道容量。
科南(Coonon) 与克莱默(Klemmer) 重复了哈克、加纳的实验。尽管他们尚未发表研究结果,但己允许我说出他们测得的通道容量范围:指示点的位置呈现时间短,通道容量为3.2 比特,指示点的位置呈现时间长,则通道容量为3.9 比特。这些数值略高于哈克、加纳测得的通道容量,因此,我们必须说沿着一条直线间距可以区分出10~15个不同的位置。这是己测定的单维变量中最大的通道容量。
目前,这四个关于简单的单维刺激绝对判断的实验报告,均已发表在心理学杂志上,但对其他刺激变量的研究,不曾报道的还很多。例如,埃里克森(Eriksen) 与哈克发现,在各种很不相同的实验条件下,判断正方形大小的通道容量均为2.2 比特,即相当于5个等级。埃里克森在一项分开作的实验中,发现大小绝对判断的通道窑量是2.8比特,色调绝对判断的通道容量为3 .1 比特,明度的通道容量则是2.3 比特。盖尔德(Geldard)还以振动器置于胸部测定了皮肤的通道容量,正常的被试约能辨别四种强度、五种持约时间与七种位置。
这方面研究最活跃的团体一直是空军操作适应实验室。承蒙波洛克向我提供了他们就视觉显示各个方面所测得的结果。他们就面积、曲率、长度与直线方向的通道容量作了测量。在一组实验中,他们先以1/40秒极短的时间闪现刺激,再用5秒钟的呈现时间进行重复测定。就面积来说,短时呈现得到2.9 比特的通道容量,长时呈现则是2.7 比特。直线长度方面, 短时呈现得到的通道容量约为2.6 比特,长时呈现约为3.0 比特。方向或倾斜角度的通道容量,呈现时间短是2.8 比特,呈现时间长则是3.3 比特。曲率显然较难判断。若弧的长度不变,短时呈现测得的通道容量为2.2比特,而当强的长度不变时,用同样的时间呈现,测得的通道容量仅1.6 比特。这最后一个数据,是所有测得数据中、最小的一个。但我要补充说明一下,由于计算传递的信息道前把所有被试的数据都并在了一起,因此得出的数值很可能是略为偏低的。
现在,来看着我们能得出些什么结论:第一,通道容量看来确实是描述被试者的一种正确的概念;第二,以上测定的单维变量的通道容量,其范围从曲率的1.6比特到间距中位置的3.9比特。尽管由各种变量测得的通道容量,其相互间的区别是实际存在的而且是有意义的,但使我印象更深的乃是其极为明显的类似性。若就上述所有变量刺激的通道容量作最准确的估算,则其平均值为2.6 比特,标准差仅0.6 比特。换算成可辨别的选择对象,平均值约相当于6.5 个等级。一个标准差所包含的是4到10个等级, 全距为3-15个等级。考虑到所研究的不同变量的差别是如此之大,我认为这显然是一狭窄的全距。
我们身上似乎有着某种由学习或神经系统构造所造成的局限,它把我们的通道容量限定在这个总范围内。根据上述事实,可以比较有把握地认为:对单维刺激作出绝对判断,我们只具有有限的,并且是相当小的通道容量;而从一种感觉属性到另一种感觉属性,通道容量的变化不大。
三、 对多维刺激的绝对判断
你们可能已注意到:我说七这个神奇的数只适用于单维判断时,始终是谨慎的。日常经验表明:我们能正确识别数百张脸、几千个单词、几千样实物等等。话若说到这里为止,那肯定是不完全的。为什么我们在实验室判断单维变量得到的结果,与我们在实验室外的日常行为相差那样大,对这个问题我们应当有所理解。一种可能的解释是:这与刺激的各种可独立变化的属性数目有关。实物面孔、单词等等的区别是多方面的,而我们上述实验中简单刺激,仅在某一个方面有区别。
对多方面不同的刺激作绝对判断, 其情况究竟怎样,这方面幸而有些资料可供说明。我们先来看克莱默与弗里克(Frick) 报道的对矩形中点的位置作绝对判断的实验结果。我们在图5 中可以看到他们的实验结果。如图所示,通道容量似乎增加到4.6 比特,这表明人能准确地判别矩点在形中的24个位置。
判断矩形中点的位置显然是一种双维判断,即必须确定点在水平方向与垂直方向上的位置,因此自然会想到把判断矩形中点的位置的4.6 比特的通道容量与判断间距中点的位置的3.25 比特的通道容量作比较。若估计间距得到的通道量是3.25 比特而我们又判断两次,那末应得到6.5 比特的通道容量,但加上独立的第二个维度后,通道容量仅从3.25 比特增加到4.6 比特,未能达到两次相加的总和6.5 比特。
毕比-赛恩特、罗杰斯与奥康内尔提供了另一个例子。他们要求被试辨别盐、糖浓度不同的溶液的咸、甜度,发现通道容量为2.3 比特。由于已知单独判断咸度的通道容量为1.9 比特,因此如对复合刺激的两方面属性是独立判断,我们可指望其通道容量为3.8 比特,但加上第二个维度后,如同关于空间位置判断的实验一样,通道容量仅略有增加,并未达到它应有的程度。
波洛克提供了第三个例子。他要求收听者同时判断纯音的响度与音高。由于单独判断响度与音高得到的通道容量分别是2.3 比特与2.5 比特,因此同时判断响度与音高我们可指望得到4.8 比特的通道容量,但波洛克仅得到3.1 比特。这又一次表明:第二个维度能提高通道容量,但不能把通道容量提高到应有的程度。
从哈勒斯(Halsey) 与查帕尼斯(Chapanis) 混合同等亮度颜色的研究中,我们可得到第四个例子。尽管他们没有用信息论术语来分析实验结果,但估计约是11 到15 种能识别的颜色。用我们的话来说,约相当于3.6 比特的通道容量、由于颜色的变化包括色调与饱和度两方面,因此可把它看作是双维判断。我们若把上述结果与艾黎克森就色调测定的3.1 比特通道容量作比较(这样的比较不尽恰当),则又可见到加上第二个维度后,其结果仍小于加数应有的总和。
但是,从双维刺激到由面孔、单词等提供的多维刺激之间,距离仍然很大。我们仅有一个实验能用来填补这个缺口,这就是波洛克与菲克斯(Ficks) 作的听觉研究。波洛克与菲克斯设法得到6种可以作出变化的声学变量,即频率、强度、中断次数比响声时间长短、总的持续时间与空间位置。其中任何一种变量都可剧有5个不同的值,因此总共能呈现5^6个即15625 个不同的声音。收听者对这6个维度分别进行评定。在这种实验条件下测得的传递信息是7.2 比特,约相当于可以对150个不同的类别作绝对判断而不出现差错。现在我们才开始进入日常经验会使我们预料到的范围。
假使把这些不零星的数据绘于图上,并推测通道容量如何随刺激维数而变化,结果则如图6所示。我大胆地画了一虚钱来粗略表明实验数据反映的趋势。
显而易见,增多剌撒中可以独立变化的属性,会增大通道容盾,但增大比率是递减的。有趣的是可以看到:甚至当若干变量并非相互独立时,通道容量同样会增大。艾黎克森报道说当大小、明度与色调一起作完全相关的变化时,传递的信息为4.1 比特,而每次变化其中一项属性时,通道容量的平均值约为2.7 比特。艾黎克森把这三种属性混合起来,增加了输入的维数,但不增加输入的信息量,结果是通道容量增大了。这正是图6 虚线函数表示的情况。
这里的要点在于:当我们在显示中增加变量时,总的通道容量就增加,但判断各个变量的准确性就降低。换言之,我们能同时对几个对象作粗略的判断。
我们也许可以争辩说在进化过程中,最易存活的是那些能在最大范围内对周围环境的刺激能量作出反应的有机体。可在不断变化的世界中生存下来,从很多的事物中获得少量的信息要比从周围一小部分环境中获得大量的信息更好些。如果需要有个折衷,则人类所取的显然是更适应环境的一种。
波洛克与非克斯的实验结果有力地支持了某个时期以来语言学家与语音学家所持的论点。根据对人类语音的分析,人的语音约有8-10个可以区别不同音位的维度,语言学家称之为区别性特征。这些区别性特征性质上通常是两分的,或最多是三分的。例如不以作出元音与辅音这样的两分的区别,口腔音与鼻音的区别也是两分的,而舌音的区别则分为舌前、舌中音与舌后音三种等等。与我们在关于言语声谱、和人耳辨别不同纯音的研究中得到的结果相比,上述处理方法对言语知觉能力作出了完全不同的描绘。我个人对这种新的处理方法极感兴趣,但遗憾的是这里没有时间去讨论它了。
波洛克与菲克斯很可能就是根据这种语言理论用一套能从8个方面改变声音刺激的装置作了测试,但他们仅要求被试对一个方面作出二元判定。用这些声音他们测得的传递信息是6.9 比例,或者说约相当于120个可辨别的声音。用这种方法是否能无限地增加维数,这是一个尚未探讨过的复杂问题。
在人类的言语中,我们使用的维度数目显然是有限的,但还不知道这种限制是来自承担辨别声音的知觉机构的性质还是来自发音的言语机构的性质。在这方面,必须有人去作实验来作出解释。在研究过的各种语言中,都有8、9个左右的区别性特征作为限制,因此当我们谈话时,都必须借助于另一种技巧来增加通道容量。语言依靠的是音位序列,因此当我们听词或句子时,就要连续作出若干次判断。这就是说,为扩大那种由我们对简单量级作绝对判断的不精确而带来的相当刻板的限制范围,我们使用了同时的与连续的判别。
这些多维判断极易使人回想起库尔拍(Külpe) 的抽象实验。你们该记得,库尔拍的实验表明:观察者在有准备的情况下判断某一属性要比没有准备时作出的判断更为准确。例如查普曼(Chapman) 用三种不同的属性作了实验。实验中,一种情况下观察者在速示前得到了指导语,另一种情况下,观察者2是在速示后才被告知应报告哪些属性,查普曼把两种情况下得到的结果作了比较。当事前给予指导语时则判断更为准确。事后得到指导语,被试可能可报告其中任何一个方面而不得不对三种属性都作判断,因此准确性也就相应地阵低了。这与我们先前提到的研究所得结果完全一致。在那些研究中,当维数增加时,判断每种属性的准确性就降低。情况可能是显而易见的,但我仍想指出,抽象实验并没有说明人一次仅能判断一种属性,这些实验只不过表明当人必须对一个以上的属性同时作出判断时,其准确性就要降低。