神奇的数字7±2:人类信息加工能力的某些局限
作者: 乔治米勒 / 15326次阅读 时间: 2016年2月12日
来源: 《心理科学进展》, 1983(4):53-65 标签: 比特 记忆广度 陆冰章 陆丙甫 判断 乔治米勒 通道容量 信息加工能力 信息量 信息论 心理学经典文献
www.psychspace.com心理学空间网
神奇的数字7±2:人类信息加工能力的某些局限 

G.A.Miller 美国哈佛大学
陆冰章 陆丙甫 翻译

我曾名为一个整数所困扰,七年来,这个数即出现在我个人的实验数据中,又见之于最出名的心理学刊物,令我困惑不已,难以释怀。这个整数有种伪装形式,有时稍大些,有时又略小些,但从未变得不可识别;由此观见,它这种令我困惑的稳定性,远不是一种随机现象。用一名知名参议院的话来说,它背后有一种谋划,有种支配表面现象的模式。看来,这个数或者确实反映了某些异乎寻常的东西,否则就是我徒受幻造之谜。

我要向你们谈谈某些实验。并以此说明我久已思考的问题。这些实验证明了人能多么准确地确定一个刺激的不同方面的数量,在心理学传统的语言中,通常称这些实验为绝对判断实验,但历史的变故却要求这些实验重新命名,我们现在称之为人传递信息能力的实验。由于这些实验室在信息论出现于心理学中以后进行的,而且是用信息论的概念来分析其结果,因此在讨论前,我应对这个理论稍作说明。

一、信息测量

信息量与我们多年来所说的"变异量完全是相同的概念。所用的方程尽管不同,但我们若恪守凡能使变异量扩大的因素,也会使信息量增大这一思想,则不会远离正。

这种讨论变异量的新方法,其优越性相当明显。变异量总是用测量单位来表示,如英寸、磅、伏特等,而信息量却是一种无量细的量。由于信息在一种不连续的统计分布中与测量单位无关,因此在没有任何度量单位可资采用,我们通常也不会想到应用变异量这一概念的情况下,却可以使用信息量的概念。信息量概念使我们能对在完全不同的实验情境中获得的结果作出比较,否则要比不同度量得出的变异,显然是无意义的。由此可见,采用这一新概念甚为必要。

对变异量与信息量的类似性,可作如下解释:当变异量很大时,我们就极难料到将发生些什么事。如果我们十分无知,通过观察我们就将获得许多信息;反之,如变异量很小,我们事先就会知道会观察到什么,所以由观察所获得的信息也就很少。

请设想一个通信系统,则可明白,这个系统输入、输出的变异性都是很大的。所以两者都可以用变异(或信息)来表示。可是如果这是良好的通信系统,则输入与输出之间必存在着有规则的联系。换言之,输出将取决于输入,或者说输出与输入相关。若测定其相关程度,我们即能说出输出的变异在多大程度上是由于输入,又在多大程度上是由于传递过程中由系统导入的随机波动或“噪音”所引起的。可见,测量所传递的信息,亦即测量输入、输出间的相关关系

这里应遵循两条简单的规则:凡我谈到信息量时,你们应理解可变异量,而说到所传递的信息量时,则应理解为协变量或相关关系。

这种情况可图解为两只部分相系的圆。左边的圆可看作是输入的变异,右边的圆则为输出的变异,相系部分则是输入、输出的协变量。下面我要谈到分别表示输入、输出信息量的左、右边的圆,以及作为传递信息量的相系部分。

在绝对判断实验中,可视被试为一信息通道。那末,左边的圆就表示刺激的信息量,右边的圆则是被试反应的信息量,而相系部分就是用传递信息量来表示的刺激——反应的相关程度。实验的内容是增大输入信息量并测定传递的信息量。若被试的绝对判断十分准确,则说明输入的信息几乎都传递了过去并在反映中再现出来。若被试的反应中出现了差错,就说明传递的信息要比输入的小得多。我们预期输入信息量不断增加,被试就会出现越来越多的差错,这样就能测起被试作准确绝对判断的限度。若被试系一正常的通信系统,则增大输入信息量时,传递的信息一开始亦将增加,而最后将逼近一渐近值。我们视这一渐近值为被试的通道容量,它表示被试作某种绝对判断时,接受刺激后能反应出的最大信息。通道容量是被试绝对判断广度的上限。在这一限度内,被试可将他的反应与我们给予的刺激作出比较。

现在要解释一下比特这一概念,然后再来看某些实验数据。一比特(bit) 信息即是对两个有同样可能的选择对象作出决断所需的信息量。我们倘要判定某人是低于还是高于6英尺两种机遇各为50%,则需要有一比特的信息。请注意,这种信息单位并不指英尺、英寸、厘米等长度单位,但若要测定人的高度,仍然需要恰好是一比特的信息。

2比特信息能使我们在4个同样可能的选择对象中作出抉择。3比特信息能使我们在8个同样可能(即等概率)的选择对象中作出抉择, 4比特信息可诀定在16个选择对象中的选择。5比特决定32个中的选择,余可类推。这就是说,若有32个同样可能的选择对象我们须连续作5次二进位的判定,才能正确判断选择对象,而每作一次判定都相当于一比特信息。所以,总规则相当简单明瞭,即选择对象每增加一倍,就增加一比特信息。

增加输入信息量有两种方法。一种是提高向被试发送信息的速率,增大单位时间内的信息量,另一种则完全不考虑时间变量,而以增加选择刺激的数目来增大输入信息量。在绝对判断实验中,我们感兴趣的是第二种方法。实验中我们仅增加选择刺激的数目,而对被试作出反应所需要的时间则不作限制。在被试辨别这些选择刺激的过程中,我们注意在什么时候开始出现混乱。可以看到,在接近我们称为通道容易的那一点,就开始出现揭乱。

二、对单维刺激的绝对判断

我们现在来看看对纯音作出绝对判断时的情况。波洛克(pollack) 要求收听者在识别纯音时为它们指定一纯音后,说出一个号数作为回答,然后被告以正确的答案。仅用2.3个纯音时,收听者决不会把它们混淆,用4个纯音, 混淆亦极少,但用5个或更多的纯音时,混淆就会频频出现,当用到14个不同的纯音时,收听者反应中就出现许多差错。

实验数据绘于图1。图中底线代表输入的信息,用比特/刺激表示。当选择纯音由2个增加到14个时,输入信息就由1 比特提高到3.8 比特。纵座标是传递的信息量。由图可知,传递信息量的变化正如我们对信息运转情况的估计那样。传递的信息量起初直线上升,至2比特左右即折向约在2.5 比特处的渐近线,故2.5 比特这个数值即是我们所说的收昕者对音高绝对判断的通道容量。

图1 波洛克得到的数据: 收听者作音高绝对判断时的传递信息量。当要求判断的不同音频的纯音从2个增加到14个输入的信息量亦增大时,传递信息量就接近了2.5 比特这个通道容量的上限。

得到的2.5 比特这个数值意味着什么呢?首先要指出2.5 比特约相当于6个有同样可能的选择对象。其次,实验结果还表明:要使收听者不发生混淆,或者说,不管要求被试判别多少个不同纯音,我们能得到的最好结果,也只能是让被试把这些纯音正确地归入6个不同的等级而不出现差错。换言之,若己知有N个选择刺激, 则被试的判断能使我们把特定的刺激归结成N/6 个等级中的一个。

许多人对6 这样小的数颇感惊讶。当然,音乐修养极高的人对音高作绝对判断时,能正确无误地辨别50~60个不同的音高。幸而我现在无暇讨论这些引人注意的特例,说“幸而”,是因为我还不知道该怎样解释他们这种极好的成绩,因此我还是着重研究这样一种普遍现象,即大部分人只能准确无误地辨别5.6 个音高。

有趣的是:长期以来,心理学家根据直觉知道,要想把评定分为更细的等级事实上不会有多大效果,因此一直使用着七点等级量表。波洛克的实验结果表明:至少对音高来说,这种直觉是相当正确的。

你也许要问:这个结果的可重复性如何?它是否取决于这些纯音的间隔或作判断时不同的条件?波洛克用几种方式变换过这些条件。他以约20 的倍数改变纯音的频率,却基本上使传递信息量没有出现超过一个很小百分数的变化。对音高的不同组合使传递的信息有所减少,但相差并不多。如,若你从一组音高中可辨别出五个高音,而在另一组音高中又辨别出5个低音,那末自然会也想到,若把这十个音合为一组,你仍能遥个辨别而不发生差错。可你试过后却发现并非如此。对音高的绝对判断来说,通道容量约为6 ,这是你所能得到的最好结果了。

图2 加纳的实验得到的资料:听觉响度绝对判断的通道容量。

关于纯音的实验,我们再来看加纳(Garner) 就响度所作的研究工作。加纳的实验结果简示于图2。在15~110分贝的强度范围内,加纳设法取得了纯音间可能是最好的间隔大小。实验中,他采用4 、5 、6 、7 、10与20这些不同的刺激强度。实验结果如图2所示,其中已考虑到被试之间的区别与前一判断的影响。我们再次发现似乎有一极限值,即响度绝对判断的通道容量为2.3 比特,约相当于五个可以完全辨别的选择对象。

由于这两项研究是在不同的实验室做的,而且实验技术与分析方法又略有不同,所以我们很难证明5种响度与6种音高是否有显著差异。这种区别也许是真的,即音高的绝对判断确实比响度的绝对判断稍微准确些,但重要的是两项结果属于同一数量级。

图3 根据毕比-赛恩恃、罗杰斯、奥康内尔的实验得到的资料:咸度绝对判断的通道容量

同样还就味觉强度作了实验。图3所示是毕比一赛恩特(Beebe一Center) 罗杰斯( Rogers)与奥康内尔(O'Connell)在食盐溶液浓度绝对判断的实验中取得的结果。浓度按主观上相等的级差在0.3-34.7gmNaCl/l00cc 自来水范围内变化。他们分别采用3, 5 、9 与17 种不同的浓度作实验,得到1. 9 比特的通道容量,约相当于4种不同的浓度。

图4 啥克、加纳的实验得到的资料:在一个直线间隔中对一个指示点位置绝对判断的通道容量。

由此可见,味觉强度比听觉刺激辨别稍难,但二者量级相差不大。另一方面,判断视觉位置的通道容量似乎大得多。哈克(Hake) 与加纳要求观察者在2 个标记之间指出呈现过的点的位置。实验结果如图4 所示。他们用两种方法作这个试验。一种方法是,尽管他们分别只在5 、10 、20 与50 个不同位置呈现刺激,但却让观察者用。0~100 中任一个数来标示。用这种一不限制反应的技术得到的结果在图上以里点表示。另一种方法是把观察者的反应限制在报告那些可能的刺激值。这就是说,在第二种方法中,观察者可以作出的不反应数与主试所呈现的不同刺激数完全相同。用限制反应的技术得到的结果示在图上以小圈表示。图上黑点与小固的函数极为相似,由比可得出结论,观察者可用的反应数的多少并不影响3.25 比特的通道容量。

科南(Coonon) 与克莱默(Klemmer) 重复了哈克、加纳的实验。尽管他们尚未发表研究结果,但己允许我说出他们测得的通道容量范围:指示点的位置呈现时间短,通道容量为3.2 比特,指示点的位置呈现时间长,则通道容量为3.9 比特。这些数值略高于哈克、加纳测得的通道容量,因此,我们必须说沿着一条直线间距可以区分出10~15个不同的位置。这是己测定的单维变量中最大的通道容量。

目前,这四个关于简单的单维刺激绝对判断的实验报告,均已发表在心理学杂志上,但对其他刺激变量的研究,不曾报道的还很多。例如,埃里克森(Eriksen) 与哈克发现,在各种很不相同的实验条件下,判断正方形大小的通道容量均为2.2 比特,即相当于5个等级。埃里克森在一项分开作的实验中,发现大小绝对判断的通道窑量是2.8比特,色调绝对判断的通道容量为3 .1 比特,明度的通道容量则是2.3 比特。盖尔德(Geldard)还以振动器置于胸部测定了皮肤的通道容量,正常的被试约能辨别四种强度、五种持约时间与七种位置。

这方面研究最活跃的团体一直是空军操作适应实验室。承蒙波洛克向我提供了他们就视觉显示各个方面所测得的结果。他们就面积、曲率、长度与直线方向的通道容量作了测量。在一组实验中,他们先以1/40秒极短的时间闪现刺激,再用5秒钟的呈现时间进行重复测定。就面积来说,短时呈现得到2.9 比特的通道容量,长时呈现则是2.7 比特。直线长度方面, 短时呈现得到的通道容量约为2.6 比特,长时呈现约为3.0 比特。方向或倾斜角度的通道容量,呈现时间短是2.8 比特,呈现时间长则是3.3 比特。曲率显然较难判断。若弧的长度不变,短时呈现测得的通道容量为2.2比特,而当强的长度不变时,用同样的时间呈现,测得的通道容量仅1.6 比特。这最后一个数据,是所有测得数据中、最小的一个。但我要补充说明一下,由于计算传递的信息道前把所有被试的数据都并在了一起,因此得出的数值很可能是略为偏低的。

现在,来看着我们能得出些什么结论:第一,通道容量看来确实是描述被试者的一种正确的概念;第二,以上测定的单维变量的通道容量,其范围从曲率的1.6比特到间距中位置的3.9比特。尽管由各种变量测得的通道容量,其相互间的区别是实际存在的而且是有意义的,但使我印象更深的乃是其极为明显的类似性。若就上述所有变量刺激的通道容量作最准确的估算,则其平均值为2.6 比特,标准差仅0.6 比特。换算成可辨别的选择对象,平均值约相当于6.5 个等级。一个标准差所包含的是4到10个等级, 全距为3-15个等级。考虑到所研究的不同变量的差别是如此之大,我认为这显然是一狭窄的全距。

我们身上似乎有着某种由学习或神经系统构造所造成的局限,它把我们的通道容量限定在这个总范围内。根据上述事实,可以比较有把握地认为:对单维刺激作出绝对判断,我们只具有有限的,并且是相当小的通道容量;而从一种感觉属性到另一种感觉属性,通道容量的变化不大。

三、 对多维刺激的绝对判断

你们可能已注意到:我说七这个神奇的数只适用于单维判断时,始终是谨慎的。日常经验表明:我们能正确识别数百张脸、几千个单词、几千样实物等等。话若说到这里为止,那肯定是不完全的。为什么我们在实验室判断单维变量得到的结果,与我们在实验室外的日常行为相差那样大,对这个问题我们应当有所理解。一种可能的解释是:这与刺激的各种可独立变化的属性数目有关。实物面孔、单词等等的区别是多方面的,而我们上述实验中简单刺激,仅在某一个方面有区别。

图5 根据克莱默、弗里克的实验得到的资料,矩形点中的位置绝对判断的通道容量

对多方面不同的刺激作绝对判断, 其情况究竟怎样,这方面幸而有些资料可供说明。我们先来看克莱默与弗里克(Frick) 报道的对矩形中点的位置作绝对判断的实验结果。我们在图5 中可以看到他们的实验结果。如图所示,通道容量似乎增加到4.6 比特,这表明人能准确地判别矩点在形中的24个位置。

判断矩形中点的位置显然是一种双维判断,即必须确定点在水平方向与垂直方向上的位置,因此自然会想到把判断矩形中点的位置的4.6 比特的通道容量与判断间距中点的位置的3.25 比特的通道容量作比较。若估计间距得到的通道量是3.25 比特而我们又判断两次,那末应得到6.5 比特的通道容量,但加上独立的第二个维度后,通道容量仅从3.25 比特增加到4.6 比特,未能达到两次相加的总和6.5 比特。

毕比-赛恩特、罗杰斯与奥康内尔提供了另一个例子。他们要求被试辨别盐、糖浓度不同的溶液的咸、甜度,发现通道容量为2.3 比特。由于已知单独判断咸度的通道容量为1.9 比特,因此如对复合刺激的两方面属性是独立判断,我们可指望其通道容量为3.8 比特,但加上第二个维度后,如同关于空间位置判断的实验一样,通道容量仅略有增加,并未达到它应有的程度。

波洛克提供了第三个例子。他要求收听者同时判断纯音的响度与音高。由于单独判断响度与音高得到的通道容量分别是2.3 比特与2.5 比特,因此同时判断响度与音高我们可指望得到4.8 比特的通道容量,但波洛克仅得到3.1 比特。这又一次表明:第二个维度能提高通道容量,但不能把通道容量提高到应有的程度。

从哈勒斯(Halsey) 与查帕尼斯(Chapanis) 混合同等亮度颜色的研究中,我们可得到第四个例子。尽管他们没有用信息论术语来分析实验结果,但估计约是11 到15 种能识别的颜色。用我们的话来说,约相当于3.6 比特的通道容量、由于颜色的变化包括色调与饱和度两方面,因此可把它看作是双维判断。我们若把上述结果与艾黎克森就色调测定的3.1 比特通道容量作比较(这样的比较不尽恰当),则又可见到加上第二个维度后,其结果仍小于加数应有的总和。

但是,从双维刺激到由面孔、单词等提供的多维刺激之间,距离仍然很大。我们仅有一个实验能用来填补这个缺口,这就是波洛克与菲克斯(Ficks) 作的听觉研究。波洛克与菲克斯设法得到6种可以作出变化的声学变量,即频率、强度、中断次数比响声时间长短、总的持续时间与空间位置。其中任何一种变量都可剧有5个不同的值,因此总共能呈现5^6个即15625 个不同的声音。收听者对这6个维度分别进行评定。在这种实验条件下测得的传递信息是7.2 比特,约相当于可以对150个不同的类别作绝对判断而不出现差错。现在我们才开始进入日常经验会使我们预料到的范围。

图6 刺激中可独立变化的属性数目与通容量关系的大概趋向

假使把这些不零星的数据绘于图上,并推测通道容量如何随刺激维数而变化,结果则如图6所示。我大胆地画了一虚钱来粗略表明实验数据反映的趋势。

显而易见,增多剌撒中可以独立变化的属性,会增大通道容盾,但增大比率是递减的。有趣的是可以看到:甚至当若干变量并非相互独立时,通道容量同样会增大。艾黎克森报道说当大小、明度与色调一起作完全相关的变化时,传递的信息为4.1 比特,而每次变化其中一项属性时,通道容量的平均值约为2.7 比特。艾黎克森把这三种属性混合起来,增加了输入的维数,但不增加输入的信息量,结果是通道容量增大了。这正是图6 虚线函数表示的情况。

这里的要点在于:当我们在显示中增加变量时,总的通道容量就增加,但判断各个变量的准确性就降低。换言之,我们能同时对几个对象作粗略的判断。

我们也许可以争辩说在进化过程中,最易存活的是那些能在最大范围内对周围环境的刺激能量作出反应的有机体。可在不断变化的世界中生存下来,从很多的事物中获得少量的信息要比从周围一小部分环境中获得大量的信息更好些。如果需要有个折衷,则人类所取的显然是更适应环境的一种。

波洛克与非克斯的实验结果有力地支持了某个时期以来语言学家与语音学家所持的论点。根据对人类语音的分析,人的语音约有8-10个可以区别不同音位的维度,语言学家称之为区别性特征。这些区别性特征性质上通常是两分的,或最多是三分的。例如不以作出元音与辅音这样的两分的区别,口腔音与鼻音的区别也是两分的,而舌音的区别则分为舌前、舌中音与舌后音三种等等。与我们在关于言语声谱、和人耳辨别不同纯音的研究中得到的结果相比,上述处理方法对言语知觉能力作出了完全不同的描绘。我个人对这种新的处理方法极感兴趣,但遗憾的是这里没有时间去讨论它了。

波洛克与菲克斯很可能就是根据这种语言理论用一套能从8个方面改变声音刺激的装置作了测试,但他们仅要求被试对一个方面作出二元判定。用这些声音他们测得的传递信息是6.9 比例,或者说约相当于120个可辨别的声音。用这种方法是否能无限地增加维数,这是一个尚未探讨过的复杂问题。

在人类的言语中,我们使用的维度数目显然是有限的,但还不知道这种限制是来自承担辨别声音的知觉机构的性质还是来自发音的言语机构的性质。在这方面,必须有人去作实验来作出解释。在研究过的各种语言中,都有8、9个左右的区别性特征作为限制,因此当我们谈话时,都必须借助于另一种技巧来增加通道容量。语言依靠的是音位序列,因此当我们听词或句子时,就要连续作出若干次判断。这就是说,为扩大那种由我们对简单量级作绝对判断的不精确而带来的相当刻板的限制范围,我们使用了同时的与连续的判别。

这些多维判断极易使人回想起库尔拍(Külpe) 的抽象实验。你们该记得,库尔拍的实验表明:观察者在有准备的情况下判断某一属性要比没有准备时作出的判断更为准确。例如查普曼(Chapman) 用三种不同的属性作了实验。实验中,一种情况下观察者在速示前得到了指导语,另一种情况下,观察者2是在速示后才被告知应报告哪些属性,查普曼把两种情况下得到的结果作了比较。当事前给予指导语时则判断更为准确。事后得到指导语,被试可能可报告其中任何一个方面而不得不对三种属性都作判断,因此准确性也就相应地阵低了。这与我们先前提到的研究所得结果完全一致。在那些研究中,当维数增加时,判断每种属性的准确性就降低。情况可能是显而易见的,但我仍想指出,抽象实验并没有说明人一次仅能判断一种属性,这些实验只不过表明当人必须对一个以上的属性同时作出判断时,其准确性就要降低。

四、直接判断

我还要简单谈一下在Mount Holyoke 大学作的判断数目的实验,才能结束这方面的论述。在考夫曼(Kaufman) 、洛特(Lord) 、里斯(Reese) 与沃克曼恩(Volkmann)作的实验中,以1/5 秒的时间在荧光屏上闪现由1~200多个点组成的随机点群。被试的任务是报告其中有多少个点。

首先要指出的是,在点群中的点不超过5.6个时,被试的判断决不会有差错。判断这些小数目的点群与判断比这数目更大的点群,其方式是如此不同,以至得到了一个专门的名称。他们把被试判断七点以下的数目称为直接判断(subitize) ,而判断七点以上的数目则称为估计(estimate) 。下面你们将会看出,这正是我们一度乐观地称之为”注意广度“的东西。

间断处为七当然是有启示意义的。在这里,起作用的难道也正是那个把我们的单维判断限在七级左右的基本过程?这样类推固然令人感兴趣,但我认为未必正确。尽管估计数目的实验数据没有用信息概念作分析,但根据己发表的实验数据,我推测被试在判断点的数日方面,传递的信息要多于4 比特。按照前边的计算方法,我们不妨说,判断大数量点群时可区分20或30个等级,这比我们预计从单维刺激显示中能得到的信息要大得多,实际上非常象显示双维刺激得到的结果。尽管随机点群的维度数还不完全清楚,但其结果与克莱默与弗里克在正方形中所显示的点双维刺激中得到的结果属于同一范围。大数量点群的2个维度可能是面积与密度,当被试能作直接判断时,面积与密度可能还不是重要的变量,而当被试必须作估计时,面积与密度就成为重要的变量了,无论如何,这种比较并不象最初想的那么简单。

这也是神奇的七令我困惑的一个地方。我们这里有2种紧密相关的实验,它们都表明了作为我们能力局限的七的意义。而当我们进一步探究这一现象时,似乎又会怀疑这不过是一种巧合罢了。 

五、瞬时记忆广度

综上所述,可概括如下:就准确性来说,我们对单维刺激变量的绝对判断,有一个明显而确定的界限。我主张称之谓绝对判断广度,而且我认为单维判断的广度通常在七左右。然而,由于我们有突破这个广度并提高判断准确性的各种方法,因此并不完全受制于这一限定了的广度。这里最重要的三种方法是: 1)作相对判断而不作绝对判断,如果这不可能的话,则2)增加维度数目,使刺激能因之而变得不同,或3)设法使作业的安排能允许连续作出一系列的绝对判断。

对相对判断的研究是实验心理学最早的课题之一,我这里不作回顾了。第二个方法即增加维度数,这我们刚才讨论了。看来,通过增加维度数并要求被试对每一属性作是或否的粗略判断,我们至少可将绝对判断的广度从7 扩展到15。根据我们的日常行为来判断,如果确实有一限度,这个限度可能达到几千。我以为我们不能把维度无限地结合起来。我还猜想同样有一知觉维数的广度,而这个广度大约是10,但我应立即补充说,目前还没有任何客观的根据来证实我的猜想,这是非常需要做实验探索的问题。

第三个方法是作连续的判断,因为这个方法引入记忆作为辨别的辅助手段,所以我有不少意见要提出讨论。记忆过程至少与知觉过程一样复杂,我们可料到,这两种过程的相互作用是不会很容易弄清的。

现假定我们稍稍修改采用过的实验程序。一直到目前,我们呈现的都是单个刺激,并要求被试在每次刺激呈现后立即作出回答。现在我们修改一下实验程序,即要求被试在几个刺激还没有连续呈现完之前,暂时不作回答,而待刺激序列呈现完后再作回答。这仍然是同用于测量传递信息所要求的输入一输出相同的实验情境,但是,我们已经从绝对判断实验进入到另一种我们通常称为瞬时记忆广度的实验。

在考查这方面的实验资料前,我认为应当提醒你们不要避免那些很容易产生但却会混淆问题的联想。众所周知,瞬时记忆有着有限的广度,而且就许多不同的实验材料来说,这个广度范围约为七个项目。我在前面刚向你们指出:绝对判断的广度约为七个等级,而速视注意广度约包括6 个对象。难道不是会很自然想到上述三种广度都是同一基本过程的不同方面吗?然而,如同我要力求表明的那样,这根本是一种误解。这正是神奇的七迷惑人的一个地方,我也就在这里产生了误解。

我以前的错误正类似于此。我们已看到绝对判断广度中不变的特性是被试所能传递的信息量。绝对判断实验与瞬时记忆实验从操作上说确实很相似。如果瞬时记忆与绝对判断一样,则其不变的特征亦应是被试所能保持的信息量。若瞬时记忆广度的信息量为一常数,则当每个单位包含的信息量多时,瞬时记忆广度就应短些,反之,广度就应长些。例如,每个十进制数相当于3.3比特,我们大约能回忆七个十边制数,其总信息量是23比特。每个孤立的英语单词约相当于10比特,若能保持的总信息量始终为23比特,则我们仅能记住2或3个随机呈现的孤立英语单词。我由此推导出:瞬时记忆广度应是实验材料单元信息量的函数。

文献中关于测量记忆广度的资料对理解这个问题是有启发的,但并不是确定的,因此还必须用实验来说明。海斯(Hayes) 用5种不同实验材料来研究这个问题,这6种实验材料是:2进制数、十进制数、英文字母、字母加十进制数以及1000个单音节词。实验中,各张表以每秒一个速率大声读出,并且不限定被试作回答需要的时间。对被试回答问题的评分采用了武德沃斯(Woodworth) 所说的方法。

图7 根据海斯的实验得到的资料:图中所示为瞬时记忆广度是测验材料单项所含信息量的函数

实验结果如图7 黑点所示。如广度的信息量是恒定的,则广度应如图中虚线所示。图中实线表示实验结果。海斯可用测验词表重复做实验。这些词表大小不一样,但都是单音节英语词(图7 中的小圈)。由这些更相似的实验材料得到的结果在图上未显示出实质性的变化。用单音节英文词测得的广度大约是5 ,用2进制数测得的广度大约是9,这种差别与假设广度信息量为恒定的变化情况相比,则是小多了。

图8 根据波海克的实验得到的资料:图中所示为一次呈现后保持的信息量是测验材料单项所含信息量的函数

由于波洛克更精心地重复作了这种实验,得到了基本相同的结果,因此可以说海斯的实验并没有什么错。波洛克耐心测定了传递的信息量,而没有用通常的方法为反应评分。他的实验结果见于图8。该图清楚表明:传递的信息量并非一常数,而几乎以正比例随输入单位信息量的增大而增加。

因此情况很清楚,尽管在上述两种情况下恰巧都出现那种神奇的七,但绝对判断的广度与瞬时记忆的广度却是对我们的信息加工能力所施加的十分不同性质的局限。限定绝对判断的是信息量,而限定瞬时记忆广度的却是输入单位的数目。用某种形象的术语来反映这种区别,我就得象通常作的那样区分信息比特与信息组块这2个概念。然后我才能说绝对判断广度的信息比特数目是不变的,而瞬时记忆广度中不变的却是信息组块。瞬时记忆广应并不随每个信息组块包含的比特数目而变化,至少就目前已经测验过的材料来说是这样的。

比特块与比特这2个词的区别,也使下述情况显得更为突出,即我们还不能确定是什么构成了信息组块。例如,海斯从一组1000个单音节英文词中随机抽取单词测定的记忆广度是5个词。由于每个英文单音节词中约有3个音素,因此把记忆广度说成是有15个音素也同样是恰当的。从直觉上说,显然被试回想起的是5个词,而不是15个音素,但其中的逻辑区别并不是一下于能看清的。这里,我们面对着的是一个将输入组合为熟悉的单位或组块的过程,而大量的学习都是用来形成这种熟悉的单位的。

六、重新编码

因此,为了能说得更为确切,我们必须认识到把输入序列组合为单位或组块的重要性。由于记忆广度是固定数目的组块,我们只要不断组成更大的每个组块比以前包含着更多信息的组块,即能增加信息的比特数目。

一个人刚开始学习无线电电报码时,他听到的每一嘀哒声都是不相连的组块。不久他即能把这些声音组成为字母,随后又能把几个字母当作组块来处理。再后来,这些字母又组成为单词,这是更大的组块,而他又开始能昕出整个短语了。我并不是说每一步都是一个分立的过程,或者说在学习曲线中会出现高原,因为各级组块显然是以不同的速率完成并且在学习过程中是相互重迭的。我不过指出了这样一个明显的事实,即:操作者通过学习把嘀哒声组成模式,而随着这些更大的组块的出现,操作者能记忆的信息量相应也增加了。用我建议采用的术语来说,操作者在学会了增大单位组块中的比特量。

在通信理论的术语中,这一过程称为重新编码。输入以某种代码发出,这种代码包含很多组块,但每一组块的比特数却很少,操作者将这些输入编成另一种代码,这种代码组块较少,而每一组块的比特数却多些。重新编码有许多方式,但最简单的恐怕是将输入事项分组,对每个组给以新的名称,然后去记这些新的名称而不再去记原先的输入事项。

我相信对人的心理来说,这是一个极普遍而又重要的过程,因此我想告诉你们一个示范实验,这个实验可能会很好地阐明我的想法。这就是西德尼·史密斯( SidneySmith) 作的实验,该实验由他本人在1954年美国东部心理协会会议上作了报告。

表1 对一个二进制数的序列重新编码的方法

人能重复出8个十进制数, 但只能重复出9个二进制数。实验根据的就是这样一个同观察到的现象。由于这两种情况下回忆的信息量相差很大,我们立即会想到:为增加2进制数瞬时记忆的广度,可采用一种重新编码的方法。表1列出了一种分组与重新命名的方法。最上面是一行18个2 进制数,其数目远远超过了任何人在一次呈现后所能记住的数目。第二行则是把这些同2进制数一对对组合起来,可能出现的有4种对子。我们把00重新命名为0 ,01 命名为1,10为2,11 为3 。这就是说把2进位的数重新编码为4进位的数。经过重新编码的序列,只有9个数要记住,这个数目差不多己处在瞬时记忆广度范围内。再下面一行,同样的2 进制数又再组成为包括3个数字的组块,这可能出现8种3 个数字的序列,对此可用0~7来分别命名。这样,我们就把18个2进制数的序列重新编码为6个8进制数的序列,这数目已完全是在瞬时记忆的广度范围内了。在最后2行、2 进制数分别组成4个与5个数一组的组块,并分别用0~15 、。0~31 的十进制数来重新命名。

不言而喻,这种编码增加了每个组块的比特数,并且把2进制数序列组合为一种能为瞬时记忆广度所容纳的形式。史密斯约集了20位被试作实验,测定他们对2进制数与8进制数的瞬时记忆广度。测定结果是2进制数为9, 8进制数为7。然后把每种编码方案交给5个被试,被试学习这些编码,直至他们说熟悉了这些编码方法。这大约需要5-10分钟。在这些被试试用学到的编码方案的情况下,史密斯再次测定他们的2进制数瞬时记忆广度。

各种编码方案都扩大了他们的瞬时记忆广度,但扩大幅度并不象我们根据8进制数记忆广度所设想的那样大。由于差距随编码比率的扩大而增大,因此我们推也被试用很少几分钟来学习编码方案是不够的。很明显,从一种代码转换成另一种代时基本上应是自动化的,否则当被试力求记忆对前一组的变换结果时,就会漏掉下一个组织的一部分。

由于4 : 1 与5 : 1 比率的编码要求长时间的学习,史密斯决定仿效艾宾浩斯(Ebbinghuaus) ,以自己为被试来作实验。他以日耳曼人特有的耐心,依次对每种编码方法进行了学习,其实验结果示于图9。图上数据的趋向与我们对8进制数记忆广度的预见极为相似。史密斯能记住12个8进制数。编码比率为2:1时,12个组块相当于24个2进制数;编码比率为3 : 1时,12个组块就相当于36个2进制数;当4 : 1 与5 : 1 的编码方法时,12个组块约相当于40个2 进制数。

图9 2进制数字瞬时记忆广度用编码方法的函数表示。预测的曲线是把8进位的记忆广度分别乘以2.3和3.3而得到的这与四选制、八进制、十进制编码分别对应.

一个人能一连串记住40个2进制数,然后能毫无错误地重复出来这是颇为惊人的。但如果你以为这不过是一种扩展记忆广度的记忆诀窍,那你就没有领会它所包含的关键点,即编码是扩大我们所能处理的信息量的极为重要的手段,几乎所有记忆方法都包含了这一过程。我们在日常行为中也总是采用这种或那种编码方式。

我认为,把输入转换成言语代码是我们最常用的一种编码方法。当我们想记住一一个故事、一个论点或一种想法时,我们总是为求用自己的措词去表达这些要记住的东西。当我们目睹某个事件并想要记住的时候,我们就用言语描述这个事件,随后就记住自己所作的描述,而在回想的时候,我们又通过第二次加工重建同先前作出的特定言语编码看来相符的细节。卡米查尔(Carmichael) 、霍根(Hogan) 沃尔特(Walter)所作的名称影响视觉图形回忆的著名实验,表明了这一过程。

在司法心理学中,目击者证词之不准确,乃是人所周知的,但证词中发生的歪曲不是没有规律的。歪曲情况当然决定于目击者采用的特远编码,而所用的特定编码又取决于其以往全部经历。我们的语言十分有助于把材料组合到少数包含大量信息的组块中去。我猜想意象也是一种编码方式,但同符号性的编码相比,意象在操作上极难把握,亦极难通过实验进行研究。

看来,连长期记忆也可以这样来进行研究。熟记的过程可能只是把一些有关的项目形成组块一直到所组成的组块数目少到我们能记住所有单个项目的程度。这方面,布斯菲尔德(Bousfield) 与科恩(Cohen)做的单词在回忆中成群出现的研究,是特别令人感兴趣的。

七、结语

我要介绍的实验资料至比己结束,因比,这里想作几点概括的说明。

第一,绝对判断广度与瞬时记忆广度对我们所能接收、加工与记忆的信息量有着严格的限制。通过把输入的刺激同时编为不同的维度和连续组成一系列组块,我们就能打破(或至少扩展)这种对信息量的局限。

第二,编码是人类心理中一个极为重要的过程,应比以往得到更多的重视。尤其是人的言语编码,在我看来似乎正是思维过程的关键。编码程序一直为临床学家、社会心理学家、语言学家与人类学家所关注,然而,与无意义音节或迷津相比,由于编码更不易为实验操作把握,因此,传统的实验心理学家对编码的分析贡献甚少,或投有什么贡献。但是,实验技术是可以应用,编码方法是可以详细说明,行为的征象也是可以找到的。因此,我预期我们会发现一组条理分明的定向关系,并用以描述出个体差异这个至今尚未探明的荒野。

第二,信息理论提供的概念与量数对处理某些这类问题提供了定量的方法。该理论向我们提供了校订刺激材料与测定被试成绩的尺度。为便于交流,我没有谈到信息测量方面的技术细节,并力求以大家更熟悉的用语来表达我的想法。我希望这种通俗解释不会使你们认为上述概念在研究中并无用处。在辨别研究和语言研究中,信息概念已被证实是有价值的,在学习,记忆研究中,这些概念也可望使我们获得许多成果。甚至在概念形成的研究中,同样可采用这些概念。二、三十年来似乎无从着手的许多问题,现在可用一种新的眼光去看待了。我以为我的阐述应在开始真正引起人们兴趣的时候就作为结束。

最后要问,神奇的七究竟意味着什么?世界的七大奇迹,七大洋、七大罪恶、昂星团中的七仙女、人的七次寿命、七层地狱、七种基本颜色、音阶中的七个音符,一星期中的七天,这些究竟意味着什么?七级量表、绝对判断中的七个等级、注意广度中的七个对象及瞬时记忆广度中的七个数字。这一切又意味着什么?我建议目前暂时不要作出判断。有可能在所有这些七的背后,存在着某种奥妙而又意味深长的东西,某种在召唤我们去揭示其中奥秘的东西。然而,我也怀疑这仅仅是令人徒作苦思的毕达哥拉斯式的巧合。

(原载《The psychological Review》1956.No.63 ,陆冰章,陆丙甫译 宋钧校)

www.psychspace.com心理学空间网
TAG: 比特 记忆广度 陆冰章 陆丙甫 判断 乔治米勒 通道容量 信息加工能力 信息量 信息论 心理学经典文献
«乔治·A·米勒92岁仙逝:帮助引领认知科学革命的心理学家 20 米勒 | George A. Miller
《20 米勒 | George A. Miller》
乔治·米勒George A. Miller 简介»