心理学书籍 » 工作记忆与语篇认知研究

定价 ¥42.00

工作记忆与语篇认知研究

本项目的主要研究观点和实验发现如下:在理论与方法部分,主要讨论了4个方面的内容:工作记忆模型、工作记忆广度、工作记忆与语言理解的关系和长时工作记忆。

工作记忆与语篇认知研究

作者:鲁忠义

出版: 科学出版社2013-1

平装: 16开204页

ISBN: 9787030365538

定价:42.00

内容简介

《工作记忆与语篇认知研究》为国家哲学社会科学研究规划基金资助项目(批准号为04BYY008),经过课题组多年的研究,完成了预定计划,现已正式结项,鉴定等级为优秀。本项目的主要研究观点和实验发现如下:在理论与方法部分,主要讨论了4个方面的内容:工作记忆模型、工作记忆广度、工作记忆与语言理解的关系和长时工作记忆。实验研究部分包括了4方面的研究:第1方面是工作记忆广度与语篇理解中推理的实验研究。通过系统的实验研究,考察了工作记忆广度与前向推理和后向推理、整体目标推理和主题推理的关系。第2部分是工作记忆广度对情境模型建构和更新的影响的实验研究。通过3项实验研究,考察了工作记忆广度对空间情境模型和时间情境模型建立和更新过程的影响。第3部分是工作记忆模型中的语音回路与语言理解的实验研究。研究采用发音抑制和无关言语的范式,考察了语音回路中的发音复述装置和发音存储装置在汉语阅读理解的重要作用。第4部分是长时工作记忆与语言理解的实验研究。研究主要考察了语篇理解加工过程中,长时工作记忆提取结构建立的影响因素。

工作记忆和语篇的阅读理解(鲁忠义)


  【内容提要】工作记忆是指长时记忆中被激活的部分,它在语篇阅读理解中具有重要的作用。长时工作记忆的特点就是信息可以在长时记忆中快速、可靠地存取。用长时工作记忆理论,可以重新解释阅读理解中的误入歧途效应、扇形效应等心理现象。

  【英文摘要】Working memory is the activated portion of long-term memoryand plays an important role in text reading comprehension.Thecharacter of working memory is that information can be storedin or retrieved from long-term memory quickly and reliably.The garden-path affect,the fan effect and otherpsychological phenomena in text reading comprehension canacquire reinterpretation by longterm working memory theory.

  【关 键 词】工作记忆/语篇/阅读理解/提取结构working memory/text/reading comprehension/retrieval structure

  【正  文】

  工作记忆是Baddeley和Hitch(1974)提出的,它与短时记忆有所不同,主要用于说明短时性的存储与加工。工作记忆在言语理解、问题解决、推理和学习等高级认知活动中具有重要的作用。

  一、工作记忆概念简短回顾

  工作记忆的概念是从短时记忆的研究中提出来的。记忆研究的鼻祖Ebbinghaus(1885)在无意义音节的系列学习中发现,当这些音节只学习一次时,通常人们可以回忆出7个音节。实际上这就是短时记忆现象,不过他没有把它从记忆中区分出来。1890年,W.James根据某些内省资料和历史经验,提出了初级记忆和次级记忆的概念。第二次世界大战后,由于工程技术的需要,在信息论等新兴学科的影响下,心理学家开始研究容量有限、保持短暂的短时记忆现象。1965年,Waugh和Norman借用James的两个术语,提出了两种记忆系统的模型,模型中的初级记忆就是指短时记忆。临床发现、动物实验和心理学的自由回忆实验为短时记忆的存在提供了大量的证据。当感觉记忆被提出和确认后,两种记忆系统模型就显得不够完善。于是,1968年Atkinson和Shiffrin将感觉记忆吸收到记忆系统中来,提出了记忆的三级系统模型,并于1969年将它加以扩展。在这个模型中,信息通过感觉登记进入短时记忆系统。短时记忆系统有两个功能:一个功能是它可以作为一种缓冲器,信息在到达长时记忆之前可以在这里得到暂时存储;另一个功能是它作为一种加工器,通过复述将信息转入到长时记忆中。短时记忆系统的这两个功能已含有工作记忆的思想。虽然记忆的三级系统模型是一个非常有影响的学说,但它仍然受到了一些批评。按照三级加工模型,短时记忆中信息复述的次数或时间直接影响到信息的长时记忆。Craik和lockhart(1972)的加工水平说则认为,记忆痕迹的持久性是加工深度的函数。他们还用实验证实,简单的机械性复述不能把短时记忆中的信息转入到长时记忆中。另外,Shallice和Warrington(1970)的研究发现也使三级系统模型遇到了困难。三级系统模型认为,如果短时记忆受到损伤,必然会影响到学习,但是Shallice和Warrington的研究却发现,短时记忆有缺陷的病人,虽然其数字记忆广度有所下降,但并不影响他的正常学习。根据这些研究,又在吸收了三级记忆系统模型部分观点的基础上,Baddeley和Hitch于1974年提出了工作记忆模型。

  工作记忆模型认为,工作记忆与短时记忆不同,它不是由单一成分构成的,而是由三个成分构成的。这三个成分是中央执行系统(central executive)、语音回路(phonological loop)和视觉空间模板(visual-spatial sketch pad)。中央执行系统是工作记忆模型的核心。他负责各子系统之间的联系以及它们与长时记忆的联系,还负责注意资源的管理和策略的选择与计划。语音回路是专门负责以声音为基础的信息存储与控制的装置。它由两部分构成。一部分是语音储存装置,语音编码可以在此保持1至2秒,随着时间的推移,编码的内容逐渐衰退以致消失;另一部分是发音控制装置,通过复述防止语音表征的消退。另外,发音控制装置还可以将书面语言和图形转换成语音代码,储存在语音储存装置中。不过,口语的信息可以直接进入语音储存装置。视觉空间模板负责处理视觉空间信息。信息可以直接进入视觉空间模板(如直接知觉到的信息),也可以间接进入视觉空间模板(如从记忆中产生的表象)。

  Baddeley和Hitch的工作记忆模型得到了许多实验的支持,但是有些记忆现象也是此模型难以解释的。比如,在实验室里研究得到的工作记忆容量是非常有限的,在下棋、心算、医疗诊断等熟练的认知活动中,专家的工作记忆容量却非常大。另外,熟练的认知活动被中断后,无需费力就能迅速恢复,用工作记忆短暂储存的性质也是不能解释的。可见,工作记忆的概念需要加以扩充。1995年,Ericsson和Kintsch提出了长时工作记忆的概念。他们认为,工作记忆是认知加工过程中随信息的不断变化而形成的一种连续的工作状态,它既包括暂时存储信息的短时工作记忆,也包括以非常熟练的知识为基础的长时工作记忆。在传统的记忆理论中,长时记忆中的信息是相对固定的,提取和存储速度比较慢,而长时工作记忆中的信息不仅可以稳定地、较长时间地保留,而且可以通过提取结构与短时工作记忆中的信息相联系,使信息从长时记忆中快速、可靠地提取出来。提取结构是长时工作记忆的主要成分。在长时记忆中存储的信息,包括对一些特殊的提取线索的联想。当这些提取线索被组织到一个稳定的结构中时,这个结构就是提取结构。

  二、短时工作记忆在语篇阅读理解中的作用

  工作记忆是指长时记忆中被激活的部分,它是注意的焦点,处于意识之中。按照工作记忆研究的专家Baddeley的看法,工作记忆是指“对正在被加工的任何领域的认知任务中的信息的暂时存储。”当长时工作记忆的概念被提出后,心理学家很快将短时工作记忆与工作记忆等同起来。

  短时工作记忆在语篇阅读理解中具有重要作用。Baddeley提出工作记忆模型后,引发了许多有关工作记忆的心理学研究,其中主要是语音回路的研究。心理学家用抑制发音(articulatory suppression)的方法进行实验发展,在阅读理解过程中,当强制被试大声重复与阅读的句子无关的语音(如the,the,the或1-6个数字)时,这个语音信息就会进入语音存储系统,从而导致语音控制装置(即语音复述装置)失去作用,就是说抑制了被试对正常语句的发音,其结果就会使读者的阅读理解成绩下降。

  1987年Waters,Caplan和Hildebrandt进行了这方面的研究。在其中的一个实验中,给被试呈现一些含有不同数量命题和句法上复杂程度不同的句子,如下面的四个句子:

  1.It was the gangsters that broke into the warehouse.

  (正是这些匪徒破门进入仓库。)

  2.It was the broken clock that the jeweller adjusted.

  (珠宝商调试的就是这只破钟。)

  3.The man hit the landlord that requested the money

  (这个人打了要租金的地主。)

  4.The meat that butcher cut delighted the customer.

  (屠夫割下的这块肉使顾客很高兴。)

  在这四个句子中,前两个句子都只有一个命题,后两个句子都含有两个命题。第二句和第四句在句法上较其它两句要复杂。被试的任务是对句子进行语义判断,记录反应时(判断时间)。实验设计是:(1)阅读过程中同时进行抑制发音。(2)阅读过程中伴随打拍子活动。(3)阅读时不做其他活动。不同条件下的反应时(ms)如下:

  实验条件  一个命题  两个命题

  无活动   2204   2730

  打拍子   2186   2794

  抑制发音  2482   3245

  从实验结果可以看到,当阅读只有一个命题的句子时,抑制发音条件下的反应时,同其它条件下的反应时相比没有显著差异。但当阅读含有两个命题的句子时,抑制发音效应十分明显。这说明阅读较复杂的句子时,需要被试将两个或更多的命题整合起来。例如,在这个例子中,需要把“地主向那个人要租金”这个命题与前半句的命题“地主被打”整合起来,形成一个连贯的意义表征。如果进行抑制发音,被试就不能有效地整合命题,从而使反应时增加。这里可能会引起人们的一个疑问,抑制发音使反应时增加,是不是因为被试同时进行了阅读与抑制发音这两种活动造成的呢?实验还发现,打拍子与抑制发音一样,也是与阅读同时进行的另一项活动,但打拍子时却没有增加对句子的判断时间。因此,抑制发音的确影响阅读理解。

  实验还发现,抑制发音和句法的复杂性没有交互作用。这样就可以得出结论,语音回路在理解的初始阶段不起作用,即不会影响到句法分析。但在后面的理解阶段,如解决歧义问题、确定最终解释等,语音回路要起作用。总之,在阅读理解过程中,语音回路对不同加工阶段会产生影响。

  三、长时工作记忆在语篇阅读理解中的作用

  提取结构是长时工作记忆的主要成分,它在阅读理解中起着重要作用。

  Chase和Ericsson(1982)首先详细地研究了提取结构,他们的研究发现,经过大量的训练,被试的数字记忆广度可以超过90。达到这样的成绩,就需要被试形成有效的策略,把这些数字同长时记忆中熟悉的模式联系起来,并把这种模式作为提取线索。例如,他们原来的一个被试S.F.是一位赛跑运动员,他把数字3596与赛跑的情境联系起来,然后利用空间关系把这些数字编码成3分59.6秒,即不到4分钟跑一英里的路程。这位被试通过精细编码,不仅把数字同提取线索联系起来,而且把编码的信息进一步联系起来,形成一种具有层次等级的提取结构。这种提取结构对数字记忆起着重要作用。同样,语篇阅读理解中提取结构也具有举足轻重的作用。

  首先,提取结构在语篇阅读理解中是建立连贯的心理表征的基础。在一句一句的阅读中,把一个一个的命题整合起来,形成连贯的心理表征,这个过程就是理解。正常情况下,句子中所包含的线索,如词语的重复、连词等,可以把当前的句子同语篇中先前的句子联系起来,形成连贯的表征。换言之,阅读中形成的新命题,就成为语篇库(textbase)或情境模型结构的组成部分。这些命题以各种方式(如时空的、因果的)与这种结构中的其它命题相联结。而且,命题因其不同的联系可以形成较大的结构,而这些结构又可以构成更宏观的结构。这是新命题同工作记忆中其他命题相联结的情形。另一方面,这些命题还要同长时记忆中的各种结构(如图式、脚本、框架、情景记忆单元等)相联结。这样,一个完整的提取结构就建立起来了。这种结构便是形成连贯心理表征的基础。

  其次,提取结构在理解中具有知识激活作用。这里举一个歧义词的语义提取问题来说明。例如:

  Two masked gunmen made their getaway.

  with $100,000 from the First National Bank.

  (两个持枪的蒙面人带着100,000美元从国家第一银行逃跑了。)

  在英语中,“bank”一词有两种含义,即“河岸”和“银行”,由于“bank”被经常使用,它就嵌入到长时工作记忆的提取结构中。在启动实验室(priming experiment)中,如果在启动词(如“bank”)呈现后,以视觉方式立即呈现目标词,并要求被试对目标词进行真假判断,那么,不论是对与语境相一致的词如“money”(钱)的判断,还是对与语境不一致的词如“river”(河)的判断,它们的反应时都比不是长时工作记忆中的控制词的反应时短。这说明它的两个意义都被激活了。但是,在“bank”呈现后350毫秒进行词汇判断,只有“钱”这个词的反应时短,这是因为延缓判断使被试有时间进行整合,与语境相一致的意义被选择,而与语境不一致的意义则被去激活。也就是说,“河”这个词义不再通过长时工作记忆而被访问。如果延缓时间增加(至少750毫秒),对“抢劫”一词进行词汇判断,那么它将被激活。因为那时句子的全部词义都会被确定下来,形成句子的语义表征。“抢劫”一词虽然不在句中出现,但它却是一个复合线索。它被启动,不是说它是短时记忆中的一个成分,而是说通过长时工作记忆建构的句子表征与这个概念联系了起来。

  长时工作记忆还有一个特点就是信息可以在长时记忆中快速、可靠地存取。根据长时工作记忆的理论,专家学会了把长时记忆的一部分作为工作记忆来使用。也就是说,在他们的长时记忆中有一个缓冲区,其中保留了特定领域的知识和相应的操作程序。专家可以快速可靠地在这个缓冲区保存信息和提取信息。这一特点对阅读理解具有极其重要的作用。Glanzer等人的一系列阅读中断实验可以说明这一问题。在1981年的一个有代表性的实验中,让实验组的被试读一篇实验材料,其中1、3、5……句构成相互联系的一篇文章,2、4、6……句是与这篇文章无关的句子,用于阅读中断,即在每读完一个正常句子后,读一个无关句。控制组的被试只读正常的文章,即由1、3、5可构成的语篇。读完后都进行阅读理解测验。实验结果是,阅读中断对理解毫无影响。在中断情况下,被试回答问题的正确率和没有中断的回答是一样的,只是中断后阅读每个句子的时间增加了400毫秒。这种结果用经典的工作记忆理论是无法解释的。因为按照过去的解释,阅读无关句子就会使前面的句子从短时记忆中消失掉。要恢复它,就需要进行耗费资源的搜索,结果会使理解成绩大大降低。然而,长时工作记忆则很容易对此作出解释,无关句(用于中断阅读的句子)之后的句子可以作为短时记忆中的线索,用以从长时工作记忆提取阅读前面文章所形成的长时记忆痕迹。Glanzer通过改变中断时间和不同的中断活动,如以做数学题来进行实验,得到了同样的结果。语篇的中断并不妨碍阅读理解,是因为长时工作记忆可以使读者利用提取线索,可靠地访问长时记忆中保存的语篇的记忆痕迹,而且,从长时工作记忆中提取信息是非常快的,大约只需要花费400毫秒。

  再举一个实验的例子说明信息的快速可靠地存取。Kintsch和Keenan(1973)要被试阅读下面两种不同形式的句子:

  含混陈述的句子:

  一根燃烧的香烟被随手扔掉,大火烧毁了大片的原始森林。

  明确陈述的句子:

  一根燃烧的香烟被随手扔掉,它引起的一场大火烧毁了大片的原始森林。

  每读完一种形式的材料后,给被试呈现一个测验句(燃烧的香烟引起了大火)。让被试核实这个句子是否在前面阅读的材料中出现过,记录核实的时间。结果发现,在即时测验中,核实测验句是否在明确陈述的句子中出现过所需要的时间,比含混陈述句快400毫秒。这是因为在明确陈述句中,三个命题(香烟引起大火、燃烧的香烟被扔掉、大火烧毁森林)在短时记忆中都处于活跃状态,因此,测验句可以被很快地核实。在含混陈述的情况下,只有两个命题(燃烧的香烟被扔掉、大火烧毁森林)处在短时记忆中。但是这两个命题与命题“香烟引起大火”相联系,所以需要增加核实时间。不过由于可以快速从长时工作记忆中提取这个命题,因此增加的时间非常有限,只需400毫秒。另外,由于读者具有燃烧的香烟被扔掉可以引起森林大火这种知识,所以通过一种搭桥推理(bridging inference)把“香烟引起大火”这一命题变成读者长时工作记忆的一个组成部分,在需要它时,就可以把它快速可靠地提取出来。

  上面讨论的Glanzer等人的实验说明,读者阅读熟悉的材料时形成的连贯的语篇表征,可以作为有效地提取结构,使读者进行长时工作记忆的操作。如果阅读的是不熟悉的材料,结果会怎么样呢?Mcnamara和Kintsch(1996)进行了这方面的研究。让被试阅读科技文献这类不熟悉的材料,并且在句中插入无关句,他们还重复了Glanzer等人的实验。实验结果是,在重复实验中,每句的阅读时间同Glanzer等人的实验结果一样增加400毫秒,而阅读不熟悉的、句中中断的材料,每句的阅读时间要增加1400毫秒。这是因为,阅读这种材料,被试形成的肯定是不连贯的不完整的语义表征,这种表征是不能作为提取结构而起作用的。或者说,在这种情况下,被试就不能使用长时工作记忆,而只好进行耗时的长时记忆搜索。

  四、阅读广度与阅读理解

  工作记忆容量是阅读理解中的一个决定性因素。过去测定的短时记忆容量反映的是被试存储不熟悉的信息的能力,它不能直接表明被试在阅读过程中能够达到的短时记忆容量。因此Daneman和Carpenter(1980)设计了另一个测量短时记忆容量的方法,即阅读广度(reading span)方法。他们给被试呈现一系列无关联的句子,让其阅读。让被试回答有关句子的一些问题,以确定他们是否真正理解了这些句子,并且要求被试将每个句子的最后一个单词回忆出来。阅读广度就是被试在这项作业中所能理解的最大句子数,而且能回忆起这些句子的最后一个词。阅读广度测验既需要被试理解又需要被试记忆,这与短时记忆广度测验只要求记忆是不同的。研究表明,阅读广度与语篇理解的相关系数的范围为0.5-0.9。

  按照长时工作记忆理论,阅读广度所测定的是读者理解句子并能将它存储在长时记忆中的能力。比起不熟练的读者来,熟练的读者能建构良好的表征,并因此获得有效地提取结构。如果他们对句子的任何一部分进行回忆,他们就会再次把整个句子整合起来,并把最后的那个词提取出来。Kintsch(1998)打了一个比方指出:不是说好的读者有一个可以暂时储存东西的大盒子,而是说他们能够更熟练地存取信息。

  首先用长时工作记忆理论来分析一下误入歧途效应(garden-patheffect)。Just和Carpenter(1992)把被试分成高阅读广度组(阅读广度为4以上)和低阅读广度组(阅读广度低于3),给被试呈现下面的句子:

  (1)The evidence that was examined by the lawyer shocked the jury.

  (被律师审查的证据震惊了陪审团。)

  (2)The defendant who was examined by the lawyer shocked the jury.

  (被律师审查的被告震惊了陪审团。)

  简化掉关系从句(即省略掉that was或who was)后,变成下面的句子。

  (3)The evidence examined by the lawyer shocked the jury.

  (4)The defendant examined by the lawyer shocked the jury.

  在被试读完这些句子后,给他们呈现目标句,要求他们作正误理解判断。被试阅读时,记录下他们的阅读时间。

  由于省略掉了重要的句法线索,使句子的理解难度加大。句子前面的主要名词的生命性(evidence是无生命的,defendant是有生命的)直接影响到对下文的理解。在阅读第三句时,不会增加by the lawyer短语的阅读时间,因为证据被审查是期待之中的事情。第四句则不同,被告是有生命的名词,它的后面跟一个动词,正常阅读时,会期待后面出现一个宾语。但本句却是一个介词短语。这样就会增加读者阅读时间,以矫正错误的期待。这种情况就是误入歧途效应。

  实验的结果是,在简化了从句的句子中,阅读无生命名词(evidence)句的“by the lawyer,比有生命名词句快75毫秒,有明显的差异。就是说高广度的读者产生了误入歧途效应。但低广度的读者却没有产生这种效应,他们在阅读这两种形式的句子时,在by短语上没有阅读时间的差异。对这种结果Just和Carpenter用容量理论来解释。他们认为,高广度的读者有足够的容量,他们既能使用句法信息,也能注意到句法信息之外的线索,如名词的生命性。低广度的读者之所以没有阅读时间上的差异,是因为他们记忆的容量有限,不能利用句法加工之外的实用信息。Ericsson和Kintsch用长时工作记忆的理论来解释这种现象,他们认为,低广度的读者就是阅读技能差的、不熟练的读者。他们能够使用明显的句法现象,但是不能利用诸如名词的生命性一类的细微线索。相反,高广度的读者在理解过程中能够使用这些线索。也有研究指出,低广度的读者不是不知道这些线索,而是不能自动熟练地使用这些线索。这说明只知道但还不能熟练使用的知识,还不是有效地提取结构。只有经过大量练习,在信息编码时,不增加加工资源的情况就能使用的知识,才构成长时工作记忆的提取结构。

  用工作记忆的理论再分析一下扇形效应(fan effect)。扇形效应是Anderson(1974)通过实验提出来的。扇形效应是指在命题网络结构中,从源结点发出的激活容量是一定的,激活从源结点扩散到与之相联系的所有通路上,通路越多,分配到每一条通路上的激活量就越少,激活的速度也就越慢。概括地说,从源结点发散到每条通路(连线)上的激活量,与从这一结点扇形发散出的通路(连线)的数量成反比。在阅读理解过程中存在扇形效应。Cantor和Engle(1993)在一个实验中,让阅读广度高低不同的被试记忆一些句子,这些句子有的有主题上的联系,有的彼此无关。与某一概念有关的这些句子有不同数量的陈述,记忆后给被试一些陈述让他们核实是否是记忆过的。从实验中观察到,在记忆彼此无关的句子时,不论是低广度的读者还是高广度的读者都有扇形效应;对某一概念的陈述越多,核实就越慢。但是,当这些句子有相互联系时,低广度的读者仍然表现出典型的扇形效应,而高广度的读者的情况正好相反;某一概念的陈述越多,核实越快。扇形效应的出现是因为被试记忆的无关陈述越多,核实测验时的搜索集就越大。对于主题上有关的句子,高阅读广度的读者能够利用高超的组织技能,建构单一的、连贯的表征。与某一概念相联系的信息越多,形成的表征就越完整,从而也就越能把它作为有效地提取结构。所以,高阅读广度的读者不仅没有出现扇形效应,反而出现了相反的情况。低阅读广度的读者组织技能差,对于主题上有联系的句子也不能建构起连贯的表征,所以产生了典型的扇形效应。

  【参考文献】

  1.Kintsch,W.(1998).Comprehension A paradigm for cognition.Cambridge University Press.

  2.Ericsson,K.A.,& Kintsch,W.(1995).Long-term workingmemory.Psychology Review,vol.102.No.2.211-245.

  3.Logie,R.H.,& Gilhooly,K.J.(1998).Working memory andthinking.Psychology Prees Ltd.

  4.Just,M A.,& Carpenter,P.A.(1992).A Capacity theory ofcomprehension:individual differences in working memory.Psychology Review,vol.99,No.1,122-149.

  5.Chase,W.G.& Ericsson,K.A.(1982).Skill and working memory.In G.H.Eower(Eds.)The psychology of learning and motivation.New York:Academic Press.

  6.Glanzer,M.,Dorfman,D.,& Kaplan,B.(1981)Short-termstorage in the processing of text.Journal of Varbal Leaningand Verbal Behavior.23,467-486.

  7.Kintsch,W.& Keenan,J.M.(1973)Reading rate and retentionas a function of the number of propositions in the basestructure of sentences.Cognitive Psychology.5,257-279.

  8.彭聃龄:《汉语认知研究》[M],山东教育出版社1997年版.

  9.杨治良:《记忆心理学》[M],华东师范大学出版社1999年第二版.

  10.王苏:《认知心理学》[M],北京大学出版社1993年版.

标签

工作记忆 鲁忠义 语篇认知

评论0

最新评论

心理学分支 » 认知心理学