西方语言产生研究中的几个主要问题
文章来源:心理科学进展200203
作者:余林 舒华
简介】余林 西南师范大学教科所,重庆 400715 舒华 北京师范大学心理学院,北京 100875
【作者【内容提要】文章对西方语言产生这一领域的研究传统与近年来的一些主要研究成果进行了一个小结,整个小结分4个部分:(1)语言产生的研究传统;(2)现代西方心理语言学研究的范式;(3)语言产生的加工阶段;(4)目前的主要理论模型及其争论。文章的主要目的是总结西方语言产生研究的进程、方法与理论争论,为汉语语言产生的研究提供借鉴。
【英文摘要】This article is a brief summary of speech production's research tradition and the main research materials in recentyears in western countries.It's mainly covered four parts:research tradition of speech production,modern research paradigm in the west,processing stages of speech production,main theoretical models and the disputes between them.The purpose of the article is to summarize the research course、methodology and theoretical disputes of speech production inthe west,and provide some useful references for the study ofChinese.
【关 键 词】语言产生/研究进程/lemma加工与lexeme提取/语音共激活
speech production/research course/lemma processing and the selection of lexeme/phonological coactivation
【正 文】
1 前言
语言产生(说话)与语言理解、语言获得并列为心理语言学的三大研究领域,不过相对于心理语言学的其他两个领域而言,语言产生领域的研究最少[1]。虽然在日常生活中,说并不比听和读的频率低,而且人们也并没有花更多的时间在听和读上,但人们对语言产生过程和加工机制的研究仍然是最薄弱的[2]。人们在研究语言产生时感到困难的一个重要原因是,要对某个思想“如何说(即如何表达)”进行控制相对比较困难,毕竟人们可以用不同的语言来表达同一个意思。另一个原因是,语言产生不仅仅是提取出所需要的目标词汇并把它们说出来,还必须对所说出的词语进行合理的句法结构安排,否则别人就会不知所云。尽管语言产生研究的难度较大,但各种与之有关的语言现象,如语误、舌尖现象和语言表达过程中的犹豫、停顿等现象仍然引起了研究者的浓厚兴趣,尤其是近年来各种特殊群体在语言产生方面出现的加工困难更激起了大量对语言产生过程,特别是正常人语言产生机制的研究。本文将对西方有关语言产生研究中的研究进程、语言产生的基本过程、主要理论及其争论作简要介绍。
2 西方语言产生研究的传统
西方语言产生的研究有两个传统,其中一个是通过分析自然语误(日常生活中收集到的语误speech error材料)或在实验室诱发的语误所提供的信息来分析正常语言产生所需要的加工过程[2,3]。
在自然语误的研究中,收集语误材料的方法主要有3种,一是通过记录所有听到的、在自然发音过程中出现的语误材料来建立语料库;二是在一个较短的时间段中集中探测语误材料(没有把要分析的言语材料记录下来);三是先记录下言语资料(录音方式),然后再对这些录音资料进行逐句分析。前两种方法都容易遗漏掉许多不太易分辨的语误材料,目前建立语误语料库都是采用第三种方法。
Meringer和Mayer 1895年[4]通过记录所有听到的语误材料建立了第一个系统的语料库,这个库和由他们所提供的相应分析就是语言产生中语误研究传统的开始。他们首先区分了语义替换与语音替换两类语误,如美国总统福特在会见埃及首相时说"the great people ofIsrael-Egypt,excuse me"和"It is my great pleasure to prevent-I mean,present…",前者是一种典型的语义替换错误,即用语义相关词代替原词,而后者则是语音替换错误,即用语音相关词代替原词。另外他们还把语误分成了交换型(如left hemisphere被替换成heft lemisphere)、前置型(如a reading list被替换成a leading list)、后置型(如beef noodle被替换成beef needle)和混合型(如rat被替换成cat)等几种类型。许多研究者继承了这一研究传统,并在20世纪六七十年代掀起了真正的研究高潮。1973年,Fromkin出版了一本颇具影响力的语误研究论文集,并在其后附上了她所收集的语料库;另一个有影响的语料库也建立在70年代,即MIT-CU,通过对这个语料库的研究,Garrett发现词交换可以跨越短语边界,并在大多数情况下保留其语法范畴和语法功能(如,he forgot it and left it behind被替换成heleft it and forgot it behind),而忽略语法范畴的情况多发生在相近词上。Shattuck-Hufnagel[5]在此库研究基础上提出的扫描-复制模型首次涉及了语言产生中的语音表征。随后其他语程的语料库也逐渐开始建立并得到相应的分析。不过通过这种耗时的工作所得到的语误材料,对于建立语言产生模型所需的量化材料而言仍然是不够的,如Garnham[6]等1981年通过对20万个单词的资料进行分析,最后只得到了不足200条语误。而且也有研究者[7]对语误收集和鉴别的方法提出了疑问,认为语误识别过程中容易漏掉不易辨别的语误材料,基于这种数据得到的结论是有限的。正是由于这两个原因,一些研究者[8]开始在实验控制条件下有目的地诱发语误,并通过这种语误材料来推断语言产生的加工过程。
语言产生的另一个研究传统则是反应时研究范式。这个范式的方法准备起源于图形命名实验范式和stroop实验范式,前者被认为是一个标准的语言产生过程,而后者则被用来探测语言产生的时间进程。图形命名实验起源于1885年Cattel[9]对词和图的命名反应时差异的研究。Stroop实验范式则起源于1935年Stroop[10]的实验研究,他发现当词的书写颜色与词的意义不同,如用红笔写“黑”字时,颜色命名会被延迟,被试命名颜色“红”时严重受到词的影响,而对词的命名则没有受到词的颜色的干扰。Rosinski等首次把这个实验范式改成词―图干扰范式,对图形的命名需要忽略印在图形中的词的干扰。另一个范式就是命名词而忽略图形,不过研究者发现前者对语义更为敏感。Glaser和Dungelhoff[11]首次研究了词―图干扰范式中语义交互作用的时间进程,通过改变SOA,他们得到了不同SOA的图形命名、图形分类和词语命名曲线。另一个研究方法上的改进是Schriefers[11]等的听觉范式,这里干扰词成了不同SOA上呈现的听觉材料,这种词―图干扰研究成为目前语言产生研究的标准范式。
3 现代西方语言产生研究的范式
关系。这种实验范式可以对语言产生中语音加工的方式进行研究,如Meiyer[12]在实验采用词对single-loner,place-local,fruit-lotus or captain-major,cards-maker,tree-maple,通过不同的组合可形成同质和异质两种反应序列。另一种类似的方法是采用符号命名,与内隐启动不同的是,在符号命名中学习的则是特定符号(如“++”)与词(如“土地”)之间的联接。这两种方法虽然突破了图片命名实验中图形实验材料的限制,但由于难以保证纯粹的语言产生过程(即语言产生应该是一个先有要表达的某种意图,然后找到相应的词条,最后提取相应的语音信息并组织发音的过程),而容易受到攻击。为了克服这一困难,一些研究者采用了翻译的方法,其中启动词是一种语言的词汇,而目标词则是另一种语言的对应词汇。因为双语研究发现熟练双语者进行语言之间的转换时需要有概念进行中介,所以通过选取合适的被试,可以获得相对有效的语言产生过程。如,Jescheniak等人[13]采用把英语启动词翻译成相应荷兰语的方法研究了语言产生中的频率效应。第三种研究变式则是对词―图干扰范式的改进,它不是对目标图形进行命名,而是对干扰字进行命名。它是在目标图形呈现后的不同时间点上呈现干扰字或者“?”号,被试看到干扰字时命名字,看到“?”时则命名图。为了保证一个相对完整的语言产生过程,即被试不是消极等待干扰出现后才决定是否对图形进行语言产生的加工,而是一看到目标图形就进行图形命名的准备,这种实验范式一般要求被试在较短的时间内完成命名工作,如果被试等待干扰符号才决定的话,是很难达到这个要求的。如Peterson等人[14]对语言产生中语义加工与语音加工阶段之间相互关系的研究就是采用这种研究方法。
现代西方语言产生的研究从研究范式上看,主要有3种类型,一种是继承前面通过语误和反应时等行为研究(包括采用ERP)方法的传统,并发展出新的行为实验方法来进一步构建和检验所构建的语言产生模型。行为研究方法中除了继续采用自然和诱发语误推测语言产生的加工过程外,还在标准的词―图干扰范式上发展出许多新的研究变式。一种方法是采用内隐启动的方法,这种方法通过学习词对的方式进行研究,词对中的前一个词为启动词,后一个词则为目标词,被试的任务是在见到启动词后进行目标词的命名。一个反应序列中的目标词则分为同质类与异质类两种,同质类表示这个反应序列中的所有目标词均共有首音或者尾音,异质类则表示这一反应序列中的目标词之间没有上述神经科学对病人的研究,通过利用失语症病人出现的语言产生困难和各种表征与加工之间的分离现象来推断语言产生所需要的加工过程,并用这些事实证据来支持或反对语言产生研究过程中建立起来的各种模型。在获得性语言障碍(失语症)的研究中发现了语言产生过程中大量不同类型的损伤与障碍,这些障碍不仅能够反映语言产生错误的类型,而且能够反映不同刺激特性(如词频、词长等)对语言产生的影响和语言产生中各种加工模块之间的分离。这些研究为语言产生模型的评估和发展提供了很好的手段。在失语症病人的研究中,其研究方法主要是通过各种命名、阅读和理解任务,观察不同病人在这些任务上表现出现出来的障碍状态,对语言产生中词汇系统的表征状态和加工过程进行推测。在这些任务中观察到的两种现象对语言产生的词汇表征状态有很大的贡献:通道特异性命名/理解障碍和范畴特异性命名/理解障碍,前者是指在命令或理解任务中出现的通道选择性损伤现象,如视觉物体命名很好但触觉命名损伤或者刚好相反的现象;后者则指病人在不同类型词语中表现出来的选择性损伤问题,如命名有生命的物体感到困难,但其他类型的词词则没有问题。这些现象表明词汇系统中的语义、语音、词形、句法等信息的表征可能是相对分离的,而且在不同的通道上,还存在通道特异性的词汇表征系统。这使得语言产生研究中在构建相应的模型时,对语言产生所需要的词汇系统和加工阶段的考虑就不得不对这些事实材料进行整合。
第二种研究范式的类型则采用认知第三种研究范式的类型则是计算机模拟的方法,虽然计算机模拟的方式并不能够为我们的语言产生模型提供相应的经验证据,但是它可以通过对现有经验证据的拟和来为各种复杂理论的正确性提供证据。在语言产生的研究中,一般不存在独立于产生理论的计算机模拟,相反,在语言产生的两个大的理论争论阵营都将计算机模拟作为一种重要的理论支持方法。如Levelt(1999)[15]构建的WEAVER++模型和Dell(1997)[16]的激活扩散模型。这些模型通过对语言产生不同表征层内部和表征层之间的激活或抑制以及联接之间的权重关系进行表示,来模拟现有的来自于语误、行为实验和认知神经心理学研究中得到的经验证据。
4 语言产生的基本加工过程
目前的语言产生研究一般认为,语言产生过程大致可以分为3个层次,最高层次是概念化(conceptualization),此过程确立说话的意图和想表达的意思;中间阶段是言语组织(formulation),即将要表达的意图转换为相应的词汇概念并提取出来的过程;最后一个是发音过程(articulation),即用发音器官执行语音编码的过程。一个完整的语言产生过程可以分为这样几个部分:概念准备(conceptual preparation)、词条选择(lexical selection)、语音编码与音节化(phonological encoding and syllabification)、音位编码(Phonetic encoding)、发音过程以及加工进程中一定的监控机制。
概念准备:话语者想要表达的意义是由相应的词汇概念来表达的,而概念准备就是话语者所要表达的意义与心理词典中的词汇概念之间的匹配问题,这个概念必须对应心理词典中的词或词素。概念准备阶段存在一个视角的问题,同一个事物如“椅子”,可以被命名为家具、椅子和厨房椅子或其他什么名称。一般情况下其基础名称(椅子)是语言产生过程中最先得到提取的,同时这也取决于语境、语用等信息的制约。
词条选择:词条选择是对特定的词或词汇的选择。对于要表达的意图,通常会有许多相关的词汇被激活,而词条选择则是对目标词汇的选择。一般认为,在词汇概念和语音之间存在一个抽象的中间层lemma,它是每个词汇概念的句法信息包,目标词汇得到激活后,将会激活与自己紧密相连的lemma,因此词条选择在某种意义上说就是lemma的选择。它会给需要表达的概念正确的语法信息,比如性、数、时态等信息。
语音编码与音节化:前面主要涉及语言产生过程中的语义加工,从现在开始涉及语言产生过程中的语音加工问题。语音编码与音节化是指为所选定的词汇在特定的韵律环境下如何发音进行编码的过程,即所谓的lexeme的编码过程。它需要提取3个方面的内容,一是确定词的词形构成,如果是动词进行时就需要动词本身和一个ing形式;二是韵律信息,即目标词有几个音节,重音的位置等;三是语音成分(音素)。在得到这些语言信息之后就可以利用这些语音成分和相应的韵律结构,将这些音素插入到韵律结构之中,形成相应的音节,这个过程被称为音节化的过程。
音位编码:这个过程是对要发音的音节所需要的发音姿势进行编码和计划。一个目标音节需要有一个相应的发音姿势或发音动作来完成它,一般认为存在一个发音姿势库(syllabary),不过并不是每一个音节都能够在这个发音姿势库中找到相应的发音姿势,这个库是由常用的发音姿势所构成的,那些不常用的发音姿势或动作,则需要在音位编码中进行相应的规定。
发音过程:这个过程是在词汇语音加工之后,由它发出运动指令驱动发音系统来完成。发音系统不仅仅是由受肌肉控制的肺、喉和声带等部分构成,它还包括控制这个高度复杂的运动系统并执行发音功能的神经系统。
自我监控:在语言产生过程中,同时还包含一定程度的语音监控,这使得我们有时能够发现语言产生过程中的错误(即语误)。当然我们的监控系统也并不是完全有效的,不然就不会出现语误现象了。
5 语言产生的主要理论模型及其争论