系统功能语言学视角下短语的表意功能研究
1.引言
大量的语料库语言学研究表明,自℃然语言输出的意义单位不是单词,而是由若干个单词组成的组合(下称为短语),短语是词项通过互选(co-sel 2.词汇衔接理论视角下支撑短语研究的核心理念:衔接链的形成与互动 我们先了解词汇衔接理论(见Halliday Hasan 1976,1985;Hasan 1984;Halliday Matthiessen 1999,2004,2013;Hoey 1991)视角下支撑短语研究的两个核心理念:衔接链的形成与互动。语篇的两个词项的意义存在以下任意一种关系时:同指(co-reference,如:a little girl-she);同一词项的语法变体(如:leave-left):同义(如:leave-depart):反义(如:leave-arrive);上下义(如:animal-dog);部分-整体(如ต:branch-tree),它们就构成一条衔接链(cohesive chain),衔接链纵向分析语篇的两个或以上词项意义的相同或相似性。另一核心理念为衔接链的互动横向分析不同衔接链的词项在句法层面上的语法关系,两条衔接链互动的条件是至少有两对以上词项的及物性关系相同(Halliday Hasan 1985:91)。例如:Halliday和Hasan(1985)分析了例1文本的衔接链互动,结果见图1。 例1:(见Halliday Hasan 1985:72): 1.Once upon a time there was a little girl. 2.and she went out for a walk, 3.and she saw a lovely little teddybear, 4.and so she took it home, 5.and when she got home she washed it, 6.and when she took it to bed with her she cuddled it, 7.and she fell straight to sleep, 8.and when she got up and combed it with a little wire brush the teddybear opened his eyes, 9.and started to speak to her, 10.and she had the teddybear for many many weeks and years, 11.and so when the teddybear got dirty she used to wash it, 12.and every time she brushed it it used to say some new words from a different country, 13.and thats how she used to know how to speak English,Scottish,and all the rest. 图1:连接两条衔接链上的罗马数字代表它们的及物性关系,字母i代表施动者-过程关系(e.g.girl went);ii代表过程-受动者关系(e.g.took teddybear);iii代表过程-地点关系(e.g.got home);iv代表言语过程-说话内容关系(e.g.said words);v代表修饰语-被修饰物关系(e.g.lovely teddybear)。 衔接链的形成与互动是两个互补的维度,前者关注语篇的词汇衔接,后者关注两条衔接链的词汇搭配关系。它们分别对应语料库语言学视角下短语的两个重要的属性:持续复现和词汇互选。根据何安平(2014),语料库语言学 视角下短语的持续复现属性指的是某个词项与若干个别的词项反复共现形成短语。该属性涉及分析组成短语的词项的形态或意义在语篇的复现,这与衔接链的形成呼应。词汇互选的属性涉及分析共同组成短语的词项间的语法关系,这与衔接链的互动呼应。 衔接链的互动产生意义相同或相似的短语集合。例如:图1(a)链的四个girl与(g)链的 combed,brushed和两个washed之间都是施动者-过程的关系。它们构成的短语girl combed,girl brushed,girl washed组成女孩装扮玩具熊系列动作的集合。由衔接链互动产生的短语集合类似Hunston (2008)论述的语义序列(semantic sequence),即指两个或以上短语的型式可能不同但意义在某方面相似。 3.新闻语篇的过程与载体衔接链的互动对塑造语篇大意的重要程度研究 3.1研究问题 上面提到例1短文的衔接链互动对塑造它的意义与使其连贯都起着重要的作用。目前鲜有文献试图衡量或量化衔接链互动对塑造语篇大意的重要程度,下面探讨新闻语篇由过程与载体衔接链互动产生的短语的概念意义有多大的概率出现在读者撰写的摘要中。本文关注过程与载体衔接链的互动,是因为根据系统功能语言学的句法理论,过程与载体共同组成小句的核心(nucleus)(见Halliday 1994:163)。小句的其他成分都与核心以某种方式关联,如施动者(agent)是动作的发起者,情形(circumstance)描述动作的时间、地点等。也就是说,过程与载体的组合简略地表征小句表述的命题(proposition)(见Li Hoey 2014)。 3.2分析的文本 本文分析了从Document Understanding Conferences中获取的80篇新闻和从事信息提取研究的专家们为它们撰写的摘要。Document Understanding Conferences 是由美国国家标准与技术研究所 (National Institute of Standards and Technology)组织的旨在促进文本摘要自动化(automatic text summarization)技术发展的年会。每年该会议都邀请全球从事文本摘要自动化研究的科研机构或团队参加其举办的大型文本摘要比赛,要求与会者用他们开发的系统为组委会统一发放的文本自动生成摘要,然后组委会用从事信息提取研究的专家们为这些文本撰写的摘要来评估与会者摘要的质量。该会议的介绍见http://duc.nist.gov/。每篇新闻有3个摘要,分别由3位专家撰写,每个摘要包含大约10个字。 3.3 研究方法 第一步采用Hoey(1991)的词汇衔接框架,分析语篇的任意两个过程的意义是否重复。 第二步分析它们载体的意义是否重复。 Halliday (1994:165)把各种类型过程的载体定义为: 物质过程: 动作者(中动语态),目标(非中动语态) 行为过程: 行为者 心理过程: 感知者 言语过程: 讲话者(中动语态),对象(非中动语态) 归属类关系过程: 载体 识别类关系过程: 被识别者 存在过程: 存在物 载体的意义重复的条件是它们在语篇的语境中指代相同事物(co-referentiality)或同类事物(co-classification,见Halliday Hasan 1985:74)。 由于过程与载体的组合简略地表征小句表述的命题,上述两个步骤主要分析语篇的两个命题的意义是否重复。 第三步把新闻的重复命题分在同一组,并统计所有命题的频率。完成这一步后,表述相同或同类概念意义的命题被分在同一组,而表述不同类概念意义的命题被分在不同组。 第四步分析新闻中哪些复现命题的意义也出现在读者撰写的摘要中。新闻命题的意义出现在摘要中的条件是它的过程和载体分别与摘要某命题的过程和载体的意义重复。Li和Hoey (2014:93)给出分析新闻命题的过程是否与摘要命题的过程重复的方法,它们的载体的意义重复的条件是在新闻的语境指代相同或同类事物。 第五步区分新闻的重要和次要命题。由于每篇新闻有3个摘要,因此如果新闻某命题的意义出现在两个或以上摘要中,那么它是重要命题。相反,如果它的意义只出现在其中一个或没有出现在任何摘要中,那么它是次要命题。 第六步(最后一步)把新闻按照下面的方法归类: 第一类(category1):新闻中只有频率(并列)最高的命题是重要命题。 第二类(category 2):新闻中除了频率(并列)最高的命题外,还有其他命题也是重要命题。 第三类(category 3):新闻中频率(并列)最高的命题不是而其他命题是重要命题。 第四类(category 4):新闻中没有一个重复出现的命题是重要命题。也就是说,表述新闻主旨大意的重要命题在新闻只出现一次。 3.4结果与讨论 图2给出各类别包含新闻的数量及占总数的比例 (C代表Category)。 下面讨论新闻由过程与载体衔接链频繁互动产生的短语的意义出现在摘要中的概率。图2显示C1和C2的新闻(占总数的54%)的最高频过程与载体组合的意义都是它们的重要命题,这表明新闻的最高频过程与载体组合的意义大约有54%的概率是它们的重要命题。C2和C3中20%的新闻的第二高频过程与载体组合的意义是它们的重要命题,也就是说,新闻的第二高频过程与载体组合的意义大约有20%的概率是它们的重要命题。因此,新闻的过程与载体衔接链互动频数位居前二的短语的意义大约有74%的概率是它们的重要命题,凸显它们的频繁互动对塑造语篇大意的重要性。 本研究有两个重要的结论,首先,语篇的词汇衔接与语篇的大意有关联。大量的语料库语言学研究(如Scott Tribble 2006; Stubbs 2010)表明,对比参照语料库后语篇中频数显著的实词是语篇内容的标记(aboutness indicators),它们在语篇的复现形成词汇衔接。Hoey(19ฎ91)的理论是支撑上述观点的又一有力论据。他分析语篇的任意两个句子的词汇衔接,并定义如果它们有三对或以上词汇存在某种重复关系,那么这对句子就相互粘结(bond)。Hoey指出某一句子与其他ร句子粘结的数量与它对语篇大意的重要性相关。与众多其他句子粘结的句子通常是表达语篇大意的重要句子,相反,与少数其他句子粘结的句子是边缘句子,它们通常不包含语篇大意的重要信息,而类似连接词起着连接上下文的作用。此外,与众多其他句子粘结的句子通常组成连贯、通顺的短文,而且短文能够概括语篇的主旨大意 (Hoey 1991)。 此外,由过程与载体衔接链频繁互动产生的短语的意义对塑造语篇大意起着重要的作用,这与语料库语言学相 ت关研究的结论吻合。Sinclair (2005),Warren (2010)和Milizia (2010)等人在语料库语言学视角下研究短语的表意功能,他们发现对比参照语料库频数显著的由实词组成的短语凸显语篇的大意。此外,Marco (2000),Nelson (2006)和吕桂、何安平(2014)等指出关键词与它们周边搭配词的语义关联揭示语篇的本质属性。本文与这些研究的结果都表明语篇中频数显著的实词与它们周边词的搭配模式与语篇的大意密切相关。 4.结语 本文在系统功能语言学的词汇衔接理论视角下,分析新闻语篇中由过程与载体衔接链互动产生的短语的意义,出现在读者撰写的摘要的概率,衡量它们的互动对塑造语篇大意的重要程度及探索句法与语义的互动关系。研究的结果表明,过程与载体衔接链在句法层面上的互动对塑造语篇的大意起着重要的作用,尤其是它们频繁互动产生的短语的意义有较高的概率出现在摘要中。