基于类比语料库的中国新闻英语语言特征研究
摘要:本研究对类比语料库的语言特点进行类比分析,包括词汇、句法和语篇三个层面,基于自建语料库,通过对自建语料库在这三个层面的分析与比较,最后得出新闻英语语言特征。研究结果显示,中国出版英语新闻在三个层面的数据所呈现出的一个最明显的问题就是信息密度过大,该发现有助于提高和改善中国语境下的新闻英语文本语言质量。
关键词:语言特征新闻英语;类比语料库
一、引言
信息时代的发展使得人们迫切需要获取来 シ自世界各地的信✫息,因此新闻英语日益受到人们的重视。基于语料库的新闻英语的相关研究近几年开始兴起,本研究是基于自建广播新闻英语语料库和报纸新闻英语语料库的研究,采用定量分析和定性分析相结合的方法,揭示中外出版新闻英语的语言特征。
二、研究方法
三、研究结果及分析
(一)词汇层面
类符形符比考察词汇丰富度。类符形符比(TTR)指的是语料库中类符与型符的比例。Baker(2000)曾指出,型次比的高低与写作者词汇使用的丰富程度和多样性成正比。胡显耀(2007)也认为:“词语的变可通过语料库的型次比来衡量。”但是对于长度不同的语料,用型次比来衡量词汇的变化程度不太合理,因此采用标准类符/型符比(STTR)的方法,当比较的文本长度不同时,标准型次比更为可靠。STTR值越大,说明该语料库中的词语变化性越大,词语越丰富,词语的重复率越低;反之则说明该语料库中的词语变化性越小,词语越不丰富,词语的重复率越高。
通过数据比较发现,由于中外英语新闻语料库大小不一致,中国出版英语新闻♥类符形符比稍大于外文英语新闻,而在标准化类符/形符比方面,外国新闻英语文本的STTR值为4.0,而中国新闻英语文本STTR值均低于这一数值,这一结果在一定程度上说明了外文新闻英语语料库词语变化性较大,词语更丰富,词语的重复率更低,而中国新闻英语语料库中的词语变化性较小,词语丰富性较小,词语的重复率较大。
(二)句法层面
句法的另一个统计数据为平均意群长。和句长的结果相似,中国英语新闻文本的平均意群长均大于9词,而外国新闻英语文本远远低于这一数值。平均句长☃和平均意群长Σ的结果均揭示了中国出版英语新闻文本受汉语的影响较大,从而表现出句子和意群较长的特点。
(三)语篇层面
计算结果显示,中国出版英语新闻文本词汇密度历年的比例均大于外文英语新闻文本词汇密度,部分甚至达到60%以上,而形合度均较低。外文英语新闻文本形合度高,虚词比例达到35.8%,远高于中国出版英语新闻文本,这表明中国英语新闻文本包含了大量的信息,难度较大,与英语原语新闻文本风格还存在一定差距。
四、结语
通过两个小型自建语料库在词汇、句法和语篇三个层面的分析,中国出版英语新闻语料库在标准类符形符比、平均句长、平均意群长以及词汇密度、形合度等方面的数据均体现出一个最明显的问题,即中国出版英语新闻文本所包含的信息量过大,这一问题反映出大量的信息如果处理不当,会给读者造成阅读障碍,影响新闻的传播效果。