浅析基于语料库的中国政府工作报告核心主题词研究

时间:2024-12-26 15:47:28 来源:作文网 作者:管理员

〇语言的社会维度 关键词:语料库;政府工作报告;核心主题词

A Corpus-based Analysis of Central Key Words in Chinese Government Work Reports

Di Yan-hua Yang Zhong Social changes and development influence language, and in the mean time the development of language reveals the changes of society. Lexical changes are more obvious and direct representations of social changes. This essay analyzes the central key words in the Chinese Government Work Reports from 1978 to 2010, in order to reveal how language and society co-change based on the corpora techniques, and then gives further explanation in liตght of the theory of language as social representation.

Key words:corpora; government work reports; central key words

30多年来的改革开放,使汉语的词汇变化空前。《中国政府工作报告》作为典型的政治语篇,对中国社会的发展具有重要作用,而且体现中国社会的巨大变化。文章通过分析《报告》中的核心主题词的使用特点、分布及规律,揭示其表征的社会变化,在社会发展中揭示语言的动态本质。

1 语言与社会表征

社会表征是一种含有其本身的逻辑和语言的认知系统,是集体成员共享的观念、意向、知识及实践系统,这种思想的共识形态由社会产生,并由社会的沟通而形成共同意识的一部分。这种社会共识性的知识体系,主要源自于人们的经验基础,同时也源自于人们通过传统、教育和社会交流接收和传递的信息、知识和思维模式。

语言是表征社会的一种形式。人们通过语言得以便捷沟通,了解社会,并形成对社会的集体认同。有一定代表性的语言载体能充分表征社会的现状、发展及变化。《报告》作为典型的政治语篇,是我们党和政府工作的航标,具有政策性、权威性和纲领性。无论从《报告》的内容、表现形式以及使用语言都十分规范。其职责传达中央政府工作的政策及实施路径,使各级政府更好地贯彻各项方针政策。《报告》直接与中国社会的经济、政治等各方面发展息息相关。追溯中国改革开放以来的历年政府工作报告,我们能看到中国政治文明所取得的巨大进步。《报告》语言作为一种典型的社会表征形式,直接体现出中国社会的发展变化。无论是新理念、新举措都通过报告的形式得以体现,被了解、认同并深入民心。这种表征使社会群体达到共识,合力共促中国之发展。

2 《报告》及其主题词、核心主题词提取 《政府工作报❦告》作为规范、正式的文体,措辞严谨、凝练,语言朴实,信息容量大。为了更好地研究《报告》中词汇的使用与中国社会共变的关系,本研究采用了语料库技术,用科学的方法收集、整理出数据,进一步量化和统计,以实证的手段对文本的特征进行定量描述和定性分析。此分析主要集中于《报告》中的核心主题词,一是由于语料庞大;另外,根据语料库工具,对于语词意义的分析重点应放在“主题词”、“核心主题词”上,因为它们具有文本所凸显的重要意义。《报告》的“主题词”蕴含着一定的政治理念,反映出社会发展动态。本研究对《报告》中的主题词、核心主题词及其词群、搭配进行分析,并结合社会背景、《报告》内容进行进一步阐释,因为研究语言的规律,需要充分考虑到其社会文化因素。

语料库分析工具首先可以提取文本词汇的频率分布,在此基础上可以提取“主题词”并验证“主题性”,在主题词中提取“核心主题词”。这些基本信息是进一步分析语料的基础。为了清楚主题词和核心主题词的分布特点和使用规律,还要看它们在语篇中与什么词同现,词群分布怎样。

在上表中,“主题词”是通过与参照语料库对比提取的文本中频率超常的词语,第一个频数即该词在观察文本中出现的频数,第一个比率% 即在观察文本中该词频数除以文本的总词量所得的百分比;第二组“频数”和“参照语料库比率”是该词语在参照语料库中的频数以及与总量的百分比。“X 2 值” 即主题性值,该值越大,表示该词语的主题性越强。与之相反,“P值”表示两个样本差异的显著性,该值越小,表示差异的显著水平越高。此表中居于频率榜首的词大都是语料中的关键词,也是核心主题词提取的重要基础。可见,词频和词的关键性有着必然的❥、正比例的关系,是文本主题的核心之所在。 统计的第二步是计算出文本的“核心主题词”。核心主题词具有两个含义,一个与参照语料库相比,该词语在观察语料库各个单篇文本中具有超常的出现频率;二是该词语作为主题词在观察语料库中一系列相关文本的主题词表中具有较高的复现率。核心主题词的提取过程可参见语料库工具使用说明。表3中呈现的是用语料库工具统计出的《报告》的前10个核心主题词,以说明问题。

根据参照标准,这里仅列出核心主题词中出现篇数>/=17的核心主题词。该表通过统计主题词表而提取,“复现篇数” 表示该词在不同主题词中的复现数。

3 主题表达分析

Michael McCarthy认为,我们在运用词语表达思想或对现实世界的认识和知识时,存在一种词语的谱系关系。在这种等级结构关系中,处于最上层的是“语义空间”,“语义空间”由各种“语义场”所组成,后者表达对真实世界的知识或概念,实现为各种“词语场”。“词语场”由一些具体的词语或词组构成,表达“语义场”中的概念。同一主题能触发具有共同语用特征和意义联系的词群。从主题出发的有关主题词以及核心主题词共同构建了词语网络,通过词语选择实现语义表达,围绕主题形成独特的语义场。在这一语义场中,词与词之间具有复杂的语义关系,这些相互关联的词在语篇层面也呈现出其特点。 从核心主题词提取的结果可以看出,中国改革开放以来的《政府工作报告》语篇中,“发展”和“经济”的复现篇数为100%,即:从1978-2010年改革开放的33篇《报告》中每一篇都出现过。足以看出,中国政府一直把“经济 ッ”和“发展”放到了重中之重的位置。其次是,“建设”、“企业” 、“改革” 、“工作” 、“加强” 、“社会”、“继续” 的复现篇数在20以上,说明在经济发展的主题下,强调行动力,重在“建设” ,这是各项工作的核心。同时,强调“企业”的发展,重在改革。“加强”强调的是加大力度,进一步强化当下需要不断完善的各项“工作”。“继续”强调的是持续性,不间断的延伸性行为。“社会”一词的复现率高说明中国政府对社会的整体关注是不变的宗旨。当然,社会的发展体现在诸多层面,包括经济的不断发展、社会体制的不断完善、健全的社会法律体系及切实可行的社会福利事业能满足广大人民群众所需等一系列相关内容,都不同程度地融入了“社会”这个大概念中。在不同的历史发展阶段,中国政府从不同的发展重心对社会的全面发展给予了不同的关注。另外,“人民”、“国家”、“我国”、“提高”、“生产”、“必须”、“我们”这几个词的复现篇数在10以上,可以将其分为三类:“人民”、⌚“国家”、“我国”、“我们”为所属性名词,“提高”和“生产”为行为动词,“必须”为意愿性动词。从这几个核心主题词的复现来看,中国政府的发展建设立足于中国特色的发展道路,归属感较明显。首先,从国家的大局出发,强调“我国”的发展道路和特点,“人民”为社会发展的首要关注。“生产”和“提高”是经济不断发展的必要条件。“必须”强调的是一种使命感,是我们肩负的责任。由此看出,核心主题词的复现篇数的多少可以看出《报告》语篇所关注的核心内容和侧重点。结合每一年政府工作报告的核心主题词提取进一步分析,便可以得出更加具体的结果,在改革开放这33年的总体发展目标下,各个阶段及每一年要解决的重点问题。

4 结束语

语言与社会必然联系在一起,语言具有表征社会的作用。词汇作为语言的一个重要组成部分,对经济、社会的发展变化反应最敏感、最直接,具有灵活性和动态性。基于语料库分析工具,对庞大的语料进行数据处理,为我们更科学地研究提供了重要的依据。中国政府工作报告是改革开放三十多年来中国发展变化的集中体现,基于语料库工具对其文本主题词及其特点、规律进行分析,能更好地了解其主题意义,尤其是核心主题词集中体现政府工作的重点和亮点。从词汇管窥《报告》语言呈现的规律性特点,能进一步了解语言、社会及其共变,对相关学科的研究也会有一定启示作用。

参考文献

管 健. 社会表征理论的起源与发展[J]. 社会学研究, 2009

.

李文中. 基于英语学习者语料库的主题词研究[J]. 现代外语, 2003

.

刘小彪. 政府工作报告30年词汇变迁看中国社会发展[N]. 新京报, 2008.

卫乃兴 李文中 濮建忠. 语料库应用研究[M]. 上海:上海外语教育出版, 2005.

殷晓蓉. 话语与社会变迁[M]. 北京: 华夏出版社, 2003.

张曙光. 社会表征理论述评:一种旨在整合心理与社会的理论视角[J]. 国外社会科学, 2008

. Burton, C. Political and Social Change in China Since 1978[M]. New York: Greenwood Press, 1990. McCarthy, M. Vocabulary[M]. Oxford: Oxford University Press, 1990.

Moscovici, S. Social Representations: Explorations in Social Psychology[M]. Cambridge: Polity Press, 2000.

Scott, M. WordSmith Tools Help Manual Version 4[Z]. Oxford: Oxford University Press, 2004.


热门排行: 教你如何写建议书