APP下载

《人民日报》社论词汇统计与分析

2017-07-21徐超

采写编 2017年3期
关键词:人民日报统计分析

徐超

内容提要:《人民日报》作为中国共产党中央机关报,集中体现着党和国家的政策及发展方向。社论词汇对于社会历史变迁,通过统计与分析,可进一步了解中国在建国以来出现的变化以及对社会生活的影响。本文主要针对《人民日报》社论词汇统计与分析进行研究。

关键词:《人民日报》;社论词汇;统计;分析

在数据背景下对社论词汇进行分析,使用统计分析和词汇进行比较,结合我国时代背景和文化语境,可以深入全面的掌握汉语词汇系统的变化发展。在对汉语体会变化发展全面了解的基础上,将社会历史的变化过程进一步的进行研究,结合社会发展变迁的过程将历史进行全面的管理,掌握更加科学的社会理论研究方式,通过词汇对社会现象进行微观的分析,并对历史发展过程进行宏观概括,《人民日报》作为机关刊物,对社论词汇的了解可以全面的对我国社会历史进行了解。

一、《人民日报》社论词汇统计数据库建设

(一)纸质文件的扫描。在进行社论词汇统计的过程中需要对纸质资料进行扫描整理,但是需要扫描的资料较多,工作量较大,需要在扫描时将贴合度以及清晰度进行全面的了解,扫描之后保存为PDF格式,按照报纸的时间对扫描件进行排序,使得扫描的结果更加的清晰准确。在整体的扫描结束之后需要将PDF文档转换成为WORD文档,便于对资料的整理和编辑,但是在进行文档转换的过程中涉及到一些扫描不清晰的地方,因此需要进行人工干预,将一些无法识别的部分进行人工录入。

(二)数据库文字、篇幅统计。《人民日报》自1952年至今共计7300左右,其中在1960年篇幅数达到最多,为461篇,在对这些篇幅文字进行分析可以发现社论词汇是随着社会的发展逐渐的出现变化,并且与当时的政治生活息息相关。例如在“大跃进”时期,这一时期的社论词汇围绕着“左”倾的思想,极具特色的反映了当时的社会变化情况,是社会和历史研究的重要参考。再例如在1960年我国经济大萧条的条件下, 《人民日报》中出现了“调整、巩固、充实、提高”的方针,对当时的经济进行指导。这些社论词汇的出现可以真实的反映社会历史的变迁,是对社会整体发展的研究。

二、计算机辅助下社论词汇统计分析

(一)利用计算机进行分词。在进行社论词汇统计的过程中需要对词汇进行分词,计算机技术可以将分词工作进行完善,提升语言文字的处理效率和研究成果的精确性,特别是在大数据时代下,计算机技术可以广泛的使用到语料库中,对语言进行计量统计。对社论语料进行穷尽式词汇统计,得到的词表数量应与语料完全吻合,因而准确的进行分词,分词错误可能造成一些词汇人为的出现消失,在软件分词之后,需要进行细致的分析,提升分词的准确率,尽量的反映社论语料的全貌。

(二)制定分词细节。在进行分词实践中,为了将分词结果进行准确,因此可以参照国家相关的标准,根据实际一些词典收录的词语结合《人民日报》的语言特点进行分词,具体包括:将常用的两个、三个词作为分词单位,将四字或者是多字成语记忆结构进行凝固,使用稳定的四字词语作为分词单位。将谚语以及格言进行分析,对于一些违背分割原则的谚语或者格言,不进行切割,保持长句的状态。一些惯用的词语和修辞,如果经过分词发现原本的词义发生变化,则需要保持原有的句式结构,不能发生变动。

(三)词数统计。在分詞结束之后需要对社论语料的词数进行分析,首先采用txt格式将纯文本的分词使用WPS文字打开,使用WPS中的替换功能将计算机中的分词软件标准的词性以及标点符号进行删除,在完成之后使用统计功能对社论词汇的数量进行统计,可以得到整体的社论词汇统计结果为7698332.

(四)词条统计。在词数统计结束之后可以使用词条统计的方式,词条统计可以借助软件的形式,将txt格式输入到软件中,使用软件中中文词频进行统计,将调入的语料进行归类整理和数据处理,并对词频进行分析。词频反映的信息更加的重要,在不同时期的重复程度直接影响到社会的现实情况意义人们对词语的熟悉程度,词频社会使用稳定情况的重要标志,词频的变化可以真实的反映社会的动态变化情况。如图所示为1951年高频词汇表,从中可以发现社论词汇统计对于分析社会实践具有非常关键的作用,我国在1951年抗美援朝开始,因此较多的使用到“侵略”等词汇,这些词汇的使用可以将当时的社会现实进行反映。在表中还有较为典型的社论词语可以起到了解社会现实的作用。

三、结束语

社会的变化影响语言的变化,在语言词汇中,随着社会的发展这种现象更加的明显,《人民日报》作为中心刊物,经过69年的发展,一直承担着传达中国共产党和国家政府重要方针政策的职责,全面的见证了建国至今整个及时发展进程以及各个领域的思想文化变迁,因此对《人民日报》社论词汇进行统计和分析是对历史社会变迁的分析。

参考文献:

[1]刘晓丽.《人民日报》社论词汇统计与分析[D].广西师范学院,2015.

[2]谯璨.语境顺应视角下《人民日报》元旦社论的历时研究[D].电子科技大学,2013.

[3]廖迅乔.认知视角下《人民日报》社论(1966-1971)的批评语篇分析[D].北京外国语大学,2014.

[4]万理.从领袖人物词频统计及语义分析中看中共执政理念的转变——以建国以来《人民日报》元旦社论为例[J].北京党史,2015,02:54-57.

(作者单位:江西南昌航空大学)

猜你喜欢

人民日报统计分析
分析:是谁要过节
回头潮
2008—2015我国健美操科研论文的统计与分析
山东省交通运输投资计划管理信息系统的设计
市场经济背景下的会计统计发展探究
Units 13—14解题分析