语篇数据分析下的经济结构转型动态研究
2021-03-24晏旸彭建国
晏旸 彭建国
【摘 要】 随着时代的发展,智能家电、汽车消费、教育休闲等新型消费越来越普及;近年来,网购、潮牌商品、定制化服务等消费也日渐火热。在互联网与人类社会深度结合的大环境下,新媒体作为新兴产业的同时也从侧面记录下了我国消费升级与产业升级的动态过程。经分析发现,国内民生、经济相关报道篇章话题的转变节奏与美国经济学家W.W.罗斯托1960年提出的经济成长阶段论投射在我国的经济表现高度重叠。该规律对各类连续新闻报道都适用,可为研究网络舆情与消费经济走向的相互作用提供参考,具有普遍意义。
【关键词】 新闻;经济结构转型;话题;媒介语言;阶段性
【中图分类号】 H087 【文献标识码】 A 【文章编号】 2096-4102(2021)01-0060-03
本文收集了微信傳播指数(WCI V10.4)季度排名全国前五的最具代表性的地区党报公众号自2016年至今整整四年的社会、民生、财经相关报道,从中提取出消费、产业结构调整各阶段的高频词出现频率和次数。从而观察词频、话题和国民经济变化的相互联系与规律。
一、经济模式转型的阶段性分析
美国经济学家W.W.罗斯托1960年在《经济成长的阶段》一书中提出了经济成长阶段论又称作“罗斯托起飞模型”(Rostovian take-off model,见图1),该理论将经济发展分为传统社会、起飞准备、起飞进入、自我持续增长、成熟、高额群众消费、追求生活质量7个阶段。这一理论与我们所熟知的“马斯洛需求层次说”相吻合。
随着因特网的全民化,基于网络载体的信息传播模型展现出一种全新的互通方式,从而形成了一种隐性的社会网格布局,并伴随着有效的信息传递、社会影响和经济状态反射。网络通常基于两个组成部分:节点和连接。节点是更复杂的概念,通常通过连接指向各个组织或城市或国家,并形成不同形状的信息网络。而本文构建出的公众号词频随时间的阶段性变化,正是一条由节点和连接构成的典型的分段式传播模型。
如上文所述,经济结构转型具有很强的阶段性,立足于我国的具体情况来看,大致可分为“三条重要的时间线”(连接)以及“三个重要的时间点”(节点),这三点三线前后相连,显示国内经济结构转型的走向。自新中国成立以来,几个国民经济结构转型的阶段大致可分为:A前工业化社会、B工业化时期、C后工业化(智慧)社会,这是三个连续的线性时间段,而把这三条线连接起来的是三个重要的转折时间点:a新中国成立初前后、b改革开放后、c科学技术革命后(见图2)。
A前工业化社会从1949年新中国成立算起到1979年改革开放逐见成效后,这段时间实际是一个经济结构变化的连续统,我国从封建时代以农业为主的经济结构逐步向工业化社会靠拢的过程。B工业化时期的端点即工业化时期的结点,这个阶段又可细分为工业化初期、工业化中期和工业化后期三个既独立又彼此黏连的小段。这一时期GDP增长显著,在中期阶段我国人均GDP基本实现了每7年翻一翻,到后期阶段我国大体已经实现了完全的工业化,到2020年前后我国的人均国民生产总值的增长点预示我国已进入高收入国家行列,工业化后期正逐步向后工业化时代迈进。C随着传统工业所带来的资源环境问题的不断暴露,可持续化与经济发展的矛盾日益加剧,经济产业结构调整成为必然的选择。未来三十年我国经济结构的转型方向将向战略性新型产业如科技、教育、服务等转向。
综上可以发现,我国经济结构的阶段模型与信息化的三个阶段高度相似。其中工业化前期对应数字化时代,工业化中期对应网络化时代,工业化后期以及后工业化时期则对应智能时代。
二、基于相关新闻语料的数据化处理
基于相关社会、经济、民生新闻语料样本,作者利用网络爬虫对信息进行抓取并尝试做到大数据化的信息收集、整合与分析。此次所选取的用于分析的数据样本具有很强的针对性。
根据微信传播指数(WCI V10.4)在当季的排行,作者找出了5家高影响度的党报公众号(广州日报、莆田新闻、太行日报、杭州日报、长江日报)从2016年至今的所有新闻报道(见图3),并通过数据处理整理出这些相关报道中词汇的出现频次排列,同时也通过对新中国成立以来各报刊新闻报道数据库的查阅整理出了在以上A、B、C这三个时间段内相关新闻报道中各自的部分高频出现词汇排序,以便更直观地呈现不同时间段内新闻报道中词汇的变化及差异,探究这些差异背后的规律。
在长达四年的时间跨度里,我们统计出了所有新闻里词汇的出现次数,其中出现频率最靠前的有“工作”(117028次)“孩子”(89322次)“媒体”(73004次)“企业”(55508次)“服务”(49595次)等等。由于词汇数量巨大,我们挑选了前500内的重要词汇,按照其词汇含义分成了“人物类”“信息媒体网络类”“经济产业类”“社会生活类”“国家政府类”这五大类。这些高频词汇基本都能归入以上的五大类之中,当然这并不是固定的标准分类,其划分可以根据研究角度的不同而改变。这一时期的高频词汇组成了一个有着自身系统性的空间一维信息网络,而以上前工业化、工业化、后工业化时期也分别有着其不同且独立的信息网络,并通过信息结点相互连接起来。
总的来说,可以看出出现频率排行前500的词汇基本能勾勒出整个B工业化后期向C后工业化迈进的这一活性变化期新闻信息话题网络的面貌。在以上这500个词汇的大分类里包含了所有新闻要素,根据这些关键词汇可以大致勾勒出整个国内经济结构转型期的国民经济生产生活全貌:以制度政策为基础,以市场需求为导向,以科学技术创新为推动力的产业升级、消费升级正在稳步地推动着我国国民经济结构转型,并逐步向“新四化”过渡的进程。
从对以上的相关统计数据的统计和分析中,我们发现了一些值得关注的现象:
(一)“新四化“在数据统计中的体现
“新四化”包括新型工业化、新型城镇化、农业现代化、信息化。以上四个转变是我国传统工业社会向可持续发展的绿色、智慧、人文的发展方式转型的核心表现。在上表的数据统计中充斥着大量的与之有关的词汇,这些词汇反映了上到国家政策层面,下至居民生活、社会民生等的各个方面。
1.新型工业化
在以上五大分类板块中,最能体现新型工业化的是产业和国家板块。如在产业板块创新、调查、标准、技术、改革、未来、人才、创业、品牌等都位居前列。
同时在国家板块,安全、世界、国际、环境、政策、调整等位居前列。新型工业化改革在数据中得到印证,而这些数据也恰恰反映了工业化改革的成果和重心——科学技术创新。在工业化后期的综合新闻报导中,“创新”一词出现23600次,“技术”一词出现18558次,可谓频率极高,这也证实了科学技术创新对工业化思路转变的深刻影响。而在国家层面,“安全”一词出现26529次,“环境”一词出现20716次,这不仅表明了国家对生产安全、产品安全、国民安全的重视,也很好地反映了国家对压缩式传统发展模式所带来的严峻资源环境问题与当前发展阶段日益增长的健康需求之间的矛盾的重视——把环境问题作为产业升级过程中的重中之重。另外,除了环境有关的整篇式报导外,由于在这一时间跨度的新闻中都充斥着环保这一理念,其词频位居前列也就可以理解了。
2.新型城镇化
新型城镇化是以城乡统筹、城乡一体、产业互动、节约集约、生态宜居、和谐发展为基本特征的城镇化;是大中小城市、小城镇、新型农村社区协调发展、互促共进的城镇化。新型城市化的进程在本文的大数据统计中也得到了明显的体现。在产业板块词汇分类中,城市、中心、乡镇、交通等词汇出现频率都极高,为我们描绘出一幅以城市为中心、以乡镇为卫星城、以大中小交通道路为连接的城乡一体化发展脉络蓝图。比如近几年来取得飞速发展成绩的快递业、宅急送、城市周边农业畜牧业、小型工厂等。而把城市与城市之间、城市与乡镇之间密切联系起来的则是大到高铁、动车,小到村村通乡道的全方位布局交通网。
3.信息化
信息化在词汇统计数据中体现的尤为明显且数量众多,因此在上文对相关词汇进行分类时,我们把与“信息、媒体、传播”相关的词汇单独归为了一个大类。其中有很多值得关注的点,如在这一词汇分类中,“微信”“网友”“视频”“平台”“客户端”“二维码”等词出现次数均在12000次以上,排在词频前300位中。以上高频词大规模的出现正和我们前文的预期相吻合。按作者的思路,高频词即话题焦点,而话题焦点反映的是一个时期的群体关注中心,这个中心直接对社会、经济、政治等各个方面产生影响也是各个方面在信息网络中的反射。在本文所统计的2016年至今这四年的时间跨度里我国正处于数字化向网络化转型的同时也是向工业时代后期及后工业时代转型的节点,大量的信息网络相关词汇在新闻中的出现就恰巧印证了这点。
农业现代化在文本数据中也略有表现,但相比于以上三点略有逊色,在此不做过多阐述。
(二)三个经济转型重点领域
我国进入工业化中后期,推动居民消费的主要需求逐渐从物质需求转化为综合物质需求进而升级为发展需求,居民的主要消费品也从早前的住房、日用转变为了高质量物品、现代制造产品、教育、健康及生态等方面。这一阶段即罗斯托提出的经济成长的第六个阶段即高额群众消费阶段。
而在对近四年的大数量、高代表性的新闻媒体文本统计分析后,我们发现教育、文化、交通是我国迈进第五、第六经济成长阶段国民的关注重心和消费热点。从表1可以看出教育、文化、交通相关词汇几乎出现在了全部五个大分类条目下,且数量可观。如在“人物”这一分类下,“学生”出现35612次,“考生”出现15208次,“家长”出现26974次,“司机”出现13786次;“交警”出现12934次。而在“社会生活”这一分类下,“学校”出现43567次,“文化”出现31355次,“教育”出现30582次,除了以上这些还有诸如“中学”“学习”“招生”等等与以上三个方面紧密相关的高频词。
(三)时空节点构成的经济发展信息网络
本文从近四年这个时间的纵向截点视角出发,来观察我国经济社会发展信息网络的一隅。从理论上说我们还能够用同样的思路收集、分析信息以搭建整个经济社会发展信息网络的全貌,包括横向的时间变化和纵向的系统联系,单个词频在不同时间段数据的变化构成单一的变化曲线,而众多单一词汇变化曲线相交就绘制成一幅复杂的舆论信息传播演变网络,最终形成一张可观的大型二维信息网格。
但因为篇幅有限,所以本文只对部分相关词汇进行了分析,除此之外很多词汇频率的变化也十分值得关注,这对于舆论议事日程和社会经济的联系的研究来说具有很强的参考价值。希望往后能再做更深一步的探索。
三、基于数据、语用、议事日程相关性的一种研究思路
Keehan.E.O.与schicflin.B.(1976)正式提出了篇章话题(discourse topic)的概念。他们认为,对任何话语片段来说,必须有一个命题(proposition)作為中心,以及作为整个话语片段的话题。经过对语料的分析和一些猜测,一篇新闻报道文本中出现频率高的词,很大程度上就是该语篇的话题和焦点。而话题和焦点的转变又反射出媒体与民众关注中心的转变以及舆论话语的转向。意识到了这一点,我们就可以把对舆论走向和态势的研究转化为数字化统计研究,通过建立数学模型从而建立舆论模型,通过深度学习来预测舆论的走向,分析其变化趋势的各种可能性。
本文数据和分析许有纰漏之处,但全文旨在提出一种跨学科的新型研究思路,至于具体的技术处理还要待日后更多相关的研究。此外,国内媒体尤其是党媒,如何在经济结构调整的关键时期起到喉舌作用,正向的引导舆论、充分发挥信息传递价值?这些问题在已有经验上都还需更深入地继续思考和探索……
【参考文献】
[1]W.W.罗斯托.经济增长理论史[M].杭州:浙江大学出版社,2016.
[2]李炜娜.疫情信息在网络节点的连接与扩散:从网络科学视域下的“中心度”向量出发[J].宜宾学院学报,2020,20(5):72-80.
[3]刘治彦.城市经济转型升级动力机制分析[J].企业经济,2020(2):5-11,2.
[4]Keehan. E.O.,schicflin.B. Topic as a discourse notion[M].in(ed.)C.N.L.,1976.