APP下载

政务新媒体“浙江宣传”的内容生产研究

2023-07-23陈龙朱俊松

新闻世界 2023年7期
关键词:计算机辅助政务新媒体内容分析

陈龙 朱俊松

【摘   要】为探究“浙江宣传”的内容生产特点,以便其他政务新媒体借鉴学习,研究采用计算机辅助内容分析的方法,特别以TF-IDF算法和LDA主题模型分析为主,对“浙江宣传”2022年5月30日至12月31日的316条阅读量为10万+的公众号文章进行内容分析。研究发现,“浙江宣传”的内容生产特点在于:立足浙江,面向全国,放眼世界;坚持党性与人民性相统一。研究建议我国政务新媒体充分挖掘地域特色,及时就国内外热点时事发声,掌握舆论引导主动权,并重视互动与反馈,维系好与用户之间的关系。

【关键词】浙江宣传;政务新媒体;计算机辅助;内容分析;内容生产;LDA主题模型

【基金项目】本文系宁夏西风传媒有限公司与宁夏大学横向课题“基于5G网络的媒体融合研究、产品开发与人才培养创新”的阶段性成果(项目编号:XFCM2020YF01)。

2022年5月30日,由浙江省委宣传部打造的公众号“浙江宣传”正式上线,10月15日“浙江宣传”入选“2022中国应用新闻传播十大创新案例”。截至12月31日,“浙江宣传”共发表466篇微信公众号文章,其中阅读量为10万+的文章共有316篇,占全部文章的67.8%。“浙江宣传”火热出圈,其内容不仅在浙江人的朋友圈中广泛传播,更是引起全国各地网友的共鸣与点赞。“浙江宣传”无论阅读量、点赞量还是评论数,都在同类政务新媒体中名列前茅,值得同行学习借鉴。那么“浙江宣传”究竟何以出圈,其内容生产有何特点?这些都值得研究。

一、文献综述

因为政务新媒体作为社会治理的一个重要环节,往往涉及社会各个层面,包括政府、社会、群体以及个人等,因此,对其的研究牵涉跨学科问题,目前对于政务新媒体的研究大致可分为以下几类:

第一类侧重于经验总结与对策研究。早期研究者例如殷俊等人从宏观视角总结了国内主要政务新媒体的实践经验,建议我国的政务新媒体要打破不平衡发展局面,加强矩阵体系建设,创新网络媒体融合新业态[1];有研究者则聚焦更为具体的时空背景下政务新媒体面临的问题与未来进路。例如,禹卫华等人以31个省区市卫健委的政务微信账号的13158条数据为研究对象,分析总结了新冠肺炎疫情下政务传播的功能定位与问题,并提出了建议[2]。

第二类重点研究影响政务新媒体传播效果的要素。如陈强等学者以共青团中央政务B站号等471个样本为基础,利用内容分析与回归分析等方法,考察其B站账号信息传播效果受内容主题、视频类别、封面图类型、画面形式、字幕、组织形式、剪接率、时长等因素的影响[3]。

第三类有少量研究关注政务新媒体的内容和传播特征。通过大数据挖掘,王玲宁等在2011年至2016年间采集了“上海发布”微博、微信账号的文字内容,对政务新媒体的内容生產和传播特点进行全文本分析[4]。

文献梳理显示,目前有关政务新媒体内容生产与传播特征的研究相对较少,尤其是以计算辅助内容分析(Computer-assisted content analysis)作为研究方法的则更少。大多以质性研究为主,主观介入较为明显,如一项研究通过分析文章内容和读者评论,以及用访谈的形式,来对“浙江宣传”进行分析[5],虽然涉及了“浙江宣传”的主旨内容、立场原则、文风作风、人才机制等方方面面,但一是相关统计分析手段不足,二是关于主旨内容的论述相对简略,未能充分反映“浙江宣传”的内容生产特征。为了更加客观,有必要采用计算辅助内容分析方法,对“浙江宣传”的内容生产特征进行探讨。

二、研究设计

(一)研究样本

本研究选取“浙江宣传”2022年5月30日至2022年12月31日期间的316篇阅读量10万+的公众号推文为研究对象,之所以特别选取10万+的文章,主要从传播效果的角度考虑样本的代表性以及结论的参考价值,10万+是一个较为典型的指标。

本研究采用Goseeker第三方数据抓取应用程序来完成数据采集工作,采集上述时段内的所有阅读量10万+的“浙江宣传”公众号推文。之后对数据进行预处理,包括对所有数据样本去重,对特殊符号等格式内容的清洗,并删除一些数字串或空缺值等无实质意义的内容,最终获取316篇公众号推文。

(二)研究方法

计算辅助内容分析能够避免传统质性研究因为主观判断所引起的误差,保证研究信度,解决人工统计速度慢、效率低,难以全面快速掌握文本内容的问题。本研究在计算机辅助下,综合运用了基于词频统计的TF-IDF算法,以及LDA主题模型两种分析方法。

1.基于词频统计的TF-IDF算法

TF-IDF(Term frequency-inverse document frequency)是一种统计方法,是信息检索与文本挖掘的常用加权技术。它是对传统高频关键词分析方法的升级,有助于我们在词频之外有更多手段对文本主题加以把握。本研究运用TF-IDF算法对“浙江宣传”公众号文章提取主题词,并通过分析文章主题词,探讨“浙江宣传”公众号文章的议题指向,为下一步进行LDA主题分析做铺垫。

2.LDA主题分析模型

LDA(Latent Dirichlet Allocation)是BLEI等人于2003年提出的无监督学习模型,指的是无需对文章进行人工标注,便能够识别文章的主题,挖掘语料中的关键信息。该模型由文章、主题、词三层贝叶斯构成。他认为每篇文章包含多个主题,而每个主题又由词语按照一定概率分布,根据主题对应的词语进行聚类分析[6]。

有研究指出,LDA算法常用于分析结构良好的文本文档,如报纸和学术期刊论文,因为文章经过审查、编辑和语法及拼写检查,便于计算机进行文本分析和处理[7]。LDA的应用场景十分广泛,如有学者将其应用于新闻主题挖掘[8]、期刊研究热点分析[9]等场景。本研究运用LDA主题模型来自动提取“浙江宣传”公众号文章的主题,以此来分析其内容生产及传播特征,节省人工编码时间。

三、研究发现

(一)TF-IDF分析

TF-IDF算法认为,“如果一个词在当前文档中出现的频率高,而在其他文档中很少出现,则它更能代表该文档的主题”[10]。如果“浙江宣传”的每一篇文章都出现“浙江”“中国”等词语,那么它们在频次上会很高,但是TF-IDF指数会非常低。TF-IDF算法有助于我们跳出传统高频关键词的维度,以全新的角度对文本主题进行把握,也是对下面LDA主题分析的铺垫。

如表1所示,从TF-IDF指数来看,10万+的文章中,最为重要的选题是有关温州部分的文章。当我们结合第二个关键词“文化”一起分析时可以发现,这些文章打破了对温商的传统刻板印象,而文化类的内容恰恰就是温州类文章的重要主题。这类文章打破了外界对于温州重商、轻文化的固有认知,吸引了众多网友阅读。典型文章如细数温州历史上的文人骚客与悠久文化底蕴的《谁说温州人重商不重文?》,追溯文化之源的海上丝绸之路古遗址的《温州古港遗址揭开面纱,让世界看到什么》,介绍温州美学文化代表“青灯市集”的《一盏“青灯”为啥这么亮?》等。

除此之外,“浙江宣传”作为中共浙江省委宣传部官方公众平台,对国家领导人重要思想的宣传不遗余力,如对《之江新语》等著作的解读阐发,这类选题收获了诸多关注;乌镇作为世界互联网大会举办地,与人工智能等现代数字经济已然紧密相连,站在风口之上的乌镇自然引来各界目光,这类文章流量显著增加,如《乌镇的三张面孔》《走过8年,乌镇峰会留下了什么》等;而介绍中国传统“和合”文化、“绘画大系”以及越剧的文章非常独特,同样引人瞩目。

(二)LDA主题模型分析

进行LDA主题分析之前,在对数据进行预处理和数据清洗的基础上,还需要依次进行文本分词(Tokenization)、去除停用词(Dropping common terms,如去除“进行”等无意义动词)、构建同义词典(Normalization)等操作,最后通过困惑度、可视化等多次实验,提取形成相应主题并开展分析。根据文章特点,将文本特征值设置为1000,最后计算困惑度(Perplexity),确定主题的最优数量。困惑度越低,则说明文本分析的主题聚类效果越好。通过困惑度变化的分析,确定研究文本的最优主题数量。

经过困惑度计算,当主题数为7时,困惑度达到一个低点,在7到8之间有一个反弹,根据困惑度的原理,拐点位置就是最优主题数,因此确定最优主题数为7。通过可视化呈现,可以更加直观地分析主题分布,具体做法是在python中导入一个交互式LDA可视化软件包——pyLDAvis。气泡图是“浙江宣传“公众号文章内容的主题分布,频率图是该阶段主题密切相关的词语。通过调整λ值,研究人员可以获得主题相关性最高的词语。本研究依据主题相关性和词频,选取较有代表性的15个关键词。

根据LDA主题模型的分析結果,可以将“浙江宣传”公众号文章的内容主题分为以下7类,下面将分别论述这7大主题。

1.政治思想(主题权重18.7%):主题词习近平、人民、现代化、同志、社会主义、理论、思想、总书记、政治、工作、建设、革命、全面、马克思主义、特色。

“浙江宣传”以习近平新时代中国特色社会主义思想为引领,深入阐释国家领导人的重要思想,尤其是对与浙江有关的论述与著作进行全面解读,代表性文章如《归根到底的两个“行”有何深意》。结合了具体实例,如《这本书值得好好读》《再读<之江新语>里的三个“锦囊妙计”》等文章,深入浅出地将习近平总书记的三条“锦囊妙计”用于文旅融合创新。

2.艺术创作(主题权重17.7%):主题词包括电影、作品、创作、艺术、大系、故事、观众、剧本、人生、研究、绘画、传统、音乐、孩子、文学。

这部分内容主要是“浙江宣传”跟网友们一起讨论时下热门电影、音乐、文学、绘画等艺术作品,以及探讨孩子的阅读等教育问题,兼具生活与艺术气息。如《孤勇者凭啥站上世界杯》一文,就以十分接地气的口吻分析了“小学生进行曲”何以突破语言界限;在《文艺作品是城市的最好代言》一文中,以浙产剧《县委大院》为引子,细数了电视剧、电影、歌曲等各种文艺作品对提升地方影响力的积极作用,希冀开启更多艺术与城市的双向奔赴之路。

3.共同富裕(主题权重16.6%):主题词包括经济、建设、全国、改革、共同富裕、数字化、企业、群众、数字、农村、习近平、工程、礼堂、战略、浙江人。

浙江省作为建设“共同富裕示范区”的“先行地”,“浙江宣传”着力从国家大局与浙江地方实际两方面进行分析解读。一方面是在“二十大”“两会”等重要时间节点向网友解读重要指示精神,另一方面则是俯下身去,从农村、企业发展实际出发,介绍浙江省共同富裕发展现状。代表性文章,如《这件事,浙江要比全国先一步》《为什么共同富裕等不得也急不得》等。

4.媒体与舆论(主题权重14.8%):主题词包括媒体、传播、平台、新闻、内容、舆论、视频、信息、技术、评论、社会、读者、网络、网友、互联网。

这部分内容,一方面为传统媒体融合转型出谋划策,强调传统媒体的坚守与突破,包括“说人话、切热点、有态度”,也承认文艺批评面临的种种困难;另一方面从本主题下的“舆论”“评论”“读者”“网友”等关键词可以发现,“浙江宣传”非常重视网友的互动与反馈,推出了许多讨论文章,如《没有互动的新媒体就没有灵魂》等。

5.文旅产业(主题权重13.9%):主题词包括品牌、传统、博物馆、故事、全屏、文物、遗址、活动、游客、视频、地方、版本、味道、考古、旅游。

从这部分内容不难发现,“浙江宣传”旨在提升浙江本土文旅项目知名度,打造文旅品牌,吸引游客观光。得益于浙江本土浓厚的历史文化底蕴,随着考古活动的进行,不少文章对此进行集中介绍,如《沉睡三千年,神秘古国重见天日?》一文,向读者揭秘沉睡了几千年的神秘姑蔑古国;此外,浙江的文化亦是多元的——“味道”代表着浙江独特的饮食文化,而“博物馆”等基础文化设施在不断完善,其中“版本馆”最为特殊,在《刚刚亮相的版本馆是个啥馆?》一文中,便生动介绍了这一中华文明种子基因库。

6.数字经济(主题权重9.6%):主题词包括数字、互联网、全球、国际、世界杯、人类、大会、价值、网络、峰会、贸易、经济、命运、技术、产业。

通过对数字经济主题下的关键词进行分析可知,“浙江宣传”公众号文章的内容生产基于本土特色,围绕数字产业、乌镇互联网大会、世界杯经济、全球数字贸易博览会等议题来展开的同时,也极为关注数字技术发展前沿。具体而言,有分析人工智能前沿技术的《虚拟数字人凭什么与真人“抢镜”》,也有介绍在杭州举办的首届全球数字贸易博览会的《数贸会是个什么会》,还有《元宇宙的盛宴背后》一文从发展现状、潜在问题与应对策略三个角度系统分析了元宇宙这一最新的前沿技术。

7.疫情防控(主题权重8.7%):主题词包括疫情、工作、群众、防控、人民、政策、防疫、风险、地方、社会、新冠、基层、病毒、科学、生命。

面对疫情防控这一较为敏感的议题,“浙江宣传”并没有退缩,而是力图从生命至上、人民至上以及科学防疫的角度,凝聚社会共识“最大公约数”,争取人民对疫情防控政策理解、支持的同时,也批评了不少地方、基层政府的防控工作搞“一刀切”等乱象。典型文章如《“人民至上”不是“防疫至上”》《“层层加码”与“动态清零”完全相悖》等,及时介入并引导社会舆论,既有效纾解了抵触情绪,也为防疫政策的正常实施提供了较好的舆论环境。

四、结论与讨论

在经过TF-IDF算法统计分析与LDA主题模型分析的基础上,本研究从以下四方面总结“浙江宣传”热门文章的内容生产特点。

一是立足浙江。“浙江宣传”立足于浙江的政治、经济、文化、社会等各方面实际,大力展示宣传浙江省动人实践。二是面向全国。作为浙江省的政务新媒体,“浙江宣传”并没有局限于地区议题,而是时刻关注国内大事。三是放眼世界。自俄乌冲突爆发以来,国际舆论战、认知战愈演愈烈,“浙江宣传”及时回应了国际热点话题。四是坚持党性与人民性相统一。党的各级宣传机关面对重大社会热点问题,如何坚持党性与人民性的统一,成为检验其宣传能力强弱的试金石。“浙江宣传”敢于直面问题,善于引导舆论,通过与网友平等且相互尊重的互动来获得认可。

政务新媒体发展至今,除了个别如“浙江宣传”等迅速出圈,赢得了社会各方的广泛认可,不少政务新媒体仍未形成较为广泛的社会影响,存在着舆情应对不当等种种问题。由此,经过上述分析,本文试对我国政务新媒体的发展提出一些建议。

第一,充分挖掘地域特色。通过对“浙江宣传”的研究发现,政务新媒体要吸引更多用户的关注,除了要充分发挥在地性优势,紧紧围绕本地信息展开传播以外,对于外地用户而言,还要以“反常识”的角度进行内容生产,在打破外地人刻板印象的同时,吸引更多用户关注,使政务新媒体的影响力不局限于本地。

第二,就国内外热点时事及时发声,掌握舆论引导主动权。在面对社会各界广泛关注的热点问题时,政务新媒体不应顾虑重重而陷入“失语”境地。作为新媒体,对时效性的追求显然要摆在极为重要位置,只有及时发声、介入并掌握热点事件的舆论引导权,才能获得用户的信赖与认可,形成媒体自身最为宝贵的公信力。

第三,维系好与用户之间的关系,重视互动与反馈。这需要政务新媒体改进文风。“浙江宣传”受到网友追捧,因为其在《“百日”了,我们想到了9个字》中总结的文风:“说人话、切热点、有态度”。它的文章标题短小精悍,内涵丰富,正文部分也恰到好处地把握住了网络潮流,很好地平衡了趣味性与深刻性;“切热点”则是带着责任与思考而来,而不是单纯为了流量;最后,态度上一方面以高度的党性批判各种丑恶现象,同时充分尊重网友表达的多元性,为他们提供交流平台。

总体而言,“浙江宣传”的成功出圈,对于党的宣传工作有着重要的启示意义。当前国际舆论斗争愈发激烈,舆论战与认知战早已无处不在。在结合各地实际情况的基础之上,党的各级宣传机关应当从“浙江宣传”的案例中借鉴经验,提升舆论影响力,为我国应对国际舆论战、认知战做好充分准备。

注释:

[1]殷俊,姜胜洪.政务新媒体发展现狀及对策探析[J].新闻界,2015(05):40-43+48.

[2]禹卫华,黄阳坤.重大突发公共卫生事件的政务传播:响应、议题与定位[J].新闻与传播评论,2020,73(05):22-33.

[3]陈强,张杨一,马晓悦 等.政务B站号信息传播效果影响因素与实证研究[J].图书情报工作,2020,64(22):126-134.

[4]王玲宁,禹卫华.全文本视野下政务新媒体的内容生产和传播特征——以“上海发布”为例[J].新闻界,2017(09):27-31.

[5]赵月枝,王欣钰.“手握笔杆当战士”:“浙江宣传”的舆论引领创新实践[J].青年记者,2022(23):60-63.

[6]BLEI D M,NG A Y,JORDAN M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003(3):993-1022.

[7]GUO L,VARGO C J,PANZ,et al.Big Social Data Analytics in Journalism and Mass Communication:Comparing Dictionary-Based Text Analysis and Unsupervised TopicModeling[J].Journalism & Mass Communication Quarterly,2016,93(2):332-359.

[8]金苗,自国天然,纪娇娇.意义探索与意图查核——“一带一路”倡议五年来西方主流媒体报道LDA主题模型分析[J].新闻大学,2019(05):13-29+116-117.

[9]巢乃鹏,韩少卿,吴兴桐.数字新闻学研究主题发现及其演化分析:基于Web of Science文献的考察[J].新闻界,2021(09):4-13.

[10]牛萍,黄德根.TF-IDF与规则相结合的中文关键词自动抽取研究[J].小型微型计算机系统,2016,37(04):711-715.

(作者:陈龙,宁夏大学新闻传播学院硕士研究生;朱俊松,宁夏大学新闻传播学院副教授)

责编:姚少宝

猜你喜欢

计算机辅助政务新媒体内容分析
“政务新媒体+”全功能应用拓展路径探析
浅谈政务微博信息传播的触点与发展方向
计算机辅助的抽样调查应用框架探讨
机械制造自动化方式解析
2016年《中国日报》“两会”数据新闻报道研究
从《远程教育》35年载文看远程教育研究趋势
计算机辅助翻译与教学设计探讨
政务新媒体语言及发布策略探究
政务新媒体发展现状及对策探析