比较半自动化与人工视频新闻质量

2021-01-02赵敏

青年记者 2021年2期

● 赵敏

截至2020 年6 月，我国网络视频（含短视频）用户规模达8.88 亿，占网民整体的94.5%，其中短视频已成为新闻报道新选择、电商平台新标配。视频受众或者说短视频受众群体数量迅速增长，视频新闻也日渐流行。然而，面对新的情况，目前国内对于视频新闻的研究还比较少见。本研究的目的在于调查西方受众如何评价计算机生产的视频内容，具体来说是半自动化视频新闻与人工视频新闻的质量。在前人较为成熟的、评估文本新闻质量量表的基础上，初步探索、构建起针对视频新闻质量评价的量表。

研究问题引入

新闻记者借用新兴技术进行新闻采编等工作由来已久，技术的发展也为自动化新闻（automated journalism）的发展开辟了一条道路。Carlson（2015）将自动化新闻定义为将数据转换为叙述性文本，其中只有有限的、甚至是没有人工干预的算法过程[1]。目前，自动化新闻已经开始在政治、体育、财经、犯罪等新闻领域施展身手。学界也已经有一些研究从整体上关注和讨论自动化新闻，但研究对象主要是文本的自动化新闻。当下，短视频越来越多地受到受众的欢迎，视频新闻也越来越频繁地出现在各个平台上，因此，本研究将关注点聚焦于视频新闻。视频新闻往往能够给予更为直观、丰富的信息，也因为音画结合、背景音乐等元素更能吸引受众的注意力。具体来说，主要聚焦于受众如何看待和评价自动化视频新闻的质量，受众又是否能够区分自动化视频新闻和人工视频新闻。

Sundar（1999）认为，新闻质量指的是新闻故事整体的出色程度或水平，在传播研究中，质量是对内容进行整体评价时不可或缺的一部分[2]。现有文献集中讨论了文本新闻的质量评价，如Clerwall（2014）从可信性和质量两方面来评价新闻，其中又将两个主要属性划分为描述性、有用、写得好、信息丰富、清晰、精确、客观等12 个分属性，但是没有说明分属性与两个主要属性之间到底是如何关联的[3]；Van der Kaa 和Krahmer（2014）从专业性和可信性两个方面评价文本新闻，并将测量属性细分为专业性、智能、教育作用、可信性、权威、精确性等11 个分属性[4]；Graefe 等（2016）在前人基础之上，从可信性、可读性和新闻专业性三个方面评价新闻质量，又将每个属性细分为4 个分属性（如，将可信性细分为精确、值得信赖、公平、可靠等），形成了较为细致、全面的评价量表[5]。

然而，以上量表主要针对文本新闻，测量的属性也体现的是文本新闻的特点；针对视频新闻的质量评价尚没有适合的量表，因此笔者一方面结合学者们对于文本新闻质量评价的研究，另一方面根据视频新闻的特点，对新闻质量评价量表进行调整和改进，将质量细分为可看性、可信度和专业度三个主要维度，并根据这三个主要维度设计量表和问卷。至此，本研究提出以下研究问题：1.受众能够区分半自动化视频新闻和人工视频新闻吗？2.在不被告知视频是否为半自动化或人工的情况下，受众如何评价二者的可看性、可信度和专业度？并由以上两个具体问题引出较为总体的研究问题；3.英语母语受众如何评价半自动化和人工视频新闻的质量？

研究设计

本研究选择Wibbitz 和the Press Association（以下简称“PA”）两个平台分别作为半自动化视频新闻和人工视频新闻的来源。前者拥有较为丰富的素材库，能够根据编辑输入的文本，从素材库选取相应的片段自动生成视频；后者则创建于1868 年，目前是英国主要的多媒体新闻网站之一，面向国内外受众提供图片、视频等多媒体新闻。考虑到两个平台的特点，笔者选择两个平台都涵盖的美国政治这一话题作为样本视频的基本框架。首先，从PA 选择9 个长度不超过90 秒、近6 个月内的有关美国政治的视频新闻（不包括那些对于Wibbitz 来说可能太过困难的采访类、访谈类视频）；随后提取视频的文本（即字幕），将文本完全复制至Wibbitz 平台，选择“美国政治”这一主题，平台随即根据字幕自动生成视频，笔者仅对其中个别背景音乐明显不相符的视频进行随机调整。因此，Wibbitz 最终生成的视频仅进行了有限的人工操作，可以被称为半自动化视频。同时，特意去除Wibbitz 平台原本带有的水印，以确保受众无法直接通过水印判断视频到底是人工的还是半自动的。

使用Qualtrics 制作调查问卷，并将问卷发布在Amazon Mechanical Turk（AMT）平台上。符合条件的受众需要随机、先后观看9 组PA 视频和Wibbitz 视频样本中的一组，每个视频仅播放一次、不重复播放。每看完一个视频，受众随即回答关于该视频的15 个问题。问卷由封闭性问题、李克特量表和开放性问题构成。

研究结果

调查共回收103 份问卷，获得97 份有效问卷。使用SPSS软件评估半自动化新闻视频和人工新闻视频的质量。

1.可看性。可看性是受众对于其所观看的视频的主观态度。他们是否被视频吸引、在多大程度上专注于所观看的视频以及他们对字幕、画面和音频的满意度是可看性这一属性所包含的指标；是否愿意向他人分享所观看的视频则是可看性较高维度的衡量指标。有趣的是，PA 视频在视觉吸引力方面的平均值只略高于Wibbitz，且经过t 检验，未得到统计学上的支持（t=0.215,p>0.05）；而Wibbitz 视频在受众专注度上的平均值虽略高于PA，也未获得统计学上的意义（t=-0.942,p>0.05）。不过，受众明显对PA 视频的画面、音频和字幕更为满意（t=5.971,p<0.01;t=3.910,p<0.01;t=1.904,0.01

（t=1.257,p>0.05）。

2.可信度。问卷中有4 个问题涉及可信度这一属性。从平均值来看，受众认为PA 的视频比Wibbitz 的视频更加客观、更为详细、信息量更大。而经过t 检验发现，一部分区别并未得到统计学方面的支持：PA 视频并不比Wibbitz 视频更加客观（t=0.086,p>0.05）、更加值得信赖（t=0.463,p>0.05）或更为详细（t=0.228,p>0.05）。在信息丰富度方面，PA 视频之于Wibbitz 视频的优势才得到统计学的支持（t=3.242,p<0.01），即受众认为PA视频的信息量大。然而，值得注意的是，研究者在每组视频样本中使用的是相同的字幕，其包含的文本信息应该是一致的。至于为何在信息丰富度方面体现出差异，笔者认为，这是因为在Wibbitz 平台上生成研究所需的视频样本时，选择了“美国政治”作为基本的模板，该模板风格活泼、动态多变，这可能使受众更多地将注意力放在视频风格的元素上，如画面切换等等。这一点也从受众对于Wibbitz 视频的评价中得到印证：他们认为该视频更富动感，画面切换更加频繁。

3.专业度。专业度意味着通俗易懂、长度适中、画面与字幕相匹配，并且体现职业性。结果发现，受众并没有认为PA 视频比Wibbitz 视频更加通俗易懂（t=0.724,p>0.05）；不过，他们却认为，PA 视频画面与字幕的匹配度明显高于Wibbitz（t=4.515,p<0.01），也更能体现其职业性（t=3.494,0.01

4.整体质量评价。问卷的最后一个问题要求受众对所观看的两个视频做整体上的评价。受众认为PA 新闻视频的质量明显高于Wibbitz（t=4.066,p<0.01）。结合此前二者在可看性、可信度、专业性三个维度的比较，尽管在客观性、通俗易懂等方面，PA 视频和Wibbitz 视频没有统计学意义上的差别，然而，受众还是从总体上较为明确地表示PA 视频的质量更优。

最后，受众需要判断自己所观看的视频中哪个是人工视频、哪个是半自动化视频。结果发现，近三分之二的受众（60/97）能够做出正确判断；23 位受众做出了错误的判断；还有14 位受众表示无法做出区分。这一定程度上表明，半自动化视频新闻拥有进步和提高的潜力，随着技术的发展、素材库的丰富、匹配算法的完善，未来有可能消除制作视频新闻上的人工与电脑的区别。

结语

本研究测量了以英语为母语的受众如何评价半自动化新闻视频与人工新闻视频的质量。总体来看，受众认为PA 视频的质量好于Wibbitz 视频。当前短视频越来越受到受众的欢迎，Wibbitz 视频在可看性上迎合了这一趋势，并且也展现了之后新闻视频的发展方向。本研究尝试在前人研究的基础上，借鉴对于文本新闻的质量评价量表，初步构建符合视频新闻特点的质量评价量表，以期能够推动对于视频新闻的规范研究。