机器人生成新闻的可信度及其与读者选择性阅读的相关性

2019-01-04王正祥

浙江树人大学学报(人文社会科学版) 2019年2期

王正祥

(淮北师范大学文学院，安徽淮北 235000)

写稿机器人利用算法程序对输入或收集的数据进行加工处理，从而自动生成新闻稿件，实现新闻生产的自动化。自动化新闻技术进入编辑部后，新闻的生产、消费方式都在改变。目前，欧美不少主流媒体已开始使用机器人处理财经、体育和天气类新闻报道，甚至在一向被认为机器人记者很难涉足的政治报道领域，也不乏写稿机器人的身影，比如《纽约时报》开发了一款机器人软件专门用来报道大选，让选民及时了解大选的进展等。国内不少媒介机构也在探索使用写稿机器人进行报道。2015年9月10日，腾讯财经新闻机器人“Dreamwriter”发布了一篇报道《8月CPI同比上涨2% 创12个月新高》，该报道引用国家统计局公布的CPI数据，还援引相关专家和业内人士的分析。该报道看似平淡无奇，但因为是机器人自动生成，引发了新闻业界的震动。其后，不少媒体机构推出自己的机器人作者，比较活跃的写稿机器人有《今日头条》的机器人“Xiaomingbot”、第一财金的“DT稿王”和《南方都市报》写稿机器人“小南”等。

对媒介经营者来说，机器人写稿的优势明显。算法程序利用收集来的数据，自动生成新闻稿件，能够进行规模化的新闻生产，新闻稿写作的成本更低、效率更高。比如《南方都市报》写稿机器人“小南”，在每个交易日会对沪、深两市几千只个股的涨跌情况进行分析，在收市后的几分钟之内发稿。对比人工财经分析师，机器人写稿的速度更快、发稿量更大且数据处理能力更强。对媒介机构而言，如果能广泛采用智能机器人采写稿件，从经营角度看，必然会降低媒介企业的运营成本，提升媒介企业的竞争能力。本研究将探讨国内读者对机器人自动生成新闻的可信度以及可信度评价对读者选择性阅读的影响，采用实验方法对大学生群体进行研究，关注大学生人群如何评价写稿机器人自动生成新闻的可信度，可信度评价是否与他们的选择性阅读行为相关。

一、研究综述、假设和问题的提出

新闻写作本是专业记者的核心技能，人工智能技术在新闻采写领域的广泛使用，激发了机器人写作对新闻业影响的诸多讨论。有研究者认为，机器人写作不仅效率高，能运用多种语言发稿，与专业记者相比，写作的稿件也更客观、公正[注]Linden C，Decades of Automation in the Newsroom，Digital Journalism ,2017，No.2，pp.123-140.。也有研究者担心未来算法机器人在取代专业记者的同时，不能很好地承担“看门狗”的角色[注]Strömbäck J，In Search of a Standard: Four Models of Democracy and Their Normative Implications for Journalism，Journalism Studies, 2005，No.3，pp.331-345.。在诸多探讨中，研究者还关注机器人生成新闻稿的质量以及可信度[注]Waddell F，A Robot Wrote This, Digital Journalism, 2018，No.2，pp.236-255.。对传媒来说，推广机器人写作不能仅仅考虑效率、成本等经济因素，公众是否愿意接受机器人写稿也是重要的方面。近年来，相关研究者开始探讨机器人生成新闻稿件的质量、可信度，公众如何评价写稿机器人的工作等，还有研究者关注可信度评价是否会影响读者对机器人报道的选择性阅读等。不过，相关研究在国内尚未引起应有的重视。本研究关注机器人生成新闻的可信度以及可信度评价对读者选择性阅读的影响，在分析相关研究的基础上，提出本研究的假设和问题。

(一)机器人自动生成报道的可信度

可信度是指公众对媒介、消息来源等的一种评价，即作为讯息接收者的公众对传媒、记者和传播内容的相信程度，主要是认知层面的概念，指“认知的可信度”(perceived credibility)[注]Meyer P，Defining and Measuring Credibility of Newspapers: Developing an Index，Journalism Quarterly, 1998，No.65，pp.567-574.。对可信度的研究，最早可追溯到霍夫兰等(1951)对说服性信息的可信度研究，他们主要关注说服性信息来源的可信度对说服效果的影响；受众对信源的信赖，则主要依据可信赖性、专业性两个指标来衡量[注]Hovland C I，Weiss W，The Influence of Source Credibility on Communication Effectiveness,The Public Opinion Quarterly, 1951，No.4，pp.635-650.。其后，可信度研究在不同维度展开，除了关注来源可信度之外，研究者还关注媒介可信度、信息或内容可信度等。

不同维度的可信度研究关注的信任对象有差异但又密切相关。媒介可信度是用户对信息传播媒介(如报纸、广播和电视等)可信任程度的感知；信息或内容可信度是指受众对信息本身(如信息质量、准确性等)可信任程度的感知；来源可信度关注受传者对于传播者是否可信作出的判断[注]周全、汤书昆：《社会化媒体信息源感知可信度及其影响因素研究》，《新闻与传播研究》2015年第4期，第18-35页。。本研究关注机器人自动生成的信息或内容的可信度以及机器人作为作者(来源)的可信度，探讨机器人作为信息来源与专业记者作为信息来源在可信度方面是否存在差异，机器人生成的新闻与专业记者采写的新闻在可信度方面是否存在差异。

有研究者关注写稿机器人作为信息来源的可信度，还有不少研究者对机器人写作新闻稿的质量和可信度进行探讨。在来源可信度方面，不少研究者对写稿机器人与专业记者作为信息来源的可信度进行对比研究，范德卡等(2014)对232名荷兰成年人进行调查，发现受试对写稿机器人在可信赖性和专业性方面的评价，与他们对专业记者在可信赖性和专业性方面的评价相比，没有差异[注]Van der Kaa H， Krahmer E， Journalist Versus News Consumer: The Perceived Credibility of Machine Written News, Proceedings of the Computation+Journalism Conference, New York, 2014，pp.24-25.。不过，沃克等(2018)在欧洲读者中调查发现，在来源可信度方面，与专业记者作为信息来源相比，受试对写稿机器人作为信息来源的可信赖性和专业性评价更高[注]Wölker A，Powell T，Algorithms in the Newsroom？ News Readers’ Perceived Credibility and Selection of Automated，Journalism，Epub ahead of Print 18 February 2018，doi/abs/10.1177/1464884918757072.。

不少研究者还对机器人报道的质量和可信度进行探讨。克莱瓦尔(2014)对机器人自动生成新闻稿的质量以及可信度进行研究，研究者把受试的46名大学生随机分成两组，分别阅读记者撰写的稿件和机器人生成的稿件，在阅读基础上对新闻稿的质量和可信度进行评价，结果发现，受试对专业记者采写的新闻稿在可读性方面评价更好，对机器人生成的新闻稿在可信赖性方面评价更好[注]Clerwall C，Enter the Robot Journalist, Journalism Practice, 2014，No.5，pp.519-531.。沃克等(2018)对欧洲读者的研究发现，与专业记者撰写的新闻稿相比，在体育新闻方面，受试认为自动生成的新闻可信度更高；在财经新闻方面，受试对两者可信度的评价得分没有差异[注]Wölker A，Powell T，Algorithms in the Newsroom？ News Readers’ Perceived Credibility and Selection of Automated，Journalism，Epub ahead of Print 18 February 2018，doi/abs/10.1177/1464884918757072.。由此，提出如下假设：

假设1：与专业记者相比，写稿机器人作为信息来源的可信度更高。

假设2：与专业记者撰写的报道相比，机器人自动生成的报道内容可信度更高。

此外，还有研究者提出，机器人自动生成的不同主题的报道在可信度方面可能存在差异，需重视其差异研究[注]Van der Kaa H， Krahmer E， Journalist Versus News Consumer: The Perceived Credibility of Machine Written News, Proceedings of the Computation+Journalism Conference, New York, 2014，pp.24-25.。本研究关注受试对可信度的评价是否会受到报道主题的影响，故提出如下问题：

问题1：机器人自动生成的不同主题的报道，在可信度(来源可信度和内容可信度)方面存在差异吗？

(二)可信度评价与选择性阅读

有研究者指出，可信度与读者的选择性阅读相关。温特等(2014)的实验研究发现，参与者在选择在线新闻阅读时，更可能选择来源可信度高的文章阅读，对来源可信度高的文章浏览的时间也更长[注]Winter S，Kramer N C，A Question of Credibility-effects of Source Cues and Recommendations on Information Selection on News sites and Blogs，Communications，2014，No.4，pp.435-456.，这也引发对可信度评价行为效应的探讨。沃克等(2018)在探讨机器人生成新闻的可信度时提出，读者对机器人生成新闻可信度的评价可能与他们的选择性阅读行为积极相关，对机器人生成新闻可信度评价高的读者可能更愿意阅读机器人生成的报道[注]Wölker A，Powell T，Algorithms in the Newsroom？ News Readers’ Perceived Credibility and Selection of Automated，Journalism，Epub ahead of Print 18 February 2018，doi/abs/10.1177/1464884918757072.。本研究关注机器人生成新闻的可信度是否会影响读者对此类报道的选择性阅读，故提出如下问题：

问题2：机器人自动生成报道的可信度与读者的选择性阅读相关吗？

二、研究方法

(一)受试选取

选取淮北师范大学新闻专业的102名本科生作为受试，其中男生50名，占49%；女生52名，占51%。参试学生被随机分成两个组，实验地点是学生上课的多媒体教室。

(二)实验材料与程序

写稿机器人的报道领域在不断拓展，在体育、金融等报道领域最为活跃。本研究分别选取机器人生成的体育、金融方面的报道各一篇作为实验材料，体育报道选取AI机器人小南自动生成的报道《中超第4轮贵州恒丰2比0战胜山东鲁能》，金融报道选择腾讯机器人Dreamwriter自动生成的稿件《两市飘绿沪指下跌0.5%收报3 245.22点》。同时，分别选取报道同一内容的专业记者撰写的稿件作为比较对象。在选取时要求一方面必须是记者撰写并公开刊发的，另一方面报道的篇幅要与人工智能生成的稿件接近，行文结构上不复杂。记者撰写的体育报道选取的是《贵州都市报》记者李易霖采写的《客场2比0击败山东鲁能贵州恒丰迎来赛季首胜》，金融报道选取《华西都市报》记者朱雷撰写的《3月22日收评：题材股活跃沪指收跌0.50%》。

实验1组51名学生阅读两篇体育报道，一篇由机器人小南自动生成，另一篇由记者李易霖撰写，两篇报道均如实标出真实作者(信息来源)。实验2组51名学生阅读两篇金融报道，一篇由机器人自动生成，另一篇由专业记者撰写，两篇报道也均如实标出真实作者。

(三)测量

在来源可信度的操作化测量方面，迈尔(1998)的量表最常用[注]Meyer P, Defining and Measuring Credibility of Newspapers: Developing an Index, Journalism Quarterly, 1998，No.65，pp.567-574.，罗伯茨(2010)对该量表的可信度进行过检验，认为量表可信度较高[注]Roberts C，Correlations among Variables in Message and Messenger Credibility Scales，American Behavioral Scientist, 2010，No.1，pp.43-56.。沃克等近年来在测量写稿机器人作为信息来源可信度时，直接采用迈尔的量表进行测量。本研究也采用迈尔量表测量报道者作为信息来源的可信度，分别询问受试，该新闻的报道者(1)不公平/公平、(2)无偏见/有偏见、(3)报道不完整/完整、(4)不准确/准确、(5)不可信/可信，并用七点尺度的语义差别量表进行测量，分别赋值1至7分，对偏见测量项进行反向编码，把5个题项的算术平均数作为来源可信度的指标(Cronbach’sα=0.78)。

在内容(message)可信度测量方面，弗拉纳金等(2000)曾用信息不准确/准确(inaccurate or accurate)等5个维度来测量信息或内容可信度[注]Flanagin A，Metzger M，Perceptions of Internet Information Credibility， Journalism and Mass Communication Quarterly, 2000，No.3，pp.515-540.。在具体测量时，参考弗拉纳金在测量网络信息可信度时的做法，使用如下5个题项分别询问受试，该报道(1)总体上不可信/可信、(2)不准确/准确、(3)不可信赖/可信赖、(4)无偏见/有偏见、(5)不完整/完整，并用七点尺度的语义差别量表来测量报道内容的可信度，分别赋值1至7分，把5个题项的算术平均数作为内容可信度的指标(Cronbach’sα=0.79)。

在选择性阅读的测量方面，分别询问受试日常用电脑上网、手机上网是否会浏览机器人生成的体育/财经报道，根据受试的回答，给1至4分不等的分值(1=从不；4=经常)，把两个题项的算术平均数作为选择性阅读的指标(r=0.61)。

三、研究发现

(一)对写稿机器人可信度的评价

在来源可信度方面，研究发现，就体育报道而言，受试大学生对机器人作为信息来源可信度评价更高，以5个题项的算术平均数作为来源可信度的测量指标，机器人作为信息来源可信度的均值为5.67分(sd=0.88)，记者作为信息来源可信度均值为4.51分(sd=0.92)，两者存在显著差异(F=41.71，p<0.001)。在金融新闻方面，受试大学生对机器人作为信息来源可信度评价的均值是5.75分(sd=1.02)，对记者作为信息来源可信度的评价均值是4.96分(sd=0.97)，两者差异明显(F=16.35，p<0.001)。假设1获得支持。

在内容可信度方面，研究发现，就体育报道而言，受试大学生对机器人自动生成的报道可信度评价更高，以5个题项的算术平均数作为内容可信度的测量指标，机器人报道内容可信度均值为5.58分(sd=0.88)，记者撰写稿件的内容可信度为5.18分(sd=0.96)，两者存在差异(F=4.94，p<0.05)。在金融新闻方面，受试大学生对机器人生成报道内容可信度评价的均值是5.53分(sd=1.03)，对记者报道内容可信度的评价均值是5.45分(sd=1.00)，两者差异不明显(F=0.15， p>0.05)。假设2只部分获得支持。

(二)报道主题差异与可信度

本研究问题1关注受试对机器人自动生成不同主题的报道在可信度评价方面是否存在差异。研究发现，在来源可信度方面，同样是机器人自动生成的稿件，受试对体育报道来源可信度的评价(M=5.67，sd=0.88)与对金融报道来源可信度的评价(M=5.75，sd=1.02)相比，差异不明显。在内容可信度方面，受试对体育报道内容可信度的评价(M=5.58，sd=0.88)与对金融报道内容可信度的评价(M=5.53，sd=1.03)相比，两者差异不大。结果表明，此两类报道主题的差异对可信度评价的影响不大。

(三)可信度与选择性阅读的关联性分析

本研究问题2关注机器人自动生成报道可信度的评价是否与读者的选择性阅读具有相关性。研究发现，在来源可信度方面，在控制受试的性别、年龄和父亲的受教育程度等因素之后，机器人作为体育报道信息来源可信度与受试选择性阅读的偏相关系数为0.262，统计上不具有显著性。机器人作为金融报道信息来源可信度与受试选择性阅读的偏相关系数为0.252，也没有通过显著性检验。结果表明，来源可信度与受试的选择性阅读关联度不高。

在内容可信度的影响方面，在控制受试的性别、年龄和父亲的受教育程度等因素之后，机器人体育报道的内容可信度与受试选择性阅读的偏相关系数为-0.038，统计上不具有显著性。机器人生成金融报道的可信度与受试选择性阅读的偏相关系数为0.039，也没有通过显著性检验。上述发现不支持内容可信度评价会影响受试的选择性阅读。

四、讨论与结论

机器人参与新闻报道越来越流行，机器人生成稿件的质量和可信度也因此受到研究者越来越多的关注，在此背景下，本研究对机器人生成报道的可信度进行探讨，关注读者对机器人生成新闻可信度的评价以及可信度评价是否与他们的选择性阅读相关，对相关研究发现的讨论如下。

1.关于来源可信度。就体育报道而言，受试对机器人作为信息来源可信度的评价高于对专业记者的评价，在金融报道方面也是如此。此前，有研究发现，公众普遍对机器人作为来源可信的评价更高，与本研究发现一致。可能的原因是新闻读者对算法程序普遍持有乐观的态度，认为算法生成的报道偏见更少、更客观中立，这无疑增加了对写稿机器人作为信息来源的信任程度。另外，或许还有心理预期的原因，新闻读者一般对写稿机器人从事新闻报道的预期比较低，但看到机器人生成的报道接近专业记者报道的水准时，往往会超出他们的心理预期，影响其对机器人作为信息来源的评价，从而对机器人作者可信度的评价更高。

2.关于内容可信度。机器人生成的体育报道的可信度更高，机器人撰写的金融报道则与专业记者的报道在可信度方面没有差异。这表明，机器人生成的报道与专业记者的报道在质量上接近，有些甚至超过专业记者的报道质量。沃克等通过对欧洲读者的调查发现，与人工记者撰写的新闻稿相比，在体育新闻方面，受试认为机器人自动生成的新闻可信度更高；在财经新闻方面，受试对两者可信度的评价得分没有差异，沃克的研究发现与本研究发现一致。有关机器人报道可信度评价与专业记者不相上下，格雷费等(2018)认为，读者对机器人生成报道的评价良好不让人吃惊，因为机器人生成的内容不仅列举大量数据，还包含很多细节，成功地把读者想了解的信息传递给读者，获得好的评价理所当然[注]Graefe A, et al.，Readers’ Perception of Computer-generated News: Credibility, Expertise, and Readability, Journalism, 2018，No.5，pp.595-610.。沃克等则认为，当前专业记者的报道对比机器人生成的稿件无优势可言，关键是专业记者在报道方面出了问题。专业记者的优势在于其创造性的写作，但现在的记者常迫于发稿压力而追求数量，报道中会不断重复列举事实和数字、重复发稿等，导致稿件质量下降，这也是读者对其报道可信度评价不高的原因。

3.关于报道主题。不少研究者提出，公众对机器人报道的不同主题的新闻可信度评价方面可能存在差异，需重视不同报道主题可信度差异的研究。本研究对机器人生成的体育报道和金融报道的可信度进行检验，结果发现，受试对两者的评价没有差异。当然，本研究只选取两种常见的报道形式，未来可以扩大研究范围。对不同报道主题或类型可信度的探讨有现实意义，在经验研究的基础上，还可以让写稿机器人在可信度高的报道领域发挥更大的作用。

4.关于可信度评价对读者选择性阅读的影响。在机器人生成报道可信度评价对读者选择性阅读的影响方面，读者对来源可信度的评价与他们对机器人生成报道的选择性阅读相关性不高，读者对内容可信度的评价也不会影响他们对机器人生成报道的选择性阅读。上述发现表明，可信度评价高不会促进人们更多地阅读机器人生成的报道。本研究发现与沃克等人对欧洲读者的研究结果一致。沃克等认为，机器人报道的质量评价有多个维度，与可信度评价相比，机器人生成报道的可读性对读者的选择性阅读影响可能更大，未来应该进一步研究可读性等报道质量方面的因素对读者选择性阅读的影响。

总之，本研究发现，受试对写稿机器人在可信度方面的评价与对专业记者的评价接近，有些地方甚至比对专业记者的评价更高，但机器人生成报道的可信度评价与读者的选择性阅读关联度不高。以上发现表明，当前专业记者的报道对比机器人生成的报道已无优势可言，这也预示着未来有必要关注机器人写作对新闻业的冲击。一些研究者已开始担心专业记者的职位会受到影响，特别是在一些涉及数据处理的特殊报道领域，机器人记者做得更好，算法程序可以很快在一大堆数据中提取关键性信息，包括天气预报、体育报道、交通路况信息、财经报道和犯罪报道领域等。在这些报道领域，算法程序正在不断挑战专业记者，这些报道领域的记者职位已经受到影响，未来甚至有被写稿机器人取代的可能。不过，多数研究者对机器人记者的影响持乐观或开放的态度。有研究者认为，对专业记者来说，未来也不完全是悲观的，机器人写稿可以把专业记者从日常繁琐的采写任务中解脱出来，专心从事深度报道、调查性报道等；与机器的程序相比，专业记者的新闻敏感和直觉也是机器人程序所没有的，专业记者可以从事更具有创造力的采写工作。

本研究存在的不足：一是受试为淮北师范大学的学生，读者代表性不足，如果扩大实验人群，结果可能会有所差异；二是在研究机器人生成报道的质量方面，仅关注可信度。报道质量评价是多维的，除了可信度，还包括可读性、喜爱等不同方面，未来应该进一步扩大研究范围。不过，本研究可以作为未来进一步研究机器人生成新闻质量的基础。此外，本研究发现，可信度评价与读者的选择性阅读关联度不高，未来应该进一步探讨新闻报道质量的其他方面与读者选择性阅读的关系。