APP下载

机器人写稿在北京冬奥会的创新应用

2022-11-01

中国传媒科技 2022年10期
关键词:奖牌榜业务部门新华社

石 超

(新华通讯社,北京 100083)

1.背景

日新月异的新媒体技术带人们进入拥有人工智能、云计算、AR/VR等高科技的智媒时代。智能化技术全面进入传统媒介新闻生产的核心环节,及其写作正在给新闻传播领域带来革命性的变化。[1]作为人工智能技术在新闻实践领域运用的代表性产物,“机器新闻写作”是指运用机器算法对数据进行抓取、分析、整理和呈现的新闻写作模式,它使新闻生产开始走上了工业化、自动化和智能化的道路。[2]

新华社承载了各种类型稿件的播发,其中资讯稿是其中之一,其新闻发布的时效性,生成次数的频繁,数据采集的繁琐,无一不牵扯了编辑记者大量的时间和精力。新华社写稿机器人“快笔小新”应运而生,它的工作范围涵盖了体育赛事、财经、各大部委官方资讯、天气等领域,自2015年11月7日上线运行以来,7×24小时不间断工作,为编辑记者在线采集海量数据,生成大量咨询类稿件,解放了编辑记者的双手,使其有精力和时间投入到新闻稿件深度报道中。[3]

从2016年起,“快笔小新”相继承担了里约奥运会、平昌冬奥会、中华人民共和国第十四届运动会、东京奥运会重大赛事报道,并圆满完成比赛成绩公报播发的任务。2022年北京冬奥会,“快笔小新”再接再厉,从各种赛事报道中不断积累经验,积极探索业务需求和智能化采写技术的结合点,在北京冬奥会赛事报道中推陈出新,解决困扰记者编辑多年的痛点,真正做到技术落地,解放生产力。

1.1 里约夏季奥运会——“快笔小新”重大赛事报道的首次尝试

随着机器人写稿在新华社的影响逐渐扩大,业务部门联系机器人写稿项目组,提出2016年里约奥运会的发稿需求,这是首次尝试在奥运会级别赛事上使用机器人写稿系统播发比赛公报。在数据方面,为了确保数据的准确性和时效性,多次联系奥组委,申请接入奥组委奥运赛事数据服务(ODF,Olympic Data Feed)。和ODF的成功对接,为将来的奥运会赛事的机器人写稿顺利进行打下了坚实的基础。

此次里约奥运会机器人写稿实现了包括每日中英文奖牌榜,所有39类项目的英文当场成绩和排名,重点球类项目(篮球、排球、足球、水球、曲棍球、乒乓球、羽毛球)英文当场成绩和小组赛排名等赛事公报的自动写稿。里约奥运会期间共生成稿件4000多条,其中写入待编库350多条(决赛成绩排名和奖牌榜),被业务部门最终核对签发稿件280多条。

1.2 平昌冬季奥运会——“快笔小新”在奥运赛事报道上启航新征程

机器人写稿在里约夏季奥运会赛事报道上的成功应用,促使业务部门将之后各大国际重大赛事的成绩公报的报道任务交给“快笔小新”进行。平昌冬奥会是“快笔小新”接手的第二个国际重大赛事,因有里约奥运会的机器人写稿开发经验,以及和奥组委对接的经历,平昌冬奥会机器人写稿的开发工作非常顺利。同时,在反思里约奥运会时机器人写稿在便捷性上的不足,重新开发了前端页面,能方便业务部门编辑直接在线选稿、编辑稿件以及签发至待编库等操作,深耕用户需求,以用户为中心,提升和完善机器人写稿功能。

1.3 东京夏季奥运会——“快笔小新”在国际疫情形势下继续发光发热

“快笔小新”在东京奥运会上首次实现自动发稿。国际疫情形势严峻,导致赛前测试数据严重不足,因此采取敏捷开发的方式,循序渐进,逐步完善不同赛事的报道服务,直到正式比赛开始一段时间之后,“快笔小新”才全部开发完毕。

一场比赛正式结束后,“快笔小新”同步接收奥组委ODF赛事数据,实时自动编写奥运会赛事稿件,并自动入库,全程无人工干预,将稿件第一时间呈现在编辑面前,发稿效率进一步提升。奥运期间共采写1050篇稿件,由于稿件生成又快又准,业务部门的英文终审发稿人特别表扬机器人写稿反应快,效果很好。

同时,“快笔小新”为新华社中英文客户端奥运奖牌榜提供实时奖牌榜数据接口。奖牌榜数据更新快,效果好,截至奥运会闭幕式当天,新华社英文客户端奖牌榜海外浏览量超过1600万,互动量近20万,多次成为新华社海媒账号当日浏览量和互动量最高的稿件。新华社中文客户端浏览量超过2600万,访问用户678万人次。

1.4 中华人民共和国第十四届运动会——“快笔小新”首次接入全运会赛事系统以及首次发中文稿件

完成东京奥运会赛事报道后,“快笔小新”临时接到新的需求,即一个月后的全运会报道。全运会赛事系统和奥运会ODF是完全不同体系的平台,短时间内对接成功,并开始播发赛事稿件是非常艰巨的任务,同时还需要满足业务部门不断变更的新需求。时间紧,任务重,“快笔小新”顶着压力,在敏捷开发模式下,尝试总结归纳整个赛事期间生成的所有数据,首次生成41篇按赛事种类总结的中文稿件,并全部被业务部门采用签发。

此次全运会首次报道的成功,能够做到机器人写稿中文和英文稿件全覆盖,以及成功对接全运会赛事平台,为后续的全运会赛事的机器人写稿提供了宝贵的经验。

2.北京冬奥会——“快笔小新”结合业务创新应用

2.1 主场作战,扩大冬奥会报道范围

此次北京冬奥会,是新华通讯社作为奥组委官方合作通讯社后第一次报道的冬季奥运会赛事,报道内容和范围都比之前有了进一步扩大。“快笔小新”也肩负起了更加重要的使命。业务部门决定将比赛报道范围从原先的半决赛、决赛扩大至每种比赛的各个阶段,这将导致本届冬奥会机器人写稿的稿件数量规模上远远超过以往冬奥会赛事报道。据统计,写稿机器人在冬奥会期间自动生成稿件1105篇,把记者从大量繁重的基础性工作中解放出来,腾出更多时间和精力采写更精彩、更有趣的深入性报道。

同时,按照业务部门需求,新增每日比赛归纳总结性稿件,每种比赛需要在当天所有子项目结束时,归纳所有子项目比赛结果。“快笔小新”研发团队积极响应用户的每一个需求,做好用户服务。

2.2 解决发稿痛点,提高冬奥会发稿时效

冬季项目比赛运动员需要佩戴头盔、护目镜等安全护具,身份不易辨认,稍有疏忽就有可能弄错。在以往报道中,这给记者编辑发稿带来很大麻烦,为此需要耗费大量时间核对运动员身份,影响了发稿时效。

为助力北京冬奥会报道,破解困扰记者编辑多年的痛点,技术局自主研发出“Bib号速查”系统,首次实现在新华社奥运报道中实时查询运动员的身份信息和成绩。

这个报道神器,助力前后方编辑记者,尤其是摄影记者在比赛现场通过运动员身上的号码牌(Bib号)快速查询运动员姓名、成绩、排名等信息,赛前可预先查阅即将出场的运动员信息,便于提前做好报道准备。系统支持运动员信息导出到图片编辑软件,输入Bib号自动替换为运动员名字,避免拼写错误。导出的数据样式可根据情况自行设定,尽量减少重复性手工操作。系统嵌入到新华社“新图片”系统和“采访通”App,实现对不同应用场景的支持。这些功能大大提高了冬奥报道时效,得到了编辑的一致好评。

“Bib号速查”系统同时集成了冬奥机器人写稿功能。编辑记者只要勾选运动员的名字,就可以自动生成稿件,方便快速发稿,同时减少人名拼写错误等问题,很大程度提高了冬奥报道的时效性和准确性,为冬奥智慧赋能。

冬奥会期间,运动员信息查询系统日均接口调用量5000余次,查询比赛2000余次,提供40多场2000多名运动员的信息和比赛成绩查询服务,为冬奥会报道提供强大助力。

“Bib号速查”系统在冬残奥期间也多次被记者“点名”,希望可以继续使用如此便利的功能。在北京冬奥会数据开发经验和基础上,“快笔小新”研发团队增加了残奥会600多个运动员、180多场比赛的信息数据,并针对残奥会的特点增加了视障项目“引导员”中英文姓名的查询和导出功能,得到了前方记者的好评。冬残奥会期间,“Bib号速查”系统平均每天查询比赛300多场次。

2.3 助力新媒体报道,携手推出冬奥会奖牌榜

在北京冬奥会报道期间,“快笔小新”研发团队,配合业务部门,在后方做了大量的数据支持和运维保障工作,提供实时奖牌榜数据更新服务,协助推出了北京冬奥会奖牌榜(中文版和英文版),奖牌榜数据更新快,数据准确,取得了非常好的传播效果。

在新华社中文客户端以及对内报道渠道上,累计获得近532万次浏览;在新华社英文客户端和海外社交媒体平台等渠道上,累计获得超过322万次浏览,受到各方好评。

3.总体设计

3.1 关键技术

数据清洗过滤与分析方法研究与模块实现:通过ODF提供的Schema,进行一致性检查、筛除错误结构,清洗接收的ODF数据。过滤非正式比赛结果信息,例如训练赛数据、比赛场地与天气数据等。通过利用各种数据分析方法检测比赛数据中的结构和模式,输出离散数据模式。例如比赛数据中的成绩结果、奖牌榜的更新等。该模块与具体比赛数据类型相关,针对不同的数据类型所输出的数据模式是不同的。通过对数据模式和输入事件进行分析,推断出对应的比赛成绩处理模式,同时推断出它们之间的关系,最后输出高层消息以及消息之间的关系。例如针对某一场比赛数据,如果是实时比赛结果数据,这种中间结果产生的消息只需记录即可,如果是最终的比赛结果,则需要创建一条最终消息。还需要检测分析消息之间的关系,例如因果关系、时序关系等。

新闻规划方法研究与模块实现:用于对信息进行筛选归类,并规划新闻篇章结构。针对不同的比赛规则和最终文本的呈现效果,分析决定哪些信息和关系需要在文本中提及,同时要确定文本的结构,最后输出需要提及的信息以及文档结构。文档规划模块必须明确文本中需要说明和展示的信息,一般可根据专家知识、消息的重要性、上游需求等来进行选择和确定。当然,该模块与成绩数据类型也很相关,不同数据类型对消息的选择所考虑的因素不一样,文档的结构也会不一样。

句子规划与实现方法研究与模块实现:基于选中的信息及结构,通过自然语言生成技术输出最终的文本。该模块主要涉及对句子进行规划以及句子实现,要求最终实现的句子具有正确的语法、形态和拼写,同时采用准确的指代表达。

3.2 写稿服务

此次北京冬奥会机器人写稿服务,分为三部分,分别是赛事公报稿件生成服务、运动员号码牌查询导出服务和奥运会奖牌榜数据支持服务。

赛事公报稿件生成服务。基于奥组委奥运赛事数据分发服务(ODF, Olympic Data Feed)的数据源,经本地高性能自动数据处理转发服务,按照比赛的过滤规则进行数据清洗,结合奥组委提供的Common Codes文档,对数据进行解析,提取关键信息,通过设定的模板库实时生成各项数据并且传送到目标服务器,为新华社提供实时动态精确的奥运会赛事报道服务。

图1 机器人写稿签发系统

运动员号码牌查询导出服务。基于ODF数据源,经本地高性能自动数据处理存储服务,通过手机App或者PC端查询某一场比赛运动员的号码牌对应的成绩、姓名等信息,并提供导出成文件功能。

图2 Bib速查系统

奥运会奖牌榜数据支持服务。基于ODF数据源,经本地高性能自动数据处理转发服务,解析官方奖牌榜数据,按国家提取金银铜牌个数等关键信息,提供实时奖牌榜排行数据服务。

图3 北京冬奥会奖牌榜(中文版)

图4 北京冬奥会奖牌榜(英文版)

图5 系统业务流程图

结语

库兹韦尔曾经断定,人工智能将于2045年超越人类智慧;美国Narrative Science也断定未来九成以上新闻内容将由机器创作。[4]可以预见,随着未来人工智能技术日新月异的发展,机器人必定会在新闻内容生产方面发挥更大的作用,同时也必将更好地辅助媒体人在深度报道方面创造更多的可能。

近年来,“快笔小新”不断地从各种赛事报道中积累经验,积极探索业务需求和智能化采写技术的结合点,新增各种解决新闻报道痛点的功能服务,除了体育赛事的报道,在其他领域,包括财经、各大部委官方资讯、天气等也有成熟的稿件编写能力。在此基础上,“快笔小新”将继续探索其更丰富的智能化功能,助力新华社新闻业务更上一层楼。

猜你喜欢

奖牌榜业务部门新华社
青春之约 共享精彩
再创新高
第45届世界技能大赛中国代表团奖牌榜
视界
应用“8K+5G”技术创新国庆阅兵报道——新华社的实践与思考
“刚刚体”走红,新华社“小编”如何专业卖萌
电力企业构建纪检监察与业务部门协同工作机制的研究
在当前形势下“业财融合”的发展
供电企业纪检监察与业务部门协同工作机制建设研究
财务人员深入业务部门的重要性和策略分析