今日头条的算法把关机制及其存在的问题研究
2019-08-29杨润苗
杨润苗
摘 要 智能媒体时代,新闻把关也在经历着“算法转向”。今日头条的算法把关机制颠覆了传统的新闻把关模式。文章以今日头条为例,通过文献分析和观察体验,重新定义了“算法时代”的新闻把关人,介绍了算法把关形成过程和机制,并分析这种把关模式下存在的问题和问题产生的原因。
关键词 把关人;机器算法;今日头条
中图分类号 G214 文獻标识码 A 文章编号 2096-0360(2019)13-0030-02
今日头条是中国互联网界发展最快的新媒体创业者,从2014年估值5亿到2018年估值750亿,短短4年时间增长了150倍。兴趣推荐算法是这款新闻资讯App成功的关键因素之一。算法突破了人工编辑推荐的数量限制,实现了内容的个性化定制,从而提高了用户使用时长和打开频次,使这款应用迅速跻身一线平台。然而2018年以来,关于算法把关的争议也使其不断身陷监管危机和负面舆论。算法把关是必然趋势,研究今日头条的算法把关机制的原理及其存在的问题和原因有利于平台规范自身行为,探究出解决方案,从而更好地发展。
1 今日头条的把关人
今日头条的新闻把关与一般媒体有很大不同。传统媒体通过记者和编辑确定内容范围,对稿件做出取舍。网络媒体则是网络编辑对稿件进行编辑和选择,充当着把关人的角色。今日头条没有专门的记者编辑,也不生产新闻。它是推荐引擎与兴趣推荐结合的产品,通过外接媒体、国家机构、企业以及自媒体的内容获得内容,再结合用户的使用习惯分发内容,最终实现平台自身的新闻推送。这种生产模式下,它的内容把关人包括三个部分:
1)内容作者。内容作者包括与今日头条合作的专业媒体和头条号平台生产内容的用户。类似传统媒体中负责采集新闻的记者,他们也在新闻采集过程发挥把关作用。
2)算法。内容审核是一种重要的把关机制。算法虽然作为技术存在,并非人工因素,但承担了大部分的审核工作。
3)审核编辑。今日头条的审核编辑团队作为内容审核二次把关人存在。文章经过算法初审之后才会传递到编辑手中,人工再对文章内容进一步
核查。
2 今日头条的算法把关机制
算法是今日头条把关机制的核心。算法在内容创作、内容审核以及兴趣推荐三个环节进行把关。首先,在内容创作环节,内容作者预发布的文章须需要符合发布规则,否则会被平台强制修改,不予发表。其次,在内容审核环节,内容首先会进入色情、低俗、标题党、虚假信息、低质模型180多个风险模型的过滤,部分反响强烈的内容会进入二次审核,获得大范围推广的内容还要通过第三道质量复检。在兴趣推荐环节,算法将内容的相关性特征、环境特征、热度特征、协同特征等作为推荐的依据,向不同兴趣的用户推荐内容。通过这三个把关环节的内容,才能最终得以发表,甚至被推上热门。
3 今日头条算法把关中存在的问题
通过算法实现把关的“今日头条”提高了内容把关的效率,也实现了资讯的精准推送。但要凭借这些优势,就让算法取代人工编辑还不是时候。算法把关模式也存在着风险和问题,这是值得我们警惕的。
3.1 语言文字方面
从语言文字层面上讲,标题党现象是今日头条被诟病已久的问题。仅2017年今日头条就四度被网信办约谈,原因之一就是该平台“标题党”现象泛滥。具体来说,其问题可分为以下几类:
1)标题与内容严重不符。比如《李小龙参加UFC,场面火爆》假借明星之名却讲的是格斗游戏视频片段等与李小龙无关的内容。
2)断章取义,扭曲原文语境。如《邓超想看女儿差点撞死?邓超家庭地位大揭秘》只是将邓超没开灯不小心撞到的生活小细节却配上了看似惊心动魄的标题,全然不顾原文特定的情境。
3)标题中使用夸张、刺激、极端的词汇,渲染气氛,故弄玄虚,从而赚取高点击率。
3.2 新闻原则方面
“真实、客观、准确、及时”被传统媒体视为必须坚守的原则。但这一原则并没有在“利益”为主要导向的今日头条被严格遵守。虚假新闻、猎奇信息、以博取眼球的新闻在该平台常常出现。例如头条号作者@方圆几里的《爆炸新闻:涉案女子涉嫌诬陷已被收押,刘强东终或清白之身》,这则被疯转的消息完全就是虚假信息;“暴走漫画”在今日头条发布的恶搞英雄烈士的短视频,也同样违背了社会道德。算法虽然提高了内容审核的效率,但审核质量远不及人类,不具备从新闻价值角度进行内容判断的能力,这也是算法把关的局限性。
3.3 政策法律方面
侵犯版权和低俗内容是今日头条的重要问题。作为最初不依赖独立采编人员的聚合新闻平台,它主要利用爬虫等技术手段,抓取最新最热的内容推荐给用户,但是这种无内容生产者依靠外接内容的机制也曾使其陷入版权困境。从2014年2017年“今日头条”深陷著作权侵权危机,新京报网等各类媒体机构都曾经与今日头条发生过版权方面的纠纷,要求其停止侵权,赔偿损失。虽然后来该平台推出排重技术做出整改,但打击范围还有一定限制。另一方面,该平台低俗低质内容常常违背质检的“红线”。2018年年初“今日头条”就因传播低俗色情内容被约谈整改,同年3、4月更是5次被罚款批评。作为月活上亿的大平台,今日头条屡次违反法律,未尽到审核责任。
4 今日头条把关问题的成因
4.1 自媒体媒介素养参差不齐
“头条号”是今日头条旗下的自媒体平台,也是其最主要的内容来源。截至2017年10月,头条号账号总数已超过120万,平均每天发布50万条内容,创造超过48亿次内容消费[3]。头条号作者贡献了该平台70%以上的内容,也是对内容生产环节的首要把关人。但他们大多由普通网民构成,受教育程度和媒介使用情况各有不同,媒介素养较专业媒体较低。用户把关人对于内容价值的价值判断不同、内容创作准则也各有标准。另一方面,作者相互之间抄袭现象也很普遍,网友@陈平就曾发文称今日头条抄写、复制、转发的文特别多,原创的文章反而得不到推荐。平台一方面重金吸引数量庞大的创作者,另一方面又无法统一把控他们所传播的信息的质量。
4.2 企业价值观扭曲
算法是由人制定的,它可以是注重用户体验充满人情味的进步产品,也可以成为平台作恶躲避监管新兴武器。如何调教算法,这背后是企业价值观的重要问题。效率、用户体验曾是这家企业的价值观,因此不看文章优劣和是否符合基本价值观的算法产生,平台收获更多上瘾用户的同时也导致传播内容越来越浮夸激烈。从2017年底被责令整改的色情低俗信息,到2018年3月违法广告“二级跳”的问题,色情、剽窃、虚假广告等现象层出不穷的背后都是今日头条“不以价值观先行”的恶果。以算法驱动为傲的今日头条,在每每爆出恶性事件时,也总是把问题归结于算法。屡教不改的背后,是头条不够彻底的整改决心,不肯转变企业价值观,逃避承担社会责任。
4.3 法律的不完备
尊重和保护网络版权是新闻生产的行业共识。今日头条争议很大的服务模式也给网络环境下的版权保护带来了新的挑战。在侵权案中,今日头条通过抓取其他媒体“新闻标题”再用“链接跳转”的方式绕过了版权费。对网易、搜狐等新闻平台而言,其网站为内容付了费,却被另一个新闻平台以跳转方式使用,这种行为等同于剽窃。在这场官司中的争议点主要是“新闻标题”与“新闻事实”的界定。我国《著作权法》中新闻类作品中仅时事性文章可适用合理使用规定,然而时事性文章的定义以及其他新闻类作品的具体分类和判定在法律中皆缺乏规定[4]。对于新媒体的版权纠纷相应的规范性的制度体系亟待建立。
5 结束语
把关人是决定信息是否进入渠道的重要关卡,把控着信息传播的险要位置。今日头条的算法把关给新闻生产带来新的机遇,也造成新的问题。技术本无罪,平台如何利用技术才是问题的关键。业要界全面推进以算法为主、人工为辅的把关方式还需要平台、政府、用户各方共同努力。
参考文献
[1]何怀文,陈如文.《今日头条》动了谁的“奶酪”新闻报道的独创性价值与时效价值保护[J].电子知识产权,2014(8):33-38.
[2]刘航.论我国著作权法定许可制度存在的问题与完善[J].科技创业月刊,2014,27(8):171-172,175.