算法在新闻实践过程中的伦理问题

2019-02-20张悦

三明学院学报 2019年5期

张悦

（安徽师范大学新闻与传播学院，安徽芜湖 241000）

所谓算法，其本质是人工智能，是指用于模拟和延展人类智能的理论、方法、技术及其应用系统。[1］(P23)新闻作为知识生产与呈现的重要载体，其与人工智能的结合已经呈现出普遍化的趋势，新闻生产也出现了不同于传统新闻模式的“个性化新闻”“机器新闻写作”“传感器新闻”“临场化新闻”与“分布式新闻”。[2］(P6-24)常见的“算法新闻”“自动化新闻”“智能化新闻”“计算新闻”等，虽然名称不同，但在本质上都是依赖于人工智能技术而出现的新闻形态。2015年9月10日，在由腾讯写作机器人Dreamwriter生产的稿件《8月CPI涨2%创12个月新高》中，其中的数据援引处与数据分析，已经达到真人稿件的水平。今日头条名为张小明的新闻机器人在里约奥运会期间撰写体育新闻稿件200余篇，累计获得200万次的阅读量。同时，今日头条人工智能实验室凭借 “互联网信息摘要与机器写稿关键技术及应用”项目荣获吴文俊人工智能技术发明奖。算法在新闻行业的广泛应用，在技术层面提升了人机协作的效率。但从客观、公正、真实的新闻专业主义维度出发，如何应对带有工具理性主义缺陷的算法所带来的新闻伦理问题与人文价值缺失的危险，才是媒体及从业者透过算法的光环，更应该考虑的问题。

一、算法在新闻实践中的技术流程

相对于传统模式下的新闻实践，得益于信息处理系统优势的算法，在与新闻结合的实践过程中可以做到生产层面的高效率、分发层面的高精准度以及互动模式的多元化。信息处理系统摒弃了传统新闻的实践流程，在新闻生产及分发方面呈现以下几个步骤。第一，数据输入。人工智能的强大在于短时间内对于数据的准确抓取，而非数据的生产。因此数据录入对于算法新闻的生产过程，虽是第一步，却也是最重要的一步。在这个过程中，数据输入者可以事先将新闻种类进行分类，再将不同种类新闻稿件中的常用文字转化成数据符号，用来充当新闻机器人的“大脑”与素材库，以备在生成新闻时能够快速抓取词条完成创作。第二，数据吞吐。提前输入的数据如何变成一则稿件，这需要通过监督式机器学习（人为预先设定规则）或者无监督式机器学习（机器自动学习形成一套人无法清晰了解的规则）[3］(P82-88)，将数据按照相应的语法和句法结构进行排列，完成语言生成的过程。第三，数据抓取与整合。算法新闻作品的产生过程，本质上就是算法技术通过对素材库中的有效信息进程抓取，再通过上述的数据吞吐形成与真人作品几乎没有差别的算法新闻。在互联网传播时代，信息的零散化、碎片化使得上述数据输入环节不仅要考虑数据的实用性，还要保障数据的全面与完整。这样才能保证算法在本环节进行快速有效的数据整合。第四，新闻产品输出。按照上述两个步骤生产出新闻后，新闻机构则要开展新闻产品的线上和线下分发。在线上分发的环节，算法可以根据个人在线上的网络痕迹，抓取个人的兴趣爱好、政治倾向、人格特征、网络人际关系以及地理位置等，从而精准地进行信息投放，以期获得最优的传播效果。

上述四个环节总体呈现出环环紧扣的关系，只有将数据进行得当选取、精准抓取，才能呈现出既符合大众阅读习惯，又助力于现实生活、生产的新闻作品。依赖于算法技术，新闻实践中的人机协作效率逐渐升高，全新的新闻业态也正逐渐产生。但算法的本质是技术，在实践过程中，应时刻警惕技术的双刃剑效应，使之发挥对于个体发展与社会进步的积极作用。

二、算法在新闻实践中的技术优势与问题

（一）算法在新闻实践中的技术优势

1.信息整合的迅速性

传统传播时代，受到传播媒介技术的限制，信息传播的时效性曾是新闻从业者们关心的议题。随着互联网技术的普及与广泛应用，“快捷”已经失去强大的战斗力。取而代之的景象是，技术的发展造就了客户终端平台的出现，社会化媒体成为公众接收信息的重要端口，一时间职业生产内容和用户生产内容等多种内容生产模式进入视野。一方面，信息渠道的开拓增加了公众接触信息的机会，在建构公共领域形成公共讨论层面意义重大。另一方面，社会化媒体的井喷现象，导致了传统媒体时代把关人形象的弱化和缺失。出于不同目的考量，良莠不齐的社会化媒体在传播信息时容易出现思维碎片化、表达碎片化、内容碎片化、主体碎片化等一系列连锁现象，“公民协同”生产信息的模式在消灭传统时距的同时，也消灭了完整的文本[4］(P91-124)，表现为混乱、无序、零碎、片面等特点。

众所周知，传媒信息是个体和社会在生活、生产方面的活动依据。当一则新闻事件发生之后，如何全面、客观、准确、真实地呈现事件的全貌，即通过对网络危机碎片化的多重拼图[5］(P18-24)，来满足受众对信息的要求，实现真正意义上的传播。联系到上述技术流程，算法的优势不在于创造数据，而是能够快速从信息海洋中实现信息资源的整合，短时间内对传播主体、传播内容、传播意义进行拼图，尽可能最大限度呈现传播要素来避免因传播要素的缺失、错误、混乱而产生的不良后果，这将有助于减少诸如反转新闻等新闻伦理事件的发生，一定程度上缓解大众对于媒体的信任危机。而这正是当下信息超载时代媒体工作关键点所在。

同时，与其他基于物质性资源行业不同的是，新闻传播行业从事的工作是新闻信息资源增值加工，新闻传播行业就是一个新闻信息资源增值行业。[6］(P320)从这个维度出发，新闻信息整合是实现新闻增值的手段，新闻增值最直接的表现就是注意力的聚集。在这一方面，人工智能可以通过关键词抓取，整合全网相关信息，在最优时间段内对新闻事件进行连续报道，从而在短时间内调动公众的注意力与情绪，形成热点新闻话题，助力新闻事件的传播。同时对于一些特殊新闻，比如涉及打黑、贪污、扫黄等社会议题的新闻事件时，也可以利用舆论热度加速事件的解决。

2.信息分发的精准性

在传播学领域，传播效果研究虽在测算层面存在难度，但作为新闻价值实现的重要依据，人们对什么是新闻信息的有效传播以及如何实现其有效传播问题，一直抱有热情。丁柏铨认为：“受众接收到某项新闻信息，对此表示认同，并受到一定程度的正向影响，作者和媒介方才实现了有效传播。”[7］(P75-79)新闻信息的真实性、传播渠道的顺畅性、接收主体的精准性等都关乎新闻信息的有效传播。

信息接收主体的精准性，即信息分发层面的准确性。传统媒体时代，新闻信息想要做到精准投放，大多依赖于媒介方对不同单位（如政府、企业等）的性质、不同地域（如工业城市、农业城市等）的特点进行判定，进而进行人工投放。总体而言，这种投放方式因为没有精准到个人，带有粗犷、低效的特点，其传播效果带有一定的局限性。这种因无法实现信息价值的低利用率本质上是对信息资源的浪费。

当下，算法技术在信息投放方面的效果已无法与传统媒体时代的相提并论。算法可以理解成是基于计算机系统的计算体系。算法在信息投放方面之所以能够做到定位、内容、方式的精准，其原理在于，算法可以先通过个体在网络上的浏览记录，分析个体的兴趣爱好、行为习惯、性格特征、价值偏好等信息；再将这些有形或者无形的特征输入到计算系统中形成数据；最后将每一个ID对应一个信息数据库，作为对用户数据分析的描摹身份画像。因此，个体在线上浏览信息时，前台随意的指尖滑动，都会被后台的算法系统所记录与测算，形成一对一的数据处理。

在形成对应的信息数据库后，个体所面对的线上海量信息，就已经不再是随机出现的，而是经过了算法的“量身打造”。经过系统的计算，个体在浏览网页时，所接触到的大多是自身感兴趣或者需要的信息。这在一定程度上减少了个体在寻找有用信息时的无意义行为，同时这个过程也可以理解为注意力增值的体现，这也是当下线上媒体平台常见的信息推送方式和盈利模式。

（二）算法在新闻实践中存在的问题

1.算法偏见的普遍性

技术是社会的产物，技术对社会发展起到的影响，取决于人在运用技术时的价值判断与行为偏向。算法是当下人工智能的代表，算法中立的支持者认为算法与新闻的结合，能够减少媒体编辑的价值取向在新闻生产中所占的比重，从而实现真正意义上的“客观”。这种“技术中性论”的观点显然忽略了算法运用主体的主观能动性，是一种盲目乐观的态度。在由算法所驱动的新闻实践中，算法已经渗透到各个环节。技术是中立的，但如果加入人的元素，算法偏见就应该得到重视。

首先，人的参与注定了新闻生产不可能做到完全公正客观。算法作为一种技术，算法设计师在算法设计中处于核心地位，其对问题的理解、对数据的选取、对变量的选择、对算法的综合评价等都贯穿着人为因素。[8］(P29-33)该过程中的算法仅仅作为一种中介的形式存在，其存在意义在于帮助新闻从业人员更好地进行新闻生产。甚至可以说，此时的算法所携带的价值观念完全来自于算法运用的主体。其次，上述已经阐释了算法在新闻生产过程中的技术逻辑，算法偏见容易出现在“数据输入”环节。“数据输入”环节相当于把文字、图片、音频、视频等元素进行量化处理，这些人为创造的数据，也与创造者本身的政治取向、兴趣爱好、价值偏向有着直接的联系，且量化处理也不可能完全复制现实世界。微软纽约研究院高级研究员汉娜·瓦拉赫认为，机器学习的程序是通过社会中已存在的数据进行训练，只要这个社会还存在偏见，机器学习便会重现这些偏见。[9］最后，作为一种技术，算法天然含有工具理性主义的缺陷，具有功利主义的特点，容易在信息的分发中过分强调经济利益，而忽略新闻媒体应以社会效益为首要追求的原则。

2.互动格局的欺骗性

传统媒体时代，囿于传播技术的落后，信息传受关系一度表现出僵化的特点，互动渠道的缺失与堵塞，导致信息接受者无法清晰、完整地表达意见信息，无法为上层的决策提供有效的反馈，这种现象也一直被西方媒体以 “缺乏民主”所诟病。当下，算法在新闻领域的应用，一方面促进了信息发布主体的多元化。传统媒体时代，在政治、技术、文化等多重因素的作用下，专业媒体在公共话语的生产与传播方面享有绝对的权力。传播技术的发展，新媒体赋权打破了传统新闻从业者作为新闻生产中心的地位。社交媒体和新闻聚合平台的搭建，让个人、自媒体等成为信息生产的多元主体。另一方面，作为信息发布主体的社会化媒体，其低门槛性丰富了信息发布者和接收者之间的互动模式，也弱化了二者之间的固定关系。传统媒体时代的“后台”被新媒体时代的“前台”所置换，二者的边界正在被技术消解，实时互动、跨时空互动让信息发布者的身份不再神秘。相对于传统新闻的生产形态，其进步性体现在有利于扩大社会对话空间，构建公共平台，促进社会往更加民主、开放的方向发展，整个社会信息环境也变得多元、丰富、活泼。

虽然算法构建了全新的信息互动格局，但值得注意的是，算法不仅应用在新闻生产与互动中，在社会化媒体平台中的内容审核环节，算法同样被运用到内容的筛选过程中，来制约不同声音的发声。即，无论在促进信息发布主体多元化方面，还是在充当把关人角色方面，算法始终作为一种工具的形式存在。这种工具属性本身似乎不具备自主意识，算法内在的价值判断与取向完全来自于新闻生产主体与算法制造主体。只有当处于新闻实践过程中的“人”具备了理性主义精神，否则这种存在方式对新闻内容的价值观、新闻行业的运行逻辑、新闻生产的惯性思维不会产生实质性的影响。新闻实践依然没有因为新技术的加入，而改变其传统媒体主导的局面。

在很多情况下，专业媒体机构愿意打破传统，主动呈现信息交互中公众的多元价值，并赋予其一定的社会影响力，形成一幅理想的信息互动景象图。比如媒体开设投稿专栏，允许公众表达自己的意见与态度。但整体而言，新闻作品的主导权依然掌握在专业媒体手中，信息发布主体依然往专业媒体倾斜，公众参与所产生的力量依然无法撼动专业媒体的地位。互动格局改变的背后，是媒体—公众新型关系的产生，还是传统媒体披上了一层算法技术的外衣？

3.价值评判的不确定性

新闻专业主义的“客观性”原则一直是新闻从业者在应然层面所遵守的准则。但在实然层面，新闻生产主体的价值取向会隐藏在新闻作品的修辞与表述中。传统媒体时代，人在新闻生产过程中占据着绝对地位，价值把关的权力被牢牢把握在新闻从业者手中。而我国传媒领域的行政色彩决定了此时的新闻修辞多偏向国家意志。社会化媒体时代，话语空间被大大拓展，信息环境逐渐表现为“众声喧哗”的景象。信息发布主体的多样性与互动格局的双向性，带来了信息、意见、观点的多元与碰撞。虽然在算法应用于新闻实践的技术流程中，新闻价值观念已经被植入其中，算法在面对不同的声音时，可以根据语义进行价值识别。但新闻信息与互动评论并不是简单的语义堆积，语义间的不同排列组合就可能触发全新的含义。算法在无意识的情况下对信息进行整合与传播，存在传递偏见的新闻伦理危险。

此外，在算法与新闻的结合中，算法虽不处于中立立场，但在具体的新闻实践中，算法作为一种技术被新闻媒体所赋权，用于信息的生产、传播、分发、互动，自动化新闻、智能化新闻等模式都被视为一种相对独立的新闻模式。把关人的缺失以及无法用经验性数据做量化处理的价值取向，都增加了算法进行价值判断的难度。此时，作为新闻内核的人文主义、价值理性等原则，常会因为评判难度大而被算法所忽略，新闻伦理问题也将进一步加深。可以发现，在当下，算法多应用于体育新闻与财经新闻领域，原因在于二者多强调数字与结果，类型化、固定化的表述系统对稿件的语言表达要求低，且很少涉及价值判断。

三、实现算法在新闻实践中的最优发展

（一）明确算法的本质与定位

互联网时代的信息超载格局，一时间使得大数据驱动的智能算法成为时代宠儿。但在算法被“神话”的背后，算法工作原理也说明：“基于统计而不是基于理解的信息选择，在提高信息获取效率的同时，也会制造和加剧信息失衡和信息歧视，成为偏见、劣质信息的传声筒和媒体负面效应的放大器。”[10］(P28-37)算法作为一种技术，其双刃剑效应体现在，算法在革新新闻生产与分发模式的同时，也会加剧信息环境的恶化程度。

得益于先天优势，智能算法已经运用到日常生活的许多领域，但算法在应用过程中，应当明确将技术运用到新闻领域的目的在于，实现技术与文化的最优协作模式。在这个过程中，具备新闻专业素养的媒体人才应该是新闻实践的主导者，且这种权利不应因为算法的技术优势而进行让渡。

明确算法技术作为实现新闻价值的工具与手段的定位，实际上就是对算法进行“祛魅”的过程。这将有助于算法更好地完成本职工作，帮助媒体传播具备人文主义、实用价值的信息。同时，明确算法在新闻实践中的位置，本质上就是明确人在新闻实践中的价值抉择。只有当设计者与从业者将新闻的社会效益放在首位，算法才能发挥其最本质的作用，在呈现多元信息、促进社会协商与整合、促进社会发展层面发挥积极影响。

（二）积极寻求算法透明

算法在应用过程中之所以存在伦理与价值风险，一部分原因来源于算法技术逻辑中存在明显的“黑箱”。“黑箱”一词可以理解为不为大多数所知道的操作，在算法应用中，“黑箱”主要来自“数据吞吐”环节，该环节所依赖的是不为用户所知的复杂技术。“黑箱”式的新闻生产过程颠覆了传统新闻生产模式，传统新闻线索的挖掘、新闻采访的进行、文本的创作等环节都变成了一站式的打包作业，用户对其中的真实度、可信度难以评估。因此在学界和业界，随着算法技术的不断优化，应用场景与实践领域的不断扩大，“算法权力”已经引起关注。同时，一些以经济效益为首要追求的媒体与技术机构，也会利用“算法权力”进行商业运营。“用户并不清楚算法的目的和意图，也无从获悉算法设计者、实际控制者以及机器生成内容的责任归属等信息，更谈不上对其进行评判与监督。 ”[11］(P16-20)技术的加入没有形成多元、开放的局面，反而加重了新闻专业主义危机。

积极寻求“黑箱”透明化，需要在数据输入环节尽可能全面、客观地采集数据样本，对数据来源、数据质量及数据标注方面进行公开化。[3］(P82-88)同时在“数据吞吐”环节，采用“无监督式”机器学习模式，即抛弃人为设定算法规则的做法，取而代之的是让机器在学习的过程中习得自主学习和创作的能力，用控制人为参与的方式来提升算法的透明度。另外，也需要提升新闻媒体与从业者的媒介素养，让新闻作为社会公器，以社会效益作为基本立足点，发挥其对于社会发展的正向作用。

（三）注重新闻价值的挖掘

新媒体时代，面对信息规模的扩大与散状分布格局，算法提高了媒体对信息的响应与处理速度，提升了媒体在新闻事件的跟踪与演进过程中的效率，以资源整合的快速性赢得了用户资源。但新闻从业者应该明确的是，算法作为新兴的工具与手段，其在技术层面的应用弥补不了专业媒体人在新闻实践过程中的价值评判缺位。如果仅靠对新闻信息的整合、收集、重组等工作，诸如新闻“宽度”“广度”“深度”等新闻价值是难以实现的。

媒体所传递的信息可以作为一种知识与文化，常以润物细无声的方式在塑造公众的思维方式、价值取向等方面发挥效用。因此，面对崭新的传播环境，新闻从业人员更应该以自身的专业素养，以长期工作积累而来的新闻敏感度，以新闻人“铁肩担道义，妙手著文章”的情怀，注重对新闻价值的挖掘，减少算法在价值评判方面的不足所造成的社会性后果。

算法技术运用的最终归宿，是要回归对社会与人的人文关怀上，让对人、社会、国家的发展有意义、有价值的新闻信息拥有信息环境的主导地位。只有借助自动化技术与人文精神的合力，媒体才能化解专业危机，在促进理性、开放、平等、多元的新型公共空间形成的过程中实现新媒介生态下的角色定位。[12］(P20-26)让技术更好地为新闻专业主义、人文关怀、道德伦理、社会责任服务，而不是让后者成为技术的附庸，甚至被技术所压迫。

算法的技术逻辑决定了算法在创新新闻生产、分发、互动模式的同时，也会造成信息失衡与信息歧视，使得当下已然超载的信息环境愈加恶化。因此应当采用中立的态度来看待算法，让其在发挥技术优势的同时，通过明确算法的本质与定位、积极寻求算法透明和注重新闻价值的挖掘等方法，来减少算法对媒体行业与社会环境的危害。只有解构算法技术神话般的光环，才能减少因“黑箱”操作、价值偏立等带来的价值伦理问题，从而让算法与新闻活动的结合更好地作为“人的延伸”，为个人的发展与社会的进步提供源源不断的动力。