新闻生产中算法运用的技术路径与价值逻辑
2021-11-11
人类发展离不开技术。但是仅就技术的有效性而言,人类与其他许多物种相比,很长时期内始终是落伍者;仅就工具制造技术而言,难以证明人类的特殊性。是人类的大脑而不仅仅是双手,使人类具备了语言符号、审美形象,以及可以在社会群体中传播和共享的知识,才使人类真正地与众不同。因此,从本质上来说,技术的工具价值带来有效性的那部分价值,并不是技术的全部价值,而其终极价值—人类文明中的根本价值,即带来知识和智慧的那部分价值,才是突显人的尊严的。马克思·韦伯将人的理性行为分为工具理性行为和价值理性行为。工具理性在于在认识和改造世界的过程中指导人类“如何去做”,而价值理性在于告诉人类“为什么要做”,二者的有机统一才能对满足人类需求的生产实践活动进行有效指导。人类对生产工具的需求并不像动物一样出于生存本能,而是存在目的性需求,因此在面临算法这种新的“生产工具”时,我们需要同时兼顾其工具价值和理性价值,考虑其作为一种技术或者工具的“工具价值”。但在现实中,我们会因为新技术的效益而欢呼雀跃,而常常忽略了另一面的价值。
智能技术可谓集人类工具制造能力和知识智慧的最高代表。人工智能就是让计算机完成人类心智能做的各种事情。人工智能正在开启新闻传播的智能传播时代,并运用于数据挖掘与信息采集、自动化写作、算法式分发、自动化事实核查、优化产品以及社交机器人与用户的互动等各个环节,引发了媒体生产与运营、媒体人的角色与技能要求的新转变。有学者断言:我们已经进入新闻算法(news algorithms)的时代,自动化和算法已经成熟到能够从事真正的新闻工作。近年来,智能算法在新闻传播领域的应用是学界的前沿和热门议题,关于智能算法运用于新闻生产,学者们主要讨论了以下几个方向:一是从新闻生产的过程入手,探讨人工智能在新闻内容采集、新闻制作与分发、新闻接收、用户画像等层面为新闻业带来的全新变革;二是从现实性、前瞻性的方向探讨智能化新闻生产的应用现状及前景,一些学者还以目前已经问世的写作机器人或算法推荐的产品为案例去分析其在新闻生产过程中的实际应用与未来发展;三是从伦理的角度出发思考算法作为一种新兴技术所带来的算法黑箱、算法歧视、隐私让渡与侵犯等问题,并试图解释算法伦理问题的成因、影响与对策;四是讨论在新闻智能化生产环境下新闻从业者的可替代性和再定位,算法仅仅是“抢饭碗”,还是能够实现对行业的融合与重塑?本文以智能算法运用于新闻生产阶段为例,通过分析算法运用的技术路径,探讨其价值逻辑及风险。
一、算法运用于新闻生产的技术路径
算法(algorithms)指的是为解决问题而进行的计算机操作规则的一系列步骤。计算机运用的技术主要是自然语言处理(natural language processing,NLP),主要包括自然语言理解(natural language understanding,NLU)、自然语言生成(natural language generation,NLG)两个方面。
以新闻文本的生产为主要目的,由机器学习或者神经网络为技术基础生产和分发的新闻被称作算法新闻。算法新闻的流程包括三个阶段,也称为算法新闻的“I-T-O模式”:数据输入(input),即从公开或私人的数据库中抓取信息,作为算法新闻生产的“原材料”;数据吞吐(throughput),即通过监督式机器学习(人为预先设定规则)或无监督式机器学习(机器自动学习形成一套人无法清晰了解的规则,并运用到之后的新闻生产中),根据既定的语法和句法规则,经过半自动或全自动的NLG,将输入的数据整理成一定的结构;新闻产品输出(output),指的是由NLG生成的新闻产品完成线上和线下的分发。机器学习是人工智能的核心技术,包括监督式和无监督式两种。监督式学习有固定的模板,输入和输出的都是已知信息,将数据“喂”给算法后,自动按照给定的规则填充公式化的表达,生成稿件;无监督式学习没有固定的输入—输出模板,以大数据为基础,主要寻找相关关系和趋势、表面奇异值等,不追究因果关系,机器自动从数据中抽取知识。
智能机器已经具有在复杂情境下进行语义理解和文本生成的能力,可以同时承担简单的替代性劳动和复杂的创造性劳动,依托不同的情境进行多元灵活的新闻生产。内容生成属于自然语言生成算法领域的一个应用分支,其历史、发展和自然语言生成基础算法的发展基本保持一致。自然语言生成是以模仿人类书写以及说话的方式来产生有意义的短语和句子的过程,其领域包括内容生成、机器翻译以及聊天机器人等应用,目的是通过预测句子中的下一个词语来传达信息,它以每秒数千页的速度,自动生成回复、描述、总结或者解释输入结构化数据的叙述性语句。目前有两类主流的自然语言生成方法:基于模板的静态算法和基于上下文的动态算法。⑪⑫ 到目前为止,只有后者被认为是“真正”的自然语言生成算法。两种算法在实际应用中各有优劣,业界比较成熟的算法往往是两类方法的结合体。
1.基于模板的静态算法
基于模板的静态算法主要将模板填空式算法作为主流算法,模板填空式算法可谓最古老最简单的自然语言生成方法之一。早期的系统代表有Eliza、PARRY、天气预报系统以及体育运动播报系统,其最初主要使用在“预定义结构”的填充上。预定义结构俗称为“模板”,类似于完形填空式的内容,对于具有预定义结构且只需要填充少量数据的文本可生成一段完整的描述。例如,天气预报播报的预定义结构是:
明天[城市
][天气状况
],最高气温[最高气温
]摄氏度,最低气温[最低气温
]摄氏度,[风向
][风力
]级,最适合[活动类型
],天气预报祝您开心每一天。(中括号内为填充内容)填充相应数据之后,便可以生成以下两条天气预报的播报内容:
明天北京晴,最高气温25摄氏度,最低气温17摄氏度,东南风1—2级,适合户外运动及出游,天气预报祝您开心每一天。
明天天津晴转多云,最高气温16摄氏度,最低气温6摄氏度,北风3—4级,适合居家及进行室内休闲活动,天气预报祝您开心每一天。
对于具有预定义结构且只需要填充少量数据的文本,这种方法便可以批量生产出符合人类语言规则的内容,且在内容上也可以实现一定程度的差异化。然而该方法并不被认为是“真正”的自然语言生成,主要在于“预定义结构”上。所谓预定义结构由句子模板和词汇模板组合而成,句子模板包括若干个含有变量的句子,词汇模板则是句子模板中的变量所对应的所有可能的内容。
静态模板运用在自动新闻写作过程中,“规则”掌握在人的手中,应当是先有规则,后有新闻产品。从上面的例子可以了解到,无论是句子模板还是词汇模板,基本上都来源于人工总结提取,并形成固定模板,但模板的丰富性和实时性都很难得到保证。在以往的各类内容中存在着大量规范化的句式,如果能从先前的文本数据中自动将这些句式模板提取出来,将极大地减轻人工负担。因此在后来的基于模板的静态算法研究过程中,大量的工作集中在如何自动从数据中挖掘和生成句子模板,减轻人工负担,增加模板的多样性。例如,使用聚类算法对内容进行聚类,然后利用先验规则将抽象的模板挖掘出来,或者使用二步迭代的方式逐步从内容中生成句子模板和词汇模板。基于模板的静态算法后期加入了逻辑规则处理可能出现例外情况,这些规则的加入使得计算机更容易生成语法正确的文本,编写更加复杂的模板。模板填空式算法的优点在于简单、可控和严谨,因为每一个模板都是人工总结出来的。
这种算法的缺点也显而易见,使用场景十分有限且生成内容的重复性高,由于过度依赖人类知识和经验,模板的丰富性和实时性都很难得到保证。基于模板的静态算法只能处理特定场景下的语言生成,且话术千篇一律,很容易产生审美疲劳,其“智能性”难以体现人类的智慧和能力。
2.基于上下文的动态算法
基于模板的静态算法由于其单一性和过度依赖人工经验的缺点,在如今的大数据时代已经不能够满足人类的需求。在此背景下,一种基于上下文的动态算法逐渐流行起来,该方法通过上下文语法语义结构信息来动态地创建句子。上下文信息指已经完成书写的段落、开始写作时输入的内容类别以及内容关键词等信息。动态创建意味着系统可以在不寻常的情况下自主做出反应,不需要技术员为每个边界情况显式地编写模板和规则。它还允许系统在语言上以多种方式优化句子,包括引用、聚合、排序和添加连接词。同时,相比于基于模板的静态算法,基于上下文的动态算法可以生成篇幅更长的文章,而基于模板的静态算法由于编写模板的限制而在全文生成方面存在困难。基于上下文的动态算法可以在“微观层面”生成句子,同时也可以在“宏观层面”生成与读者相关、结构良好的有用的叙事性文档,能否做到这一点取决于文本的目标人群及个性化信息体系是否完整。
自然语言生成从模板生成到动态生成,经过了多年的技术试验才取得了令人满意的结果。作为NLP和AI的一部分,自然语言生成依赖于一些算法来生成文本,近年来主流的基于上下文的动态算法主要有以下几种:
(1)马尔可夫链(Markov chain):马尔可夫链是最早用于语言生成的算法之一,其名称来源于俄国数学家安得雷·马尔可夫。该模型通过当前词语并考虑每个词语之间的关系来计算下一个出现的词语的概率,从而预测句子中出现的下一个词语。这种算法在早期版本的智能手机输入法上经常使用,在用户主动输入一些词语后,句子中可能出现的下一个词语会被联想出来,从而为用户生成内容建议。基于马尔可夫链的语言模型在数据驱动的自然语言生成中有着重要的应用,但研究人员必须为每一个场景以及领域设计特有的输入特征,例如为体育领域设计的输入特征无法适用于其他领域。
(2)循环神经网络(RNN):神经网络是试图模仿人类大脑运作的模型。RNN通过前馈网络传递序列中的每一项,并使用模型的输出作为序列中下一项的输入,同时储存着历史信息。在每次迭代中,模型将前面遇到的词语存储在内存中,并计算下一个词语出现的概率。对于字典中的每个词语,模型根据前一个词语分配一个概率,选择概率最大的词语并将其存储在内存中。RNN的“记忆”使该模型成为语言生成的理想模型,因为它可以随时记住对话的背景。然而,随着序列长度的增加,RNN不能存储句子中相距太远的词语,只能根据最近的词语进行预测。由此,循环神经网络很容易忘掉前文生成的内容进而生成前后逻辑不一致的内容。
(3)长短期记忆网络(LSTM):为解决远程依赖问题,人们引入了RNN的一种变体—长短期记忆网络。虽然与RNN相似,但LSTM模型包含三个门信息以及当前单元状态的神经网络,三个门分别为遗忘门(forget gate)、输入门(input gate)、输出门(output gate),它们允许神经网络在任何时间间隔通过调整该单元的信息流来记住或忘记单词。当遇到句号时,遗忘门识别出句子的上下文可能发生变化,可以忽略当前单元状态信息。这就使得网络能够选择性地只跟踪相关信息,同时最小化梯度消失的问题,模型也能够在更长的时间内记住信息。尽管如此,由于从上一个单元到当前单元的固有复杂的串行路径,LSTM内存的容量被限制在几百个单词内,长度有限。其模型复杂度导致了高计算需求,这使得LSTM难以训练或并行化,内容生成速度慢。
(4)自注意力模型(transformer):2017年谷歌首次提出了一个相对全新的模型,该模型使用了一种名为“自注意力机制”的新方法。Transformer由处理任意长度输入的一组编码器和输出生成的句子的另一组解码器组成。与LSTM相比,transformer只执行少量的、固定数量的步骤,同时应用了一种自注意力机制,直接模拟句子中所有单词之间的关系。与以前的模型不同,transformer能够处理较长的句子,同时其计算量并未激增。因为自注意力模型在训练时可以并行化,所以其内容生成速度远远领先于长短期记忆网络。
用于语言生成的transformer中最著名的例子之一是OpenAI,即其GPT-2语言模型,该模型通过关注先前生成的文章来预测下一个词语。GPT-2语言模型是学界和业界生成模型中最为领先也最具代表性的一个,其不仅在很多任务上超越了此前的最高水平,还可以根据一小段话自动补充大段连贯的文本,并模拟不同的写作风格。同时,GPT-2还被冠以最强假新闻生成器的称号。OpenAI 设想,人们可能出于恶意目的利用GPT-2来生成误导性新闻、在网上假扮他人进行欺诈、在社交媒体上自动生产恶意内容和伪造内容、自动生产垃圾邮件或钓鱼邮件等。所以,OpenAI在发布GPT-2的同时就宣称“这种强力的模型有遭到恶意滥用的风险”,选择不对其做完整开源。后经过一年多的时间,GPT-2谨慎地开源了一部分源代码以供开发者尝鲜。但不可否认的是,作为谷歌最新升级的算法,transformer双向编码器(BERT)为各种自然语言处理任务提供了最先进的结果。
基于上下文的动态算法由于不需要过多的人工干预,克服了基于模板的静态算法的诸多缺点,已经越来越受到业界的重视。然而基于上下文的动态算法也有其缺陷:不可控性以及前后逻辑矛盾。不可控性主要体现在生成的内容可能会超出人类预期的一些结果,比如违背道德和法律的内容、种族歧视以及虚假新闻。因其不需要人工干预,完全由上下文来决定要生成的内容,所以很容易被训练语料、初始状态或在线学习算法等过程引导到一个错误的方向,进而生产大量的垃圾内容。前后逻辑矛盾主要受制于当前的技术水平,在目前技术水平下能回顾的上文长度不宜过长,否则上文信息就会消失,进而生成和上文完全没关系的内容,生产出的内容会显得非常松散甚至出现前后观点矛盾的情况。这种方式将新闻生产过程推进深深的“黑箱”—新闻生产的幕后,人类现有认知水平难以判断其真实度、可信度、透明度,人们不需要知晓规则,产品即“不需要推敲”的成品,编辑审稿环节(如果还保留的话)很难进一步核查事实、追寻真相逻辑链。但是对于基于模板的静态算法而言,因为其模板都是人工总结出来的,所以天然不存在以上两个问题。
目前,市面上几乎所有的产品都不只局限于某种单一的技术,而是采用基于动态算法的多种技术的集成。例如,今日头条的新闻写作机器人“张小明”(xiaomingbot)可以2秒完成稿件并快速上传,在里约奥运会开始后的13天共撰写457篇报道,每天生产新闻30篇以上,内容涵盖羽毛球、乒乓球、网球等领域,发稿速度几乎可以与现场直播相媲美。“张小明”通过语法合成,结合最新的自然语言处理、视觉图像处理和机器学习等技术,不仅可以模仿人类语气进行新闻稿件写作,还可以自己选择新闻配图。在内容生产运用于新闻生产的领域,国外的主要新闻写作机器人和智能编辑审稿机器人有美联社的Wordsmith、《纽约时报》的Blossombot、《华盛顿邮报》的Heliograf、《卫报》的Open001、路透社的OpenCalais等;国内的除“张小明”外,还有新华社的快笔小新、腾讯的Dreamweiter、第一财经的DT稿王等。
语言生成从使用简单的马尔可夫链生成句子向使用自注意模型生成更大范围、更连贯的文本演变,再到如今新闻生产机器人多种算法的技术集成,这是一个从机器学习到深度学习的过程。然而,我们正处于生成语言模型的开端,transformer只是迈向真正的自主文本生成的第一步。生成模式也被开发用于其他类型的内容,如图像、视频和音频,这为将音视频生成模型与文本生成模型集成在一起,开发出具有音频及可视界面功能的高级个人助理提供了可能。同时,为了增加可控性以及逻辑一致性,目前大量的研究开始探索如何将人类经验和生成模型统一结合起来,人类只需要提供少量的监督信息即可规避上述问题,这个领域在未来肯定会有更好的发展。
二、算法运用于新闻生产的价值逻辑
在人类创造、使用技术和工具的过程中,技术和工具也会承载着特定社会中人的价值。随着算法的逐渐发展与强大,作为一种技术或者说工具,算法也不可避免地会陷入技术伦理价值的善恶之争之中。算法运用于新闻生产,涉及人在生产中的创造性和主体性,算法的权力关系与道德责任,以及工具价值与终极价值的矛盾等价值观问题。
1.人的主体性与创造性
计算机不可或缺的四大思维,包括精准的沟通、记忆和计算能力、具有计算的通用性和特定的结构,以及能够按大脑核心算法进行创造性思考。运用计算机科学的基础概念去求解问题、设计系统和理解人类的行为,首次从物理空间对人体的延伸、思维的嫁接与嵌入进行革新,最终以取代人类大脑为目标。算法思维将成为一种空前的技术思维,推动社会向未来变革。算法的本质是抽象和自动化,抽象是人类以理性把握世界的重要方式,而数学、计算和逻辑则是抽象思维的最高境界,从20世纪中期开始,伴随着生物学和计算机科学的发展,人们就尝试着以计算的抽象思维去认识和把握世界。
人工智能不仅仅是计算机科学发展的产物,它还是特定媒介文化前提下的人机混合物。传统上,人们认为人工智能模拟人类功能,并重现人的智力能力,但从控制论的视角来看,人工智能并不是重现人的智力能力,而是通过捕获人类的认知能力将人类嵌入自身,形成混合的人机设备。这其中,人的主体性与创造性是值得关注的重要问题。基于计算机智能的生产者和研究人员降低了人性。笛卡尔主张的客观和中立的真实性、真正的知识是无语境的抽象,基本预设了事实和价值的分离,以为信息技术是中立的。对于人工智能新时代的传播理论与实践而言,如何保持人的独特性是首要问题。
计算思维已经大量地运用于新闻产品中,而且要设计得具备智能思维—人类思维的模拟化,这就需要足够的“新闻的想象力”。不同的算法意味着不同的价值观考量。仅从上述自动化写作的技术之中,我们就可以发现算法技术存在的缺陷。首先,写作模式固定,缺乏举一反三的创造性。人类的写作,即使使用“模式”,也是以思维的载体的形式出现的,记者并非按部就班地遵循闭合的规则来进行事实推敲和文本写作。而基于数据统计的AI在过去的数据中进行归纳总结,难以出现人类的推理、灵感。目前的AI技术不会联想,是缺少想象力和个性的,但是人类具有灵感。因此自动化写作仍需要人的创造力的弥补,并为文本的发展和多样性提供更多的可能。其次,原生创造力缺失,应对突发情况能力差。无论是传统的基于规则模板的方法,还是目前的统计学方法,都缺乏创造力,基于规则模板的方法也只能创造给定场景和条件下的内容。基于统计学的方法只能从过去的新闻内容中学习文法规则、事件实体以及已产生的内容。一旦遇到全新的新闻,包含大量新的事件、场景以及描述词语时,目前AI的创造能力基本是不足的。因为AI只能模仿以往的新闻写作习惯以及用词,对没见过的事物基本无法处理,所有的内容都来源于海量数据,不可能产生训练数据没有涉及和覆盖的内容。最后,知识和感知可能无法自洽。基于数据的AI,无论是一代的知识型AI还是二代的感知型AI,在知识和逻辑中还未达到自洽的程度,如果人类没有提前告诉它人生理构造的不同,AI有可能写出女性得前列腺癌的文章。想要以人工智能完全替代人类的诸如新闻写作这样的智力劳动,还是难以实现的。
2.权力关系与道德风险
这里有两层权力关系。一层是算法对新闻业的介入引发的“权力迁移”,算法使权力从公共机构迁移到资本驱动的技术公司,相比传统媒体清晰的操作流程,算法使传播的操作后台化,资本权力扩张,垄断传播资源,内容采集、投递、营销难以受到公共力量的监督,拥有技术和数据的公司反而拥有更多的公共权力。算法除了在控制信息生产、流通的过程中体现出权力,还通过制定行业规范彰显统治力。
另一层是在人工智能系统的生产过程中,存在两种不平衡的权力关系—决策权和技术知识的联手。一方面,管理者首先为人工智能系统运行提出要求;另一方面,技术人员在技术决策过程中保留必要的自主决定权。因而,在工程师的职业想象中,其在法律规则、组织规范和用户要求的基础上构建AI系统,人工智能系统的道德责任是分散的,工程师事实上扮演着人工智能系统、用户、决策者之间协调者的角色,无法独自为人工智能系统的道德状况负责。
内容生产中的权力,与信息分发中对用户的“网络分层”密切互动,内容公司需要全部的用户行为数据,特别是用户的“关系数据”,通过机器学习、神经网络、定位服务等技术,向精细化导流的方向发展。现阶段人工智能属数据驱动型,机器主要是通过模拟人类的感知进行计算的,这代技术先天地具有不可解释性、不透明性。算法包含技术人员的价值观和意识形态取向,如果技术员心术不正,刻意写出有问题的算法,那么算法生产出的内容就会存在伦理问题。内容生产会受到互联网信息服务类公司的控制,在专业性、独立性上向服务商做出让步。价值观和意识形态一旦被事先嵌入算法之中,就会带来算法偏见和伦理问题。即使并不存在有意为之的行为,目前通过已有数据集决定的算法,已经有相当多的案例证明其存在偏见,这里包括数据集的不全面和先天缺陷,比如关于少数族裔的数据,因为其数量的不足常常出现先天性的不公正结论;也包括以过去的数据预测未来而带来的价值偏见风险,比如关于美国历史上犯罪率导致的算法种族偏见;还包括以整体的数据集的结论投射到个体身上的问题,比如美国单个黑人要承受黑人犯罪率被算法夸大标记的风险。
3.工具价值与终极价值的矛盾
在新闻选题策划方面,记者通过大数据的方式获取新闻线索,将语音识别技术及文本转化技术作为工具来管理稿件、组织采访并回复电子邮件等。以“机器人记者”代替“人类记者”的自动化新闻写作技术,使得新闻出稿数量大幅增加;报道速度大大加快,在一些对时效性要求较高的领域具有显著优势;形式更加多样,不仅仅限于文字信息,图片和视频的识别、编辑能力也在迅速增强。对于商业媒体而言,以最有效的方式增加受众和产出是其重要目标。哥伦比亚大学的专家认为,社交媒体和技术平台对新闻生产的影响,Facebook、Snapchat、Google和Twitter这样的技术平台在加速全面接管传统的新闻生产发行工作,并为之进化,以适应激烈的同行竞争。社交媒体和互联网公司不满足于只占有新闻内容分发的渠道,他们逐渐掌握了让你看到什么、感觉到什么、关注到什么的操纵技能,甚至改变了新闻的格式。此外,监控流量的技术公司、追求精准导流的媒介运营商、外包商协作网络乃至金融资本,都以各种方式参与新闻生产,追求效益最大化。其结果可能是用户成为被权力工具宰制的对象,成为机构实现商业化目标的手段。
智能技术具有工具价值,即它可以被应用于特定的目的。但是技术的积极意义还在于其使用户认为它代表了一个“良好”社会的价值观,也就是不只强调技术的工具理性,还关注技术的价值理性。技术对于人类而言,其终极价值—关乎人类生存的意义、生命与宇宙起源等—是极为重要的。从其起源开始,技术就与人类本质属性互相联系—一开始以生命、生存为中心,并非以劳动生产为中心,更不是以权力为中心,技术始终是文化整体的一部分。强调工具价值,其行为是根据目的、手段和后果作为其行为取向的,目的和后果之间可能是相互竞争和冲突的,是目的至上的;而价值理性行为是人根据自己的信念(包括义务、尊严、美、宗教训示、孝顺、某事的重要性等)和要求所做出的行为,是价值观至上的行为。
此外,基于既有数据(包括非理性用户)的智能技术,有时会走向反智的一面,进而反人类价值观。2016年3月23日,微软公司的智能聊天机器人Tay上线还不到一天,就被下线了。Tay基于上下文和动态数据的算法,导致其生成不可控的内容,被“坏用户”引入歧途,生成大量反人类伦理的对话:诋毁黑人,发表/转发种族歧视、性别歧视和反犹太人的言论。对于机器人Tay而言,它其实根本不理解所输出内容的内涵。就本质而言,技术对人类的危险来自于人而不是机器。控制论创始人之一维纳曾经指出:“作为科学家,我们一定要知道人的本性是什么,一定要知道安排给人的种种目的是什么……我们一定得知道为什么我们要去控制人”。
算法运用于新闻生产的业界技术探索和学界对智能算法的探讨方兴未艾,而算法与既有社会结构进行互动及对新社会秩序具有中介作用,在这个过程中,算法对既有社会秩序的延续与重构、算法与人的复杂交互过程值得关注,算法并非仅以技术工具的角色存在于社会生活中,它已然在人与世界的交互中扮演起重要角色。在智能算法发展的过程中,人类的主体性与创造性、权力关系与道德风险,以及工具价值与终极价值的矛盾的解决,都不是可以一蹴而就的。但不管最终结果如何,我们现在已经进入了一个智能算法强大到足以引起关注的时代。
注释
①芒福德.机器的神话:技术与人类进化(上)[M].宋俊岭,译.北京:中国建筑工业出版社,2015:3-4.
② 博登.人工智能的本质与未来[M].孙诗惠,译.北京:中国人民大学出版社,2017:3.
③陈昌凤,石泽.价值嵌入与算法思维:智能时代如何做新闻[J].新闻与写作,2021(1):54-59.
④ DIAKOPOULOS N.Automating the news:How algorithms are rewriting the media[M].Cambridge,MA:Harvard University Press,2019:1-2.
⑤ LATZER M,HOLLNBUCHNER K,JUST N,SAURWEIN F.The economics of algorithmic selection on the internet[M/OL].Zurich:University of Zurich,2014[2021-03-15].http://www.mediachange.ch/media//pdf/publications/Economics_of_algorithmic_selection_ WP.pdf.
⑥ 仇筠茜,陈昌凤.基于人工智能与算法新闻透明度的“黑箱”打开方式选择[J].郑州大学学报(哲学社会科学版),2018(5):84-88.
⑦ DÖRR K.“Mapping the field of algorithmic journalism”[J].Digital Journalis,2015:1-24.
⑧ 仇筠茜,陈昌凤.黑箱:人工智能技术与新闻生产格局嬗变[J].新闻界,2018(1):28-34.
⑨ 陈昌凤,石泽.价值嵌入与算法思维:智能时代如何做新闻[J].新闻与写作,2021(1):54-59.
⑩ REITER E,DALE R.Building natural—language generation systems[J].Natural Language Engineering,1997,3(1):57-87.
⑪ GATT A,KRAHMER E.Survey of the state of the art in natural language generation:Core tasks,applications and evaluation[J].Journal of Artificial Intelligence Research,2018,61(1):65-170.
⑫ SANTHANAM S,Shaikh S.A survey of natural language generation techniques with a focus on dialogue systems—past,present and future directions[J].2019.In arXiv:1906.00500.
⑬ WEIZENBAUM J.Eliza-a computer program for the study of natural language communication between man and machine[J].Communications of the ACM,1966,9(1):36-45.
⑭ KENNETH M.Artificial paranoia:a computer simulation of paranoid process[M].Oxford:Pergamon Press,1975.
⑮ GABOR A,PERCY L,DAN K.A simple domain-independent probabilistic approach to generation[J].EMNLP 2010:502-512.
⑯ REGINA B,LILLIAN L.Catching the drift:Probabilistic content models,with applications to generation and summarization[J].HLT-NAACL 2004:Main Proceedings,2004:113-120.
⑰ RAVI K,BLAKE H,FRANK S.A statistical NLG framework for aggregated planning and realizationc[J].Proceedings of the Association for Computational Linguistics,2013:1406-1415.
⑱ BLAKE H,RAVIKUMAR K,Frank S.Domain adaptable semantic clustering in statistical NLG[J].International Conference on Computational Semantics,2013.
⑲ LU W,CLAIRE C.Domain independent abstract generation for focused meeting summarization[J].Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics,2013:1395-1405.
⑳ SUTSKEVER I,VINYALS O,QUOC L.Sequence to sequence learning with neural networks[J].NIPS 2014:3104-3112
㉑ HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Com putation,1997,9(8):1735-1780.
㉒ VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[J].NIPS 2017:6000-6010.
㉓ ZELLERS R,HOLTZMAN A,RASHKIN H,et al.Defending against neural fake news[J/OL].(2019-05-29)[2021-04-27].https://arxiv.org/abs/1905.12616.
㉔ 仇筠茜,陈昌凤.黑箱:人工智能技术与新闻生产格局嬗变[J].新闻界,2018(1):28-34.
㉕ 虞鑫,陈昌凤.美国“事实核查新闻”的生产逻辑与效果困境[J].新闻大学,2016(6):27-33+66.
㉖ 陈昌凤,师文.智能化新闻核查技术:算法、逻辑与局限[J].新闻大学,2018(6):42-49.
㉗ 赵禹桥.新闻写作机器人的应用及前景展望— 以今日头条新闻机器人张小明(xiaomingbot)为例[J].(2017-01-11)[2021-04-27].http://media.people.com.cn/n1/2017/0111/c409691-29014245.html.
㉘ 库兹韦尔.人工智能的未来[J].盛杨燕,译.杭州:浙江人民出版社,2016:170-189.
㉙ 李凌.算法人文主义:智能时代信息价值观的哲学论纲[J]//陈昌凤,李凌.算法人文主义:公众智能价值观与科技向善(印刷中)[M].北京:新华出版社,2021.
㉚ MüHLHOFF,R.Human-aided artificial intelligence:Or,how to run large computations in human brains? Toward a media sociology of machine learning[J].New Media &Society,2020,22(10):1868-1884.
㉛ 克里斯琴斯.哲学视野中的人工智能:语言的视角[J]//陈昌凤.智能传播:理论、应用与治理(印刷中).北京:中国社会科学出版社,2021.
㉜ STEPHENR.培养数字时代的新闻记者:新闻学的想象力[J].全球传媒学刊,2017(4):70-74.
㉝ 师文,陈昌凤.社交分发与算法分发融合:信息传播新规则及其价值挑战[J].当代传播,2018(6):31-33.
㉞ 陈昌凤,霍婕.权力迁移与关系重构:新闻媒体与社交平台的合作转型[J].新闻与写作,2018(4):52-56.
㉟ 吕新雨,赵月枝,吴畅畅,等.生存,还是毁灭—“人工智能时代数字化生存与人类传播的未来”圆桌对话[J].新闻记者,2018(6):30-44.
㊱ 师文,陈昌凤.新闻专业性、算法与权力、信息价值:2018全球智能媒体研究综述[J].全球传媒学刊,2019(1):82-95.
㊲ ORR W,Davis J L.Attributions of ethical responsibility by artificial intelligence practitioners[J].Information,Communication &Society,2020,23(5):1-17.
㊳ 喻国明,姚飞.试论人工智能技术范式下的传媒变革与发展—一种对于传媒未来技术创新逻辑的探析[J].新闻界,2017(1):39-43.
㊴ 师文,陈昌凤.信息个人化与作为传播者的智能实体:聚焦2020智能传播研究[J].新闻记者,2021(1):90-96.
㊵ HANSEN M,ROCA-SALES M,KEEGAN J,KING G.Artificial intelligence:Practice and implications for journalism[J/OL].Columbia University Academic Commons,2017(2017-09-14)[2021-04-27].https://doi.org/10.7916/D8X92PRD.
㊶ 格伦瓦尔德.技术伦理学手册[M].吴宁,译.北京:社会科学文献出版社,2017:302.
㊷ 芒福德.机器的神话:技术与人类进化(上)[M].宋俊岭,译.北京:中国建筑工业出版社,2015:11.
㊸ 韦伯.经济与社会(上卷)[M].林荣远,译.北京:商务印书馆,1997:57.
㊹ 维纳.人有人的用处[M].陈步,译.北京:商务印书馆,2019:144-166.
㊺ 师文,陈昌凤.信息个人化与作为传播者的智能实体:聚焦2020智能传播研究[J].新闻记者,2021(1):90-96.