APP下载

科学传播中的意识形态变迁
——基于美国人工智能报道的文本分析

2020-04-29余文婷

科学与社会 2020年3期
关键词:保守主义高频词主题词

余文婷 刘 会

(1 香港城市大学媒体与传播系;2 暨南大学新闻与传播学院)

随着科学技术的发展,越来越多挑战传统社会认知的新兴科技(如克隆、转基因食品、人工智能)引起社会热议甚至恐慌。科学传播作为研究科学技术如何面向非专业受众进行公共传播的学科,也因此逐渐得到各国政府及研究者的重视。

以人工智能的传播为例。近年来,人工智能以其强大的运算能力和广泛的应用空间得到各国政府的重视和支持,然而对于人工智能的争议从未平息。人工智能技术在千禧年后取得飞跃式进步,公众在享受人工智能带来的便利的同时,也担忧人工智能技术的迅猛发展会减少就业机会,甚至最终取代人类。这种争论在“深蓝”击败了世界第一国际象棋选手卡斯帕罗夫(Kasparov)以及“阿尔法围棋”(Alpha Go)击败了世界一流围棋选手李世石和柯洁之后尤为激烈。以人工智能为代表,许多社会性科学议题在全球社会都遭遇了相似的科学传播困境。一方面,政府、科学机构或商业机构希望推动高新技术发展与应用;另一方面,社会存在恐惧科技以及迷信谣言的现象。因此,谁来做以及如何做科学传播工作,实现公众充分理解科学、参与科学的科学发展进程,是科学传播的研究重点。本文以美国人工智能的新闻媒体报道为例,分析大众媒体如何在社会意识形态的影响下将高新技术传播至公众,为大众媒体如何传播科学技术增添实证研究结果。

一、文献回顾与研究问题

贾鹤鹏和闫隽从文献中发现,政治立场的不同会导致人们在科学议题上的态度分化,这是近年国外学者十分关注的科学议题政治化现象[1][2]。科学议题政治化在美国尤为明显,对气候变化、疫苗使用等科学事件的态度成为党派斗争议题。研究发现,美国的保守主义者(如共和党人)较少主动学习新科技,更容易对科技进步持消极态度[3],而自由主义者(如民主党人)更愿意支持新科技的发展[4]。

美国新闻记者和新闻机构长期受意识形态影响[5][6]。20 世纪70—80年代的美国社会学家普遍认为美国媒体倾向于对剧烈的社会进步持保守态度。雅普·梵·吉内肯(Jaap van Ginneken)认为受众更想在新闻中看到一个稳定而非激进的社会,因此每当有突发新闻时,媒体会在第一时间维持社会秩序,减少社会恐慌[7][8]。甘斯在《什么在决定新闻》中提出美国新闻的八大价值观,其中包括小镇田园主义(small town pastoralism),代表新闻工作者的怀旧情怀、对小城镇的偏爱以及对新技术的恐惧[8]。直到千禧年代,美国媒体工作者都认为总体上美国媒体比其他国家媒体更加保守[9]。

由此,本文基于这样两个问题展开研究:美国媒体是否还在向公众传输着保守的科技发展观?现代美国主流媒体分化出旗帜鲜明的意识形态立场,保守主义与自由主义力量看起来势均力敌,科技报道依然被保守主义牵制吗?保守派媒体(如《华尔街日报》、《福克斯新闻》)和自由派媒体(如《波士顿环球报》、《纽约时报》)常在社会议题上针锋相对,为研究科学报道中的意识形态影响提供了绝佳案例。

本文选择以人工智能为例分析美国主流媒体科技新闻中的意识形态倾向。人工智能是科学传播领域最适合的研究对象之一。首先,人工智能没有像克隆和核能技术那样被各国政府严格管控,其技术发展与媒体曝光率稳步增长。其次,人工智能在世界各地都是一个有研究价值的争议性社会议题。

曾有学者研究过美国主流报媒对人工智能话题的建构。伊桑·法斯特(Ethan Fast)和埃里克·霍维茨(Eric Horvitz)在2017 年对《纽约时报》30 多年来发布的人工智能新闻报道进行了众包式内容分析[10],让参与者对人工智能新闻进行态度和主题分类。该研究指出,《纽约时报》对人工智能失控等问题的担忧有所上升,但在过去30 多年里对人工智能的态度偏向乐观。然而,该研究存在以下几个缺陷:第一,新闻机构有自己的意识形态偏见,《纽约时报》被认为是自由主义价值观的代表[11],其意识形态偏好可能是其支持新兴技术的原因,并不能代表美国新闻界对人工智能的态度,需对保守主义阵营的报道也加以分析;第二,法斯特和霍维茨基于积极情绪报道数量逐年上升的结果,得出人工智能报道趋向乐观的结论,并未考虑总体新闻数量的历时性。人工智能新闻的数量也随着时间的推移而增加,只有通过统计检验才能确认文本的积极或消极趋势。本文进一步对美国人工智能新闻报道中的意识形态影响进行详细研究。

首先,为了证实意识形态对科技新闻报道口径的影响,本文提出以下假设:

假设一:保守主义媒体的人工智能报道比自由主义媒体的报道更消极。

如意识形态取向确实影响美国人工智能报道,本文继续研究以下问题:

问题一:美国人工智能新闻报道总体上是受保守主义影响还是受自由主义影响更多?

问题二:美国人工智能新闻报道的意识形态经历了怎样的变迁?

为了深入探讨受意识形态影响的报道如何塑造人工智能形象,本文提出第三个研究问题:

问题三:美国人工智能新闻报道中,受自由主义影响的报道与受保守主义影响的报道分别呈现什么样的主题?

二、研究方法

1.样 本

报纸是历史最悠久的大众媒体,报纸文本在数据库中保存完整,适合作历时性分析。因此,本文选择美国报媒的人工智能报道作为研究对象。研究者于2018 年1 月1 日在ProQuest 美国新闻数据库根据相关性搜索“人工智能”(artificial intelligence)、“自动化”(automation)、“社会网络”(social network)和“机器人”(robots) 这几个关键词,经过除重后得到45 家新闻机构发表的5003 篇新闻,最早的新闻发表于20 世纪80 年代。本文延续法斯特和霍维茨对《纽约时报》人工智能新闻研究的做法,以5 年作为一个分析间隔。由于最后一个时期不足5 年,将2010 年至2017 年的数据进行合并分析。因此,本文将美国人工智能报道分为7 个时期进行比较:1980—1984 年(35 篇)、1985—1989 年(196 篇)、1990—1994 年(242 篇)、1995—1999 年(101 篇)、2000—2004 年(497 篇)、2005—2009 年(298 篇)和2010—2017 年(3633 篇)。国内外不少学者都以新闻标题作为新闻文本的分析对象[12][13][14],选择新闻标题作为样本有两个优点:新闻标题常常是新闻记者态度的浓缩,能简单有效地体现报道的主题和情感取向;新闻记者常常使用直接或间接引语,引语并不一定代表文章观点,但其主观程度和长度会影响自然语言处理中的情感分析或主题提取。基于以上原因,本文采用新闻标题作为样本。不可否认的是,新闻标题中的情感不一定代表全文态度,这是所有使用新闻标题作为样本的研究的缺陷之一。

为了验证假设一,需要对比保守主义与自由主义报纸样本。理想的研究应当是分析所有的保守主义和自由主义报刊,但是由于一些报刊,特别是许多小众媒体在政治立场上不明确,较难定义,且各家报纸成立时间差异较大,本文最终选择两家代表性媒体作对比:《纽约时报》和《华尔街日报》。根据皮尤研究中心2014 年的报告[15],《纽约时报》和《华尔街日报》分别是自由派和保守派最具代表性媒体之一。这两份报纸均于19 世纪开始发行,可以排除时间因素的影响。最终,验证假设一的样本是《纽约时报》的528 篇报道和《华尔街日报》的777 篇报道,两家报纸最早的人工智能文章均发表于20 世纪80 年代,在数量和时间上都具备对比性。

2.情感测试工具

研究表明自然语言处理中的情感分析是有效的[14][16][17][18],本研究通过文本情感测量新闻中的意识形态。Python 是目前使用最多、最为方便的程序语言,其开发者编写了许多自然语言处理程序,可用于分析文本的结构和意义。本文的情感测试工具采用的是被高频使用的Textblob 工具包,其运行速度快,具有句子划分和情感测试等功能。Textblob 会以自有的情感词词库为基础,对句子情感进行从-1 到1 的评分,-1 表示极度消极,1 表示极度积极。由于Textblob 对文本情感进行了量化,研究者可以将不同时期和不同新闻媒体的情感值进行统计对比。本文以0 分为分界线,大于0 分的样本判断为情感积极,小于0 分的样本为情感消极。

3.主题分析工具

研究问题二探讨的是受自由主义影响与受保守主义影响的报道主题的不同,即积极报道与消极报道主题的不同。本研究使用词频-逆文档,也就是TF-IDF(term frequency–inverse document frequency)算法计算词频。TF-IDF 能在挖掘关键词的时候进行加权处理,某个字词的重要性会随着它在一篇文章中出现的次数增加而增加,但同时会随着它在整个语料库(同时输入的多篇文章)中出现的频率增加而下降。TF-IDF 有助于同一主题的大批量文本分析,能够找出频繁出现在某一篇文章,但较少出现在其他同主题文章的区别性主题词。

三、数据分析与结果

假设一推测,保守主义立场的报刊比自由主义立场的报刊在报道人工智能时展现出更消极的情感。本文采用独立t 检验法进行检验。结果显示,保守主义的《华尔街日报》与自由主义《纽约时报》的情感基调存在显著差异(t=-2.017,df=1 115.74,p<0.05)。《华尔街日报》新闻标题的平均情感(M=.015,SD=.235)比《纽约时报》更为消极(M=-0.013,SD=0.249)。因此,假设一成立,保守主义立场的《华尔街日报》比自由主义立场的《纽约时报》在人工智能报道中展现出更消极的情感。研究继续对问题一至三进行分析。

第一个研究问题是关于人工智能报道的总体情感偏向。从图1 可以得出,所有人工智能新闻标题的平均情感得分略低于0(M=-0.006,SD=0.268)。另外,从图2 可以观察到,7 个时段中有5 个时段的人工智能新闻标题平均分低于0,只有2000—2004 年和2005—2009 年期间的报道情感均分高于0。为检测是否有其他原因促使所有报刊都采取了更保守的报道口径,本文检测了深受自由主义影响的《纽约时报》在这5 个时期的情感分值,发现各时期情感分值依然高于0,且对比另外两个时期的分值没有明显下落趋势。综上,本研究认为样本总体情感偏向消极,因此推理人工智能的新闻报道在1980 至2017 年间总体上受保守主义影响更多。

研究问题二是过去38 年间人工智能报道的情感趋势走向。图1 展示了人工智能新闻在过去38 年的年平均情感值变化。报道的情感年均值有明显波动,但没有明显的峰值,大多数时候维持在-0.10 到0.05 之间。情感值在1982 年跌至最低点,随后曲折上升,在2011 年达到最高,超过0.1。同时,从图2 可以得出,消极报道的比例逐渐降低。总体来看,人工智能新闻的情感有缓慢上升的趋势。为了进一步确认,本文使用方差测试对比这七个时期的情感均值(见表1)。结果表明,这些时期之间的差异具有统计学意义,F(3,5200)=9.640,p<.001。薛费测试显示情感得分的显著差异发生在1990—1994 年和2000—2004 年之间,以及在1990—1994 年和2005—2009 年之间。2005—2009 年和2000—2004 年的平均得分高于1990—1994 年。结果表明,虽然美国人工智能新闻的情感总体上有偏向消极的迹象,但在1980 年至2019 年里发生了显著的变化,有趋向积极的趋势。

在回答研究问题三之前,本文先统计了每个时期出现最多的高频主题词,以验证样本是否准确反映人工智能发展史。然后按时间段进行高频词计算,提取出现频次最高的前20 个词进行可视化词云制作(图3a-g);再计算出1980 至2017 年间标题中出现频次最高的前50 个词,并进行可视化(图3h)。

图 1 美国人工智能新闻的年平均情感分值分布

图 2 不同时期的人工智能新闻情感

表 1 情感比较的方差分析

从高频词结果来看,本文获取的人工智能报道样本有效反映人工智能发展历程。第一,报道关注人工智能技术发展。比如,“系统”(systems)和“软件”(software)在每个时期都占据了非常重要的位置;由于人工智能发展到后期已不仅限于电脑技术,“电脑”(computer)从2010 开始不再属于排名前二十的高频词;2010 年后,“机器学习”(machine 和learning)作为人工智能的新突破成为高频词。第二,报道紧跟人工智能发展浪潮。例如,198—1987 年,人工智能中专家系统的商用价值被广泛接受,商业机构争相投入人工智能产业,“金融”(financial)、“公司”(firm)和“银行”(bank)成为80 年代人工智能报道的高频词。第三,人工智能报道持续关注该领域佼佼者,如1985—1989 年的“施乐”,2005—2009 年的“麻省理工”和“斯坦福”,2010—2017 年期间的“谷歌”和“IBM”。第三,报道关注相关热点社会事件。国际象棋人工智能在1996 年和1997 年首次战胜世界顶尖棋手和首次以总比分战胜人类棋手,“棋”(chess)成为1995—1999年的高频词;2001 年,由斯皮尔伯格导演的电影《人工智能》掀起社会对人工智能的热议,而在2000—2004 年期间,“斯皮尔伯格”(spielberg)和“电影”(movie 和film)均为高频词。

图 3 美国 人工智能报道标题高频词 词云①注:图中呈现的是删掉“人工”(artificial)和“智能”(intelligence)后的结果;由于1980-1984 年间的样本量很小,出现频次超过一次的词语不足20 个,本文展现了频次超过一次的13 个词语。

采用TF-IDF 算法分别提取积极标题与消极标题的主题词。在积极情感标题中,TF-IDF 分值越高的词,越能体现积极情感标题的特有主题,反之亦然。由于篇幅有限,本文罗列分值排名前二十的词语。情感分值高于0 的积极标题主题词是(按TF-IDF 值从大到小排列):“创新的”(innovative)、“快的”(fast)、“强大的”(powerful)、“可行的”(available)、“有创造力的”(creative)、“超级”(super)、“有魔力的”(magic)、“有趣的”(fun)、“碗”(bowl)、“赢取”(winning)、“更好的”(greater)、“安全的”(safe)、“谢谢”(thanks)、“美好的”(sweet)、“命名为”(called)、“交易所”(etfs)、“完美的”(perfect)、“黄金一样的”(golden)、“公平的”(fair)、“好的”(great)。情感分值低于0 的消极情感主题词是(按TFIDF 值从大到小排列):“尝试”(tries)、“圆的”(round)、“期望的”(expected)、“军队”(military)、“普遍的”(common)、“武器”(weapon)、“危险的”(dangerous)、“失败”(failure)、“充满力量的”(powered)、“地址/解决”(address)、“影响”(affect)、“公告/注意”(notice)、“假的”(fake)、“错误的”(wrong)、“狭窄的”(narrow)、“领先的/削减”(cutting)、“制药”(pharma)、“改善”(bolster)、“特质”(attributes)、“克莱威”(cleaver,一个仪器生产公司)。为确定发现的主题词规律并非受个别时期的极端情感值影响,本文分别计算七个时期内积极和消极报道的主题词,结果仍呈相同模式,此处不另作展示。

四、结论与讨论

研究大众媒体面向社会“如何传播”、“传播什么”是科学传播中的重要议题。大众传媒应该认识到意识形态与科学技术报道的关系,把握科学传播的走向,推动科技造福社会。本研究尝试用自然语言处理中的情感分析方法来勘测美国科技新闻中的意识形态影响,对科技传播中的意识形态进行量化,并通过主题词分析进一步剖析了美国媒体对人工智能话题的塑造与呈现,为科技传播研究和美国新闻研究贡献实证结果,并为中国媒体的科学传播提供经验借鉴。在此结合研究结果、人工智能发展史和相关民意调查对本文发现做出相关讨论。

1.美国人工智能报道的意识形态取向:从保守主义到自由主义

理论表明,保守主义意识形态对科技持消极态度;相对地,自由主义更支持科技的发展。以甘斯为代表的美国社会学家在20 世纪70 年代发现,美国新闻主要受保守主义的影响。通过验证美国自由主义报刊和保守主义报刊在人工智能报道标题上的情感差异,证实了意识形态对人工智能报道的影响,并且发现美国人工智能新闻在过去38 年间存在着一种轻微的保守主义。

然而,保守主义对美国人工智能新闻的影响似乎正在瓦解。长期趋势表明,美国人工智能报道的情感呈现出乐观趋势。2000 年后,新闻的积极标题多于消极标题,从ANOVA 结果来看,样本后期的情感分值显著高于前期的情感分值。以目前观察到的趋势来看,在过去38 年间,保守主义在人工智能报道新闻中的影响力逐渐萎缩,自由主义意识形态上扬。

结合人工智能发展史来看,人工智能报道中保守主义与自由主义的胶着、博弈过程与人工智能技术进展息息相关。人工智能从20 世纪50 年代开始发展,经历了黄金发展年代,直至70 年代中期因技术瓶颈遭遇第一次发展低谷。而之后的1980—1987 年,人工智能产业逐渐复苏,商业机构争相投入人工智能产业,当时发明的专家系统的商用价值被广泛接受,受到全世界商业公司的热捧。这也就不难理解,为什么“金融”(financial)、“公司”(firm)和“银行”(bank)这些词会成为80 年代人工智能报道的高频词,且报道情感趋势在20 世纪80 年代经历了较大的波动(见图1)。然而,80 年代商业机构对人工智能的追捧造成泡沫破裂,世界人工智能发展在1987—1993 年进入了第二次低谷,1989—1995 年的情感趋势呈现出在曲折中小幅度下降的趋势。在本文按时期划分的主题词分析结果中,20 世纪90 年代早期,“按揭”(mortgage)和“银行”(bank)成为这一时期的高频词。在经历了低迷期后,人工智能从1993 年开始凭借一系列的技术突破重新进入稳定发展期。2000—2010 年,人工智能报道的情感趋势开始呈现较为明显的上扬,而且这一时期的年均情感分值基本高于0 分。进入21 世纪后,人工智能的深度学习能力备受瞩目,再加上研究机构的突破发现等,使人工智能的社会关注度大幅提高,人工智能报道口径在2000 年后呈现明显的积极趋势。也就是说,虽然科技的进步有时会引发公众恐慌,但自由主义意识形态的科技态度也藉由科技的发展在媒体中得到彰显。

2.新闻报道中的人工智能形象

高频词和主题词分析有助于提取美国报纸新闻中的人工智能形象。高频词结果说明新闻报道紧跟人工智能发展浪潮,关注技术进展。但由于报纸是面向大众的群体,技术语言的使用较为浅显,关注知名机构和热点社会事件(如人工智能电影)。

从主题词分析结果可看出,积极报道的主题词几乎都是有赞美性的形容词,说明受自由主义影响的报道主要聚焦于人工智能的优点。而受保守主义报道的关键主题词涉及更多方面,既有负面的形容词如“危险的”(dangerous)、“假的”(fake)、“错误的”(wrong),也有“军队”(military)和“武器”(weapon)这样的名词。受保守主义影响的报道除了关注人工智能的缺点以外,还担心人工智能被滥用,成为对人类社会的威胁。人工智能报道中的自由主义价值趋势说明,新闻媒体有可能在千禧年后减少了对人工智能潜在威胁的描述,而对人工智能的优点予以更多关注。

本文发现,人工智能报道的主题也与民意调查结果相对应。美国皮尤研究中心2017 年的一项调查指出,越来越多的美国人担心机器可能会完成人类目前所做的许多工作,其中72%的受访者对这一概念表示了一定程度的担忧[19]。但同时,对超级智能前景感兴趣的受访者比那些不感兴趣的受访者更多[20],对使用人工智能与客户互动感到满意的受访者人数要多于对人工智能感到心里不适的人数[21]。根据媒介理论,媒体的建构会影响受众的认知,而舆论也反过来塑造媒体的建构[22][23]。本文认为,媒体意识形态取向与公众态度互相影响媒体对人工智能的建构,最终形成了自由主义的科学态度在人工智能报道中呈现上扬趋势的结果。

猜你喜欢

保守主义高频词主题词
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
智能传感器的智慧战略,新技术创造新价值
保守主义的价值与局限
取消公文主题词的真正原因是什么?
公文主题词消失的原因浅析
什么是保守主义
俄罗斯保守主义现代化的实现路径