从诠释到他异:AI媒体技术带来的社交与认知变革
2020-05-13牟怡
牟怡
摘要:在智能化浪潮席卷全球的今天,基于大數据、人工智能、物联网等技术的应用层出不穷,使得媒体研究中的诸多传统范式或多或少陷入捉襟见肘的境地。人际传播与大众传播的边界已然模糊,而前者正在对后者的诠释功能产生不可忽略的消解作用。伴随AI而来的新问题,使得技术现象学中关于人机关系的讨论再次热烈起来。文章以技术现象学家唐·伊德的技术中介理论为指导,在回顾了传统媒体所扮演的诠释角色以及近期的困境后,提出AI技术提供了一个他者的视角,这或许会是可行的解决路径。基于此,文章从认知推理逻辑和媒体感官比例等概念入手。讨论了AI技术这个他者应该被赋予何种特征.才能更好地实现人机之间的他异关系等相关问题。
关键词:人工智能;人工智能;AI媒体技术;诠释关系;他异关系;技术现象学;认知变革
中图分类号:TP18 文献标识码:A 文章编号:1004-8634(2020)01-0092-(10)
DOI.10.13852/J.CNKI.JSHNU.2020.01.009
1950年,媒体技术史上稀松平常的一年。然而,这一年里有两位学者各自从不同的视角提出了两个问题。谁能想到,对这两个问题答案的追寻会无形中形塑了近70年后今天的媒体技术格局。一个问题是艾伦·图灵在其经典的《计算机器与智能》一文中提出的“机器会思考吗”,另一个是马丁·海德格尔在演讲中追问的“技术的本质是什么”。
在智能化浪潮席卷全球的今天,基于大数据、人工智能(artificial intelligence,以下简称AI)、物联网等技术的应用层出不穷。作为目的手段,技术无疑是成功的。以媒体技术为例,以机器写作、智能分发为特征的智能媒体正在促使内容生产、分发、消费等全面升级,并使得三者之间互相渗透、互为驱动,共同推动一场新内容革命。然而这种雅斯贝斯式的工具性观点,正如海德格尔所批评的那样,尽管符合常识,却不免偏离了技术的本质。媒体研究中的诸多传统范式,不论是洛厄里(Lowery)和德弗勒(De-Fleur)提出的三大范式:大众社会范式(mass society paradigm)、认知范式(cognitive paradigm)和意义范式(meaning paradigm),还是更广义上的结构功能主义(structural functionism),都在智能媒体的挑战下或多或少陷入捉襟见肘的境地。而另一方面,伴随AI而来的新问题,使得技术现象学中关于人机关系的讨论再次热烈起来,这或许能为今天的传播范式革新带来新的视角。因此,本文将从技术现象学中“人一技术”的几种关系人手,对媒体技术在塑造人与世界的关系过程中的机理与作用进行讨论,尝试找到不同于传统视域的新路径。
一、媒体研究传统范式的困局
互动互联的新媒体格局下,人际传播与大众传播的二元划分不再成立,取而代之的是万物皆为媒介化(Everything is mediated)。自拉斯韦尔(Harold Lasswell)以来的关于媒体的功能主义受到了极大的冲击,传统媒体的各大功能无一不面临修正。拉斯韦尔阐述了传播在社会中的三大功能:一是监督环境,开拓个人视野;二是协调社会对公共事件的反应;三是传递文化遗产。以大众媒体传播新闻与信息这一功能为例,不同于以新闻专业主义为准绳的传统媒体时代,今天的新闻从诞生到散播都有大量用户参与,支离破碎的信息反而难以呈现事实的全貌。公共舆论场中重情绪、轻事实的“后真相”现象被冠以“有毒的”(toxic)定语,与传统的媒体对于公共空间的“看门狗”(watchdog)功能大相径庭。究其原因,“后真相”现象的出现不外乎是历来隔离在新闻生产之外的观众变成了内容的生产者,具有社交主动性的用户通过人际网络获取社会关系的信息分享,在感知他人情绪之余又附加自己的情绪与价值判断。无数看似微小的情绪涟漪当遇到合适的频率与相位时可能会发生共振,甚至形成诸多反转新闻的案例。在这样的传播场域中,人际传播与大众传播的边界已然模糊,而前者正在对后者的诠释功能产生不可忽略的消解作用。这或许可以部分解释为何工业化社会大众传播产物的传播学架构已经无法适应信息革命化社会互联网传播带来的非线性、圈层、超链接等现象。
与此同时,伴随着AI的第三次崛起,智能机器与算法开始作为一种全新的传播者(communicator)出现,已经呈现出成为未来媒体场域搅局者的端倪。经典的传播“5W”模型中,信源(source)和信宿(re-ceiver)均为人,这就默认了双方的诸多特性,例如有意识,有价值取向,至少在一定程度上能够遵循共同的沟通原则等。然而,当交流的一方变成机器(包含算法)之后,传播的定义变得模糊起来。看似一个简单元素的改变,却带来对定义基本前提的重新审视。意识是否必需?机器居于伦理坐标的何处?信息接受与反馈机制是否需要双方一致?更现实一点,我们需要给机器赋予怎样的社交线索以保证人机交流的有效进行?传统媒体研究范式的藩篱之下,这些问题的答案似乎难以寻得。因此,我们急需引入一种新的探究路径。
二、技术中介理论及其延伸
作为技术现象学的代表人物,美国哲学家唐·伊德(Don Ihde)提出的“人一技术”关系理论被广为引用,很大程度上扭转了技术哲学早期的超越论色彩与对技术的消极态度。伊德关注人与技术的关系问题,认为两者不能孤立看待,尤其是技术在人与世界的关系中起着重要的调节作用。他尤其强调意向性(intentionality),即意识的普遍本质(胡塞尔语)。技术是人与世界之间的中介者,而非中立者。这种中介性便是伊德提出的技术意向性(technological intentionality),即技术具有塑造自身使用的意向性,不同于人的意向性。技术中介的意向性关系为:
人-技术-世界
技术在人与世界之间的调节性中介作用具体又分为两种。一种是具身(embodiment)关系。这种关系中,透明的技术拓展了人类身体知觉的范围,仿佛抽身而去,典型的例子是眼镜。其关系可以表示为:
(人-技术)→世界
另一種中介关系为诠释(hermeneutic)关系。此种关系中,技术提供了世界的表征,作为我们诠释世界的依据,最好的例子便是温度计。其关系可以表示为:
人→(技术-世界)
除了中介关系之外,还有一种他异(alterity)关系。在这种关系中技术可以被称作一个准它者(quasi-other),例如智能机器人。其关系可以表示为:
人→技术(-世界)
伊德提出的最后一种人机关系是背景(background)关系,即技术作为生活背景与氛围嵌入背景之中,人们常常注意不到其存在,例如电。其关系可以表示为:
人(-技术-世界)
继伊德之后,后现象学家费尔贝克(Verbeek)认为除了中介意向性外,还进一步补充了另外两种形式的意向性。一种是混合意向性(hybrid intentionality),即赛博格关系(cyborg relation),将人与技术两者之间的相互关联变成两者的融合,进而形成一种新的实体(entity)。其关系可以表示为:
(A/技术)→世界
在此基础上存在着另一种复合意向性(composite intentionality),即复合关系(composite relation),不仅人类有意向性,人类所使用的技术亦有意向性,而且后者起核心作用。其关系可以表示为:
人→(技术→世界)
三、诠释关系下的传统媒体技术与人
技术现象学认为技术是感知并转化为知觉的方式。伊德将知觉分为微观知觉与宏观知觉两种。前者即感知到的知觉,指通过身体感官所感受到的知觉;后者即文化的或解释的知觉,系通过转化的途径感知到的知觉。而作为大众媒体的技术通常被认为是受众认知与理解世界的途径;这尤其与诠释角度下的技术现象学一致。媒体技术提供了世界的表征,从新闻资讯到虚构故事,观众借此对世界进行各自的诠释。尽管伊德提出的其他几种人一技术的关系均可在媒体技术与人的关系中找到,然而,传统媒体时代,诠释关系无疑是这几种关系中最重要的一个。因此,本部分的讨论仅仅围绕诠释关系展开。
1.传统媒体的诠释角色
传统媒体时代,新闻传播学中最具影响力的理论莫过于议程设置理论(agenda setting theory)和涵化理论(cultivation theory)。前者着眼于探究大众媒体受众的注意力导向问题,指出媒体的议程设置功能乃媒体的一种能力,通过反复播出某类新闻报道,强化该话题在公众心目中的重要程度。因此,公共议程(public agenda)在很大程度上是由媒体议程(media agenda)来设置的。然而,媒体议程与真实世界之间存在的差异已经被证实良久。早在20世纪60年代,美国学者芬克豪泽(G.Ray Funkhouser)比较了美国社会中公众认为的“美国面临的最重大问题”与三家周刊(《时代》《新闻周刊》《美国新闻与世界报道》)中出现的各种事件,发现公众按重要程度对事件的排序与媒体对该事件报道的频率有着明显的对应关系。然而,媒体的报道并不能与真实的事件很好地吻合,在诸如种族关系、犯罪、贫困和环境污染问题上,媒体报道与实际情况大相径庭。新闻媒体未能全面地告知正在发生的重大事实,因此公众对未被设置的议程缺乏了解。
与议程设置理论关注媒体的角度不同,涵化理论则聚焦于受众层面。因为电视中包含了信息、观念和意识的来源,电视观众通过电视观看来形成对世界的认知。尤其对电视的重度观众而言,电视教导了共同的世界观、角色观和价值观。正因如此,电视重度观众才会出现“冷酷世界综合征”(mean worldsyndrome),即在大量观看了电视中的暴力内容后,观众会有这个世界充满暴力和冷酷的感觉。学者热勒曼(Dolf Zillmann)尝试用媒介影响的范例理论(exemplification theory of media influence)来解释涵化理论的效应。他指出,现象的范例化存在两种情况,一种是事件分布的关键参数已知,那么样本的代表性可以得以判断;另一种是事件分布的关键参数未知,样本是否具有代表性则无从判断。电视节目中出现的现象,比如犯罪行为、天灾人祸等事件,普通的观众对其分布的参数无从得知,因此并不能知晓电视节目提供的样本是否具有代表性。同时,电视节目擅长展示具体、生动的事件,而较少提供复杂抽象的知识,更使得那些具有“轰动效应”吸引眼球的事件让观众记忆深刻。由此可以看出,很大程度上传统媒体并不胜任出色的诠释角色。
2.受众的认知推理模式
传统媒体时代的新闻传播理论,不论其关注的视角和层面有哪些差异,其共同的前提都是社会推理(social inference)的心理认知模式。作为“认知的吝啬鬼”(cognitive miser),人们通常在有限的信息下快速做出认知判断,却在认知推理的各个环节中引入偏见。20世纪80年代,两位美国社会心理学家菲斯克(Fiske)和泰勒(Taylor)完整梳理出认知推理过程以及潜在的偏见来源(图1)。
首先,在收集信息的步骤中,既有的预期或已知的理论会有意无意地指导我们进行信息采集。在大众媒体的使用场景中,持不同政见者通常会根据自己的政治立场选择不同的报刊或电视节目,而选择性忽略掉与自己政治立场不符合的媒介,这就是通常所说的选择性暴露(selective exposure)。近年来被热议的“信息茧房”(information cocoon)的原因也可以被选择性暴露解释,即用户被与自己品位喜好相似的人所包裹着,接触到的信息都是高度同质化的,他们主动或被动地暴露在经过有意或无意选择过的信息里。然而,如果已有理论,尤其是那些明显的或者是人们特别有信心的理论,一开始就是错误的选择,那么后来的整个推理过程可能就是无根之木。一个典型的例子便是当下社交媒体上各类健康伪信息(misinformation)的广泛流传。用户置身于自己协助构造的“信息茧房”中,所接收的信息不断对之前的信息做出正反馈,故而伪信息层出不穷。当然,绝对的对与错的二元对立在很多情况下难以成立,更多的时候只是不同的立场而已。
社会推理的第二步为信息抽样。当面对大量甚至是海量的信息时,人们无法窥见事实的全貌,只能借助样本来代表总体。然而,人们通常对样本的代表性缺乏了解,使用极端案例、小样本、偏见样本,或者根据自己喜好忽略样本,这些都是常见的会带来认知偏差的错误。前文所述的涵化理论便与此相关。现代社会里的犯罪率普遍偏低,然而电视节目中的暴力犯罪行为比例却很高。重度的电视观众如果不对真实世界中的总体与电视节目中带有偏差的样本加以区分,就容易得出这是个充满暴力的世界的结论。
当确定哪些信息进入推理后,如何使用这些信息便成了信息处理的关键。这一步骤中常见的错误包括未能充分使用基础比率(base rate)信息,未能正确理解概率与回归,以及冗余信息带来的稀释效应(dilution effect)。例如,如果有人想就欧洲是否应接收国际难民这一问题厘清来龙去脉并形成相应观点,那么仅仅靠几个难民故事是没法提供客观公允的事实的。他必须找到造成国际难民的成因,其准确数量,其诉求,以及逃难沿途各国的社会经济状况和接收容量等基础比率信息。同时,他还必须甄别出有用的核心信息,而不至于湮没于浩瀚的非事实性观点之中。
最后一步是整合信息形成判断。而这一过程中,如果人们赋予不规律或不正确的线索权重,使用错误线索、过少线索,或者不规律地使用决策规则,都可能造成信息整合的错误。比如,过度偏激的刻板印象的介入往往会让最终的判断失之毫厘谬以千里,在之前的众多反转新闻里我们往往能看到这样的例子。“榆林产妇跳楼案”反转前网民们对医者的集体讨伐,“公交车坠江案”反转前众人对女性司机的口诛笔伐,等等,不过都是信息整合时出现了偏差。
当然,因为人类倾向于节省认知消耗,期望能够在较短时间内迅速做出认知决策,因此,以上的完整认知推理过程并不会总是被使用。双重加工系列理论(dual-process theories)已经告诉我们,个体的信息处理存在两个加工途径。其中的启发式系统化模型(heuristic-systematic model)告诉我们,当个体投入了较高的认知努力,运用自身过往的知识与经验等来精细加工信息,这叫作系统化加工(systematicmodel);而启发式加工(heuristic model)则表明个体采用了启发式线索和简单的决策规则来快速做出判断。常用的启发式加工有代表性启发(representative heuristic)、可得性啟发(available heuristic)、模拟启发(simulation heuristic)、锚定和调整(anchoring and adiustment)等。代表性启发指的是人在推理过程中倾向使用具有代表性的案例来代表整体:可得性启发则指的是判断事件发生的频率和可能性取决于相关案例能多快被想到;模拟启发指的是对通过假设情形的建构来评估事件后果;锚定和调整则意在不确定性下做判断,从最初的参照点开始一步步做调整,实现最后的决断。两位提出者基于此对理智判断与决策模型发起挑战,其中一位丹尼尔·卡内曼(Daniel Kahneman)进而发展出前景理论(prospecttheory),并以此获得了2002年诺贝尔经济学奖。
纵观传统媒体时代,不论是基于印刷的报纸或杂志,还是电信号的广播和电视,甚至是互联网早期,我们可以看到受众接受媒体信息形成对世界的认知诠释都遵从着以上规则。换句话说,人与技术以及世界的“人→(技术-世界)”关系中,技术遵循着自身或人为的规则,提供了世界的部分信息给受众,受众以此解读世界。然而这一过程中存在着大量与真实世界偏离的信息。这些偏离一部分源自媒体技术在提供世界的表征时所过滤、曲解掉的信息,另一部分更直接来自人的认知局限。因为人类感官没有足够发达,信息处理能力不够,所以人类过多依赖于启发式线索带来的迅速信息处理方式,形成对世界并不全面的认知。按照海德格尔的观点,技术是一种解蔽方式,自有一套技术的逻辑,最终将展示真理和事物的本质。那么,更新换代之后的技术是否可能提供另一种展示真理与本质的方式呢?
四、他异关系下的AI媒体技术与人
新技术革命下的AI与媒体有了越来越多的交集。机器写作、智能分发、仿人交互等技术已然进入了今天的媒体,并与社交网络发生强势互补。从传播的基本模型“5W”模型来看,“谁”(who)以“什么渠道”(what channel)说了“什么”(what)给“谁”(to whom)并得到了“什么效果”(what effect)中各个元素均获得了升级。各类AI智能算法或以虚拟或以具身形式与技术用户产生互动,它们或以聊天方式传播新闻,或以机器记者身份进行创作。在一些情形下,AI技术虽然会以具身关系(例如机器外骨骼)或诠释关系(例如在火星上考察的机器人)与人类发生关系,但更多时候,人与AI智能技术之间会以他异关系出现,形成人_技术(一世界)的关系链。学者寇克尔伯格(Coeckelbergh)指出,在与我们的互动中,AI技术不仅仅是一样东西(a thing),而是一个可以与我们发生关系的他者。这样的关系并没有暗示一个自我的互惠关系,或者我们需要从AI技术那里获得认可。AI技术是独立于人类个体的他者或准他者,与人类的其他他者无异。因此,我们无需将人类的自我体现在技术中,也无需将技术具化在我们的认知里。AI的意义既不存在于AI中,也不存在于人类的主观想象中,而是存在于具体的人机关系中。因此,作为他者的AI技术,可能带给我们诠释关系之外的新的解蔽方式。
1.从人的认知推理到AI的认知推理
回到前文中的认知推理模型,其中的四个步骤依然成立:收集信息、信息抽样、选择使用的信息、整合信息。然而不同的是,这四个步骤可以在不同程度上借助AI技术来完成。今天技术的赋能使得我们可以收集到从前无法收集的信息。大数据、物联网等新技术让机器能捕捉到更多来自各种传感器的数据。例如可穿戴设备的普及使得每个人的健康相关数据得以获得并可视化出来。一个明显的案例就是“传感器新闻”。例如,2015年10月CCTV推出的《数说命运共同体》专题,其中第一集《远方的包裹》中,数据分析师通过全球定位系统获得了全球30万艘大型货船轨迹,对比过去航运数据120亿行之后,发现过去一年中途径“一带一路”沿线主要国家的海上货运量增加了14.6%,高于同期全球航运总量增长的3.8%。而近三年春节期间CCTV联手百度打造的“据说春运”则是用GPS数据生动而详实地描绘出中国人的春运集体大迁移。不同于以往基于统计学的抽样方法,大数据技术的全样本采集使得我们不再担心抽样的代表性,亦不再受个人喜好的影响,从而实现了对总体全局的把控。
而在信息的使用与整合阶段,智能算法能够摈弃人为的偏见,保持一贯的决策规则,因此,机器生成的信息被认为比人生成的信息更客观。最近的实证研究也证实了这一点,用户认为机器生成内容更具有公信力,甚至比人工生成的内容更具专业性。
然而如果本应由人脑完成的认知工作交给技术来完成,是否会带来一些负面效果?早在2008年,观察者就提出这样的质疑:以Google为代表的搜索引擎会让我们变傻吗?这一质疑的逻辑在于用户因为过于依赖搜索引擎这种外在的存储空间,故而使得他们的记忆力退化而变得愚蠢。这一论断也得到了心理认知实验的证实。2011年发表在《自然》期刊上的研究指出,当面对困难问题时,人们首先想到计算机,他们不再费尽心力去寻找想要的信息,而是回忆如何找到信息。更进一步,如果我们不仅仅是把记忆交付给技术,而是把更多思维过程交付给技术,让技术代替我们“思考”,那么未来人类的万物之灵的地位是否会岌岌可危呢?
2.全新感官比例的传播技术
尽管AI技术在收集信息与整合信息上有着得天独厚的优势,但如果仅仅将AI局限于此,那么其实是对其传播潜能的低估。技术固然有着自己的进化规律,但其发展也会受到人类需求的直接影响。传播学家麦克卢汉曾提出“感官比例”的概念,即愈是符合人类天然的各种感官需求的媒体技术,愈是让人感觉自然而易于使用。这点从对鼠标键盘与触摸屏的比较中便能知晓。尽管鼠标键盘可以有效地输入信息,但是终究没有触摸屏来得自然。因此,儿童在会使用鼠标键盘之前就会无师自通地使用触摸屏。
作为有机体的人类,其生理构造的局限非常明显。我们的各种感官很有限,力量不足,行动速度比很多动物都逊色得多。媒体技术的出现在很大程度上弥补了这些不足。我们看不到、听不到远方发生的事情,因此媒体充当了我们的眼睛与耳朵。然而传统的媒体技术过多依赖于我们的视觉,报刊、电视以及今天网络的很大一部分都无一例外地选择我们的眼睛作为知觉的主要入口。其次是听觉,广播与电视,以及今天众多的所谓“声音媒介”(例如播客、有声APP等)在视觉泛滥的缝隙中占有一席之地。但不得不说,除此之外的其他感官,包括触觉、嗅觉、味觉等,在自工业革命以来的媒体技术中均败下阵来,只能蜷缩于有限的人际传播中。从这个意义上说,人类的各种感官不同程度地受到自工业革命以来媒体技术的延伸或截短,而呈现出不符合天然的“媒体感官比例”。
然而这一状况可能会随着AI技术的发展而得到改变。社交機器人、人脸识别、语音识别、情感计算等一系列基于大数据、AI、认知科学发展起来的技术可能打造出符合人类天然感官比例的传播技术。例如,电影《少数派报告》中的感应技术已经变成现实。MIT媒体实验室Pranav Minstry发明的第六感技术,通过4个套在手指上的彩色标记环、1个小型摄像头、1部便携式投影仪和1台便携式电脑,就可以通过简单的动作完成信息的获取。用手指做出一个摄像框的动作,拍摄即在瞬间完成,而无须按下快门键。如此一来,信息的输入、输出不再受限于实体屏幕,我们长久以来在传播中被忽略的触觉得以实现回归。
不仅如此,我们的大脑本身也可以跟技术发生接壤。借助脑机接口,碳基的大脑与硅基的计算机可以连接起来,通过大脑直接控制机器的动作。尽管这一技术目前还处于初级研发阶段,但是可以想见未来这一技术可能带来的革命性变化。交流的终极目标,即思想的有效交换,有可能逾越语言的阻隔得以真正实现。
3.AI:正在崛起的传播他者
如果人类将定义自己的“思考”(见笛卡尔的“我思故我在”)交予他者之手,这无疑需要足够的人机信任才能实现。如何实现这样的信任,其实是一直以来的一大难题。工业革命时出现的卢德分子时至今日依然存在,继续保持着对技术深深的敌意。而更多的人则持谨慎的怀疑态度。例如,73%的欧盟公民对AI可能造成失业感到害怕,只有31%的美国人支持发展高水平机器智能。2015年以科学家霍金、科技企业家埃隆·马斯克以及一些AI专家为首公开签名的反对AI武器宣言则象征性地代表了人类对AI技术不确定性的担忧。对机器人如何实现有效的约束也一直备受关注。从阿西莫夫的“机器人三定律”到2004年墨菲和伍兹提出的修订三法则,再到2010年英格拉姆等人提出的“机器人工程师-的伦理准则”,不论是机器人还是从事机器人研发的工程师都受到了明确的约束。
除了AI技术的潜在威胁外,人类目前尚不习惯于这样一种全新的交流对象。不同于人,目前的AI尚不具备意识,也不能完全遵循人类的交流准则。人AI交流对时间维度的改变,对AI方可控性的放大,以及AI对信息的无意识、无批判,这些都可能深刻改变传播的过程与效果。例如,从时间长短来看,死亡赋予生命特殊的意义,人类的生命历程会塑造出不同的传播模式。具有几十年平均寿命的人类在不同生命阶段做出不同的传播方式选择,所以才会有“人之将死其言也善”的现象,更不用说所有的关系都具有起始、增强、维持和可能的恶化与终结。然而,技术赋能下的AI交流对象可以没有死亡,即使机器老化,也可以找到一模一样的具身再加载之前的数据,以打造出不漏痕迹的替代者。人类无须面对这样的交流者的离场。面对一场不会散的筵席,人类的传播行为是否会做出不同的选择?
在漫长的进化过程中,交流双方的不可控性促使人类发展出共同遵循的准则来预期对方的行为。在社会分层林立,实践规则纷繁的人类社会里,各种社会规则被创造出来。每个人的权力都受到或多或少的制衡。然而,在未来AI技术以人类用户为中心的微型社交圈里,人类可以享有按照自己喜好个人定制化构建出来的“社交星系”。然而,这样一个个小型的极度个人定制化的社交规范能否融入更大的社会规范里?这些由自我为中心构建出来的微粒社会能否和谐地共存?
即使不看那么长远,近在眼前的AI技术已经开始成为很多人倾诉衷肠的对象,聊天机器人便是其中的代表。因为机器不具有道德批判和伦理规范的约束,用户可以对着聊天机器人吐露各种心声,包括那些埋藏在内心阴暗角落里的想法,曾经做过的荒唐事,不堪回首的种种往事等。当然,他们可以对聊天机器人选择语言滥用。以微软小冰为例,截至2018年,微软小冰已经在亚洲吸引了超过2亿的注册用户,其与用户平均聊天多达23个回合。然而,这样光鲜的数据似乎掩盖了一个事实,那就是超过90%的机器反应其实毫无章法可言。这就是所谓的“反ELIZA效应”(anti-ELIZA effect)。图灵提出的通用机具有两个基本假设:一是时间的离散性,二是思维状态的离散性。今天的聊天机器人普遍采用马尔科夫链(Markov chain)原理,即在一个离散时间的随机状态中,只有当前的状态可以用来预测未来,过去的状态与未来无关。因此,今天的聊天机器人是回合制对话。所以,我们不得不问:当前的弱AI真是一个完美的倾诉者吗?抑或是一个电子版的“树洞”而已?
尽管媒体等同理论(media equation theory)早于20多年前就指出,人类用户以何种社交方式对待他人,就会以何种社交方式对待媒体技术。而这一结论的前提是技术需要提供一些社交线索(socialcues),导致人类用户处于无意识(mindlesss)的状态而来不及思考人与机器的差异。因此,他异关系中的人和机器如果需要和谐共处,那么则需要机器具备一定的人类社交线索。由此一来,一些问题便应运而生。例如,人性是否需要体现?如何体现?以人类人格为模板的机器人格是否合适?AI技术是否需要有具身(embodiment)?如果需要具身的话,那么拟人化的外形是否必需?是否应该给机器赋予性别?……这些种种问题的答案,将直接塑造我们与未来媒体技术这个他者之间的交流与信任。
以机器人的人格设定为例,冯(Terrance Fong)与合作者将其分为5类:工具型(tool-like)、宠物型(pet or creature)、卡通型(cartoon)、人工創造物型(artificial being)和类人型(humanlike)。工具型指的是像智能工具一样运行即可;宠物型则是模仿狗或猫等家养宠物的特征;卡通型则是像漫画一样将某些人格特征放大;人工创造物型反映的是机械或机器类型的特征:类人型则是全面模仿人类的人格特征。最近的一篇综述研究总结了过去12年中社交机器人的人格定义、操作以及效果。其研究结果表明,目前尚无专门的机器人人格定义,冯等人提出的5种类型中的前四种几乎没有被运用,而是全盘借鉴人类的人格;其中,心理学上常用的“大五”(big five)模型,即外倾性一神经质一开放性一宜人性一责任感五大因素模型,是使用最多的模型。然而,不同于人,社交机器人的人格并非均衡地体现在这五个维度上,而是更多地考虑技术的因素而体现在外倾性上,因此,机器人的个性太过脸谱化和单一化。而在其人格特征的实现上,以往研究者集中采用了外表(例如颜色、面孔)、动作、语言、音调、表情等手段来体现个性。与人类交往的常识一致,外向宜人的机器人通常更受用户的喜爱,带来各种正面的认知与行为效应。然而,也有不少以往的研究指出,也许用户只需要一个“善良的”(kind)机器人就足够了。
AI技术中社交线索的讨论日益激烈。为了让人与AI技术这个他者进行有效的交流,一个公认有效的做法是将人类社交场景中语言或非语言的细节赋予机器,通过这些细节人们可以做出相应的符合社交规范的判断。这些人类的社交线索包括自然线索(例如注视和手势)、情绪的表达和感知、外貌特征,甚至包括社会性别。给社交机器人强行赋予性别似乎是目前一个通用的做法,例如国外的“索菲亚”和国内的“佳佳”机器人都被设定为女性,甚至连没有实体的聊天机器人微软小冰也是十几岁的女孩子形象。但是,参与制定机器人五原则的专家温菲尔德(Alan Winfield)表示,设计一个性别化的机器人实际上是一种欺骗,有违“不能用欺骗性的方式来设计机器人,从而剥削易受伤害的使用者;相反,它们的机器属性应当透明化”的原则。开发者固然可以通过外观设计或编程设计出性别模式行为,让人类相信机器人有性别或.11生别特征,但是这无异于告诉别人一块石头是男性。而一旦人类相信了机器人的性别化,便会对这个性别暗示做出反应,性别歧视、物化女性和物化男性的现象可能会在机器人身上重演。
五、结语
AI技术的崛起正在重塑媒体格局。人与传统媒体技术间的诠释关系在新技术的冲击下已经变得不合时宜。早在2013年,超过一半(61.5%)的网络流量由机器生成。以通过模仿合法用户行为、对网站或API进行高速滥用或攻击、发送垃圾邮件或宣传为目的的恶意机器人已经屡见不鲜,甚至影响了世界各国的政治选举。如果还仅仅把技术作为人类诠释世界的一个工具,并不能完全理解技术及其带来的各种后果。例如,在评估网络上的人类舆情时是否应该将这些网络机器人的观点排除在外?因此,在他异关系下重新审视人机关系变得迫在眉睫。
从人类感官比例来说,过去自工业革命以降的传统媒体技术也许仅仅是人类发展史中的一个插曲。AI技术的发展有可能将人类天然的感官比例得以复原,重新回到前科学的但可感知的生活世界,甚至得到增强。然而AI技术毕竟不同于其他自生自灭的他者(例如动物),人类塑造的痕迹处处可见。所以,应该为它赋予哪些特征才能使人机和谐共处是不可规避的关键问题之一。将人类的各种特征生搬硬套到AI技术上也许是最直接的选择,却不见得是最优选择。AI技术这个他者应该被赋予何种特征,才能更好地实现人机间的他异关系,是一个值得深入探讨的问题。
当然,AI技术以他者身份出现,仅仅提供了一种可能的方案,却不能保证把我们直接引到正确的答案面前。目前AI技术采用了基于大数据的机器学习,仅仅提供了相关性数据,却没有探究因果关系,因此,AI尚不能建立起很多常识。如果这样,那么AI技术是否能真正走出之前传统媒体在诠释世界时的局限可能还是个未知数。