符号叙述学视域下的算法信息分发及其反思
2021-03-25谢林杉雷晓兰
谢林杉,雷晓兰
(1.宜宾学院 文学与音乐艺术学部,四川 宜宾;2.四川大学 符号学—传媒学研究所,四川 成都)
马歇尔·麦克卢汉从传播的角度将人类社会划分为三个阶段,即口语传播时期、文字印刷传播时期以及电子传播时期,又对应称为部落文化阶段、脱离部落文化阶段以及重组部落文化阶段。在不同时期,符号与信息有着不同的传播方式,人们获取信息的途径也有着相应的变革与偏重。
当今时代,人们正处于互联网的包裹当中。计算机在传播活动中所承担的作用,就其智能性而言,远远超出了以往任何时期的媒介。算法技术无疑是智能时代运用最为广泛的技术之一。各类应用程序或搜索引擎的开发者根据不同用户使用行为等方面的差异,运用算法进行与之匹配的个性化信息生产与推荐。例如,当某用户在搜索引擎上对某地新冠肺炎疫情相关情况进行搜索之后,该用户在搜索引擎的后续使用中,便会收到与各地新冠肺炎疫情相关社会问题的推荐报道。
但是,算法技术在带来许多显而易见的便利的同时,也引发了不少困惑、反思与讨论。例如,对于由算法分发引起的信息茧房等问题,来自计算机科学、哲学、新闻传播学等领域的学界人士,和来自互联网、传媒等行业的业界人士都有着持续不断的关注与讨论。本文将算法技术进行信息分发的过程看作是一个叙述文本,采用符号叙述学的相关理论与视角,对相关问题进行研究。同时,对于用户在智能时代保持自身思维独立性的情况进行反思,以期在计算机技术带来的各种信息所组成的迷宫中保持清醒。
一、全文本视角下的算法信息分发
叙述是人类认识世界的基本途径之一。人是用符号来讲故事的动物,研究一切包含叙述的符号文本的叙述学称为符号叙述学。赵毅衡认为,符号文本的定义需要满足以下两个条件:“1.一些符号被组织进一个符号组合中。2.此符号组合可以被接收者理解为具有合一的时间和意义向度。”[1]43而叙述文本的定义需要满足的条件为:“1.某个主体把有人物参与的事件组织进一个符号文本中。2.此文本可以被接收者理解为具有事件和意义向度。”[2]7二者相较可以看出,叙述文本一定是符号文本,但符号文本不一定是叙述文本。符号文本的发送主体可以缺失,例如自然符号雷电等,而叙述文本必然存在一个叙述主体;此外,符号文本中可以没有人物的参与,而在叙述中一定需要卷入人物。
人类在机器学习领域不断突破,运用算法技术和其他计算机技术使得传播活动日益智能化。这其中,由算法生成的每一个文本可能是叙述文本,也可能是符号文本。但如果将算法分发信息这一过程整体看作一个文本,算法技术是叙述主体,用户是参与的人物,每一次信息的推送是事件,且这一过程拥有可被理解的意义观与价值观,那么,算法信息分发这一行为就是叙述,其从生产、分发到被接受这一完整的过程就是叙述文本。
文本的范围在研究对象是文字文本时,不会出现太大的争议与过多的讨论,因为其边界十分明确。但在符号叙述学的视域下,文本的范围大大被扩展开来。它“不是符号载体的集合,而是符号表意的集合”[2]212。也就是说,文本并不需要是一个实实在在的物质存在,从广义上说,它包括任何一种携带了意义的文化产品。在广义的文本概念下,我们的研究对象可以从文字文本拓宽到人类社会的文化现象或表意活动,但同时,究竟哪些因素需要作为叙述文本进入到研究视线范围内,这成了需要定义的问题。
意义的表达需要符号,符号的解读需要语境。不存在完全孤立的表意符号,事实上,这样的符号也无法完成表意活动。因此,叙述文本周遭的伴随文本,对于意义的表达与解释起着至关重要的作用。“任何一个符号文本,都携带了大量社会约定和联系,这些约定和联系往往不显现于文本之中,而只是被‘顺便’携带着。”[1]143伴随文本分为六种,即型文本、副文本、前文本、元文本、链文本和先后文本,“这些成分伴随着符号文本,隐藏于文本之后、之外,或文本边缘,积极参与文本意义的构成,影响意义解释”[1]143。在对叙述文本进行解释时,不同类型的伴随文本与叙述文本结合的紧密程度有所不同,部分伴随文本已无法与叙述文本进行区分,成为其中的一部分。“凡是在进入解释的伴随文本,都是文本的一部分,与狭义文本中的因素具有相同价值。”[2]218这种新的文本形态,称之为全文本。
叙述文本是用户在智能终端设备上所看到的推送内容,表面上看,这是用户作为读者或符号接收者接收到的全部信息,但实际上,隐藏在叙述文本背后的算法技术才是对符号接收者产生影响的关键。算法技术作为伴随文本,与作为内容呈现的叙述文本实际上是不可分割的。“不是符号在‘说话’,而是符号的媒介在‘说话’。”[3]麦克卢汉的名言——媒介即讯息,早已预示了这一现象。
基于算法生产和推送给用户的内容,即便叙述文本看起来与前算法时代相差无几,但二者无论从生产逻辑还是传播模式上来看,都有着根本性的区别。目前主流的推荐算法有以下几类。
一是协同过滤的算法。协同过滤又分为基于邻域的协同过滤和基于模型的推荐。简单来说,这种算法推荐是根据用户或用户间使用行为的相似性来完成的。例如用户A喜欢吃火锅,算法便会推荐与火锅相似的食物给A;当有一个与A相似的用户B出现时,算法也会推荐用户A喜欢的食物给用户B。从这一例子我们不难想到,协同过滤算法的实现,需要互联网产品拥有海量的用户行为数据,数据越多,算法推荐结果可能越精确。
二是基于内容的推荐。它通过分析用户关注的话题、浏览标题内容、浏览记录等与用户自身标签的匹配程度来进行信息分发与推荐。这种模式在当下被运用于大部分的新闻类应用程序中。
三是基于关联规则的推荐。虽然运用算法的场景各有不同,但算法均将其看做是一个数学问题,试图针对其提出最优解。在数学问题中,事件A会引发事件B的概率是可以计算的。例如,购买汉堡的顾客中有90%的人同时也会购买可乐。在运用算法的各类程序中,会根据用户的A行为来推荐具有关联性的B行为的产品。
四是基于流行度的推荐。例如某App中的“实时热门书影音TOP20”等。
最后,随着技术的发展与更新,语义推荐模式逐渐被运用得更为广泛。这种模式并不将重点放在表面意思的匹配上,而是通过寻找内容中的相似语义来进行推荐。例如,经常浏览外交新闻相关内容的用户,可能对时事政治感兴趣,那么有关其他国家领导人的报道也会进行推荐。算法推荐发展到这一阶段,其重点已发生了较为明显的转变——相较于之前研究用户行为,算法的语义推荐模式更注重寻找引发用户行为的动因。当然,单一的算法推荐模式都存在着较为明显的不足,因此,行为、语义等多种因素的结合越来越成为算法技术发展的趋势。
从以上推荐算法的类型来看,算法技术是根植于互联网上的叙述文本不可分割的伴随文本。以个性化新闻推送为例,“算法推送新闻是一种通过计算机算法与海量数据匹配将个性化内容推荐给不同用户的智能媒介技术”[4]。基于互联网技术的新闻资讯类平台,与传统的新闻媒体有着很大的不同。它没有新闻媒体“必备”的采编人员,也不自己采写新闻,完全依靠算法,将互联网上的新闻资讯进行整合,并根据不同用户的不同偏好进行推送。虽然都是对新近发生的事实的报道,但算法推送新闻无疑与传统专业新闻有很大的不同,且对专业新闻产生较强的冲击。
史安斌和王沛楠认为,“在算法推荐系统下,一则新闻的显现度与阅读量很大程度上由算法规则及其所反映的用户的兴趣决定,专业媒体的把关权力与议程设置能力不断被削弱”[5]。这可以说明,基于算法推荐的新闻,它作为叙述文本,其核心已经从呈现在用户面前的文字文本或图像文本,转向为隐藏在后的算法技术。因此,不能抛开技术,以传统文本分析的方法去讨论基于算法推送的内容;必须将技术与叙述文本看作是一个整体,用全文本的视角进行研究。由于文本范围发生了改变,叙述文本所要传达的意义也随之有相应的变化。
二、算法信息分发的隐含作者与隐含读者
符号叙述学认为,完整的叙述行为可以总结为作者“偷记”叙述者对受述者所讲述的内容,形成叙述文本,而该文本被读者“偷看”。由于在实际情况中,作者可能是一个创作集体,或者有意伪装自己的真实意图,因此,作者虽然是叙述行为的开端,是叙述信息的发出者,但仅仅由作者的意识去论证叙述文本想要表达的意义是做不到或不可行的。叙述文本中真正想要表达的,并非出自作者之口,亦非存放于作品表面的文字、音符或画面等中,而是隐藏在叙述文本归纳出的人格当中。
“隐含作者,是一个体现叙述文本意义—价值观的文本人格。”[2]228韦恩·布斯在其《小说修辞学》一书中提出了隐含作者的概念。在此之后,叙述学界对于这一文本人格究竟应该采取何种路径进行确定,持有不同意见。主要的观点集中于两个学派:一是坚持发展布斯理论的“修辞学派”,另一个是通过读者解读与“试推”确认隐含作者的“认知学派”。
“修辞学派”中,布斯认为小说家“在他写作时,他不是创造一个理想的、非个性的‘一般人’,而是一个‘他自己’的隐含的替身,不同于我们在其他人的作品中遇到的那些隐含的作者”[6]。可以看出,在布斯的观点中,隐含作者应从作者本人出发,通过作者意识来确定。因为从隐含作者可以追溯到作者本人的意识,即便这可能不是作者意识的全部,但可以肯定的是,它是真实作者意识的一部分。也就是说,隐含作者就是生产文本时作者的全部主体意识,具有充分的主体性。同时,布斯还提出,“不管一位作者怎样试图一贯真诚,他的不同作品都将含有不同的替身,即不同思想规范组成的理想”[6]80-81。这表明不同的叙述文本,即便是出自同一作者之手,也可能拥有不同的隐含作者。布斯关于隐含作者的此种观点,后来被发展成为确定隐含作者的“修辞方式”。由修辞学派路径确定的隐含作者,也可称之为执行作者。
除此之外,布斯认为,作为读者,“我们对隐含作者的感觉,不仅包括所有任务的每一点行动和受难中可以推断出的意义,而且还包括它们的道德和情感内容”[6]83。对于读者如何“推断”出意义,安斯加·纽宁认为,“隐含作者显然是读者在整个文本结构的基础上建构出来的”[7]。也就是说,区别于布斯从作者出发的路径,纽宁认为对隐含作者的确定应从读者一方入手。读者从叙述文本中解读出的一套“意义—方法”被称为“认知方式”。西摩·查特曼将在这一路径下确定的隐含作者称为推测作者。
赵毅衡从符号叙述学的角度出发,认为执行作者与推测作者都是有效的隐含作者,从哪个路径得出,根据叙述文本的不同体裁,选择不同的方法。具体来讲,纪实型叙述适用于执行作者,叙述者与执行作者人格合一,且作者同时也是叙述者,即作者、叙述者、隐含作者三位一体,作者以本人自身的人格承担责任。而虚构型叙述适用于从认知路线得出推测作者,解释社群对隐含作者的确定拥有发言权。这是因为如果完全按照个人的意义解读,则不可能得出一个相对固定的意义,即取消了意义问题可讨论的先决条件。解释社群理论能够帮助隐含作者在作者、文本与读者中,取得一个相对平衡的位置[2]231-233。
与隐含作者相对的是隐含读者,“隐含读者是从叙述作品的内容形式分析批评中归纳推论出来的价值观集合的接受者、呼应者,是推定作者假定会对他的意见产生呼应的对象”[8]。与作者、叙述者和隐含作者的关系一样,读者、受述者和隐含读者,通常情况下三者不能等同,但同时也有读者即是受述者,且读者与隐含作者价值取向完全相同的情况出现。
隐含作者与隐含读者的概念,是从以小说为主要研究对象的叙述学中而来的。但叙述行为充斥在人类活动的各个层面,若仅将其作为小说叙述学的研究理论,不扩展运用至人类实践行为的探讨,无疑是对叙述学理论的禁锢与窄化。赵毅衡认为,“所有的符号文本(包括陈述文本和叙述文本)……都有意义—价值观,因此都有体现这套意义—价值的一个发出符号文本的拟人格。……任何表意文本必定卷入文本身份,文本身份需要一个拟主体集合,因而就必须有一个‘发出者拟主体’,即‘隐含作者’,作为文本的意义—价值集合,此时可以称作普遍隐含作者”[2]221。因此,隐含作者的研究不应局限在实体的纸质文本上,也不应囿于由人类直接创造出的符号文本。智能设备上,利用算法生产和推荐的文字、音频、视频等内容,自然也应纳入我们关注与研究的范畴。
前文中提到了算法分发的信息推荐模式,无论是基于何种模式,算法分发推荐到具体某位用户终端上的相关内容,其叙述文本的意义—价值观一定是与用户匹配吻合的。从概念上理解,算法型信息分发最早被定义为:指推荐系统向客户提供商品信息和帮助用户决定应该购买什么商品,模拟销售人员帮助客户完成购买的过程。①Resnick,P.,&Varian,H.R.(1997).Recommender systems.Communications of the ACM,40(3):56-59.转引自喻国明,杜楠楠.智能型算法分发的价值迭代:“边界调适”与合法性的提升——以“今日头条”的四次升级迭代为例[J].新闻记者,2019(11):15-20.可以看出,与其他叙述文本有所不同,算法分发的文本内容本身就是为了精确匹配用户(也就是读者)所创造的。即便现在算法信息分发已不再局限于促进用户的消费行为,但其精确匹配用户的目的是没有改变的。
上文中已经谈到,纪实型叙述适用于修辞方式确定隐含作者,即叙述者与执行作者二者合一;虚构型叙述适用于以认知方式推断出隐含作者,即在解释社群参与下试推出的推测作者。但在算法技术介入下生成的符号文本,不论是纪实型的新闻报道、拟纪实型的广告,还是虚构型叙述的音、视频等,在文本生成的过程当中,用户的意义观与价值观极大程度地参与其中,甚至决定了叙述文本所要传达的意义—价值观。因此,若将算法信息分发这一行为看作是一个广义的叙述文本,那么它的隐含作者便是目标用户的意义—价值观形成的人格。同时,这一文本的隐含作者与隐含读者几乎一致,且读者与隐含读者合二为一。
三、算法信息分发的符号叙述学反思
一般来讲,大多数的叙述行为起源于作者,作者根据自己想要表达的意图来创造叙述文本。读者如果想要真正走入作品,欣赏作品,那就需要认同叙述文本的隐含作者所传递的意义—价值观。这时在接收作品的读者,与在创造作品时的作者一样,分裂出了一个第二自我。布斯认为,“最成功的阅读是这样的:在阅读时被创造出来的两个自我、作者和读者,能够找到完全的和谐一致”[6]152。这样“和谐一致”的效果,正是算法技术所希望达成的。在这样“和谐一致”的情况下,作者的意图将会完全实现:通过推送的新闻、短视频、商品信息等内容,在积累用户、扩大流量的同时,增加用户与平台的黏性,最后达到盈利的目的。因此,为了达到这一目的,算法信息分发行为又有别于一般的叙述行为。它改变了大多数叙述中从隐含作者到隐含读者的路线,在隐含作者之前,通过分析用户行为和语义等,设置了一个“类隐含读者”,并且由“类隐含读者”来决定隐含作者。算法技术希望达到的,即是“类隐含读者”与隐含读者完全重合,从而精准匹配推送给用户的内容。
但在算法技术的介入下,这样接近“最成功的阅读”模式的叙述,真的是达到了理想的状态吗?答案是否定的。信息分发在进入了算法时代之后,许多以前不存在或者不突出的问题都成了人们关注的焦点摆在了大众面前。“信息茧房”便是一个突出的例子。2006年,凯斯·桑斯坦在其著作《信息乌托邦:众人如何生产知识》中提出了著名的“信息茧房”的比喻,其内涵是:“我们(信息传播中用户)只关注自己选择的内容、使自己感到安慰和愉悦的传播世界,如同置身于蚕茧般作茧自缚。”[9]
桑斯坦提到,传媒与科技专家尼古拉斯·尼葛洛庞帝提出了“我的日报”就是“信息茧房”效应的预言:每个人都可以根据自己的喜好、兴趣和观点来选择自己喜欢的内容,来组成一份完全个人化的报纸。如今,互联网用户已经实现了在海量信息中以个人喜好选择性地接触感兴趣的信息,排斥与筛出所有不喜欢的东西,选择最适合自己品位的内容,但长此以往也无法避免“信息茧房”的形成。桑斯坦认为:“对于生活在信息茧房里的领导人和其他人而言,一个安慰是这是一个温暖、友好的地方,每个人都分享着我们的观点。但是重大的错误就是我们舒适的代价。对于私人和公共机构而言,茧房可以变成可怕的梦魇。”[10]实际的使用经验也反映出,生活在“信息茧房”里的用户,虽然面对着互联网带来的海量信息,但在阅读经验逐渐积累的过程当中,在算法的“控制”下,仅会“选择”符合自身观点的信息内容进行浏览,对自己已有的价值观重复加固,结果或许会失去多元化、批判性思考的能力。
有研究者在谈到算法新闻时,认为“算法新闻的‘回音室效应’本质上是算法工具对用户自我的囚禁,在‘信息茧房’中,算法工具生成的新闻文本之于用户而言是一种‘绝似符号’”[11]。在表意活动中,对象不在场才需要符号。因此,符号与对象之间需要存在一定的表意距离。当这个距离极短甚至趋向重叠之时,这样的符号就是“绝似符号”。算法技术形成的“绝似符号”造就了一个封闭的系统,将用户作为主体的自我囚禁于其中。一个作者可以有不同的隐含作者,同样的一个读者也可以有不同的隐含读者。但用户在封闭系统中参与的叙述活动,始终无法摆脱过往已有经验的牢笼,主体意识中深层、潜在的自我被遮蔽。也就是说,潜在的隐含读者被禁锢甚至逐渐消失。算法技术形成的“绝似符号”文本填充进了用户的主体意识,抹杀了主体意识潜在的可能性,这样或许会导致主体自我符号表意能力的退化甚至消失。
文学理论认为,小说需要具备三种类型的文学趣味,以实现自身在读者中的价值,分别是认知的趣味、性质的趣味以及实践的趣味。认知的趣味指我们具有对某个事实真实的解释、真实的理由、真实的本源、真实的动因具有的强烈认知好奇心。性质的趣味指我们具有体验某种性质进一步发展的强烈愿望,也可以称为审美的趣味。实践的趣味指我们具有希望我们爱或恨、赞扬或讨厌的人们成功或失败的强烈愿望,也可以称为人性的趣味[6]139。基于此,在小说的创作中,作者需要尽量满足读者的这三种趣味。虽然各个叙述文本在满足读者这三种趣味上达到的程度不尽相同,但从作者的出发点来说,这三个方面都是需要尽量去实现的。
然而,在算法技术介入下的叙述文本,单一化了文本应该满足的用户的趣味。算法技术通过对用户行为和语义的分析,单方面对用户的需求做出了结论,也就是上文中曾提到的类隐含读者。叙述文本作为一个符号,用户作为符号接收者在对其进行解释时,是带着阅读期待参与其中的。在算法技术造就的封闭系统中,这样的阅读期待逐渐被压缩。但由于在互联网环境中,信息量足够充足,从表面上看,数量的庞杂似乎掩盖了类型的不足。
当然,算法技术也在不断地完善与优化。同时,使用算法技术的平台也逐渐采取算法多元化的方法来改进“信息茧房”的困境。不过,除依托于推动技术的发展之外,人作为叙述活动的主体,应当在互联网环境喷射的迷雾中,清醒地认识到自身的主体性,提高自身的媒介素养。在面对算法时代互联网平台海量叙述文本时,唤醒自身作为读者可能存在的隐含读者,尽可能地与符号文本保持表意距离,避免落入卡西尔所说的“文化之悲剧”当中。