社交的延伸:新闻推荐算法的进化与反思
2023-02-14于严舒王鹏
于严舒 王鹏
摘要:文章应用保罗·莱文森的媒介补偿理论,站在社交补偿的视角,发现算法推荐系统在不同时期以不同的媒介技术融入社交媒体,作为个体在线社交的桥梁,并在一定程度上对个体的社交进行补偿。文章采用文献分析法与历史观察法,对新闻推荐算法的进化路程进行回溯与归纳得出:在算法1.0时代,基于内容的推荐算法,对用户的社交能力完善进行生理上的补偿;在算法2.0时代,基于协同过滤的算法,对用户的社交孤独趋避进行心理上的补偿;在算法3.0时代,基于隐私保护的推荐算法,可以对用户的社交安全焦虑进行防御型补偿。文章以技术迭代为主要逻辑,阐述算法在技术迭代中对自身进行补偿,探讨算法在进化过程中是如何对用户的社交进行补偿的,并对新闻推荐算法进行理论上的补充。
关键词:算法进化;媒介补偿;社交延伸;内容推荐;协同过滤;隐私保护
中图分类号:G206 文献标志码:A 文章编号:1674-8883(2023)01-0015-04
一、引言
21世纪是信息化时代,每天都会产生海量信息,这造成了严重的信息过载与信息爆炸问题。学者詹姆斯·格雷克认为,信息负载和信息处理之间的关系,在坐标轴中呈现出一个倒写“U”形的曲线。信息数量在人类信息处理范围内是有利于信息传播以及能够提升人类认知的,但是随着信息数量的持续增加,如果超出这个范围,就会产生一定程度上的消极作用。所以要从庞杂的新闻信息中,获取用户真正想要了解和关注的信息是非常困难的,为了有效解决“信息过载”问题,让用户轻而易举地获取到对自己有价值的信息,启动运用算法搭建的新闻推荐系统就成了解决这一问题的关键法宝。将算法机制巧妙而又有效地融入信息传播中,提升整个信息在采集、生产、分发和反馈之间的流程运转,全方位改变信息传播生态圈,进一步提升用户接受信息的体验。
人们对于信息传播的积极探求,才是发展新信息媒介技术的主要原动力,故保罗·莱文森提出了关于“补偿性媒介”的理念。
他认为,媒介的发展是越来越人性化的过程,新媒介是对旧媒介的补偿,补偿性作用不仅仅只存在于一个媒介产品的生产本身,更存在于各种媒介产品与其他媒介组合之中,任何一种后继发展的、新生的媒介都是对过去某一种媒介或某一种媒介的先天不足导致的某些功能缺憾的合理补偿和补救[1]。在保罗·莱文森的“补偿性媒介”这一理论的基础上,学者罗杰·菲德勒提出新旧媒介之间存在一定的连贯性和继承性,旧的媒介会在新媒介技术的辅助下继续进化和升级,以适应人类的信息需求。
国内的学者在梳理“补偿性媒介”理论后则认为,补偿性媒介一方面是功能性的补偿,另一方面是对人们生理需求和心理需求的补偿。
在信息媒介方式的选择上,个人的主观能动性又有所提高。人们不仅在线下进行面对面的沟通,在媒介技术驱动与互联网的飞速发展下,还可以选择在线上进行交流互动,从而满足在线下无法进行“正常”社交活动的需求。
“社交补偿”假说认为,在线下面对面交流中存在困难的人们会通过线上的方式弥补线下的缺失[2]。站在社交补偿的视角来说,在面对面的社交活动中,人们的语言、语音、语调、身体语言和面部表情都会向外传递信息,由于不同个体在编码、解码与释码方式上有主观上的不同认知,就非常容易造成信息的误读。这对患有社交焦虑症或者社交恐惧症的人群来说,是非常不愿面对的社交问题。
所以研究者几乎一致研究认为,当社交焦虑水平较高时,个体更容易选择使用虚拟现实网络信息工具去进行主动交流,并建立亲密情感纽带和关系,试图以此维持较稳定的人际关系。
这样的线上社交方式在虚拟现实网络世界中,可以自觉避免诸如眼神上的肢体接触、对话和肢体表情外露等社交符号特征,同时还可以主动控制发送的信息内容,并可以用表情包、图片、照片等表现形式去表达个体的内心情感。这使用户不再担忧自己在行为举止上的不合适,而造成对方的误解。反过来也有助于缓解网络个体的焦虑感,能够有效营造出一种相对更健康自然、舒适而和谐有序的网络社交环境。
与此同时,在信息媒介类型的选择上,人们也具有主观能动性。新媒介的诞生是为了能够更好地满足现代人的信息需求,用户可以使用媒介来克服个人特质、行为导向、时间和空间等现实,并弥补人们在现实世界与线下活动中难以被满足的诉求。根据保罗·莱文森提出的“补偿性媒介”相关理论,通过对算法变迁的研究发现,算法技术的每一次更新迭代都是基于现实需要对上一代的功能补偿,是人类在媒介演化中不断地理性选择。算法推荐系统也在不同时期以不同的媒介技术融入社交媒体中,为个体在线社交的进行提供了方法,对个体的社交进行了补偿。
由此,本文在过往的基础上继续研究,明确在算法发展的三个时间段中,分别给予了用户怎样的补偿?以保罗·莱文森的媒介补偿理论为理论支撑,站在社交补偿的视角,结合算法推荐的进化,深入探讨在媒介补偿机制中,人们如何跟随算法的迭代进行社交的延伸与对自我的社交行为进行补偿?
二、算法1.0基于内容的推荐:社交能力完善的生理补偿
在算法1.0时期,新闻传播领域主要运用基于内容推荐的算法。基于内容推荐的算法是一种非常经典且十分重要的推荐思路,也是在日常生活中最普及的推荐算法。简单来说,基于内容推荐的算法就是依据用户过往喜好的内容为参照系,为用户推荐其喜欢的内容。在这种以内容相似度的度量为核心的算法类别中,如何进行相似度计算是最重要的环节。主要经过三个流程:第一步,提取文章内容中能够代表文章属性的关键词,从而使一篇抽象的文章被具体的一个向量所表示,即内容的内容向;第二步,提取用户过往喜欢内容的阅读偏好,形成用户喜好的特征向量;第三步,将内容的特征向量与用户喜好的特征向量进行比较,再进行相似度计算,然后取相似度最大的前多个内容,作为推荐结果分发到用户的推荐列表中去[3]。以上三個流程基本为物品表示、用户偏好学习、生成推荐列表三个方面的实时操作。
如今新闻门类的线上版体现了基于内容的推荐算法对用户社交能力的补偿。在过去,人们仅仅在线下阅读报纸,对于阅读到的内容无法实时与他人分享与交流。但随着互联网传播技术的发展,人们有了更多的消遣与阅读新闻的方式,大众传播时代,传统的报纸行业逐渐没落,报纸行业必须对自身进行革新,改变传统报纸行业的新闻分发流程,在原本的新闻制作与分发上进行创新,使新闻分布方式发生转变。
例如,人民网、央视新闻、南方周末等都开发了线上阅读模式。《南方周末》上线了电子版,根据用户过往浏览过的新闻内容推送带有相同标签的新的新闻内容,并在新的新闻内容的下方设置了评论区。这对因算法推荐系统而阅读到同一条新闻的用户来说,即使人分散在天南海北,互相见不到面,也可以就相同的、感兴趣的新闻内容进行讨论与交流。
新闻发布平台不再只是单纯地提供内容,而是以基于内容的新闻推荐算法为技术内核,成长为以新闻内容为核心的社交平台。这在客观上扩大了用户进行社交活动时的渠道选择,为用户的社交行为提供了多样化的场景。补偿性地建立了用户与其他主体社交的途径,并使用户能直接满足自身的社交需求,对自我的社交能力完善进行了生理上的补偿。
三、算法2.0协同过滤:社交孤独趋避的心理补偿
在新闻推荐算法发展的2.0时代,从之前基于内容的推荐算法转换为完全以用户行为为信息分析的协同过滤算法。简单来说,协同信息过滤算法就是一种将群体智慧作为基本分析思想,即通过群体得到统计结果的结论。根据一些兴趣相投、拥有共同使用经验的特定群体成员的行为喜好来预测下一个特定用户最感兴趣的内容信息。群体是人类应对自然和社会挑战、推动社会发展与进步的选择,而群体的智慧也有着至关重要的作用。
随着协同过滤算法的更新迭代,又可以拆分为基于用户数据的协同过滤、基于项目信息的协同过滤以及基于模型信息的协同过滤。这种基于用户数据的协同过滤算法框架,可以被简单概括为“人以群分”,通过聚类分析找到与目标用户内容消费行为相似度较高的一类用户,将行为类似的用户编为一个隐性阅读兴趣小组,并向目标用户推荐此类用户感兴趣但未被目标用户消费过的内容。
基于物品的协同过滤算法,根据目标用户的内容偏好去计算,即为“物以类聚”,自动推荐与之相似程度高的内容[4]。内容之间的相似性计算依据不再是内容自身的特有属性,而是用户对其的反馈。基于模型信息的协同算法推荐技术则是指利用用户行为偏好的画像来训练协同算法模型,以实现实时预测用户点击率行为的目的。
算法2.0时期,人们会基于自身的兴趣爱好拓展自己的社交圈。线下社交用户除了在互联网上保持原有的熟人社交以外,同时还会以兴趣为纽带,在互联网平台与陌生人开展线上社交。“陌生人们”凭借着相同喜好在以互联网为媒介的平台中建立“同好会”,因此,协同过滤算法在互联网中就成了文化群体在社交网络中找到彼此的桥梁。
有研究者在研究社交行为、孤独感和现代大众媒体使用等三个问题之间存在的复杂关系时,提出了所谓的“补偿假说”。研究者认为,媒介常常被人用来作为补偿社会人际关系种种不足的工具,而媒介也更容易被获得。所以该研究中媒介所能够补偿到的主要是人类现实生活场景中因为缺乏社交行为而产生的孤独感。而另一些研究者则认为用户使用媒介克服时间、空间、个人特质、行为倾向等限制,在线上弥补线下活动中个人难以满足的交友诉求。
网易云音乐于2013年上线,是以歌单为核心结构的音乐类应用软件。网易云音乐的“每日推荐”和“推荐歌单”中都运用了协同过滤推荐算法,给用户推荐“下一首歌曲”。那么又是如何做到用户社交的呢?
在网易云音乐初上线的时候,就提出了“音乐社交”的概念,将自己定位成具有社交媒体和音乐平台双重性质的音乐类应用软件。网易云音乐在提供给用户海量的高品质音乐资源的同时,通过感性的包装和情怀的渲染,引导用户在音乐播放界面进行评论。用户在使用网易云音乐时,可以边听歌边在界面中与其他用户交流与讨论,而这些用户正是因为协同过滤的推荐算法而收听了同一首歌,他们欣赏同一首歌就好比“志同道合”,这就像是将本应该在线下互动的“音乐会”搬到了线上的音乐平台。
“音乐会”中的成员因为相似的审美、兴趣甚至价值观而进入同一个空间,进行交流与自我表达。用户在音乐社交模式下通过彼此的情感投射来完成自我身份认同的构建,并在音乐的情感连带下实现了虚拟在场,与陌生人建立起非现实的“亲密关系”。
网易云音乐在虚拟网络空间中的社交功能很好地缓解了用户的孤独感和疏离感,让更多的用户在参与音乐欣赏和分享的同时,也因为该应用软件带有社交属性的互动功能,而在线上对线下的社交孤独进行了心理上的补偿[5]。
四、算法3.0隐私保护:社交安全焦虑的防御型补偿
到了算法3.0时期,由于以自动化、智能化、个性化为特点的推荐算法技术已经渗透到传播过程中的每一个环节中,整个虚拟网络世界已经成为由“数据+算法”驱动的算法环境。但是,在推荐算法技术为人们带来生活便利与提升社会运转速率的同时,问题也随之而来,最为突出的表现就是给个人的信息安全和隐私保护带来了一系列的挑戰。
算法公司在为特定的用户免费提供满足其隐私偏好需要的算法内容时,过多地获取了用户个人的相关信息数据与个人隐私,导致一些用户认为,自己会在大数据技术和算法公司面前变成信息完全公开的透明人,毫无任何个人的隐私自由可言。用户们更认为,基于大数据和推荐算法技术的各种社交网络、电商软件、视频平台、搜索推荐引擎等,在为自己提供生活便利的同时,也把自己当作流量,对作为用户的自己有所诉求。在为自己提供便利服务的时候,获取其他个人隐私信息。
而失去个人隐私这最后一片阵地,不仅给个人的生活造成干扰,还会给他人造成不良的影响。在电视剧《底线》的相关剧情中,麻醉科医生毕良因被人传播谣言,称其在给当红演奏家辛承轩的麻醉手术时出现了技术上的失误,导致辛承轩出现了严重的演出事故。疯狂而愤怒的粉丝们认为这是毕良的失职而造成的后果,就在网络上对毕良进行人肉搜索,导致毕良的个人隐私被泄露,个人生活和家庭不堪其扰,更有甚者到毕良的工作单位大吵大闹,影响其他患者正常就医。这一案例是根据真实事件改编,从中可以看出隐私泄露会给个人造成极大的负面影响。
也正因为个人隐私的重要性,所以用户对平台算法有了负面的看法,仿佛它永远带着原罪。所以在新的时代就有新的问题产生,用户如何在享受推荐算法带来的便利的同时,还能够让自己的隐私受到保护?
算法3.0时代是移动大数据快速获取的时代,人们往往需要更多有效的社交隐私保护措施,为个人社交网络安全提供有力的防御和武器,所以现在也衍生出更多隐私保护规则与约束机制。我国目前正在完善电子法律,其中主要包括《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《中华人民共和国数据安全法》等,明确出台了关于个人隐私保护的法条[6]。这表明了在大数据搜集个人信息的问题上,任何组织与个人都戴上了法律的镣铐,再也不能无所顾忌地随意收集、处理或泄露用户数据,否则将面临巨额罚款以及更严重的处罚。
所以,算法3.0时代是一个算法、代码与法律有序融合的时代。需要将现实的法律规范融入代码之中,每一个代码都带有法律规范;而不是代码只体现它的算法,代码必须把法律原理体现出来,这是目前行业内的首要任务。
當然,正因为人们对个人隐私保护的重视,所以科技的发展产生了隐私保护算法。隐私保护算法是基于同态加密、差分隐私、不经意传输三个底层密码学算法而产生的交叉融合技术。以应用领域的不同划分为三大路径,分别是以安全多方计算为代表的密码学路径、以可信任执行环境为代表的硬件路径和以联邦学习为代表的人工智能路径,其理念核心就在于有效管理隐私边界。
在以安全多方计算为代表的密码学路径中,安全指一切行为必须由使用者本人实施,他人无法代替完成;多方则指一个行为必须多个参与人共同完成。在该路径的运行流程中,用户可以安全地实施行为,不会担心他人冒充、代替和跨越自己,全方位地保护自己的信息安全不受侵犯。
在以可信任执行环境为代表的硬件路径中,采用软件硬件相结合的方式在中央处理器中构建安全区域,在本区域内确保内部加载的程序和数据得到保护,中央处理器则是可信执行控制单元被预置集成的商用CPU计算芯片,可信执行环境在基于硬件安全的CPU实现了基于内存隔离的安全计算,在这种情况下既能够保证计算效率也可以完成隐私保护的计算。联邦机器学习技术是一种机器学习、分布式存储和个人隐私数据保护三位一体的交叉整合技术,在目前以联邦机器学习技术为核心代表技术的新的人工智能路径指引下,原始的数据分布在全球不同规模的个人终端用户和企业中,在调取数据时,隐私保护技术在对训练过程的中间结果进行转化,以掩盖原始数据等方式防止数据泄露,增加安全性。
在如今的互联网中,除了法律的有效监管,各个互联网公司自觉提高隐私算法技术和改变营运流程外,互联网用户对个人隐私的关注程度也影响着个人对各种类型应用软件的接纳与持续使用的意愿,从心理和行为上都会强化对隐私风险的评估和应对。三方共同努力,对未来互联网的隐私保护算法技术的提高与发展,以及整个互联网生态都是百利而无一害的[7]。
五、结语
本研究站在社交补偿的视角,以算法的进化与更迭为技术背景,探讨了用户如何运用算法对自身进行补偿性的社交。算法1.0是基于内容推荐,用户通过该算法对自我进行关于社交能力完善的生理补偿,算法2.0是基于个人兴趣爱好的协同过滤,因拥有相同的兴趣爱好而形成群体,从而在用户因线下的社交孤独而趋避于线上的过程中对其心理进行了补偿。
因为之前的大数据获取了太多用户的个人信息以支持算法技术的运作,个人信息的泄露使得用户提出了在社交活动中是否安全的疑问,并由此产生了个人隐私泄露焦虑。这使用户对推荐算法技术产生了反抗情绪,做出了拒绝系统获取自己的信息甚至是学习自己的行为,但因为中国市场以电商为代表的数字经济呈爆发式发展,人们的生活已经无法避开大数据与互联网科学技术的裹挟,所以在算法3.0时代,国内外关于隐私保护的法规越发完善,互联网企业的决策者们也自觉对企业走向与运作做了新的规划与调整。
在技术层面,加强包括安全多方计算、可信任执行环境以及联邦学习等相关隐私保护技术,给予用户对隐私保护算法的信心,使用户在社交时不再担忧个人的隐私泄露问题。
纵观算法技术从1.0时期到3.0时期的变化,从对内容的计算到对用户的测量,再到对用户体验的关注,可以发现算法在进化过程中越来越偏向人性化的考量,算法从冰冷的机器与代码的产物,转为更多为用户的思考而思考。
在本身是代码组成的高精度科学技术之外,更考虑到它所服务的对象,也就是用户在使用算法时的真正需求到底是什么?用户使用推荐算法在互联网虚拟世界中进行社交活动,满足自我的需求,对自我情感进行补偿,所以无论技术如何进步与变革,推荐算法都将成为人们社交的延伸,它的落脚点和关注点最终还是会回到人的身上。
参考文献:
[1] 喻国明,徐子涵,李梓宾.“人体的延伸”:技术革命下身体的媒介化范式:基于补偿性媒介理论的思考[J].新闻爱好者,2021(8):11-13.
[2] 王可欣,史蒙苏.媒介补偿:理论溯源与研究路径[J].全球传媒学刊,2021,8(6):69-84.
[3] 俱鹤飞.新闻算法的进化与反思[J].青年记者,2019(3):39-40.
[4] 刘总真,张潇丹,郭涛,等.新闻推荐算法可信评价研究[J].信息安全学报,2021,6(5):156-168.
[5] 高子伦.在线音乐平台社交化研究[D].广州:暨南大学,2017
[6] 张文祥,杨林.新闻聚合平台的算法规制与隐私保护[J].现代传播(中国传媒大学报),2020,42(4):140-144,154.
[7] 陈梦如,李晓云.隐私关注对算法推荐类新闻App用户信息安全行为的影响研究[J].河南工业大学学报(社会科学版),2021,37(6):15-23.
作者简介 于严舒,硕士在读,研究方向:新媒体、网络舆情。 王鹏,博士在读,副教授,研究方向:新媒体、网络舆情。