APP下载

个性化新闻推荐的算法把关研究

2024-04-18范蕾蕾

新闻研究导刊 2024年5期
关键词:信息茧房黑箱操作

摘要:随着互联网技术的发展,新闻媒体的传播方式和用户的阅读习惯都发生了巨大的变化。个性化新闻推荐指利用大数据分析和人工智能技术,根据用户的个人特征、兴趣偏好、浏览历史等数据,为不同用户推荐不同的新闻内容,使新闻信息服务精准化和个性化。相较于传统的人工推荐或统一推荐,个性化新闻推荐更加准确、主动、智能化。文章介绍个性化新闻推荐的算法基础,包括协同过滤算法、内容推荐算法和混合推荐算法,并分析各算法的工作原理,发现协同过滤依赖用户行为数据,内容推荐依赖新闻文本数据,但是两者都存在冷启动和稀疏性问题,因此混合推荐算法应运而生。文章指出个性化新闻推荐面临的三大挑战:用户隐私与数据安全问题、信息茧房效应、“黑箱”操作与透明度问题。大数据时代,用户信息高度易感,算法过滤容易导致信息同质化,“黑箱”操作也容易引发用户质疑。对此,文章提出优化策略:引入多样性指标,增强结果差异性;健全用户反馈机制,持续优化算法;提高算法透明度和可解释性,增强用户信任感。具体做法包括:调整相似度计算、设置反馈入口、采用可视化技术等。文章旨在为个性化新闻推荐提供借鉴和参考。

关键词:个性化新闻推荐;算法把关;信息茧房;“黑箱”操作;优化策略

中图分类号:G210.7 文献标志码:A 文章编号:1674-8883(2024)05-0005-03

基金项目:本论文为2018年度江西科技学院人文社科项目“个性化新闻推荐的算法把关研究”主要成果,项目编号:RW1808;2023年度南昌市“十四五”社科规划课题“网络治理视域下南昌县级融媒体参与社会基层治理研究”阶段性成果,项目编号:XW202304

一、引言

新聞是人类社会的重要信息源,它不仅能够反映社会的现状和变化,还能够影响人们的认知和行为。随着互联网技术的发展,新闻媒体的传播方式和用户的阅读习惯都发生了巨大的变化。根据中国互联网络信息中心(CNNIC)发布的第52次《中国互联网络发展状况统计报告》,截至2023年6月,我国网民规模达10.79亿人,较2022年12月增长1109万人,互联网普及率达76.4%。网民规模不断增长的同时,网民对新闻信息的需求也越来越多样化和个性化,他们希望根据自己的兴趣偏好,获取更加符合自己需求的新闻内容[1]。

个性化新闻是指通过算法把关、个性化推荐、协同过滤等方式推送给受众的新闻内容。平台结合大数据对用户阅读习惯的捕捉,对用户阅读兴趣进行预测和推断,为其推送更符合需求的新闻内容。简而言之,个性化新闻就是基于“用户洞察”的个性化信息智能匹配,根据个性化需求聚合相关的信息和应用,以满足用户需求的个性化内容。因此,个性化需求改变了传统媒体时代用户主动寻找信息的情况,平台利用推荐的形式为内容找到与其相匹配的用户。

为了满足网民的个性化新闻需求,各大新闻平台纷纷采用个性化新闻推荐系统,其能有效解决信息过载的问题,提高用户的满意度和忠诚度,延长用户的停留时间,从而为新闻平台带来更多的流量和收益。根据中华全国新闻工作者协会发布的《中国新闻事业发展报告》,2022年,中国传媒产业规模呈恢复性增长态势,总产值达29710.3亿元,增长率从上一年的8.40%提升至13.54%,恢复到2019年两位数的增长水平。当前,个性化新闻推荐已经成为新闻资讯行业的主流模式[2],但个性化新闻推荐系统也面临一些挑战。因此,个性化新闻推荐的算法把关显得尤为重要。

二、个性化新闻推荐的算法基础

(一)协同过滤算法

协同过滤算法是个性化推荐领域的经典方法之一。它基于用户的历史行为数据,通过计算用户之间的相似性来预测用户的兴趣偏好。在新闻推荐中,协同过滤算法能够发现具有相似阅读习惯的用户群体,并根据这些相似用户的喜好为用户推荐新闻内容。其优点在于能够自动发现用户之间的关联,不需要对新闻内容进行深入分析。然而,协同过滤算法也面临一些挑战,如冷启动问题和数据稀疏性问题。冷启动问题指对新用户或者新加入的新闻,由于缺乏足够的历史数据,算法难以准确推荐。数据稀疏性问题指由于每个用户阅读过的新闻只占很小一部分,“用户—新闻”矩阵非常稀疏,影响了推荐的准确性[3]。

(二)内容推荐算法

与协同过滤算法不同,内容推荐算法更注重对新闻内容本身的分析。它通过分析新闻文本的特征和用户的历史偏好,为用户推荐与其兴趣相关的新闻。内容推荐算法通常基于自然语言处理和机器学习技术,能够深入挖掘新闻内容的语义信息,从而更准确地理解用户的兴趣和需求[4]。在内容推荐算法中,关键词提取、主题模型、深度学习等技术被广泛应用。例如,通过提取新闻的关键词和主题信息,可以构建用户的兴趣模型;利用深度学习技术对新闻文本进行深度学习,可以捕捉更丰富的语义信息。这些技术的应用使得内容推荐算法在理解用户兴趣和需求方面取得了显著的效果。然而,内容推荐算法也存在一定的局限性。它对新闻文本的依赖性较强,如果新闻文本的质量不高或者存在偏见,推荐的准确性会受到影响[5]。

(三)混合推荐算法

为了充分发挥协同过滤和内容推荐的优势并克服各自的局限性,研究者提出了混合推荐算法。混合推荐算法结合协同过滤和内容推荐的优点,通过融合多种推荐策略来提高推荐的准确性和多样性。在混合推荐算法中,常用的融合方法包括加权融合、串联融合和并联融合等,其可以根据具体的应用场景和需求选择不同的融合方式和权重分配策略,从而使新闻推荐服务更加个性化[6]。

三、个性化新闻推荐算法面临的挑战

(一)数据隐私与安全问题

个性化新闻推荐的核心在于对用户数据进行深入分析和挖掘。用户的浏览历史、阅读习惯、兴趣偏好等信息是推荐算法进行精准推送的关键。然而,在收集、存储和使用数据的过程中存在隐私和安全问题。近年来,大型互联网公司数据泄露事件频发,引发了公众对个人信息安全的担忧。例如,犯罪分子通过自己开发软件爬取淘宝客户的数字ID、昵称、手机号码等信息近12亿条,导致大量用户信息被非法获取并用于恶意营销,严重侵犯了用户的合法权益[7]。因此,如何在确保推荐准确性的同时保护用户隐私,成为个性化新闻推荐算法亟待解决的问题。

(二)信息茧房效应

信息茧房效应是指用户在接收信息时,由于算法的过滤和推荐,逐渐陷入信息闭环,导致视野受限、思维僵化。个性化新闻推荐算法在提供精准内容的同时,也可能加剧这一效应[8]。近日,中国青年报社社会调查中心联合问卷网,对1501名受访者进行的一项调查显示,62.2%的受访者认为,“大数据+算法”的精准推送方式,让自己陷入了信息茧房。长期来看,这不仅会限制用户的认知范围,还可能引发社会偏见和分裂。因此,个性化新闻推荐算法需要在追求精准性的同时,考虑信息的多样性和平衡性,以避免信息茧房效应带来的负面影响。

(三)“黑箱”操作与透明度问题

个性化新闻推荐算法的决策过程对大多数用户来说是“黑箱”操作。用户只能看到推荐的结果,而无法了解算法是如何做出推荐决策的。这种缺乏透明度的做法容易引发用户对算法公平性和可信度的质疑。例如,一些用户在多次收到与自己兴趣不符的新闻推荐后,怀疑算法存在偏见或错误。个性化新闻推荐算法需要提高决策过程的透明度,让用户了解算法是如何工作的以及为何会推荐某些内容[9]。这可以通过提供详细的推荐解释、展示推荐依据的权重分配等方式来实现,从而提高用户对算法的信任度和接受度。

四、优化个性化新闻推荐算法的策略

(一)引入多样性指标

为解决信息茧房问题,个性化新闻推荐算法需要引入多样性指标。多样性指标能够衡量推荐列表中新闻的来源、主题和观点的多样性,从而鼓励算法为用户提供更加多元化的内容。提升新闻的多样性,可以帮助用户打破信息茧房,使他们接触到更广泛的信息和观点,进而提升他们的认知水平和思维能力[10]。

在实际应用中,可以通过调整推荐算法中的相似度计算方法、增加对冷门新闻的推荐权重等手段,实现对多样性指标的引入。例如,澎湃新闻平台在其算法中引入了基于主题模型的多样性指标,通过计算新闻主题的相似度,确保推荐列表中的新闻具有多样性。该策略实施后,用户对该平台的满意度提高,黏性增强[11]。

(二)健全用户反馈机制

用户反馈是个性化新闻推荐算法优化的重要依据。收集用户对推荐新闻的满意度、点击率、阅读时长等数据,可以了解用户对推荐内容的偏好和需求,进而对算法进行针对性的优化。同时,用户反馈还可以帮助平台发现算法中存在的问题和偏差,及时进行修正和调整。要健全用户反馈机制,可以在新闻推荐平台上设置明确的反馈入口和选项,鼓励用户提供真实的反馈意见[12]。此外,还可以采用激励机制,如给予积分奖励、提升用户等级等,鼓励用户参与反馈[13]。例如,腾讯新闻在其应用中设置了用户满意度调查功能,通过收集用户对推荐新闻的评分和评论了解用户的反馈意见。该平台还定期对用户反馈进行分析和总结,将结果应用于算法优化中,从而不断提升推荐质量,优化用户体验[14]。

(三)提高算法透明度与可解释性

提高算法的透明度和可解釋性,是提高用户对个性化新闻推荐算法信任度的重要途径。透明度要求算法能够向用户展示其决策过程和依据,而可解释性则要求算法能够提供易于理解的决策理由和依据[15]。提高算法的透明度和可解释性,可以让用户更加了解算法的运作方式和决策依据,从而提高他们对算法的信任度和接受度。在实际操作中,可以通过可视化技术向用户展示推荐算法的决策过程,包括新闻筛选、排序、推荐等环节的具体操作。还可以在推荐结果中附带相应的解释信息,如基于用户的哪些历史行为和兴趣偏好进行了推荐、推荐的新闻与用户的哪些需求相关等。例如,搜狐新闻在其应用中增加了“为什么推荐”功能,以简明扼要的文字向用户解释每条新闻推荐的依据,从而提高用户对算法的信任度和满意度。

五、结语

个性化新闻推荐的发展充分体现了互联网技术是如何变革传统新闻业,使新闻内容的推送方式从被动转向主动,从粗放转向精准的。它带来的定制化新闻体验,无疑更贴近当代公众的信息需求。然而,也要清醒地看到,个性化新闻推荐算法的应用引发了一些负面问题,数据隐私、信息茧房、算法不透明等风险日渐凸显。如果任由其演化,可能导致公共讨论碎片化和观点极端化。因此,有必要把双刃剑用好,防止其伤人。在继续增强算法效果的同时,要注重用户权益的保护、结果的多元化和过程的透明化,还要完善监管,建立第三方审计与评估体系,在技术创新与社会责任之间找到平衡,提升算法的可解释性、公平性与安全性,让其健康可持续地服务用户和社会。

参考文献:

[1] 熊亚光.新闻个性化推荐的影响因素分析[J].传媒论坛,2023,6(23):27-29.

[2] 王茹楠.电视新闻节目主持人实现个性化表达的路径[J].西部广播电视,2023,44(16):188-190.

[3] 孟祥福,霍红锦,张霄雁,等.个性化新闻推荐方法研究综述[J].计算机科学与探索,2023,17(12):2840-2860.

[4] 李云霞,李伟.基于用户角度的新闻内容个性化推荐研究[J].新闻研究导刊,2023,14(7):87-89.

[5] 周帅,都云程,张仰森.个性化新闻推荐研究进展[J].计算机技术与发展,2023,33(2):1-8.

[6] 徐茜茜.融合传播下时政新闻“语言+视觉+文本”的个性化解读[J].采写编,2023(1):6-8.

[7] 喻玲.个性化推荐、公共性贬损与数字新闻市场反垄断[J].法学,2022(11):154-173.

[8] 夏艳.新闻评论的个性化表达探讨[J].西部广播电视,2022,43(19):58-60.

[9] 赵怀智.个性化新闻的推送:弊端及解决措施[J].湖北科技学院学报,2022,42(4):90-96.

[10] 胡箐妍.个性化新闻推荐技术研究[J].中国传媒科技,2022(7):137-139,143.

[11] 公沛然.个性化新闻推送的影响[J].中国地市报人,2022(6):68-69.

[12] 蒲岍岍,雷航,李贞昊,等.增强列表信息和用户兴趣的个性化新闻推荐算法[J].计算机科学,2022,49(6):142-148.

[13] 杨浩琛.新闻评论的个性化表达探讨[J].新闻传播,2022(3):101-102.

[14] 牛琛琛.个性化新闻推送对新闻业务链的重塑[J].西部广播电视,2021,42(20):16-18.

[15] 丁正祁,彭余辉,孙刚.基于改进LDA主题模型的个性化新闻推荐算法[J].赤峰学院学报(自然科学版),2021,37(6):28-32.

作者简介 范蕾蕾,讲师,研究方向:新媒体传播。

猜你喜欢

信息茧房黑箱操作
拒绝黑箱
失踪的黑箱
微时代大学生“信息茧房”效应干预
社交媒体时代下新闻产需变化刍议
“信息茧房”禁锢了我们的双眼
“信息茧房”禁锢了我们的双眼(观察家)
关于数控机床操作中防碰撞措施的探讨及分析
泌尿外科手术及操作致输尿管损伤临床分析
浅谈低年级数学教学中的操作能力
这道电学黑箱题有误吗?