算法推荐争议
2017-10-16王敬恺
王敬恺
算法推荐是在对海量用户行为的数据分析与挖掘基础上,利用计算机通过数学算法,推测出用户可能喜欢的东西。
目前,算法推荐大致可分为三类:
基于内容。理论依据主要来自于信息检索和信息过滤,根据用户过去的浏览记录向用户推荐其没有接触过的推荐项。
基于知识。某种程度上可以看成是一种推理技术,它不是建立在用户需要和偏好基础上推荐的,可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。
基于协同过滤。它是基于这样的假设:“跟你喜好相似的人喜欢的东西,你也很有可能喜欢”。所以基于用户的协同过滤主要的任务就是找出用户的最近“邻居”,从而根据最近“邻居”的喜好做出未知项的评分预测。
算法内容平台的推荐个性化主要表现在:一是针对审核通过的文章,智能推荐引擎会根据内容质量、内容特征、首发情况、互动情况、媒体的历史表现、媒体订阅情况,为文章找到感兴趣的读者并推荐;二是针对读者,根据其阅读历史、地理信息、搜索關键词、阅读习惯等进行推荐。
以今日头条、一点资讯为代表的智能新闻客户端,凭借强大的算法、先进的数据抓取技术,能够精准分析并解读用户的阅读习惯和兴趣,从而为用户提供量身定制的新闻产品,满足个性化需求。
但随之带来的色情、谣言、夸张广告等低俗内容泛滥,这还只是算法推荐新闻平台在内容分发方面所面临的难题之一。
自9月18日起,人民网连续三天推出三篇评论文章批评以今日头条为代表的新闻算法推荐,分别为《不能让算法决定内容》、《别被算法困在“信息茧房”》、《警惕算法走向创新的反面》。人民网在批评算法推荐的文章中,形象举例称:有位网友无意点击了一条关于花圈的消息,结果今日头条就连续推送丧葬用品信息,令人不堪其扰。
归纳起来,公众对算法推荐新闻争议主要集中在三点:
首先,技术、代码、算法替代了传统内容分发过程中专门把关内容的编辑。单一的标准不仅容易忽视优质内容更为丰富的面向和维度,也增加了把关内容产品的难度和成本。
其次,对于拥有强大算法和技术支撑的信息平台,一心“取悦”用户远远不够,更要自觉执行有关政策法规,不能有侥幸心理,任凭暴力、色情等不良信息泛滥。
第三,智能信息平台带来的最大问题,不仅是侵权,而是可能走向创新的反面,甚至破坏创新的原动力。
9月21日下午,今日头条正式回应,称理解媒体的忧虑,将正视机器学习技术目前整体发展的不足,勉力改进。此前,今日头条一直表示重视提高分发效率、满足用户的信息需求。创始人张一鸣接受《财经》记者采访时也曾说,企业和媒体的区别在于媒体是要有价值观的,它要教育人、输出主张,而头条不提倡。因为它不是媒体,更关注信息的吞吐量和信息的多元。endprint