带着偏见看推荐
2018-10-31闫泽华
推荐语:
今天,至少有4亿中国人通过算法获取内容,国内创作者群体半数以上流量来自内容推荐系统。通过算法实现的推荐技术基于用户历史数据和行为,推测用户意图,推荐合适的商品和内容给终端用户,显著提高了用户的点击率和留存率。未来,算法推荐可能会成为互联网公司的标配。对于互联网内容产业相关从业者来说,了解算法与内容推荐系统势在必行。
书摘:带着偏见看推荐
推荐其实不是一个新事物,它早已被应用在了如淘宝购物推荐、豆瓣电影推荐、点评美食推荐、携程差旅推荐等不同的场景中,以提升服务质量、优化系统效率。
当推荐技术应用于内容分发领域后,在已有传统媒体、门户网站仍然占据重要分发位置的情况下,质疑的声浪频传。如果你经历过PC时代,也许会觉得这一幕似曾相识:当年,传统媒体对门户发出过质疑声,中心化的门户模式对去中心化的微博模式同样质疑过。只是岁月轮回,昨日的挑战者成了今日的卫道士,何其唏嘘。
信息茧房
当内容分发全面进入推荐分发时代,对这一分发模式的质疑也就越来越多,很多人站出来号召大家要一起戳破“算法的泡泡”。
一种普遍观点是:机器算法主导的精准分发,在提升阅读体验的同时,也极易导致由信息收窄带来的一叶障目,即在算法分发下,用户将深陷信息茧房当中。
哈佛大学法学院教授、美国前总统奥巴马的法律顾问凯斯·桑斯坦在其2006年的著作《信息乌托邦——众人如何生产知识》中提出了“信息茧房”这一概念。通过对互联网的考察,桑斯坦指出,在信息传播中,由于公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的领域,久而久之,会将自身桎梏于像蚕茧一般的“茧房”中。这顶“信息茧房”的帽子,随着信息流量分发的迁移,被扣到了不同的内容分发服务头上:
在国外,先后被吐槽的是谷歌的个性化搜索结果和脸谱网的信息流服务。
在国内,早在2012年就有人吐槽微博是“信息茧房”,如今吐槽的对象又变成了机器推荐分发。
当信息生产的门槛不断降低造成内容量的大繁荣,当信息消费者的选择权越来越大、越来越能够主动选择而非被动接受的时候,令人担忧的“信息茧房”就会被越来越多地提及。
然而,过滤你的并不是算法泡泡。
在纸媒时代,当用户从特定的媒体人、特定的媒体刊物处获取信息的时候,其信息获取方式不就是纸媒版的订阅关系分发吗?各家纸媒有自己的题材偏好和内容风格,不也构成了一个“茧房”吗?当面对报亭中琳琅满目的刊物和邮局的订阅表时,用户的主动选择便构成了他的认知世界。
还记得那本月发行量逾700万册的杂志——《知音》吗?其刊载的内容正是今天饱受诟病的典型标题党样例:《风之谷啊我的妹妹,哥哥的未来献给你》《再大的恨放下吧,唤醒前夫赢得亲情一片天》。在10年前,为什么会有那么多人消费这本杂志,在10年后的今天,就为什么会有同样规模的人在消费着类似内容。从用户需求的角度看,这些内容符合大众用户偏好、可以满足他们打发时间的需求,高阅读量就是用户主动选择的结果。
内容作为一种消费品,每个人都有选择消费途径和消费内容的权利。无论是纸媒还是网媒,只要有足够大的候选集和主动选择权,用户就一定会选择自己更为偏好的信息载体和信息源。从内容匮乏到内容繁荣,从中心化一统到垂直化聚群,用户的选择更贴近自身喜好是不可逆转的趋势。
那些表示担心的人,本身就是多源信息的消费者,希望看到多源信息的渴望胜过了他们看到不感兴趣内容的不悦。而不担心的人,本身就不曾有信息多样性的焦虑,乐得在自己的小圈圈里打转。
进一步,对那些担心的人来说:他们跳得出算法分发,也跳不出社交关系分发;跳得出社交关系分发,也跳不出自己的认知选择边界。“茧房”始终存在,真正过滤你的,是你的认知泡泡。
在这种情况下,将“信息茧房”归罪于分发模式更像是因失语而产生的牢骚。与其吐槽分发模式,不如考虑在新的模式下如何优化;与其大声疾呼内容分发服务商的道德义务,不如将其归结为内容服务商的利益诉求。
“信息茧房”并不是内容服务商的诉求,“用户茧房”才是其诉求。为保证用户更好地长期留存,内容服务商就势必需要不断探索用户的内容兴趣偏好、了解用户的观点偏好:
你以为只给用户展示他喜欢的类目就够了?那你错过的就是拓展用户兴趣认知的机会。只有给用户展示多元化的内容,才能够让他消费更多内容,停留更长时间。
你以为只给用户推荐他偏好的观点就够了?那你就可能错过用户间的讨论和互动碰撞。给用户展示多元化甚至有冲突的观点,对评论的刺激作用是显著的。而在多元化的讨论之后,内容丰富的评论区也具有了可以消费的价值。
如果你的認知还停留在算法分发只会给你推荐感兴趣的内容上,那你的认知泡泡,也该戳一戳了。
推荐会导致Low?
对内容推荐的又一个常见误解是:推荐系统会趋向于低质量和Low(低格调)的内容。
什么样的内容是质量好的内容?对于食品,我们有诸如保质期、配料成分表、制作工艺等方面的要求;对于衣物,我们有型号、材质、洗涤方式的规范;对于内容,这种非标准化的手工产品,是否也存在一套类似ISO9001的标准可以衡量呢?
大众说好,专家也说好,“叫好叫座”大概是好内容最理想的终局。但在达成“好”的共识之后,进一步的问题是:如果一篇内容专家不叫好,这样的内容是否应该被过滤掉呢?
未必。
比如,明明自己觉得还不错的电影,为什么在影评人眼里变得满目疮痍,充满各种各样的问题呢?自己觉得还不错的桥段,在影评人眼中却成了陈词滥调,缺乏创新与深度。
在猫眼电影工作的朋友的一番解释让我释然:“你是观众视角,影评人是专业视角。专业的判断跟大众的喜好通常会存在认知背景的偏差,在技法上有待改进的内容并不意味着缺乏受众。一如范雨素的爆红,从文字技法上看,她的内容一定是有缺失的,但她对生活的记录触动了许多人的心。”
(本文选自闫泽华《内容算法:把内容变成价值的效率系统》一书,内容有删减。)
编辑:牛绮思