APP下载

智能推荐在个人网盘内容生态中的应用

2022-10-13黄珊珊丁小波马嘉蔡茂贞

网络安全技术与应用 2022年8期
关键词:网盘权重标签

◆黄珊珊 丁小波 马嘉 蔡茂贞

(中移互联网有限公司 云产品事业部 广东 510600)

1 智能推荐技术介绍

智能推荐系统(图1)主要是基于内容广场的用户埋点信息,通过bi侧的数据治理聚合整理,来获取数据。内容广场给用户行为和对应标签埋点,埋点数据经过bi存储和归纳后,将数据以文本方式保存于服务器中,智能推荐系统将bi中的数据进行读取、入库、解析计算等操作,最终得到用户的标签喜好度排名,热点标签,相似用户等结果。内容广场根据需求,选择性的调用智能推荐系统接口,根据返回结果再配合一定的业务逻辑,查询内容,实现推荐的智能化。其中,智能推荐系统返回的用户喜好排名信息,在用户产生的数据量不足的情况下,会将热点标签和大网标签用于补充,同时智能推荐系统也提供了运营标签接口,用于管理人员人为的控制整体用户的推荐排行。

图1 智能推荐系统结构

智能推荐系统通过对用户的历史埋点信息分析计算,结合大网数据,热点数据,构建智能推荐计算法模型,生成用户画像,实现智能推荐能力。

2 智能推荐业务简介

推荐系统是能找出用户和物品之间联系的信息过滤系统,传统的技术实现方式表现为热门推荐和随机推荐,并不能满足网络条件下大规模的、精准的内容推荐需求。个人网盘内容开放平台的智能推荐系统将大网用户行为,域内用户行为和大数据推荐技术结合,可以满足内容知识,用户需求知识和推荐知识的有效获取,实现不同用户的个性化推荐,并有效解决冷启动问题。

3 智能推荐在内容生态业务的应用场景

依托中国移动的海量数据积累,基于深度学习技术,从海量数据中深入挖掘用户行为及业务特征,针对不同场景提供个性化、精准的推荐服务。智能推荐应用于个人网盘产品发现广场频道,支持“个性化推荐”、“相关推荐”、“主题推荐”、“TOP推荐”等场景,不同场景细分算法策略。在用户刷信息时,结合用户兴趣点及意图,为用户推荐其感兴趣的信息,从而提升用户黏性及价值转化。

4 笔记搜索技术设计

4.1 实现机制

4.1.1 权重算法模型

智能推荐系统的权重算法模型是核心部分,权重算法的好坏程度,直接影响到用户画像准确性,以下权重算法可以有效解决用户重复的行为和历史数据对当前数据影响过大问题。

对用户的行为埋点信息进行筛选聚合,形成原始埋点数据。

原始埋点数据需要有埋点时间、行为、标签等必要信息。

对行为设置原始权重分数,对埋点时间距离当前时间设置衰减周期长度,单位:小时。

同一衰减周期内,重复命中规则:

(1)同一衰减周期内多次相同行为命中同一标签:

在一个衰减周期内,如果多次采用同样的行为命中统一标签,则依次叠加原始权重分的10%。如果是在单个衰减周期中多次使用相同行为点击同一内容的,浏览时长进行行为时长叠加,领取仅计算一次,点赞及收藏通过奇偶计算最终得分(仅奇数有效),浏览文件数量进行行为叠加。

计算方程:X为原始权重分、N为命中次数。

权重分=X(1+10%(N-1))。

(2)同一衰减周期内多次不同行为命中同一标签:

在一个衰减周期内,以命中行为最高权重分为基础,如果出现新的行为权重分更高,则进行替换,然后叠加低权重分的10%。该项权重分为经环节(1)计算处理后的分值。

例如:先命中“健身”标签,为分享60分,在同一个衰减周期内,通过收藏再次命中此标签,则计算基准修改为收藏的90分,总分为90+60*10%=96分。

不同衰减周期中命中同一标签。

(3)衰减中的标签相较于上两种,仅存在有初始分的分别,不同衰减周期间采用累加的方式进行计算。该项权重分为经环节(2)计算处理后的分值。

利用本智能推荐标签权重计算方式,对所有埋点信息进行计算,为每个用户得到从高到低的标签权重排行。

利用该标签权重排行,获取对应的内容信息。

4.1.2 召回策略

由于内容众多,系统无法为每一个用户逐一计算每一个物品的评分,这就需要召回阶段。召回阶段可计算出部分内容,以此降低系统计算量。根据不同的业务场景,智能推荐系统选择了比较重要的有基于行为相似的召回和基于内容相似的召回。

内容自身标签分数均计为100。

例如内容A有[a,c,b,y,z]5个标签,用户B有[a(100),b(90),c(80),d(70),e(60),f(50),g(40),h(30),i(20),j(10)]10个爱好标签。

通过余弦相似度算法,计算用户的内容喜好倾向,生成用户画像。

基于用户画像,推荐类似用户喜好内容。

4.1.3 冷启动策略

当用户当前的行为历史为空时,智能推荐系统面临一个比较独特的状态,针对这个问题,智能推荐系统使用了如下几个方案:

(1)使用智能推荐系统产生的热门数据;

(2)使用大网数据和内容标签进行映射。

4.2 结论

通过对用户的大数据归纳整合,配合大数据实时计算能力,基于权重算法模型,召回策略,冷启动策略,构建智能推荐系统,能够有效精准推荐内容,提升用户产品体验满意度,维持域内用户活跃,提升用户留存率。后续根据业务发展,可不断对智能推荐系统进行优化迭代,以提升智能推荐系统的通用性。

5 智能推荐技术成效

个人网盘产品内容生态采用智能推荐技术,能根据用户历史行为,迅速做出智能化推荐,高并发下响应时间仍能保持200ms以下。整个智能推荐系统通过增加实例可不断扩展性能,通过增加实例组合可接入不同平台,打通不同平台数据共享。配合可视化界面,更可具有直观感演示和配置推荐效果。

6 未来智能推荐技术演进趋势分析

随着互联网技术的不断发展,未来几年中,智能推荐技术在跨平台实时推荐方面将更加普及。每个用户的喜好,会随着时间、空间的改变发生变化,不同的平台在不同年龄段,不同区域的受喜好程度不尽相同,跨平台的智能推荐存在比较大的价值。在5G时代,智能推荐的应用将从线上往线下发展,与生活联系更加紧密。

(1)基于语音、图像识别与分析等人工智能技术的应用,个人网盘在内容智能分类、内容检索和内容创作上为用户带来更为智能、便利和高效的服务,利用AI技术的个人云盘将可以采用更加智能化的方式帮助用户提高数据管理的效率,进一步优化用户使用体验。

(2)AI技术加持,未来个人网盘将成为智能平台。智能搜索与智能推荐深度融合,基于深度识别算法构建的模型,通过多维度标签,对复杂数据进行有效解读,不断提高识别准确率。

(3)以存储为基础功能的个人云盘,在物联网时代中价值更加凸显,数据来源的复杂性,牵引围绕家庭场景的数据统一管理势在必行,个人云盘在个人场景的基础上向家庭场景倾斜。

猜你喜欢

网盘权重标签
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
权重常思“浮名轻”
将网盘文件集中到Office 365网盘
网易网盘消逝谁是“凶手”?
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
不害怕撕掉标签的人,都活出了真正的漂亮
360网盘内容的快速转移
网盘关停
让衣柜摆脱“杂乱无章”的标签