APP下载

AI混合推荐算法在企业内部学习社区场景的深度应用

2023-02-02汪亚娟

科技与创新 2023年2期
关键词:标签数字化社区

徐 胤,宋 灿,汪亚娟

(国家电网有限公司客户服务中心信息运维中心,江苏 南京 211166)

1 研究背景

贸易战、疫情加快了国家数字化战略的推进,宏观上中国的数字化能力将形成领先全球的数字化竞争力。在国家战略的指导下,大型央企进一步加快转型的决心与速度。在转型的过程中,企业数字化的场景非常丰富,从软件信息化场景、硬件智能化场景、应用数据集成化场景,丰富的数字化场景对人才的成长与进步要求越来越高[1]。

在数字化转型的过程中,员工要面对多元化的数字化场景,知识结构也将面临一次大的升级,70后、80后、90后、00后不同年龄段的员面对数字化转型,学习效率、学习需求、评价标准都不一样,研究小组的“AⅠ混合推荐算法在企业内部学习社区场景的深度应用”这一课题就是在这个背景下产生的。

2 行业借鉴

互动社区的核心是其所产生的内容,当前互联网互动社区产生内容的方式大致有UGC、PGC、OGC这3种。UGC指用户生产内容,一层是用户,即内容贡献者;另一层是平台,充当内容运营者和内容审查者的角色,有了人气,平台就会越来越大,人气就会越来越旺,反之亦然。PGC指专业生产内容,其内容个性化、视角多元化、传播民主化、社会关系虚拟化,电商媒体、高端媒体多采用PGC模式。OGC指职业生产内容,内容产生者如记者、编辑、媒体工作者等,创作内容属于职务行为。本文主要分析UGC及PGC模式,借鉴其经验。

2.1 UGC可借鉴内容

以知乎为例,知乎涵盖话题内容全面,问答丰富多样,用户量庞大,人均日访问时长达50 min。用户围绕着某一感兴趣的话题进行相关的讨论,同时可以关注兴趣一致的人。针对一些话题进行发散思维整合,用户活跃度高、内容专业门槛较低,荣誉体系完善。

2.2 PGC可借鉴内容

以36氪为例,36氪是一个科技创新创业综合生态服务平台,文章水平较高且篇幅较长,能够看到很多观点和互动。36氪对于用户投稿要求非常高,经过严格专业审查通过后才能发表,故文章专业性极强,帖子无法实现实时发表,更新周期略长。如果要实现作者入驻,需要递交作者简历及真实性检查等一系列工作,平台需要对专家人才库进行运营管理。

3 研究过程

3.1 确定研究方向

研究背景:新上线的大型企业数字化营销系统涉及企业营销员工超过2万人。新的企业数字化营销系统业务模块众多、知识点零碎,新业务、新规则、新功能、新政策变化迅速,而一线员工由于知识结构、自身能力、培训条件、政策传达等方面的原因在使用中必然会产生众多的问题。结合以往新系统上线的经验,困扰员工最大的3个问题是“功能不会用”“问题谁解答”“想法向谁提”。

研究方向:AⅠ混合推荐算法在企业内部学习社区场景的深度应用。研究小组将大数据的标签应用与NLP的深度网络学习相结合,以员工数据校本、内容数据样本2个维度,形成一套针对每个员工、每份学习内容的个性化AⅠ推荐算法,将推荐算法应用到每个员工身上形成“千人千面”的学习方案与评价文案,提升学习效率。将推荐算法应用到每个学习内容上,建立强大的关联性学习内容之间的知识图谱关系,从而形成一个强大的智能知识库。“千人千面的AⅠ标签库”与“以点带面的知识图谱智能知识库”这2大核心产品是课题组的核心研究方向。

实验场景:学习社区建设应用。研究小组的研究课题是在实际工作场景中形成的,研究小组承担了企业数字化营销系统的运营运维工作,在工作的过程中,为了更好地让内部员工学习、适应新的数字化营销系统,建立了学习社区这个内部学习社区,加快员工对数字化营销系统问题的解决、使用技巧的掌握,课题组将AⅠ混合推荐算法深度应用到了学习社区这个场景研究中。

3.2 研究的理论基础-AI混合推荐算法

3.2.1 数据分类

学习社区项目中,将系统所产生的全部数据进行了分组:用户数据类、内容数据类。通过内容数据不断作用于用户数据,实现用户学习行为、学习效率、学习结果的不断变化,再根据用户数据的不断变化来调整与之对应的内容数据。

3.2.2 标签画像

标签是对数据进行定义的手段,通过不断对每条数据进行标签化处理,从而获得数据的标签画像。标签分为初始标签、AⅠ标签、人工标签3大类,对应数据的3大场景,数据产生的时候会自动产生初始标签,在数据不断被访问应用的过程中,会产生AⅠ标签,在与用户、管理员不断互动的过程中,会产生人工标签。通过3大类标签,不断通过标签重合度进行去重,实现标签画像的智能化、精准化[2]。

3.2.3 NLP自增标签

自然语言处理(Natural Language Process,NLP)深度整合了数字化云企业内部顶级的NLP技术,依托千亿级中文语料累积,提供16项智能文本处理能力,包括智能分词、实体识别、文本纠错、情感分析、文本分类、词向量、关键词提取、自动摘要、智能闲聊、百科知识图谱查询等。可广泛应用于用户评论情感分析、资讯热点挖掘、电话投诉分析等场景,满足各行各业的文本智能需求。

基于NLP框架,将大型企业营销线的26个专业的数据字典进行分词,生成初始标签库。根据员工、内容这2类数据打上初始标签,实现基础的匹配。同数据不断互动、使用的过程中,通过NLP学习网络对标签进行重合度、标签密度的计算,将高密度、高重合度的标签进行NLP自增方式标记到数据上,实现数据标签AⅠ自增[3]。

3.2.4 AI混合推荐

通过初始标签、NLP自增标签、人工标签,笔者们的用户类数据、内容类数据分别获得了标签画像。在企业数字化营销系统学习社区员工登陆学习的过程中,展开了AⅠ推荐算法在企业内部学习社区场景的深度应用。

根据每个用户登陆后的身份、学习内容、内容热度进行AⅠ混合推荐,“千人千面”的个性化学习方案、评价方案,提升学习效率。主要采用以下3个步骤开展算法搭建:①数据建模。推荐系统根据用户的某些信息给用户建模,同时给频道建模。②内容推荐。推荐系统根据不同的算法对用户兴趣与频道信息进行筛选匹配,找到用户感兴趣的频道,然后推荐给用户。③分类。根据用户行为记录等对用户进行划分,为同一群体的用户推荐其余用户喜欢的,也可以根据内容元素为内容分类。

AⅠ混合推荐算法工作原理如图1所示。

图1 AⅠ混合推荐算法工作原理图

4 AI混合推荐算法的几大应用场景的实验情况

4.1 在“问答”学习场景中的应用

学习社区项目设计了“问答”这个功能场景,就是让员工在使用企业数字化营销系统的过程中将遇到的问题在学习社区进行“一键提问、闪电提问”,然后快速帮助员工解决企业数字化营销系统的使用问题。

AⅠ混合推荐算法在这个场景中发挥了巨大的作用。首先员工提问的时候,通过AⅠ推荐,在员工输入提问标题的时候AⅠ助教就会即时进行相似的已解答的问题推荐,员工不用提问就可通过别人已经问过的问题来解决自己的问题。同时如果已解答问题没有员工需要的答案,AⅠ推荐算法会继续推荐正在提问中的相似问题,员工只需点击“同问”就可以闪电实现问题关注,问题被解答后自动推送消息帮助员工获得答案。

4.2 在经验交流场景中的应用

企业数字化营销系统学习社区系统具有“经验分享”功能模块,是一个帮助员工在内部社区学习过程中从“新人”到“专家”的自我成长的主动学习过程。AⅠ混合推荐算法将每条“经验分享”内容进行标签化,将内容类数据的标签库作用于经验分享类的内容,然后通过经验分享的每篇文案的标签库与用户的标签库进行“标签重合度、标签高密度”的AⅠ推荐,将经验分享文章推荐给每位员工,帮助他们从“新手”向“专家”进行成长蜕变。

AⅠ混合推荐算法在企业数字化营销系统学习社区的3大典型场景得到了成功的应用,为企业数字化营销系统培养了大量的使用专家,加快了企业数字化营销系统的应用效率。AⅠ混合推荐算法在课程组研究成功后,可以应用于很多场景,在企业内部学习社区场景延伸开来,具有更广阔的市场前景。

平台的生命周期与活跃度,取决于持续不断运营。基于企业数字化营销系统的目标定位,确定营销知识运营、营销文化运营、营销创新运营3方面的运营目标:打造创新性学习型问答社区,运营场景包括知识沉淀、知识流动、知识应用等;推动营销数字化转型文化认同,运营场景从传、沟通、参与到进化的递进认同过程;推进企业数字化营销系统优化与提升,运营场景包括知识收集、创新推动及需求创新落地。

5 结束语

研究小组在实施企业数字化营销系统学习社区项目的过程中,参考了大量的知识文献,阅读了大量书籍,将方法论提炼成为“AⅠ混合推荐算法”,并将之深度应用于企业数字化营销系统学习社区项目。整理复盘整个研究过程,整理研究资料,研究发现“千人千面的AⅠ标签库”与“以点带面的知识图谱智能知识库”这2大核心产品将是课题组的宝贵经验,现总结出来和大家分享。

“千人千面的AⅠ标签库”:为数据资产打上标签,应用NLP技术给每条数据打上初始标签、AⅠ标签、人工标签这个方法论实现了每条数据标签画像,内容数据与用户数据之间的“标签重合度、高密度”匹配,然后进行AⅠ混合推荐实现了“千人千面”的推荐效果。

“以点带面的知识图谱智能知识库”:每条内容数据都是宝贵的学习资产,在实施企业数字化营销系统学习社区项目的过程中,由于每条内容数据都带着多维度的标签库,AⅠ算力可以精准定义到每条学习内容,匹配给每位学习者。因此,将所有的学习内容以每位学习者提出的“第个问题”为切入点,帮助学习者形成一个强大的关联知识库。如果能够在后期不断丰富学习内容数据,必然能够形成一个以与“AⅠ混合推荐算法与关系型标签库”相结合的创新型知识库。

猜你喜欢

标签数字化社区
社区大作战
家纺业亟待数字化赋能
3D打印社区
在社区推行“互助式”治理
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
数字化制胜
让衣柜摆脱“杂乱无章”的标签