高校资讯智能推荐系统的架构设计与关键策略研究*
2023-12-20郑競力王士贤
秦 楠 郑競力 吴 驰 王士贤
高校资讯智能推荐系统的架构设计与关键策略研究*
秦 楠1郑競力1吴 驰1王士贤2[通讯作者]
(1.华中科技大学 网络与计算中心,湖北武汉 430074;2.华中科技大学 软件学院,湖北武汉 430074)
随着智慧校园的快速发展,高校网站、公众号等资讯发布平台的数量急速增长,信息过载、内容长尾效应、个性化程度低等问题也随之日渐凸显。为此,文章首先基于研究现状探究了高校资讯推荐系统的应用难点;然后,文章针对系统的应用难点提出一种基于数据采集层、数据挖掘层、推荐引擎层和应用层四层架构的高校资讯推荐系统;接下来,文章提出了高校资讯推荐系统的关键策略,重点介绍了多路级联召回策略和冷启动策略;最后,文章展示了高校资讯智能推荐系统在华中科技大学的落地应用情况,以期为提升高校资讯发布的个性化、智能化水平提供参考。
智慧校园;智能推荐;推荐系统架构;多路级联召回;冷启动
随着教育信息化和智慧校园的深入发展,目前大多数高校已经开始通过网站群技术建设和管理校园网站,得益于网站群便利的建站方式,高校网站的数量也随之急速增长[1][2]。调研发现,截至2022年12月,我国985高校的网站数量平均达400多个,部分高校网站数量达1000多个。同时,在移动互联网背景下,以高校为主体的微信公众号也日益增多,部分学校官方认证的微信公众号达200多个[3]。校园网站和微信公众号给师生提供了获取校园资讯的便捷渠道,但同时也带来了一些问题:一方面,面对分散发布的海量信息,高校师生对个性化、智能化信息服务的需求日益增长;另一方面,资讯分发方也亟需借助智能化技术对师生进行精准的资讯推送,以缓解长尾效应,提升资讯的利用率。2018年,教育部印发《教育信息化2.0行动计划》,明确提出需借助信息技术特别是智能技术的发展,构建网络化、数字化、智能化、个性化教育体系[4],教育个性化被提升到了前所未有的高度。在此背景下,本研究通过深入分析高效资讯推荐的研究现状、应用难点,进行了高校资讯推荐系统的总体架构设计,并针对多路级联召回策略、冷启动策略等关键策略进行了研究,通过展示该系统在华中科技大学的应用实践情况,期望为解决高校资讯领域面临的信息过载、长尾效应等问题提供参考,以提升高校信息化的个性化、智能化水平。
一 研究现状
1997年,Resnick[5]第一次正式提出“推荐系统”概念,此时的推荐系统实际上还局限于协同过滤推荐。随着移动互联网的蓬勃发展,推荐系统在电子商务、内容分发等领域得到了广泛应用,同时得益于大数据、NLP、机器学习等技术的交叉融合,针对其进行的研究不断涌现,陆续出现了基于内容的推荐算法[6]、基于用户的协同过滤算法[7]、基于物品的协同过滤算法[8]、基于知识的推荐算法[9]、基于标签的推荐算法[10]、基于深度学习的点击率预测算法[11]等。这些推荐算法都在一定程度上实现了个性化推荐,但也有各自的缺陷,如基于内容的推荐算法在新闻资讯推荐场景下效果显著,但对音频、视频等的属性抽取存在困难,且缺乏新颖性、多样性,存在信息茧房的问题;基于用户的协同过滤算法能提供多样、新颖的推荐内容,但存在冷启动和数据稀疏的问题,用户行为较少时很难发挥作用。为有效结合不同算法的优点,同时克服其存在的缺点,越来越多的研究开始关注混合推荐系统,如Burke[12]针对五种推荐算法总结了七种不同的混合策略,即加权、切换、交叉、特征组合、串联、特征补充、元级,为不同推荐场景下的混合推荐提供了解决思路。
此外,冷启动问题作为推荐系统在实践中面临的重要挑战之一,相关研究层出不穷[13][14]。根据处理对象的不同,可以将冷启动问题分为三类:用户冷启动、物品冷启动及系统冷启动[15]。在实际应用中,随机推荐法[16]、平均值法[17]、众数法[18]等是常见的冷启动解决方法,但这些方法都没有分析用户的特征和兴趣,不具备个性化推荐能力。为提升冷启动阶段的个性化程度,研究者相继提出基于社交网络[19]、基于标签系统[20]、用户采访过程[21]等方法,这些方法能一定程度上缓解冷启动阶段的数据缺失问题,但由于涉及用户隐私、交互烦琐,导致数据收集困难,推荐效果下降。事实上,冷启动的解决方案通常与推荐应用场景和业务数据基础高度相关,除了单一推荐算法的优化,还可以从推荐算法融合[22]、跨领域数据收集[23]、系统功能设计[24]等角度提升用户在冷启动阶段的体验。
针对推荐系统的研究和应用如火如荼,然而通过在CNKI中检索并分析高校信息化领域推荐系统的相关文献,可以发现大部分研究还集中在图书推荐[25][26],而对高校资讯的推荐较少涉及。其中,李涛[27]提出一种基于协同过滤算法和内容推荐算法的高校文化内容组合推荐系统,实现了互补式内容推荐;毕曦文等[28]采用基于肘部法则改进的K-means聚类算法,结合用户兴趣标签实现了针对高校新闻的个性化分类推荐。这些研究在一定程度上实现了高校资讯的个性化推荐,但仍然存在冷启动以及对用户兴趣变化的实时反馈能力不足等问题,对高校智慧校园体系下的数据资产、师生群体特征、内容特征等也缺乏深入的分析和运用。
二 高校资讯推荐系统的应用难点
针对高校网站、微信公众号的资讯进行个性化推荐,是推荐技术在高校信息化领域的典型应用场景。尽管资讯推荐在互联网行业已经发展得非常成熟,但是高校场景下实现资讯推荐系统仍然面临以下应用难点:
1 数据分散
互联网行业的应用推荐技术一般是在业务应用上实现个性化升级,也就是说其用户数据和物品数据已经聚合在业务系统内。而高校资讯推荐场景下,网站、微信公众号都是独立运营,资讯发布分散,用户数据分布在各类业务系统中,如何实现这两类数据的聚合是系统需首要解决的难题。
2 用户及资讯规模小
高校推荐系统面对的用户是校内师生,相比互联网应用动则上亿的用户量来说,其规模较小,然而业界主推的协同过滤、深度学习等算法需要大量的用户数据对模型进行训练才能实现精准推荐,因此无法在高校资讯推荐场景下单独使用。此外,高校资讯的总体量不足百万,且由于高校类型不同,资讯分布并不均衡,对于小众资讯,基于内容的相关算法会出现召回过少的情况,推荐结果抖动较大。
3 冷启动困难
冷启动问题几乎是所有推荐系统必须面对的难题,高校资讯推荐系统也不例外。不仅如此,互联网推荐常用的注册兴趣填写、促销、拉新等冷启动手段,在高校资讯推荐系统用户群体已知的情况下并不适用,需要从算法、数据、功能等角度去缓解冷启动问题。
三 高校资讯推荐系统的架构设计
为适应高校资讯推荐场景,解决上述应用难点,本研究提出了一种高校资讯推荐系统,包含数据采集层、数据挖掘层、推荐引擎层、应用层4个部分,其架构设计如图1所示。
图1 高校资讯推荐系统的架构设计
1 数据采集层
数据采集层负责采集用户的基础数据、行为数据和内容数据,解决数据分散的问题,为高校资讯推荐提供数据基础。智慧校园的发展累积了大量业务信息系统,用户基础数据就分散在其中。数据采集层通过高校数据中心采用定时推送或共享接口的方式将这些基础数据同步到系统[29],为推荐算法和冷启动策略提供先验数据,以提升推荐准确度。行为数据则由客户端页面埋点,通过消息中间件上报浏览、点赞、收藏等行为记录的方式进行收集。内容数据包含网站内容数据和公众号内容数据,分别通过网站群webservice接口和微信公众号订阅接口进行采集。
2 数据挖掘层
数据挖掘层将采集的原始数据转换成便于推荐算法计算的特征值和便于运营管理的标签画像。其中,元数据ETL模块将收集到的原始数据存储到数据仓库中。数据仓库中的数据此时还不能被推荐算法直接使用,需经特征服务模块按照不同数据类型进行特征处理。标签管理模块负责标签的生产、更新、存储和输出。相较于具有计算属性的特征值,对特征进行描述的标签具有更强的可读性和可解释性,可用于标签召回、推荐预处理、推荐结果解释等环节。此外,将用户属性标签、用户兴趣标签、用户行为标签汇集起来形成用户画像,并将资讯属性标签、资讯关键词标签、资讯热度标签等汇集起来形成资讯画像,可共同为运营人员和算法人员构建直观的用户形象与资讯内容概览,辅助其调整运营策略和优化算法。
3 推荐引擎层
推荐引擎层承载推荐系统的核心业务流程,采用召回、排序、后处理3个子阶段串联的pipeline模式。其中,召回是快速从全量资讯库中尽可能多地筛选出师生可能感兴趣的资讯,为规避单个算法的缺点、提升召回多样性,一般采用混合推荐的策略。排序则是从召回的资讯当中尽可能准确地挑选出较感兴趣的Top个资讯,即优中选优,一般采用较复杂的单一点击率预测评分模型,在用户行为数据较少的情况下可以采用加权评分的方式代替。排序后的推荐列表还需根据业务规则和运营策略做进一步的过滤、增补等微调处理,才会最终经由推荐服务接口输出到应用层,呈现到师生面前。除核心业务流程之外,在实际应用中,推荐引擎层还包括推荐预处理、离线模型训练、推荐缓存等模块,为召回和排序策略提供支撑。
4 应用层
应用层包含管理端和客户端。其中,管理端是系统的控制中心,包含用户管理、资讯管理、专题管理、实验管理等模块,从用户、内容、算法三个维度实现数据化、可视化运营。客户端则负责向师生展示资讯推荐列表以及各项扩展交互功能,如推荐、发现、专题等。
四 高校资讯推荐系统的关键策略
召回作为推荐引擎层中的核心业务阶段,其结果直接决定推荐系统的整体效果,同时冷启动对用户留存和体验也至关重要。为此,本研究结合高校场景下用户及资讯规模不大、数据资产累积情况较好、用户及资讯源关系明确等特点,设计了高校资讯推荐系统的关键策略,其重中之重是多路级联召回策略和冷启动策略,以切实提升推荐系统的多样性、准确性、用户粘性。
1 多路级联召回策略
召回的作用在于减少候选资讯的数量,方便后续排序阶段使用复杂模型精准排序[30]。为结合不同算法的优点、规避不足,同时提升召回的多样性和鲁棒性,目前多采用混合推荐的召回策略[31]。在内容推荐领域,协同过滤、内容相似推荐和热门推荐三者并行的多路召回策略最为常见,但这种策略在高校资讯推荐系统中面临以下三个问题:
①召回稳定性差。区别于互联网的海量内容库,高校资讯库体量较小,且根据高校类型不同,资讯分布也呈现不平衡的状态,如理工类高校的文史类资讯和师生都较少,此时基于内容相似的召回量可能很少;师生用户体量较小,依赖于大量用户数据的协同过滤算法推荐结果也不稳定。因此,固定比例的并行召回可能会使总体召回量波动较大,客户端展示不流畅。
②兴趣变化实时反馈能力差。协同过滤和内容相似算法通常采用离线计算的方式,定时(通常是每天一次)将计算结果输出到缓存中,那么当师生兴趣发生实时变化时,该变化只能在第二天才能体现在召回列表中,无法及时反馈。
③数据资产利用度不高。高校在各业务系统中累积了大量师生数据资产,这些数据可以为推荐算法提供先验知识,但协同过滤算法只与动态行为数据相关,内容相似算法只与内容特征相关,热门推荐则是完全非个性化推荐,都无法利用这些数据来提升推荐效果。
为解决上述问题,本研究在协同过滤召回、内容相似召回、热点内容召回等多路召回策略的基础上,增加了兴趣标签召回、资讯源关系传递召回,并采用两级级联的方式设计了多路级联召回策略,如图2所示。
图2 多路级联召回策略
(1)多路级联召回的工作流程
协同过滤召回、兴趣标签召回和内容相似召回等完全个性化推荐算法多路并行,形成默认召回级;资讯源关系传递召回和热点内容召回等非完全个性化推荐算法多路并行,形成补充召回级。多路级联召回的工作流程为:优先从默认级召回,当召回列表的长度满足要求时,直接进入排序阶段;当召回列表长度不足时,启动补充级召回进行补足,合并两级召回列表后再进入排序阶段。多路级联的优势是在提升召回多样性和鲁棒性的同时,最大化个性化推荐的占比,并保障召回的稳定性。
图3 用户兴趣标签正排索引和资讯关键词倒排索引
(2)兴趣标签召回
兴趣标签召回通过用户兴趣标签匹配资讯的关键词标签,选择包含命中标签的资讯进行召回。它在内容推荐领域被广泛使用,具有实现简单、即时反馈、可解释性强等显著优点[32]。兴趣标签召回的流程为:①生成用户初始兴趣标签,默认为空;②以用户ID为主键生成用户兴趣标签队列的正排索引,如图3(a)所示;③生成资讯的关键词标签列表,资讯正文经过文本分词后利用TF-IDF获取权重较高的个关键词作为内容标签;④以关键词为主键生成关键词和包含该关键词资讯列表的倒排索引,如图3(b)所示;⑤根据当前用户ID通过正排索引查找其兴趣标签列表,再根据列表中的标签通过倒排索引查找包含该关键词标签的资讯列表进行召回;⑥记录用户操作过的资讯所包含的关键词,将其作为新的兴趣标签保存到用户兴趣标签队列中,然后跳转到第⑤步,进入下一轮兴趣标签召回。
在实践过程中,高校资讯库存在分布不均衡的情况,部分关键词关联的资讯较少,召回效果不佳。为提高兴趣标签的召回量,本研究使用Word2Vec算法在词向量空间中计算与用户兴趣标签较相近的5个相似词,形成扩展兴趣标签,如表1所示。该表展示了在系统中随机抽取的6个师生的兴趣标签及其词向量扩展标签的召回量情况,借助词向量扩展兴趣标签,原标签的召回量得到了不同程度的提升。
表1 词向量扩展标签及召回量
此外,用户兴趣通常随时间推移产生较大变化,单一的用户兴趣标签队列无法体现这一特性。针对这一问题,本研究采用长短期双兴趣标签列表的方式进行优化:短期兴趣标签利用先进先出队列,根据用户操作行为实时更新;长期兴趣标签计算用户时间窗口内发生行为的资讯所包含关键词标签的累加权重,按从高到低排序取top个关键词标签。上述优化方式既实现了用户短期兴趣的实时反馈,也保证了用户长期兴趣的稳定呈现。
(3)资讯源关系传递召回
在高校资讯推荐场景下,师生和资讯源、资讯源与资讯源之间存在一定的关联关系,如计算机学院的学生与计算机学院的官网关联度较高,计算机学院的官网与软件学院、人工智能与自动化学院的官网又有关联。借用数学中关系的传递性思路,计算机学院的学生与软件学院、人工智能与自动化学院的官网也产生了关联。关系传递中的关联度计算如公式(1)所示。
其中,R表示资讯源A到资讯源N的关联度,取值在0~1之间,等于A到N关联路径上所有关联度的乘积。获取资讯源之间的关联度后,如何令师生与资讯源产生关联呢?本研究采用了两种方法:①师生没有产生行为,但是由于师生有学院或者单位属性,因此网站群内学院官网或者二级单位官网与该用户的关联度默认为1,这样用户就可以通过关系传递到其他资讯源。②师生对某个资讯产生了行为,该资讯属于某个资讯源,根据该资讯源关系传递到其他资讯源。产生了师生到资讯源的关联度后,可按关联度由高到低排序,按需从关联的资讯源中选取最新资讯进行召回。实际应用中,基于资讯源关系传递的召回算法在冷启动或召回补足场景下可有效提升用户粘性。
2 冷启动策略
冷启动指推荐系统在用户特征不明确、用户行为数据缺失的情况下,由于推荐算法缺乏计算数据,导致无法提供精准推荐的问题,它是推荐系统落地过程中的重要挑战之一。本研究从算法、数据、功能三个层面设计冷启动策略,以多维度解决冷启动问题,提升用户体验。
(1)算法层面
本研究在协同过滤召回算法的基础上增加了对用户行为数据依赖较少的内容相似召回算法、兴趣标签召回算法和资讯源关系传递召回算法等,弥补冷启动阶段召回率低和推荐准确率差等缺陷。同时,多路级联召回设计使推荐结果能够根据用户成熟度进行动态调整,随着用户行为数据的累积,自动减少非个性化推荐的比例,增强个性化体验。
(2)数据层面
在数据共享治理框架和“一张表”平台的推动下,高校数据孤岛问题已得到有效解决,校级数据资产更加完善,数据质量进一步提高。目前高校数据中心已经集成了包含人事系统、教务系统、学生注册管理系统等众多业务系统的数据,涉及教学、科研、人事、学生管理等众多方面[33],为构建师生特征画像奠定了基础。本研究利用师生特征画像进行兴趣标签预设,使用户在初期也能够基于兴趣标签召回算法得到较为精准的推荐。预设兴趣标签按照计算方式可以分为三种:
①规则映射。针对师生的结构化数据,本研究根据业务规则预设标签,如为毕业班大学生设置“招聘”“留学”“考研”等标签。
②算法抽取。“一张表”平台以及教师个人主页等系统中汇集了教师的论文发表、科研项目、研究方向等数据,同时教务系统中也记录了学生的课程信息、学习方向等数据,借助NLP技术提取这些文本数据的关键词,可将关键词预设为兴趣标签。图4以华中科技大学光电学院教师的研究方向标签和论文标签为例,展示了算法抽取出的预设标签词云。
(a)研究方向标签词云(b)论文标签词云
③传递补足。针对部分师生无法通过已知数据获取预设标签或者标签量过少的情况,本研究利用导学关系、同学关系、同事关系等社交关系进行兴趣标签传递,如学生A的学术类兴趣标签过少,则将其导师B的论文标签、研究方向标签等设置到学生A的标签列表中。
(3)功能层面
除主要的推荐功能之外,为引导师生产生更多交互,获得更多反馈,本研究设计的高校资讯推荐系统实现了搜索、发现、关注、专题、正负反馈五大功能:①搜索,即为师生提供全局搜索功能,便于师生在推荐列表不满足需求时通过输入找到目标资讯;②发现,即为师生提供资讯源目录,可通过浏览或搜索找到目标资讯源及其资讯列表;③关注,即为师生提供感兴趣资讯源的标记功能,在关注列表页面将展示所有关注过的资讯源的最新发布内容;④专题,即为管理员提供通过关键词设置专题栏目的功能,系统根据专题关键词自动汇集所有相关资讯进行集中展示;⑤正负反馈,即为师生提供对资讯的显式正负反馈功能,正反馈包括点赞、收藏等,负反馈包括屏蔽资讯源、屏蔽标签、内容投诉等。
五 高校资讯推荐系统的应用实践
本研究中提出的系统架构、多路级联召回策略以及冷启动策略在华中科技大学校园资讯应用“华中大智能推荐系统”中进行了实践,取得了良好的效果。
1 推荐应用
“华中大智能推荐系统”的客户端主页面向校内师生实现了校园资讯的Feed流式个性化推荐。除此之外,系统还将推荐服务封装为标准化接口,第三方应用可通过该接口请求指定用户的推荐列表。在首期落地应用中,系统借助推荐服务接口将推荐服务融合到企业微信webview页面中,并结合企业微信消息发送功能进行每日个性化推送,实现了推荐应用的跨平台融合,如图5所示。
2 实践效果
系统试运行期间,累计采集涵盖学校网站群平台、校内微信公众号、专业领域微信公众号等共582个资讯源的93万条资讯,累计访问量达19余万次。推荐系统的活跃用户数、忠实用户数及访问次数是客观反映用户体验的重要指标,因此本研究对试运行首月访问次数大于15次的3097名活跃用户访问情况进行了分析,表2按不同访问次数区间分别统计了师生用户数、月累计访问次数、月均访问次数和人数占比情况。本研究将访问次数达30次以上的用户定义为忠实用户,从表中可以看出,从活跃用户到忠实用户的转换率达28.93%,充分体现了师生对华中大智能推荐系统的积极评价。
六 结语
信息爆炸时代,高校信息化领域同样面临着信息过载问题,如何利用智能推荐技术实现更高效、更智能、更便捷的个性化内容分发方式受到越来越多高校信息化从业者的关注。本研究针对高校数据分散、用户及资讯规模小等问题,提出了一种基于数据采集层、数据挖掘层、推荐引擎层、应用层等四层架构的高校资讯推荐系统,并创新性地采用了一种多路级联召回策略,在传统的协同过滤召回、内容相似召回的基础上,融入优化的兴趣标签召回和资讯源关系传递召回,提升了召回的多样性、稳定性和实时反馈能力。此外,面对推荐领域的难点——冷启动问题,本研究结合高校领域的数据资产情况、师生群体特征及内容特征,围绕算法、数据和功能三个层面提出全方位的冷启动策略,从多维度提升了师生的使用体验。虽然系统在实践中取得了一定成效,但仍存在一些不足,未来研究团队将针对如何利用资讯文本之外的图片、音频、视频等多模态信息进行建模,如何实现跨领域推荐等问题进一步展开研究。
[1]刘臻,张旭,鲁学亮,等.中国高校网站群建设与应用情况研究[J].中国教育信息化,2017,(19):6-9.
[2]路遥,任晓霞,侯静,等.新形势下高校网站群建设与服务管理探究——以北京大学为例[J].实验技术与管理,2020,(9):32-34.
[3]周春雷,曹玲静.“985”高校微信公众号发展现状研究[J].数字图书馆论坛,2017,(5):61-67.
[4]教育部.教育部关于印发《教育信息化2.0行动计划》的通知[OL].
[5]Resnick P, Varian H R. Recommender systems[J]. Communications of the ACM, 1997,(3):56-58.
[6]Pasquale L, De Gemmis M, Giovanni S. Content-based recommender systems: State of the art and trends[J]. Recommender Systems Handbook, 2011,(1):73-105.
[7]Resnick P. GroupLens: An open architecture for collaborative filtering of netnews[A]. Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work[C]. New York: Association for Computing Machinery, 1994:175-186.
[8]Sarwar B. Item-Based collaborative filtering recommendation algorithms[A]. Proceedings of the 10th International Conference on World Wide Web[C]. New York: Association for Computing Machinery,2001:285-295.
[9]Aggarwal C C. Knowledge-based recommender systems[A]. Recommender Systems[C]. Cham: Springer International Publishing, 2016:167-197.
[10]Li X, Guo L, Zhao Y E. Tag-based social interest discovery[A]. Proceedings of the 17th International Conference on World Wide Web[C]. New York: Association for Computing Machinery, 2008:675-684.
[11]Zhou G, Zhu X, Song C, et al. Deep interest network for click-through rate prediction[A]. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining[C]. New York: Association for Computing Machinery, 2018:1059-1068.
[12][31]Burke R. Hybrid recommender systems: Survey and experiments[J]. User Modeling and User-Adapted Interaction, 2002,(4):331-370.
[13]Konstan J A, Riedl J, Borchers A, et al. Recommender systems: A grouplens perspective[OL].
[14]Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005,(6):734-749.
[15]Bobadilla J, Ortega F, Hernando A, et al. Recommender systems survey[J]. Knowledge-Based Systems, 2013,46:109-132.
[16]Carbonell J, Goldstein J. The use of MMR, diversity-based reranking for reordering documents and producing summaries[A]. Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C]. New York: Association for Computing Machinery, 1998:335-336.
[17]Gianluigi G, Sergio G, Ester Z. Collaborative filtering supporting web site navigation[J]. AI Communications, 2004,(3):155-166.
[18]孙小华.协同过滤系统的稀疏性与冷启动问题研究[D].杭州:浙江大学,2005:115.
[19]Ma H, King I, Lyu M R. Learning to recommend with explicit and implicit social relations[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2011,(3):1-19.
[20]Zhang Z K, Liu C, Zhang Y C, et al. Solving the cold-start problem in recommender systems with social tags[J]. Europhysics Letters, 2010,(2):1-16.
[21]Sun M, Li F, Lee J, et al. Learning multiple-question decision trees for cold-start recommendation[A]. Proceedings of the Sixth ACM International Conference on Web Search and Data Mining[C]. New York: Association for Computing Machinery, 2013:445-454.
[22]Peng F R, Lu X, Ma C, et al. Multi-Level preference regression for Cold-Start recommendation[J]. International Journal of Machine Learning and Cybernetics, 2018,(9):1117-1130.
[23]史海燕,倪云瑞.推荐系统冷启动问题研究进展[J].图书馆学研究,2021,(12):2-10.
[24]Zhou K, Yang S H, Zha H. Functional matrix factorizations for cold-start recommendation[A]. Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval[C]. New York: Association for Computing Machinery, 2011:315-324.
[25]赵杨,杨彬,董姝仪,等.多源大数据驱动的移动图书馆个性化推荐系统设计与实现[J].图书馆学研究,2021,(11):20-31.
[26]陈安琪,金昆,陶兴华,等.基于知识图谱的图书馆智能化资源推荐系统架构与优化策略[J].图书馆界,2023,(2):21-25.
[27]李涛.一种组合推荐系统在高校文化内容聚合管理的应用[J].电子设计工程,2020,(11):64-68.
[28]毕曦文,纪明宇,吴鹏,等.个性化高校新闻分类推荐的应用研究[J].计算机应用与软件,2019,(7):218-223.
[29]毛文卉,吴驰,刘雅琴,等.数据治理背景下高校数据共享框架的研究与实践[J].实验室研究与探索,2022,(8):297-303.
[30]Spurthy M, Shwetha B, Sangeetha P, et al. A Survey on hybrid recommendation engine for businesses and users[J]. International Journal of Information Engineering and Electronic Business, 2021,(3):22-29.
[32]Ernesto D, Lucas D, Lars S, et al. Real-time top-n recommendation in social streams[A]. Proceedings of the Sixth ACM Conference on Recommender Systems[C]. New York: Association for Computing Machinery, 2012:59-66.
[33]刘雅琴,毛文卉,吴驰,等.基于“一张表”平台推动面向高校教师的数据治理实践[J].现代教育技术,2022,(1):118-126.
Research on the Architecture Construction and Key Strategies of Intelligent Recommendation System for University Information
QIN Nan1ZHENG Jing-li1WU Chi1WANG Shi-xian2[Corresponding Author]
With the rapid development of smart campus, the number of information rele platforms such as university websites and public accounts has increased rapidly, and the problems of information overload, content long tail effect, low degree of personalization and other issues have also become increasingly prominent. Therefore, based on the current research situation, the paper firstly explored the application difficulties of university information recommendation systems. Then, the paper proposed a university information recommendation system based on four layers architecture of data collection layer, data mining layer, recommendation engine layer, and application layer to address the application difficulties of the system. Next, the paper conducted research on key strategies, with a focus on introducing the multi-channel cascade recall strategy and cold start strategy. Finally, the implementation of the university information intelligent recommendation system in Huazhong University of Science and Technology was displayed, with the aim of providing reference and reference for improving the personalized and intelligent level of university information dissemination.
smart campus; intelligent recommendation; recommendation system architecture; multi-channel cascade recall; cold start
G40-057
A
1009—8097(2023)12—0100—11
10.3969/j.issn.1009-8097.2023.12.010
本文受中国高等教育学会2022年专项课题“基于闭环的高校主动式网络安全管理机制与智能化技术防范体系研究”(项目编号:22XX0403)资助。
秦楠,工程师,硕士,研究方向为信息系统开发与管理、智能化应用、教育信息化等,邮箱为qinnan@hust.edu.cn。
2023年5月3日
编辑:小时