基于大数据的高校图书馆情境化推荐模式研究
2021-11-30朱静徐一然吴颖孙叙伦任娟
朱静 徐一然 吴颖 孙叙伦 任娟
关键词:高校图书馆;情境化推荐;用户画像;用户标签
1绪论
基于大数据的高校图书馆情境化推荐模式利用图像处理技术,将数据进行可视化呈现,促进高校图书馆开展针对某类用户的阅读推广和智慧化推送。高校图书馆可以有效利用大数据和用户画像技术实现服务模式的创新,如知识服务、学科服务、web服务、手机终端服务等等,同时根据用户特征变化调整用户画像,提高阅读推广效果。
2高校图书馆用户画像建模
2.1用户画像数据获取
图书馆用户画像数据的来源主要包括高校图书馆门户网站、图书馆集成管理系统、移动图书馆、门禁管理系统及微信等平台。图书馆用户画像数据资源包括用户属性数据、用户人格数据、内容偏好数据、互动数据、会话数据和情境数据。用户属性数据可以通过系统的注册信息获取,用户人格数据可以在系统注册时的个人信息中进行完善。内容偏好数据、互动数据和会话数据都可以从图书馆门户网站获得。情境数据包括时间情境数据、位置情境数据和自然情境数据,其中时间情境数据和位置情境数据都可以通过定位技术获得,如WIFI、蓝牙、RFID、GPS、北斗、无线网络基站等,而自然情境数据可以通过用户手持的智能终端设备和传感器来获取。
2.2构建用户标签
根据图书馆用户画像获取的途径,为了满足大数据背景下用户的情境化推荐需求,本文构建了图书馆用户画像模型的静态与动态标签体系。其中,用户属性与用户人格为静态标签,用户偏好、互动、会话和情境为动态标签。
2.3用户画像模型的建立
(1)用户属性标签。用户属性标签包括用户姓名标签、性别标签、年龄标签、出生日期标签、教育程度标签、用户专业标签和婚姻状况标签。用户属性标签的形式化表示为User-Information={Name,Gender,Age,Birth,Education,Major,Marital}。Name为用户姓名,为用户记录的唯一标识;Gender为用户性别编码,为男性或者是女性;Age为用户年龄代码,一般分为18岁以下、18至35岁、36岁及以上;Birth为用户出生日期识别码;Education为用户教育程度编码,一般分为专科、本科、硕士、博士等;M aj叫為用户专业编码,如机械设计制造及其自动化、软件工程、市场营销等;Marital为用户婚姻状况编码,为已婚或未婚。
(2)用户人格标签。用户人格标签包括用户兴趣爱好标签、用户理想标签、用户能力标签、用户气质标签和用户性格标签。用户人格标签的形式化表示为User_Personality={Interest,Ideal,Capacity,Temperament,Character}。Interest为用户兴趣爱好编码,可能包括运动、音乐、棋类、写作、表演等;Ideal为用户理想编码,一般包括职业理想、素质理想、生活理想、社会理想;Capacity为用户能力编码,一般包括智力、专门能力和创造力;Temperament为用户气质编码,一般分为胆汁质、多血质、黏液质和抑郁质;Character为用户性格编码,一般分为理论型、经济型、权力型、社会型、审美型、宗教型。
(3)内容偏好标签。内容偏好标签包括浏览标签、阅读标签、检索标签、预约标签和续借标签。内容偏好标签的形式化表示为User_Preference={Browser,Reading,Search,Res-ervation,Renewal}。Browser为浏览情况编码,即用户浏览图书馆门户网站的时间和页面停留时间,页面停留的时间越长表示用户越感兴趣;Reading为阅读情况编码,表示的是用户阅读的具体内容;Search为检索情况编码,一般表示用户通过关键字对感兴趣的主题进行检索;Reservation为预约书籍编码,反映了用户的潜在需求;Renewal为续借书籍编码,表示用户阅读完一本书籍后对其产生了浓厚的兴趣,从而引发客户的续借行为。
(4)互动标签。互动标签包括收藏标签、评论标签、分享标签和情感态度标签。互动标签的形式化表示为User_Interact={Collection,Comment,Share,Attitude}。Collection为收藏文献编码,表示用户对搜集来的文献资料进行筛选、加工和贮存的过程;Comment为评论情况编码;Share为分享内容编码,部分用户会对其感兴趣的书籍在社交平台进行分享;Attitude为情感态度编码,表示的是用户对书籍以及其他用户分享内容的喜好程度。
(5)会话标签。会话标签包括访问时间标签、访问次数标签、资源下载量标签、咨询量标签和浏览路径标签。会话标签的形式化表示为User_Dialogue={TID,Visits,Downloads,Consulation,Path}。TID为用户访问时间唯一识别码;Visits为访问次数编码;Downloads为下载情况编码;Consulation为咨询情况编码;Path为浏览路径编码。会话标签反映了图书馆用户的行为特征。
(6)情境标签。情境标签包括时间情境标签、位置情境标签、自然情境标签。情境标签的形式化表示为User_Situa-tion={Time,Position,Nature}。其中时间情境标签的形式化表示Time={Datetime,Month,Parttime},Datetime表示用户浏览的绝对时间,Month为1—12月,Parttime可以分为清晨、上午、中午、下午、夜晚;位置情境标签的形式化表示为Position={City,PosType},City指的是用户所在城市,PosType可能包括阅览室、借阅室、机房、教室、宿舍、餐厅、体育馆、操场等。自然情境标签的形式化表示为Nature={Weather,Temp,Humidity,Windscale,Noise}。Weather主要包括晴、多云、雨、雪、冰雹、霜冻、雾等;Temp主要包括30~C及以上、21℃~29℃、 11℃~20℃、0℃~10℃、零度及以下;Humidity表示的是自然情境中的湿度;Windscale描述的是风级,分为0~17级;Noise表示的是噪音,一般分为O~29分贝、30~49分贝、50~69分贝、70~89分贝、90分贝及以上。
3基于大数据的高校图书馆情境化推荐
读者对高校图书馆资源的兴趣度与其所在的情境高度相关。在图书馆用户画像情境化推荐模式下,我们首先要计算图书馆用户的当前情境与历史情境的相似度,然后再获得与当前情境类似的历史情境中的读者对资源项目的兴趣度排名,最后利用top-n规则选择排名靠前的n个资源推荐给目标用户,如图3所示:基于大数据的高校图书馆情境化推荐的实现过程见图4。
首先是數据资源层,包括数据获取和数据处理。图书馆用户画像数据可以通过高校图书馆门户网站、图书馆集成管理系统、移动图书馆、门禁管理系统及微信等平台获取。数据获取结束后需要进行数据集成、数据转换、数据规约、数据清洗和数据聚类,这几项可以统称为数据的处理。数据处理完毕之后,我们还将对数据进行存储。
下一步是数据挖掘层,数据挖掘层主要通过从图书馆数据库中提取关键特征信息并建立基于大数据的高校图书馆用户画像标签体系,并对标签进行分类建模和用户标识,勾勒数字化图书馆用户画像。
最后是应用服务层,应用服务层通过用户画像特征计算目标用户与服务资源的相似度,并结合用户当前的情境(时间情境、位置情境、自然情境),为图书馆读者推荐与其所在情境最匹配的个性化资源。应用服务层中最重要的是要实现推荐应用的可视化,即利用可视化技术将数据转换为用户能够识别的图形或图像在屏幕上进行显示,可视化推荐能够把大量、繁杂、看似毫无关联的数据、信息、知识以一种用户能够理解的视觉方式呈现出来。常见的数据可视化形式有图表、数据流、层次结构、时间序列、矩阵、信息图形、地图、网络等。
基于大数据的高校图书馆情境化推荐模式能够完善图书馆资源,更科学地对目标读者进行分析,及时调整推荐书目,提升用户体验。同时可以对读者群进行精准刻画,可以对具有相似阅读兴趣或内容偏好一致的读者建立多重关联,绘制出基于用户画像的读者关系图谱,深度挖掘读者的潜在阅读倾向,指导图书馆完善业务运营流程、精准开展各类阅读推广服务。
4结语
本文基于图书馆用户属性数据、用户人格数据、内容偏好数据、互动数据、会话数据和情境数据进行标签化识别,围绕这六个维度构建基于大数据的高校图书馆用户画像模型,以此为基础建立基于大数据的高校图书馆情境化推荐模型。需要特别注意的是,由于图书馆用户的服务需求是实时变化的,因此需要对用户的兴趣变化以及所处情境进行动态化跟踪。