基于用户画像的智慧图书馆个性化移动视觉搜索研究
2020-10-20曾子明孙守强
曾子明 孙守强
摘 要:将用户画像嵌入智慧图书馆的移动视觉搜索及推荐服务中,将解决信息过载且存在语义鸿沟、检索结果不能满足读者的个性化需求等问题。文章述评了智慧图书馆移动视觉搜索和用户画像相关研究,探索了用户画像在智慧图书馆移动视觉搜索及推荐服务中的数据采集、数据预处理、画像建模和效果评估等实现过程,搭建了智慧图书馆个性化移动视觉搜索及推荐服务模型,探讨了模型的数据获取、资源整合、数据处理、智慧服务等各层次功能,分析了涉及的用户隐私保护、用户画像动态变化、服务性能优化等关键问题。
关键词:智慧图书馆;移动视觉搜索;用户画像;个性化推荐
中图分类号:G252.7 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2020066
Research on Personalized Mobile Visual Search of Smart Library Based on User Portrait
Abstract Embedding user's portrait in smart library's mobile visual search service can solve the information overload and the semantic gap problem, and meet the personal needs of the readers. The paper made a review of the related research of mobile library visual search and user portrait, explored the realization process of user portrait in data collection、data preprocessing、modeling and effect evaluation of smart library mobile visual search and recommendation service, constructed personalized mobile visual search and recommendation service model, probed different function of the model in data collection, resources integration, data processing, and smart service, and analyzed some key problems such as privacy protection, dynamic changes of the portrait, and optimization of service.
Key words smart library; mobile visual search; user portrait; personalized recommendation
大數据时代,图书馆数字资源变得异常庞大,传统的知识检索方式,难以满足移动网络环境下用户对知识的多元化、个性化检索需求。相比于传统数字图书馆,智慧图书馆以用户为中心,提供精准的知识搜索及个性化推荐服务,从海量馆藏资源中为用户提供检索并根据检索信息推荐用户感兴趣的知识。移动视觉搜索(Mobile visual search,MVS)满足读者的多元化、敏捷化的知识检索需求,而推荐系统则为读者提供精准化、个性化知识推荐服务。两者的结合,充分发挥智慧图书馆智慧化服务能力,增强用户体验。
虽然不同用户检索相同的视觉对象,但用户所期望检索的结果却是因人而异、因情而异的。通过采集用户注册信息、访问日志、检索查询及其行为特征数据等,融合读者情景信息,构建精准全面的用户画像,然后根据用户输入的关键词、主题及用于检索的视觉对象特征,结合用户画像,挖掘读者检索意图并将检索结果按其知识偏好进行有序排列,可提高读者的检索效率和准确性。智慧图书馆个性化推荐服务,可通过记录用户检索浏览的知识内容、下载阅读、添加收藏、检索次数、阅读时间、点击量、阅读后的评论咨询等数据,共同构成用户画像的基础数据,并对数据进行清洗、分类、挖掘、融合等处理,结合推荐算法为读者提供个性化知识推荐。当前推荐系统主要包括协同过滤推荐、人口统计推荐、基于内容的推荐、基于知识的推荐、基于社区的推荐和混合推荐系统[1]。除此之外,可采用深度学习进行知识推荐,即通过对用户行为特征和物品特征数据进行迭代学习,挖掘用户与物品之间的关联,从而提高推荐的准确性[2]。本文在分析智慧图书馆MVS和用户画像的相关研究基础上,针对当前大数据时代移动视觉搜索存在语义鸿沟、呈现结果存在信息过载、没有突出特点、未考虑用户个性化需求等不足,构建面向读者的精准用户画像,将其融入智慧图书馆个性化MVS及推荐服务,并分析各环节实现流程,深入探讨其中关键问题与对策,以提升智慧图书馆检索服务质量。
1 相关研究
1.1 智慧图书馆MVS
人工智能高速发展,图书馆知识服务已经不是传统的单一借阅模式,而是向以读者为中心的智慧型综合服务模式转变。智慧图书馆以智能技术为基础,实现书书互联、书人互联、人人互联,以人为本,并提供智能、高效和便捷的知识服务,是未来图书馆发展的新模式[3]。MVS概念是由B. Girod在第一届移动视觉搜索研讨会上提出的。智慧图书馆MVS能够以读者为中心,满足读者多元化的知识检索需求。国外针对MVS技术的研究起步较早,国内相对滞后,但许多学者已积极投入相关领域的创新研究。如张兴旺和李晨晖[4]探讨MVS发展过程,分析数字图书馆MVS机制的内涵、分类与架构设计,建议从移动环境软硬件资源局限性、用户需求多样性、移动用户体验质量、互操作性、协同管理等方面建设数字图书馆MVS机制;同时,根据数字图书馆MVS引擎的领域依赖性,通过模块化设计思想分析其业务流程,提出一种领域导向的、自适应的、可演化的数字图书馆MVS引擎[5];曾子明和秦思琪[6]分析了图书馆MVS的研究现状,从读者、知识、情境和服务等进行需求分析,构建智慧图书馆MVS服务模型,指出ROI定位、语义鸿沟和情境融合等问题,并搭建智慧图书馆MVS技术框架,为相关领域研究提供参考;韩玺等[7]认为MVS服务能有效促进图书馆各种资源开发利用,并分析图书馆MVS资源聚合的需求,结合数字资源多维度聚合和语义关联等理论,构建基于语义关联的图书馆MVS资源多维度聚合模型,并阐述其实现流程;又将情景感知融入图书馆移动视觉搜索服务,并从数字人文和电子图书MVS服务的应用进行举例分析[8];张亭亭等[9]提出通过众包模式获取大规模视觉资源,该创新模式的提出对促进图书馆移动视觉资源库的建设有重要意义。
智慧图书馆是图书馆的创新变革,融合科学技术,结合现代化管理模式,无缝地融入读者学习和生活的方方面面。随着智能移动设备的普及,MVS已成为读者青睐的信息检索方式。智慧图书馆MVS可以理解为:首先通过智能移动终端设备获取视觉资源(如图片、视频);其次,把获取的视觉资源作为检索对象并通过移动互联网进行传输;最后,提取视觉检索对象的特征并分析处理,将从图书馆海量资源中提取关联匹配的知识内容以可视化的形式呈现给用户。智慧图书馆MVS丰富了读者的知识检索方式,使知识的获取更加方便快捷,同时增强读者对知识获取的主动性。目前的研究集中于对图书馆MVS服务模型的创新和视觉资源的组织管理,注重于检索结果的多而全,较少涉及如何更好地感知和理解用户检索意图和知识偏好,降低语义鸿沟,以提供个性化的MVS服务,使检索结果对不同个体都更具实际价值。
1.2 用户画像
近年来用户画像成为学界和业界研究的热点。在学界,相对于国外,我国在用户画像方面的研究相对滞后。用户画像的提出者交互设计之父Alan Cooper[10]认为它是对真实用户数据的虚拟角色描述。陈添源[11]认为用户画像是指在特定产品使用情境下,借助抽样问卷调研或者大数据技术抽取用户的人口统计属性、行为习惯、消费心理和社交特征等多维度数据,利用数据挖掘模型构建与用户画像相关的标签内容,从而精准描述差异化群体特征的一种分析方法;D.Travis[12]指出用户画像应满足P(Primary research,基本性)、E(Empathy,移情性)、R(Realistic,真实性)、S(Singular,独特性)、O(Objectives,目标性)、N(Number,数量性)、A(Applicable,应用性)等7个基本条件;余孟杰[13]认为用户画像是大数据环境下对用户进行标签化的方法;刘海鸥等[14]采用文献分析方法对国内外用户画像研究进行分析,从概念界定、构成要素、模型与方法等维度细致梳理用户画像最新研究成果,结合国外研究提出我国在用户画像研究的方向和启示;并将用户画像用于图书馆[15]和旅游[16]情景化推荐服务中;何娟[17]根据个人和群体画像,挖掘用户阅读偏好以推荐图书,并通过调查问卷得到评价结果在基本满意之上的读者占比为86%;程全[18]讨论基于用户画像的数字图书馆信息服务模式研究的必要性,提出了挖掘隐性语义模型、拓展图书馆信息服务内容、监控动态知识流动轨迹等完善路径。
在业界,用户画像被应用于搜索引擎。科技的进步,推动物联网和网络设备技术水平提升,移动终端设备得到极速普及。大数据无处不在,如何从海量数据中获取有用有价值信息成为重要的研究方向。搜索引擎是一种帮助人们从海量信息中获取期望内容的筛选工具。泛信息时代,信息量过载的问题越来越严重,搜索引擎提取的信息存在大量冗余而且没有条理,需要人为的多次筛选。通过采集用户基本信息、检索记录、查询及阅读浏览记录等,构建用户画像,从而提供个性化、精准化搜索服务。根据输入的检索关键词,结合用户特征,识别、分类、关联检索对象,依据用户对内容的偏好程度进行排序,有效解决信息过载问题,提高用户检索体验。具有代表性的是Google搜索引擎应用。用户画像另一个应用领域,也是主要领域,即推荐系统。根据用户画像和商品及内容画像的匹配,采用基于内容的推荐机制,将符合用户偏好的商品或内容推荐给用户。通过数据挖掘和深度学习等方式对用户消费行为进行分析,找到相似的用户群体,结合其他用户的购买倾向,推荐关联商品。同时,用户画像在电子商务产品设计、优化和精准营销等方面发挥重要作用。目前个性化阅读比较受关注,不同的用户在客户端上看到的内容是差异化的,主要根据用户阅读偏好进行知识的分类推荐。构建用户画像,挖掘读者的阅读行为习惯(如时间、方式、内容种类等)和偏好,可提供个性化内容推送,结合评论反馈数据进行画像模型与推荐算法的动态调整,能够最大程度上满足用户个性化阅读需求。
综上,用户画像可定义为在特定领域通过数据挖掘、大数据采集等技术获取用户产生的一系列数据,并对数据进行分析处理,实现用户特征的标签化,是挖掘用户兴趣偏好以为高层决策提供指导的工具和方法。将用户画像嵌入智慧图书馆MVS及推荐服务中,充分挖掘读者的知识偏好,全面感知读者的检索意图,提供因人而异、因情而异的MVS。
2 智慧图书馆用户画像构建
2.1 数据采集
图书馆获取读者数据是比较容易的,归因于其服务对象主要是学生、教师和科研人员,目的是为读者提供更优质的知识服务。图书馆可在读者允许的情况下采集其注册信息,如姓名、年龄、专业、研究方向、联系方式、住址、民族等属性特征;利用图书馆用户管理与服务平台、系统门户网站或移动智能终端设备等日志数据、后台数据库,收集用户检索、阅读、点击、浏览、收藏、转发等行为数据;采用网络爬虫工具和日志分析技术获取注册用户评论、评分数据,结合文本挖掘和情感分析,获取用户情感偏好;亦可借助在线问卷调查、在线访谈或远程提问等收集读者相关数据;收集日志数据中检索阅读记录,获取用户偏好的知识领域(如自然科学、历史、文学等)、知识类型(如论文、书籍、专利等)、知识形式(如文本、语音、视频、图片等);借助全球定位系统(GPS)、无线射频识别技术(RFID)、监控器、智能可穿戴设备、传感器等采集用户情景数据,用于挖掘分析读者在不同情景下的检索意图和知识偏好。
2.2 数据预处理
鉴于采集的原始用户数据存在不完整、不一致、有虚假数据等情况,会影響用户画像构建的准确性,甚至误导系统决策。因此,需要进行数据清洗、集成、转换、规约等预处理。数据清洗是将收集到的原始数据中无关数据、重复数据剔除,对异常数据进行实际调查更正。对来自不同数据源的用户数据表达形式存在不一致和异构问题,需要进行数据的集成,并转换成统一标准进行整理和存储。通过对原始数据的预处理,为后续模型的构建提供良好的数据基础,提高模型的准确性和适用性。
2.3 画像建模
获取充分的用户数据后,需对用户特征数据进行建模,实现对用户多维特征的标签化,以构建清晰的用户画像。标签是对目标对象进行定义的易于理解和识别的特征标识,具有语义化和短文本等重要特征。语义化使人能够更直观理解标签的具体含义,而短文本是方便计算机对标签进行提取、识别、处理与分析等。标签化是用户画像的核心,通过对标签识别,使计算机能够自动完成分类统计,并进行标签的深度挖掘[19]。特征标签之间相互补充,目的是精准全面反映用户画像。特征是对用户数据的挖掘与凝练,从复杂数据中提取有价值信息,以直观表示和区分独立用户。结合已有研究,本文从读者维、情景维、知识维构建用户画像模型(见图1)。
用户画像可分为个体画像和群体画像。根据已有研究,构建用户画像多采用统计、聚类分析、贝叶斯网络、主题模型及神经网络等方法[20]。群体画像是对有相似特征用户进行类别划分,考虑到同一类用户在信息检索和知识获取等有很高的相似性甚至重复,对同类用户提供服务能够节约搜索和推荐过程的时间消耗,提高响应速度和推荐的准确性。群体画像分析是在用户画像获取之后,对加权的用户标签属性进行相似度计算,形成具有不同标签特征的用户群体画像。计算相似度之前,需要归一化,即物理系统中的无量纲处理,常用方法是线性函数转换。相似度计算采用欧式距离、余弦相似度、Person相关系数等度量方法,涉及到二元变量时可采用Jaccard系数计算。聚类是一种无监督分类,即无先验知识可以利用。聚类算法可分为层次化聚类、划分聚类、基于密度和网络的聚类、基于神经网络和统计学的聚类等[21],较为常用的有K-means、DBSCAN、神经网络等。甄选合适的算法进行用户画像聚类,应确保簇内差异尽可能小,簇间的差异尽可能大(见图2)。
2.4 画像评估
用户画像建模完成,还需要评估画像效果,判断生成用户标签的准确性及是否符合读者的实际情况。只有读者最直接明确该标签是否真实准确,鉴于读者群体庞大,使用统计学中的抽样调查法,对个体和群体画像分别进行随机抽样和分层抽样,并记录用户确认准确且符合实际的标签数。通过计算样本标签准确率(Pi=(正确标签数/总标签数))的平均值P(即平均标签准确率)和方差σ2衡量模型的优劣(即P越大且σ2越小,模型越精准),并为图书馆用户数据有效性检验、模型调整与优化提供反馈。
(1)个体画像评估
(n为随机抽样的样本个数) (1)
(2)
(2)群体画像评估
(3)
(4)
L 表示分层的数量,N表示总体数,其中 Nh、nh、Ph、σh,分别指的是第h层的样本总数、采样的数量、采样得到的样本标签准确率均值和标准差。
3 基于用户画像的智慧图书馆个性化MVS服务
MVS作为搜索引擎在本质上是一种帮助用户过滤信息的手段,只能满足用户部分知识检索的需求,显示的目标知识没有突出特点且数量较多,未考虑用户的个性化需求,难以有效应对信息过载效应[22];同时,仅根据视觉资源的底层语义特征进行知识检索,系统仍然难以判断读者的完整且真实检索目的,提取的知识目标偏离用户真实期望,即MVS存在“语义鸿沟”问题[23]。通过对用户、情景和知识资源特征进行多维度刻画,提取用户兴趣向量,并与检索视觉资源特征向量进行关联匹配。根据用户画像,挖掘用户真实检索意图和知识偏好,缩小目标对象的搜索范围,并把读者真实需求或偏好程度高的知识排在最前面;同时根据用户的检索行为推断用户可能想要获取某一方面的知识,并推荐与读者检索对象关联知识。如检索汽车图片,根据用户画像,设计专业学生期望获得汽车外观设计知识,具有制造专业特征的更关注汽车制造环节,而物理学画像用户更倾向于汽车动力学知识等。
智慧图书馆MVS,嵌入用户画像及推荐算法,实现检索结果的智慧化、个性化推荐。分析不同用户画像,根据相似用户的检索内容偏好,提供其感兴趣的知识内容;通过提取资源特征,结合用户检索阅读各类知识之间的关联,推荐关联度高的知识。基于用户画像的智慧图书馆MVS,目标是将检索到的大量视觉资源,按照用户偏好筛选排序并可视化。通过MVS对象语义特征与资源语义标签建立的准确联系,结合用户画像为读者提供个性化MVS和推荐服务。为此,构建基于用户画像的智慧图书馆个性化MVS服务层次模型(见图3)。
3.1 数据获取层
数据获取的对象包括读者维、情景维和知识维数据。情景维数据可通过移动智能终端设备或物联网技术采集,如GPS、监控器、RFID、图像采集器、传感器、可穿戴设备等获取读者社会、个人、设备及物理等情景信息。读者维和知识维数据获取是通过采集读者的注册信息、在线问卷调研数据、系统后台数据及网页日志数据。采集的原始数据存在噪声、缺失值、类型不匹配等情况,且形式包括文本、图像、音视频等,需要进行数据的加工处理,保障数据的规范化、一致性和可读性。如注册信息、问卷调研数据、网页日志数据需判断同一用户身份。调查问卷不能任意投放,而是对每一个注册用户根据其邮箱发送调查问卷;亦可根据用户注册编码、绑定手机号、个人基本信息等判断,及借助用户使用设备的IP地址、邮箱等分辨。获取充分的用户数据为构建准确全面的用户画像奠定基础,是智慧图书馆提供个性化MVS及推荐的保障。
3.2 资源整合层
资源整合层由文本库、图片库、音/视频库等构建的语义标签库和用户特征标签库构成。通过对知识库建立语义标签,实现视觉资源检索对象与文本、图像、音/视频、3D等不同形式知识的语义关联,这种关联在视觉检索过程中可能存在面向主题的资源关联问题[23]。可通过主题图的方法解决该类问题,以提供准确快速的信息检索[24]。用户画像包含个体画像和群体画像,个体画像是对个体属性特征的刻画,群体画像是对某一类用户属性特征的描述。前者实现精细的用户分析,提供个性化MVS和推荐;后者实现对一类用户的知识检索推荐,提高系統响应速度和效率,优化服务设计。而且在对同一类用户中某一新用户进行推荐时,可以采用同类用户中的相关数据对新用户缺失属性标签进行预测,保障系统在对该用户未知的检索对象进行推荐时,可以提高检索推荐的准确性。通过智能化推荐和精准用户画像,融合用户所处情景,挖掘用户知识检索的真实意图,对视觉检索对象进行语义分析,并与视觉资源语义标签关联匹配,更好地为用户提供其期望的知识内容,降低MVS存在的语义鸿沟问题。
3.3 数据处理层
数据处理层主要是对视觉对象的分析和知识标签库的建立,实现个性化MVS和推荐,并完成动态反馈和调整,提高检索推荐的准确性,使检索内容更符合读者需求。该层整合了智慧图书馆个性化MVS和推荐服务的MVS模型、用户画像模型、推荐模型及情景感知模型等。检索模型提供知识检索的工具,用户画像实现对用户的属性、行为和情感偏好特征的刻画,推荐模型是对用户感兴趣的信息预测和判断,情景感知模型是对用户检索阅读过程进行情景分析,挖掘用户不同情景下的检索意图和知识偏好。通过整合相关模型,将检索推荐的TOP-n项结果可视化,提高智慧图书馆MVS和推荐服务的智慧化水平。从图书馆获取用户数据根据画像模型生成用户特征标签,而标签是否准确且符合实际,需用2.4公式量化评估,然后审查数据源的真实有效性和模型设计合理性。只有当画像模型能够客观描述用户精准特征时,才能有效挖掘用户检索意图和阅读偏好,为MVS和检索推荐提供基础。当然检索结果是否符合用户期望,亦需通过用户调研和系统反馈衡量。基于用户画像的智慧图书馆个性化MVS流程(见图4)。
3.4 智慧服务层
在智慧服务层包括个性化MVS服务、个性化推荐服务、一站式服务、情景服务和社交服务等。个性化MVS服务包含精准视觉特征匹配、个性化视觉搜索、MAR(移动增强现实)和MVR(移动虚拟现实)等[23]。视觉特征匹配实现视觉检索对象(局部或全局)特征与文本、图像及其他类型视觉资源特征的关联匹配;个性化搜索是结合用户画像,通过基于用户标签的推荐算法将符合用户检索意图与需求偏好的信息排在最前面,提高知识检索的个性化水平,增强用户体验。MAR、MVR是在移动智能终端设备依托增强现实AR和虚拟现实VR技术实现视觉资源的动态可视化展示。在其他服务中包含文本、语音检索等其他智能检索服务。智慧图书馆个性化推荐服务分为实时推荐、新知识推荐和关联推荐。实时推荐是根据当前读者提供的视觉检索内容和阅读浏览记录进行即时分析,结合用户画像,向读者提供个性化知识推送。新知识推荐是指根据用户的检索阅读记录,推荐用户可能感兴趣的不同类型的热门知识。关联推荐是根据用户检索阅读的内容,通过关联分析判断符合用户需求偏好的关联知识,从而提供推荐。一站式服务是将智慧图书馆的基本服务通过逻辑清晰和简洁的方式进行流程化,指导查询、账户管理、充值等基本操作,系统交互更加人性化,方便读者获取相关的知识和服务。情景服务是智慧图书馆通过物联网和智能终端设备获取读者情景信息,并在读者进行视觉对象检索时,利用场景馆或智能终端设备将目标情景再现,提升读者对检索知识的感知与理解。智慧图书馆提供社交服务,人人都能参与知识的创造、应用与传播,形成高度共享的知识交流平台,亦为构建用户画像积累充分的用户原始数据。
4 基于用户画像的智慧图书馆个性化MVS关键问题
4.1 用户隐私安全
用户信息隐私保护是图书馆以用户为中心提供智慧服务必须要面临的关键问题。智慧图书馆为用户提供高度开放、共享的知识服务环境,对用户信息隐私的保护是极其重要。而且,图书馆为用户提供智慧化、个性化的MVS和推荐服务,采集大量的用户数据,其中大部分涉及用户信息隐私。因此,智慧图书馆更要做到对用户信息隐私的保护,这不仅是对图书馆声誉的保障,更是对用户负责的表现。为保障用户信息隐私安全,可采取如下措施:(1)采集必要的用戶数据,减少无关数据的采集;(2)对涉及用户隐私的信息,在不影响研究的情况下进行脱敏处理;(3)对用户隐私信息进行数字加密处理,保障数据在传输和存储中的安全性;(4)设置严格的用户数据访问权限,只有获得访问权限的对象,才能访问用户信息内容;(5)对用户数据的操作采用授权机制,只有取得管理授权才能进行相关数据的指定操作。同时,避免集中存储,采用分布式存储保障用户信息数据和馆藏资源的存储安全。
4.2 用户画像动态变化
用户的行为习惯和特征偏好并不是固定不变的,而是随着时间动态变化。智慧图书馆提供个性化MVS及推荐服务,都是建立在构建精准全面的用户画像并挖掘用户需求偏好的基础上。但是,用户的行为习惯和偏好都会随着时间发生变化,使得原有的用户画像模型的适用性和准确性受到影响。因此,如何把握用户画像的变化以精准构建反映用户实际特征的画像模型,是智慧图书馆个性化MVS及推荐服务存在的关键问题。如果系统进行用户数据的实时采集和模型优化,显然浪费资源,影响系统服务效率。根据已有研究,Kim等[25]采用增量学习追踪用户行为偏好的转变;吴翔宇[22]提出使用一次指数平滑模型,以时间序列为标尺划分用户兴趣,进而预测用户兴趣的变化。同时,可对影响用户偏好的属性特征进行权重划分,提取影响用户偏好的主要因素,以把握用户兴趣演变的主趋势。只需筛选合理时段获取权重高的用户属性,即可跟踪用户兴趣的变化,进而提高用户画像的精准度。
4.3 服务性能优化
泛信息时代,图书馆视觉资源数量异常庞大,提供视觉资源的分析处理已经占用部分系统性能和运行空间,再对视觉对象特征匹配的大规模资源进行推荐排序运算,严重影响系统响应效率。图书馆需要选择高效的视觉资源特征提取和匹配模型,以及快捷的推荐算法,并根据用户偏好提高查准率或查全率。以用户为主导的新时代,用户对获取知识服务过程更注重体验。智慧图书馆MVS及推荐服务,必须以用户为中心,确保检索结果符合用户真实期望,知识表示方式适应用户阅读习惯。移动网络环境下,影响用户体验的因素,主要是智能移动设备的性能尚不足以提供高效的大数据运算。因此,智慧图书馆可搭建基于Hadoop的云计算平台,一方面,为海量馆藏资源提供分布式安全存储,促进资源协同共享;另一方面,将复杂的模型算法和大数据处理通过云传输到云服务器进行并行计算,再将结果安全传输给用户,从而提高系统响应效率,创造极致服务体验。同时,智慧图书馆利用云计算平台提供无线泛在的个性化MVS和推荐服务,保障用户可以在任何时间和地点及时、便捷、高效地获取相关服务。
5 结语
将用户画像嵌入智慧图书馆MVS和推荐服务,能够以读者为中心,提供多元化的知识检索方式,实现对读者检索对象的精准匹配和个性化推荐,降低并缓解信息过载及语义鸿沟问题。通过对读者进行画像建模,实现对读者检索意图和知识偏好的精准推断,并利用系统交互数据,动态调整检索推荐模型,提高检索服务质量。建立用户画像并不是一成不变的,因为用户的行为习惯及偏好会随着时间而演变,如何更好的协调用户画像模型适应这种变化,需要深入研究。MVS作为便捷的搜索方式,实现对视觉对象关联知识的快速匹配,依托用户画像挖掘读者的检索意图及知识偏好,对检索结果进行可视化,有效提高智慧图书馆MVS的个性化水平。下一步将以本文提出的模型为基础,搭建原型系统进行实证研究,并构建评价指标体系对用户检索满意度调查分析,旨在推动智慧图书馆高质量发展。
参考文献:
[1] Yusefi Hafshejani Z,Kaedi M,Fatemi A.Improving sparsity and new user problems in collaborative filtering by clustering the personality factors[J].Electronic Commerce Research,2018(18):813-836.
[2] Elkahky A,Song Y,He X.A multi-view deep learning approach for cross domain user modeling in recommendation systems[J].In International World Wide Web Conference Committee(IW3C2),Florence,Italy,2015:18-22.
[3] 王世伟.未来图书馆的新模式——智慧图书馆[J].图书馆建设,2011(12):1-5.
[4] 张兴旺,李晨晖.数字图书馆移动视觉搜索机制建设的若干关键问题[J].图书情报工作,2015,59(15):42-48.
[5] 张兴旺,郑聪.领域导向的数字图书馆移动视觉搜索引擎建设研究[J].图书与情报,2016(5):40-47.
[6] 曾子明,秦思琪.智慧图书馆移动视觉搜索服务及其技术框架研究[J].情报资料工作,2017(4):61-67.
[7] 韩玺,何秀美,张珗.基于语义关联的图书馆移动视觉搜索资源与服务聚合研究[J].现代情报,2017,37(10):3-7.
[8] 韩玺,何秀美,张珗.基于情景感知的图书馆移动视觉搜索服务设计研究[J].图书馆学研究,2017(16):63-68.
[9] 张亭亭,赵宇翔,朱庆华.数字图书馆移动视觉搜索的众包模式初探[J].情报资料工作,2016(4):11-18.
[10] COOPER A.About Face 3.0: the essentials of interaction design[M].New York: John Wiley & Sons Inc,2007.
[11] 陈添源.高校移动图书馆用户画像构建实证[J].图书情报工作,2018,62(7):38-46.
[12] Travis D.E-Commerce Usability:Tools and Techniques to Perfect the On-Line Experience[M].CRC Press,2002.
[13] 余孟杰.产品研发中用户画像的数据建模——从具体到抽象[J].设计艺术研究,2014,4(6):62-64.
[14] 刘海鸥,孙晶晶,苏妍嫄,等.国内外用户画像研究综述[J/OL].[2019-12-20].http://kns.cnki.net/kcms/detail/11.1762.G3.20180816.1744.005.html.
[15] 劉海鸥,黄文娜,谢姝琳.面向情境化推荐服务的图书馆用户画像研究[J].图书馆学研究,2018(20):62-68.
[16] 刘海鸥,孙晶晶,苏妍嫄,等.基于用户画像的旅游情境化推荐服务研究[J].情报理论与实践,2018,41(10):87-92.
[17] 何娟.基于用户个人及群体画像相结合的图书个性化推荐应用研究[J/OL].[2019-12-20].http://kns.cnki.net/kcms/detail/11.1762.G3.20180816.1745.009.html.
[18] 程全.基于用户画像的数字图书馆信息服务模式研究[J].图书馆学刊,2018,40(4):68-71.
[19] 牛温佳,刘吉强,石川.用户网络行为画像——大数据中的用户网络行为画像分析与内容推荐应用[M].北京:电子工业出版社,2016:30-32.
[20] 单晓红,张晓月,刘晓燕.基于在线评论的用户画像研究——以携程酒店为例[J].情报理论与实践,2018,41(4):99-104.
[21] HAN J,KAMBER M.Data mining concepts and techniques[M].Orlando,USA: Morgan Kaufmann Publishers,2001.
[22] 吴翔宇.基于用户画像的推荐技术研究[D].青岛:青岛科技大学,2018.
[23] 曾子明,宋扬扬.基于SoLoMo的智慧图书馆移动视觉搜索服务研究[J].图书馆,2017(7):92-98.
[24] 李冠楠.基于主题图的数字图书馆信息资源整合研究[D].武汉:华中师范大学,2011.
[25] Kim H N,Ha I,See S H,et al.Modeling and Learning User Profiles for Personalized Content Service[C].Asian Digital Libraries.Looking Back 10 Years and Forging New Frontiers,International Conference on As Asian Digital Libraries,Icadl 2007,Hanoi,Vietnam,December 10-13,2007,Proceedings.DBLP,2007:85-94.
作者简介:曾子明(1977-),男,武汉大学信息资源研究中心、武汉大学信息管理学院教授,博士生导师,研究方向:大数据资源智能化管理及应用;孙守强(1995-),男,武汉大学信息管理学院硕士研究生,研究方向:智慧图书馆。
本文系国家自然科学基金项目“云环境下智慧图书馆移动视觉搜索模型与实现研究”(项目编号:71673203)研究成果之一。
收稿日期:2019-12-18;责任编辑:胡刚;通讯作者:孙守强(sun_shouqiang@163.com)