基于小数据融合的图书馆用户精准画像构建研究
2020-11-23龙春芳
龙春芳
关键词: 小数据;图书馆;用户画像;融合
摘 要: 文章分析了小数据的内涵与特征,介绍了图书馆对用户小数据的融合处理流程,指出了基于小数据融合的图书馆用户精准画像构建方式,以期为相关研究提供参考。
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2020)10-0090-03
大数据、云计算等技术在图书馆的应用为信息资源获取提供了便利,保障了个性化定制、智能推送等服务的实施,推动了图书馆服务环境、模式与内容的变革。然而,大数据的总量和复杂程度日益增长,对其研究和利用要耗费大量的人力、财力,这个过程不仅容易导致隐私泄露,而且无差别的服务方式也影响了服务效果。为解决这些问题,图书馆界开始关注小数据。小数据是指具有显著个体特性的信息证据,是从个体角度采集的全部数据,包括行为、喜好、社会关系等。对小数据进行统一融合和客观分析,发现其中隐含的价值,可以预测个体的行为、特征和社会联系,弥补大数据的不足[1]。通过数据融合建立精准的用户画像,对用户阅读场景、阅读需求、身份特点等进行分析,有利于准确制订服务方案,提升用户的服务体验。
1 小数据的内涵、特征与作用分析
1.1 小数据的内涵
小数据又被称作个体资料,是指包含个体所有特征信息的数据集合。关于小数据的研究始于2011年,最初研究人员仅将其看作与大数据相对的概念,即规模小、变化慢、维度低的数据。舍恩伯格教授在《大数据时代》一书中指出,大数据是侧重决策的全数据,是通过全方位的数据采集、整理、分析探索事物发展的结果,小数据是以用户为中心,侧重对个体特征的深入挖掘,旨在探索个体与相关事物之间的联系。
1.2 小数据的特点
随着大数据的兴起,人们日益认识到数据的价值,借助大数据分析预测用户需求成为各行各业的趋势。与大数据相比,小数据具有成本低、风险低、个性化、动态化的特点,各种移动终端、可穿戴设备的应用也为小数据采集提供了便利[2]。小数据是围绕个体产生的,因此不同个体之间的差异以及对同一事物的不同见解决定了数据的个性化特点。小数据的形式多样,包括图像、视频、声音等。由于小数据规模较小、结构简单,并不需要复杂的技术和系统配置,所以可以在一定程度上避免信息利用过程中存在的风险。小数据的数据体量小,分析整理更加方便,对于系统的配置要求不高,能够减少系统损耗,降低数据处理成本[3]。
1.3 小数据的作用
小数据包括用户的情境状态数据、身体数据、行为数据等,对这些数据进行采集和分析,建立与用户相关的数据模型,可以更好地预测用户需求。小数据从微观层面反映了用户的阅读需求、个性特征、喜好等,揭示了用户活动与图书馆服务之间的因果关系。对个体数据进行追踪、采集和分析,可以精准预测个体需求和事态发展方向,为图书馆制订服务方案提供依据。
2 图书馆对用户小数据的融合处理流程
数据融合是指将异构数据转换为统一的形式以便为决策提供依据。图书馆用户在获取服务过程中会产生形式多样的小数据,图书馆应对这些小数据进行融合分析,挖掘其中隐含的价值。
2.1 分析数据源
图书馆通过多种途径采集与用户相关的小数据后,首先要对数据进行综合分析,经过数据映射、去重、更新等操作后将其纳入小数据融合库中。对于来源多样的异构小数据,图书馆需要建立统一的数据模型,在确定不同数据映射关系的基础上赋予不同数据相应的权重,再将这些数据纳入相同的模型中。对于相同模型下的映射数据,图书馆还需要做好去重工作以减少数据存储占用的空间,提高数据存储效率[4]。
2.2 深入挖掘小数据的基本属性
深入挖掘小数据的基本属性有利于掌握读者的个性化特征。图书馆应从数据中提取与用户属性相关的内容,如检索次数、 访问时长、阅读类型等,用于更准确地分析用户行为。在这个过程中,图书馆既要对有价值的数据进行挖掘利用,也要重视去重处理,只有这样才能准确描述用户偏好并划分用户群体。
2.3 构建用户画像
用户小数据收集与整理完成后,图书馆就要对这些数据进行关联、挖掘和态势分析,从中获取可用的信息并纳入用户数据库,从而全面掌握用户的兴趣爱好、行为特征和个性化需求。图书馆只有结合用户所处的情境建立符合用户特征的知识空间,探究不同数据之间的关联,才能获得更有价值的数据,为构建用户画像奠定基础。
3 基于小数据融合的图书馆用户精准画像构建
3.1 小数据融合分析
图书馆建立用户精准画像的目的就是结合用户小数据还原用户信息,从而全方位把握用户需求,为开展个性化服务提供支持[5]。图书馆不仅可以从各类服务系统中获取小数据,也可以借助智能终端、可穿戴设备等采集用户数据。由于采集的初始数据是分散异构的,彼此之间关联度不高,所以需要对这些数据进行融合。在这个过程中,图书馆可以提取用户基本信息,初步描绘出用户画像,然后对用户静态、动态数据进行分类处理并对源数据库进行完善,进而得到更加清晰的画像。
3.2 用户画像构建
图书馆对用户精准画像的描摹是长期动态的过程,需要分阶段、分步骤进行。首先,图书馆要根据源数据分析结果为不同用户设置对应的标签,然后对用户标签进行分类,建立个体用户和群体用户标签体系;其次,图书馆从多个渠道获取用户小数据后,需要借助数据集成、清洗、转换等技术对其进行预处理,再利用语义分析、聚类分析、有序化分析等算法得出符合用户特点的标签;再次,图书馆应根据不同用户之间、不同数据之间的关联勾勒出个体和群体用户画像,为个性化服务提供依据,详见图1。
3.3 用戶隐私保护
图书馆在处理用户数据过程中不可避免地会涉及一些隐私内容,尤其是个性化服务策略的制订是以小数据为依据的,这些与用户切身相关的数据若利用不当,很容易引发各种纠纷。图书馆要想规避用户小数据利用风险,保障用户的信息安全,不仅需要引进先进的信息处理技术,还需要完善相应的规章制度[6]。一方面,图书馆要借助信息加密、身份识别等技术对用户隐私信息进行安全认证,根据用户等级设置系统访问权限,对重要信息进行加密传输,避免被窃取或恶意传播;另一方面,图书馆要规范用户数据使用流程,确保管理人员规范操作,对于部分重要数据的处理必须征得原持有者的同意。
4 基于小数据融合的图书馆用户需求分析与服务策略
4.1 了解用户需求
结合用户精准画像模型挖掘有价值的内容是掌握用户需求的必要步骤。图书馆要做好小数据的价值挖掘工作,促进数据库的不断完善和更新,确保用户需求与个性化推送内容的精准匹配[7]。由于用户需求是动态变化的,所以数据库中的内容需要实时更新。图书馆也要利用相关评估模块对与用户兴趣相关的内容进行测评,从而及时发现用户需求,提高信息服务的针对性。
4.2 调整服务方案
图书馆用户的需求是随着服务方式、服务阶段、阅读情境等而变化的,存在隐性需求和显性需求之分,也存在长期需求和短期需求之分[8]。鉴于用户需求的复杂、动态性,图书馆应做好用户数据库管理工作并及时对用户小数据进行补充、删改和更新,保障用户画像构建的科学、合理。一方面,图书馆要根据小数据了解用户心理、行为、社会关系的特点,发现用户感兴趣的内容,明确不同数据之间的因果关系;另一方面,图书馆应重点采集与用户兴趣相关的资源,为个性化服务提供支持。图书馆只有根据用户需求变化动态调整服务方案,才能为其提供更精准和有效的服务。
4.3 推送个性化资源
图书馆建立精准用户画像的最终目的就是为个性化服务提供有效指导。互联网环境下,越来越多的用户习惯于通过网络检索馆藏资源,因此,图书馆可以对用户的在线浏览数据进行综合分析,借助“数字足迹”跟踪的方式获取用户小数据,全面掌握用户的行为偏好并制订信息资源采集、处理、推送的具体方案,提高资源推送的针对性和精准性。
5 结语
满足用户的个性化资源获取需求是图书馆读者服务的目标。大数据环境下,图书馆可以借助数据分析技术、数据挖掘技术等构建基于用户个性化特 征的数据库,建立精准、动态、真实的用户画像,在保护用户隐私的基础上全面掌握用户需求,制订科学合理的个性化服务方案,切实提高图书馆的服务效能。
参考文献:
[1] 陈臣.图书馆小数据读者个性化兴趣预测与发现模型的构建[J].图书馆论坛,2017(5):98-105.
[2] 陈添源.高校移动图书馆用户画像构建实证[J].图书情报工作,2018(7):38-46.
[3] 胡媛,毛宁.基于用户画像的数字图书馆知识社区用户模型构建[J].图书馆理论与实践,2017(4):82-85,97.
[4] 范晓玉,窦永香,赵捧未,等.融合多源数据的科研人员画像构建方法研究[J].图书情报工作,2018(15):31-40.
[5] 汪强兵,章成志.融合内容与用户手势行为的用户画像构建系统设计与实现[J].数据分析与知识发现,2017(2):80-86.
[6] 刘艳.基于数字足迹的公共图书馆社会化阅读服务研究[J].数字图书馆论坛,2018(11):52-57.
[7] 丁雷.大數据环境下高校图书馆用户画像与特征研究[J].中国科技信息,2018(24):59-62,64.
[8] 陈廉芳.大数据环境下图书馆用户小数据的采集、分析与应用[J].国家图书馆学刊,2016(3):69-74.
(编校:周雪芹)