APP下载

画像视角下的数字图书馆服务体系建设

2023-07-07赵萌萌

河南图书馆学刊 2023年5期
关键词:用户画像数字图书馆服务体系

赵萌萌

摘 要:文章论述了用户画像的概念,介绍了用户画像视角下数字图书馆服务的相关内容,探讨了用户画像相关技术的具体应用,即数据采集和标签提取技术、数据储存技术、个性化推荐技术等,分析了数字图书馆服务体系建设的重点,旨在提高图书馆各类资源的利用率,为用户提供个性化的资源推荐服务。

关键词:数字图书馆;服务体系;用户画像

中图分类号:G250.76   文献标识码:A   文章编号:1003-1588(2023)05-0094-03

1 用户画像

用户画像是指收集和分析目标用户的基础信息、历史行为、生活习惯等数据,挖掘其中与用户需求和偏好相关的信息内容,再利用各类算法提取能够体现用户特征的核心指标,从而给目标用户贴上全维度的标签[1,2]。用户画像具有目标性、独特性、真实性和移情性等特征[3],是建立在一系列真实数据之上的目标用户模型。在产品设计、精准营销、教育、广告等领域中使用用户画像技术,能够进一步分析用户需求,从而对市场进行更细致的划分。随着数据挖掘技术、大数据技术的应用,用户画像技术已经实现了自动画像,即基于定期更新的海量用户数据自动进行信息挖掘,分析勾勒用户的行为偏好、场景、价值取向及背景等多维度特征,对用户形象进行全面精准的刻画,进而有效预测用户需求并提供与之相适应的服务。相较于传统讨论小组、问卷调查等信息数据采集方式,自动用户画像的数据采集过程更加智能,收集的数据信息更加丰富,应用前景更为广阔。

2 用户画像视角下的数字图书馆服务

在数字图书馆服务中应用用户画像技术,是指搜集并分析用户的基础信息、阅读偏好和借阅历史等数据,提取与用户阅读特点相关的核心指标,再利用聚类算法对用户进行分类,分析挖掘不同用户群体的阅读信息全貌与需求,进而建设更高效的服务体系,全面满足用户的信息需求。将用户画像技术应用于数字图书馆服务领域是互联网技术发展的必然趋势,其应用具有三大特征:一是交互性。交互性是指在使用数字图书馆过程中,不同用户的终端和图书馆系统之间产生了大量互动行为和数据信息,这些数据是分析用户行为的前提和基础。二是动态性。动态性是指用户的各类操作处于持续变化中,其访问偏好、阅读兴趣等标签信息也会随之不断调整与更新。三是跨时空性。跨时空性体现在受诸多因素影响,用户的阅读偏好和兴趣会存在短期迁移,从而使相同的书籍内容在不同时间、空间上对用户的吸引性存在差异,精准化的用户画像能够对用户偏好进行及时跟踪,并对画像结果进行反馈更新[4]。

3 用户画像相关技术

3.1 数据采集和标签提取技术

利用数据采集技术能够全面准确地采集用户的数据信息,该技术是建立用户画像的基础,如日志挖掘技术、平台数据库采集技术、埋点监控、网络爬虫技术等[5]。日志挖掘和平台数据库采集技术通常被用于采集用户的社交数据和行为数据等。图书馆只有对采集到的数据做更深层次的分析挖掘,才能实现数据价值。Web日志与平台数据库详细记录了用户的行为轨迹,而海量行为数据中蕴含了相应的规律,分析这些数据能够了解用户的深层次需求。与自动化数据采集相比,日志挖掘与平台数据库采集的成本偏高,但对于数字图书馆服务体系建设而言,系统日志与数据库中的数据价值又极高,无法完全放弃。埋点监控是利用SDK对系统页面操作节点进行搜集,埋点出现行为变化时,系统便能够自动传输数据。网络爬虫技术能够自动收集用户的基础信息,有效降低了数据采集的成本[6]。标签提取是指提取源数据中的用户特征和偏好并对其进行格式化处理,进而构建用户的虚拟化模型,形成具有标签特征与应用价值的用户画像。

3.2 数据储存技术

HBase和Hive数据仓库是应用较为广泛的数据标签存储方式。HBase是一个分布式的开源数据库,能够实时储存、读写数据信息。Hive是依托Hadoop的数据仓库基础架构,能够对海量数据信息进行提取和转换、加载,更适用于处理结构化信息[7]。数据库主要被用于储存原始数据,处理相关事务,数据仓库则主要被用于计算分析数据,能够对数据信息进行加载、转换和抽取等操作。Hive负责储存源数据,HBase负责对需实时查询的轨迹和日志等进行处理,二者表现出了较高的兼容性。

3.3 个性化推荐技术

个性化推荐技术主要包括机器学习技术、协同过滤算法等。机器学习是人工智能技术的一个分支,是指通过综合运用统计、概率等学科知识和算法,使计算机能够尽可能模拟人类的学习模式,并在持续的学习经验积累中优化算法性能[8]。大数据背景下,图书馆可以借助机器学习技术对海量数据进行深度和智能化的数据分析,为个性化推荐提供支持。协同过滤算法是应用较为广泛的个性化推荐算法之一,其原理是基于用户历史操作信息计算不同用户的距离,参考与目标用户相距最近的用户加权评价值,对目标用户对产品的喜爱程度進行预测,系统根据预测结果向目标用户推荐其可能感兴趣的产品。协同过滤算法具体可以被划分为基于用户的协同过滤、基于物品的协同过滤等,在数字图书馆服务体系建设中,笔者更倾向利用基于用户的协同过程算法,即通过计算用户的相似性,向其推荐同类型用户感兴趣的资讯信息,同时也能够挖掘用户尚未表现出的喜好兴趣,防范出现推荐内容同质化等问题。

4 基于用户画像的数字图书馆服务体系建设

4.1 精准化推荐

目前,图书馆提供的泛在化推荐服务已经很难满足用户的个性化资源获取需求。随着人工智能技术和大数据技术的应用,精准化推荐服务成为数字图书馆服务体系的重要构成部分。精准化推荐以图书馆用户为核心,通过分析用户在图书馆借阅、搜索的行为数据,挖掘其深层次的信息需求,从而针对性地调整资源配置,为用户提供精准化的资源推荐服务。精准化推荐以建立用户标签体系为基础,用户标签体系主要包括用户基本属性、阅读兴趣与偏好、阅读主题、心理特征等。图书馆应按照用户标签的相似性和关联性对其进行划分,如按专业、年龄、性别等将用户分为不同群体,形成相应的群体画像,从而明确不同群体用户的活跃度、借阅特点和阅读偏好等,这是图书馆提供精准化服务的依据。

4.2 个性化智慧搜索

信息资源的爆炸式增长导致当代社会信息焦虑现象日益严重,难以高效满足用户知识需求成为突出问题[9]。个性化搜索可以帮助图书馆用户快速精准检索到所需内容,一定程度上缓解了用户的信息焦虑。个性化智慧搜索是数字图书馆服务体系的核心业务之一,其在数据分析的基础上对用户在特定和普遍情景中的偏好兴趣进行挖掘,并根据用户每次的检索行为及时调整分析结果。当用户检索时,系统会将检索词与数据库主题词做匹配,并根据用户显性和隐性需求调整主题。

4.3 智能化隐私保护

随着数字图书馆资源的开放共享,用户的信息安全与个人隐私安全成为业界广泛关注的焦点之一。数字图书馆服务体系隐私安全问题主要涉及身份污染与隐私泄漏两个方面:身份污染问题是由于用户账号绑定了过多身份信息,进而产生各种无用数据;隐私泄漏是指未经图书馆用户允许私自使用用户信息并获取利益[10]。数字图书馆在提供精准化推荐、智慧化预测等服务时,会实时监测、搜集用户行为信息并上传至云端,而云空间的不确定性与虚拟性,导致信息收集传输期间极易发生隐私泄露或数据丢失等问题。图书馆可采取数据脱敏的方式处理用户行为数据,即基于用户所处情景将数据信息分为不可恢复和可恢复两种类型,同时构建隐藏式用户标签体系,对行为数据的共享和使用权限进行控制,并通过隐藏用户标签进一步防范数据信息泄露,保证用户个人隐私信息的安全。

5 结语

用户画像作为利用大数据技术精准定位用戶的一种重要方式,被运用到图书馆阅读推荐、知识服务等方面,基于此,图书馆能够为用户提供个性化的阅读推广服务。数字图书馆应充分重视新兴技术的应用,积极构建科学合理的服务体系,降低运营成本,减少资源浪费,全方位提升用户体验。

参考文献:

[1] 韩秋萍.基于用户画像的图书馆个性化推荐体系构建策略研究[J].河南图书馆学刊,2022(9):59-60,70.

[2] 程光胜.基于“大数据+小数据”的智慧图书馆用户精准画像模型构建[J].图书馆理论与实践,2022(5):90-95,104.

[3] 徐玉虹.基于用户画像的公共图书馆精准服务对策研究[J].河南图书馆学刊,2022(4):42-45.

[4] 汤丽媛,王俏.数据驱动下的图书馆用户画像构建与信息资源精准服务研究[J].晋图学刊,2021(6):39-44.

[5] 王毅,吴睿青.公共图书馆数字文化资源服务用户画像研究[J].图书情报工作,2021(16):42-55.

[6] 刘海鸥,李凯,姜波.移动图书馆推荐系统中的用户画像与资源画像情境化融合研究[J].图书馆,2021(6):66-71,93.

[7] 杨正.大数据环境下用户画像在图书馆个性化服务中的研究[J].中国新通信,2021(8):55-56.

[8] 王灵萱.基于用户画像的图书馆联盟用户数据个性化服务分析[J].信息与电脑(理论版),2020(14):165-168.

[9] 张宇,阮雪灵,闫幸.基于情境化用户画像的图书馆知识服务方法研究[J].中国新通信,2020(7):86-88.

[10] 许鹏程,毕强,张晗,等.数据驱动下数字图书馆用户画像模型构建[J].图书情报工作,2019(3):30-37.

(编校:周雪芹)

猜你喜欢

用户画像数字图书馆服务体系
智慧出行,智绘未来——新一代出行服务体系构建与实践探讨
“三效合一”构建现代农业服务体系
建好公共法律服务体系“最后一公里”
把声音的魅力发挥到极致
移动用户画像构建研究
基于云计算的数字图书馆建设与服务模式研究
基于微博的大数据用户画像与精准营销
刍议数字图书馆计算机网络的安全技术及其防护策略
移动互联网下手机用户使用行为特征的研究
初具规模的健康管理服务体系