APP下载

图书馆用户画像服务失灵风险及其规避

2024-09-19于风程

图书馆建设 2024年2期
关键词:用户画像风险规避图书馆

[摘 要] 用户画像服务失灵用来描述用户画像服务供给理想和现实之间的差距,指受用户画像服务自身固有局限和外在不利因素的制约,服务偏离了预想或计划,未能有效完成服务任务并达成既定目标,进而失去用户信任的局面。无法提供精准个性化服务与偏离图书馆核心价值理念是图书馆用户画像服务失灵的主要原因。为规避服务失灵风险,图书馆在追求技术效率的同时,必须具备和履行更高道德水准的价值理念。为此,图书馆要为用户赋权赋能,改进优化算法,构建资源服务画像,打破信息茧房,实现普遍均等服务,依法建立合规完备的个人信息保护体系。

[关键词] 图书馆 用户画像 服务失灵 风险规避

[中图分类号] G250.7 [文献标志码] A [ DOI ] 10.19764 / j.cnki.tsgjs.20230176

[本文引用格式] 于风程.图书馆用户画像服务失灵风险及其规避[J].图书馆建设,2024(2):110-118,126.

* 本文系中共山东省委党校(山东行政学院)重大项目攻关创新科研支撑项目“图书馆用户画像服务失灵风险及其规避”的阶段性成果,项目编号:2023CX096。

Risk of the Failure of Library User Profiling Service and Its Avoidance

Yu Fengcheng

[Abstract] The failure of user profiling service is the gap between the ideal and the reality of user profiling service supply. Restricted by own inherent limitations and external adverse factors, user profiling service deviates from expectations, fails to effectively complete the task and achieve the goals, thus loses users’ trust. The failure to provide accurate and personalized services and the deviation from the core values of the library frequently result in the failure of user profiling services. In order to avoid the risk of service failure, the library must have and fulfill more higher moral value while pursuing technical efficiency. To this end, library should empower users, improve optimization algorithms, build resource service profiling, break the information cocoon room, ensure universal and equal service, and establish the personal information protection system.

[Keywords] Library; User profiling; Service failure; Risk averse

0 引 言

改进粗放、无差别、同质化的被动式服务,主动为用户提供精准的个性化服务,满足用户个性化、特色化、多样化的需求是图书馆孜孜以求并为之不懈努力的目标。近年来,随着大数据和人工智能技术的发展,图书馆借鉴电子商务领域的成功经验,引入用户画像这一新的服务形态,从而有效、快速、准确地分析出用户需求和行为偏好,主动为用户提供精准的个性化服务。“数据化和智慧化的结合将成为图书馆转型的轴心”[1],可以预见,用户画像服务必将成为图书馆的新理论研究和实践探索热点。

1 用户画像及其应用研究简要回顾

交互设计之父Cooper最早提出,用户画像(Personas)是建立在真实用户数据之上的虚拟角色描述[2]。《信息安全技术 个人信息安全规范》规定,用户画像(User Profiling)是指通过收集、汇聚、分析个人信息,对某特定自然人个人特征,如其职业、经济、健康、教育、个人喜好、信用、行为等方面做出分析或预测,形成其个人特征模型的过程[3]。

Personas为Cooper在1998年开创使用[4],主要应用于交互设计领域或产品设计,利用问卷、访谈等方式获取用户特征而提炼得出的虚拟的“典型用户”,是具有某种显著特征的用户群体的概念模型,这是早期概念。User Profiling是大数据环境下,人工智能自动抓取用户数据,针对一个个具体人物或者群体形成的用户模型,应用于产品设计、客户管理、推荐、营销等方面。在大数据和人工智能得到广泛运用的当下,本文采用User Profiling这一概念。Personas和User Profiling二者有所区别,但是并不存在本质区别,而是“相辅相成”[5]。从Personas 到User Profiling是用户画像这一概念随着信息技术发展而不断演变的结果,User Profiling是对Persona的继承和发展,丰富与深化。

用户画像的实质是把用户信息标签化,把用户特征抽象成高度精炼、语义突出的标签,标签主要抽象自用户统计学中的信息、性格、喜好、习惯、行为等静态数据和动态数据,这些数据可通过数据库工具或者网络爬虫技术从业务系统中获取,也可通过调研的方式来获取。

用户画像又分为个人画像和群体画像。个人画像可用以提供个性化服务。群体画像描述用户群体特征,常用以辅助决策,如设计和改进服务、优化图书馆空间、优化资源配置、制定规章。群体画像尽管是面向某一群体,但也可以为群体中的个体成员提供高质量个性化服务奠定坚实基础。

目前,国内外对用户画像的研究主要涵盖了用户画像概念、构成要素、特征、算法与技术、模型构建、应用可行性探索等诸多领域。本文重点关注、研究用户画像在图书馆实践应用中可能面临的挑战这一问题。

在国外,20世纪80年代的英国国家书目和Blaise-line(欧洲首批在线服务之一)的服务优化是用户画像在图书馆领域有文献记录的最早应用[6]。 在国内,2010年郑宝鑫在《基于用户画像、信令挖掘技术的手机游戏产品推广》一文中最早明确提出用户画像这一概念[7]。2014年,吴国芳[8]、李业根[9]分别发表论文,提出将用户画像运用于图书馆,这是国内较早地将图书馆与用户画像相结合的中文文献。

图书馆探索研究将用户画像运用于多种工作场景,运用用户画像实现个性化检索,开展知识发现服务,构建微知识服务体系,进行阅读推广,推荐个性化资源及服务,开展精准营销,构建大数据分析平台,智能荐购馆藏文献资源,实施空间再造,开展移动视觉设计及服务设计等。

这些应用场景可以大致概括为个性化服务和辅助决策两个领域,其中个性化服务又以个性化推送为主。也有少数研究者注意到了用户画像存在的问题,如会导致过度服务、不当服务、服务“内卷”等问题[10]。

总之,目前图书馆用户画像的应用研究多着眼于化解图书馆同质化供给与用户个性化需求的矛盾,以减少无效供给,更偏重发挥提升图书馆服务效能的积极作用。但是,人工智能技术是一把双刃剑,其内在的、固有的局限性不可避免地会给图书馆带来消极影响,而目前的研究却多忽略了这一点,少数这方面的研究缺乏总体上把握和宏观上审视,显得不够系统性、较为零散。

2 图书馆用户画像服务及其失灵的概念界定

图书馆用户画像服务是指图书馆根据用户人口统计学信息、社交关系、需求偏好、行为模式等数据抽象出来而形成的标签化的用户模型,以此结合不同情境预测用户的信息需求、信息行为,从而主动为用户精准推送个性化资源、服务,或用以辅助决策(配置资源、设计服务、优化空间、制定规章)的一种智慧化服务模式。

图书馆用户画像服务的直接目标是为用户主动提供精准的、智慧化的个性化服务,为用户提供超越预期的良好体验;根本目标则是在遵守法律的基础上,践行智识自由、平等、民主、包容等图书馆核心价值理念,保障用户平等的文化(信息)权利,从而保持用户对图书馆持续增长的满意度和忠诚度,增强用户黏性,促进图书馆可持续发展。这两个目标是图书馆理想中的用户画像服务效果,实现了工具理性与人文精神的完美结合。

图书馆用户画像服务失灵用来描述用户画像服务供给理想和现实之间的差距,指受用户画像服务自身固有局限和外在不利因素的制约,服务偏离了预想或计划,未能有效完成服务任务并达成既定目标,进而失去用户信任的局面。

中国青年报社社会调查中心2021年的调查显示,在广泛运用用户画像的互联网领域,用户画像失灵现象已经出现[11]。“我们谁都不是从未来穿越回来的,因此任何对未来的具体描述都充满风险”[12],尽管这是刘炜针对未来十年哪些信息技术在图书情报行业应用并将带来怎样的影响而提出的观点,但其同样适用于用户画像这一新的服务形态,我们要高度重视用户画像服务可能存在的风险。

3 图书馆用户画像服务失灵的原因

简而言之,图书馆用户画像服务失灵的原因是不能实现直接目标和根本目标。

3.1 无法提供精准个性化服务,没有实现直接目标

用户画像服务实质是用过去发生的事件预测未来发生的事件。但未来是充满不确定性的,对未来的预测往往附带诸多假定条件,一旦假定条件不成立,不准确性就是一种必然。

用户画像服务的运行机理是基于概率统计来寻找重复出现的模式或规律,遵循观察—获取数据—分析数据—挖掘统计规律—建模再现数据规律的过程,通过处理数据,从数据中发现一些深层次的知识、模式、关系或趋势,预测个人或群体的可能行为。

图书馆用户画像服务隐含着这样的逻辑:用户需求和信息行为是有规律的;这个规律是可以被挖掘和掌握的;这个规律具有延续性,即过去的需求和信息行为规律在未来继续有效。这三个方面环环相扣,任何一个方面出了问题,用户画像服务都会失灵。这要求用户需求偏好和信息行为必须呈现较强的规律性,挖掘规律的算法是有效的,用户需求和行为偏好须在一定时期内静态维持不变,而不是动态的、变动的,否则失灵将不可避免。

3.1.1 不同类型的需求和行为的可预测性存在差异

用户画像服务是数据驱动,规律蕴含在历史数据之中,充足数量的高质量数据是用户画像服务的基础。

用户需求包括规律性需求、弱规律性需求、无规律性需求、漂移性需求。这些共同构成了用户多样化需求的丰富多彩、不可缺少的组成部分,它们可以产生的数据是不同的,因而它们的可预测性也是不同的。

规律性需求一般在一定时期内维持静态不变,充足数量的高质量数据呈规律性分布,正确的算法可以挖掘出规律,精准构建细粒度的画像,并以此预测未来,可预测性较高。

弱规律性需求往往数据数量不足、质量不高,数据分布的规律性不明显,挖掘规律的难度很高,构建的用户画像往往呈现出粗粒度特征,可预测性较低。

无规律性需求往往表现为随机性需求、偶然性需求甚至是瞬时性需求,呈现出一次性特征,波动性较大,始终处于动态变化中,数据极少,基本不具备可预测性。无法有效预测无规律性需求是包括用户画像服务在内各种预测技术的先天局限。

在现实场景中,用户自身兴趣发生改变,或者受人群、环境、热点事件、情境等外部因素的影响,用户兴趣容易漂移。这意味着原有需求及行为规律对未来是失效的,不具有延续性。这种漂移兴趣即使在长期来看是规律性需求,但在漂移的起始阶段往往缺乏足够数量和质量的数据,处于冷启动状态,很难保证预测的准确性。冷启动现象是预测所面临的不可回避的挑战。

3.1.2 忽视构建资源画像

资源画像是在用户画像思想和构建原理的基础上,对资源的各种信息数据进行挖掘和处理,从而生成关于资源的画像模型[13]。

图书馆用户画像服务能否成功实现精准推荐取决于用户与资源的匹配度。为实现用户与资源的准确匹配,需要将准确的、动态的用户标签与图书馆资源深层标签之间建立关联映射,结合相关性特征、情景特征、协同特征,为用户实时准确地推荐符合其需求的信息。因此加强资源的有效描述与标引,多维度、多属性构建资源画像也就成为必不可少的基础工作。很显然,资源画像与用户画像同等重要,是用户画像服务不可或缺的重要组成部分,用户画像只有与资源画像深度融合为一体,才能深化用户画像服务效能。

实践中,往往过于重视对用户画像的构建,忽视了对图书馆资源及服务的多维、细粒度、精准标识,对资源画像重要性缺乏足够认识,少有构建资源画像。用户精准的个性化需求依然对应着近似同质化、辨识度不高、粗粒度的资源,无法实现用户与资源的精确匹配,用户画像失去了应有作用,无法精准推荐个性化资源和服务。

3.1.3 算法失灵导致画像失真与推荐失准

人工智能成效依赖于大数据、计算能力、人工智能算法这三个要素的有效结合。用户画像服务,无论是画像构建还是资源推荐同样要依赖于算法。但是算法也有可能错误洞察规律,并不能保证百分之百的准确无误,表现为画像失真,推荐不准。实践表明,真正需要的资源不可能完全靠算法按照一定规则来精准筛选,很多时候依赖于用户的隐性知识、洞察力来定性判断。面对同样的资源,不同用户的TOP-N(排名前N)选项很可能不完全一致,甚至于在不同心理状态、情境、时间阶段,同一用户的需求和选择都有可能不一致。

算法之所以会失灵的原因有两个:一是,自然界和人类社会还有太多的规律没有被人类所认识,人类自身的求知欲和猎奇心理会激发人对新信息的渴望,预测人类需求和行为偏好充满了风险和挑战,作为试图利用数字概率来描述人类思考过程的算法也自然不可能洞察所有规律。

二是,目前的算法并不完美。人类智慧的源泉在于知识、经验与推理能力。单纯依赖数据驱动的算法,其性能跟人类智慧差别非常大,无法达到真正的智能,容易被欺骗或者被操纵。算法依赖于大量的数据,一旦面对数据缺失、数据稀疏的情况,算法的准确性、可靠性是存疑的。同时,算法不是在脱离人类社会的真空中产生和运行的,代表着选择,意味着判断,承载着价值。算法黑箱现象带来的技术屏障、算法歧视,在人工智能的深度学习中都难以识别,深刻地影响用户的选择自由。

3.2 无法实现根本目标,偏离图书馆核心价值理念

在智能化阶段,人类必须深入思考智能化如何更好地服务于人。用户画像作为新兴人工智能技术,对提高图书馆服务效率,满足用户个性化需求起到了积极作用,但同时,我们必须看到,近年来方兴未艾的基于人工智能技术的知识获取方式,正在摧毁“图书馆精神”[14]。具体表现在这种知识获取方式有悖于图书馆长期实践形成并极其珍视的智识自由、平等、民主、包容等核心价值理念。如果在用户画像服务过程中,背离了图书馆核心价值理念,必然导致用户的不满与排斥,不能促进社会对图书馆事业的理解与支持,如此则没有达到图书馆用户画像服务的预期,导致服务失灵。

3.2.1 诱导需求偏离智识自由,产生信息茧房

现代图书馆学确立了智识自由的核心价值[15],2002年,IFLA《图书馆格拉斯哥宣言:信息服务和智识自由》宣布:“不受限制地获取、传递信息是人类的基本权利。”[16]

智识自由是指人人享有不受限制地寻求与接收各种观点的信息的权利[17],强调用户自主选择、独立决策,将知识与信息的选择权完全交给读者,图书馆不干预用户信息行为和需求,在提供知识与信息时要保持服务价值的中立性。

用户画像服务主动向用户推送服务在一定程度上干预了用户信息需求和行为,这与智识自由产生了偏离。尽管图书馆是出于善意,是为了能最大程度满足用户需求,提高用户获取信息的效率,但是过度介入用户信息需求,会架空用户选择的权利,使得用户长期依赖于他人的审美经验或信息推送,失去了自由搜索、获取资源、自主学习、主动思考解决问题的能力和权利。人的自由全面发展需要全面的信息知识,图书馆不能通过信息过滤把人的信息需求框架于某一方面。

研究证实协同过滤、用户画像等算法技术手段极易导致“信息茧房”[18]。 在跟随大数据算法、精准个性化推送浪潮中,用户画像服务持续推送经过过滤的同质化内容,固化、窄化了用户的需求,用户失去了获得异质信息的机会,不知不觉中陷于“信息茧房”的困境中。“信息茧房”与互联网开放多元的精神格格不入,也是智识自由被破坏的必然后果和极端后果。

3.2.2 违背平等服务理念

现代图书馆学确立了平等服务的核心价值。1994年联合国教科文组织《公共图书馆宣言》强调了平等服务,《公共图书馆法》明确规定“公共图书馆应当按照平等、开放、共享的要求向社会公众提供服务。”[19]

平等服务理念主张对所有人一视同仁,提供普遍均等服务,平等对待所有群体,同时对不能正常利用图书馆服务的特殊群体予以特殊服务。在进行图书馆服务创新时,必须高度警惕平等服务理念自觉或不自觉遭到侵蚀的可能,保障全部用户都能平等地获得这一服务,避免群体分化。

图书馆根据用户群体画像预测这一群体的整体需求与行为,以此来规划图书馆的未来发展和建设思路,辅助决策。这种情况极易导致资源配置、服务设计、空间布局、规章制定等方面向拥有画像的优势群体倾斜。

用户画像服务高度依赖线上服务,基于数据驱动,服务利用的越多,数据足迹越多,服务越精准,推送的资源越多。特殊群体由于各种障碍难以利用线上服务,数据少甚至没有留下数字足迹,这种情况必然影响用户画像服务的准确性,不精准的服务必然进一步影响到用户对服务的利用欲望,形成恶性循环,导致特殊群体无法获得高质量的用户画像服务。这种数字排斥会加剧用户画像服务在不同群体间的马太效应。图书馆要高度警惕用户画像服务可能筑起的不公平的围墙,避免数字鸿沟和数字排斥剥夺不会使用智能终端的数字贫困群体的平等权利。

3.2.3 个人信息保护存在较大风险

蒋永福[17]认为,图书馆维护智识自由,要坚持用户自主选择和保守用户秘密的原则,这里的用户秘密就包括用户个人信息,同时,保护个人信息是法律对图书馆的基本要求。因此,个人信息保护极其重要,其地位不亚于智识自由,本文不将个人信息保护作为智识自由的一部分来论述,而将其单独论述。

《个人信息保护法》规定,“个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。”[20]这一定义较《网络安全法》《民法典》在一定程度上拓宽了个人信息的范围。

图书馆大量保有用户个人信息,人工智能在为用户提供快捷精准服务的同时,也给他们的个人信息安全带来极大风险,图书馆遭遇网络攻击、内部泄露、第三方对数据过度挖掘和滥用的情况时有发生。随着用户信息安全意识的增强,个人信息安全焦虑广泛存在。用户迫切要求图书馆提供强有力的个人信息保护措施,否则会排斥图书馆利用个人信息来提供服务,造成服务失灵。

但是,受制于整个社会个人信息保护水平,图书馆个人信息保护存在较大风险,面临严峻挑战。目前,图书馆对个人信息保护意识与管理水平存在不足,对个人信息保护不力所引致的后果还缺乏足够认识,缺乏与服务规模相适应的专业人员和技术支持,国内大部分图书馆都没有明确与用户达成个人信息收集和服务协议,已有的个人信息保护政策则合规性、系统性不足,呈现出碎片化特征,文字过于冗长,语言晦涩不明。

4 规避图书馆用户画像服务失灵的必要举措

用户画像服务对满足个体和社会的需要有重要意义,完成了“人找信息”到“信息找人”的转变,实现了人与信息的高效连接。算法必将越来越成为主流推荐方式。但是在享受人工智能技术红利的同时,要有效防控技术失范带来的种种问题,促进人工智能服务健康、持续、安全有序发展,要着重从两个方向发力,一方面完善人工智能技术,另一方面要用主流价值导向驾驭算法。作为公益性机构的图书馆,在追求技术效率的同时,必须具备和履行更高道德水准的价值理念,更体现人文关怀,要做好把关人的角色。

4.1 为用户赋权赋能,增强用户的主体性

用户画像服务所需洞察的客观规律本身包含着主体的意志、主体的经验、主体的实践,其只会在主体的不断实践中呈现出来并不断进化。不存在没有主体参与的、一成不变的客观规律。

现代服务理论认为,用户和生产者共同决定服务的质量,用户应参与服务的生产,而不仅仅消费服务,高质量的服务依赖于用户的主体性和创造性。

但是,在算法主导的世界里,人不再是拥有复杂内涵的丰富个体,一个个具体的、鲜活的、丰富多彩的人异化为一个个堆积的数字标签,成为被定义、被分类、被评价的客体,人的主体性荡然无存。

最了解用户需求的是用户自己,因此,用户画像服务更要强调用户的主体地位,向用户开放,为用户参与算法决策提供渠道,通过用户的主观感知对服务过程进行修正。增强用户主体性,保障用户的参与机会与发言权,需要为用户赋权赋能,构建图书馆与用户利益平衡机制。为此,图书馆要着重开展以下工作:

赋予用户知情权。个人信息处理过程要对用户公开透明,要公示算法基本原理、服务目的、主要运行机理机制、用户标签管理规则等。

赋予用户同意权。用户对用户画像服务有同意及终止的权利,图书馆应落实《互联网信息服务算法推荐管理规定》中“一键关闭个性化推荐”的规定,并提供不针对个人特征的选项。

赋予用户修改权、删除权。用户可以修改错误、不完整的标签,添加标签,可以基于被遗忘权来删除过时的、不想保留的标签。这有助于以人工干预方式突破人工智能确定标签的限制,实现画像的动态完善及迭代,有助于以系统推送与用户自选相结合的方式优化信息推荐,更好地完成精准化内容定制与推送服务,完善和改进用户画像服务,也可以有效破解信息茧房,解决零数据冷启动问题。

赋予用户评价反馈权。用户的评价反馈是至关重要的一环,图书馆要围绕画像与用户面貌的一致性、推荐系统性能、推荐结果的准确性、推送模式等要素建立画像服务评价体系,依据评价情况来完善和改进用户画像服务,提升用户体验。

赋予用户个人信息保护权。图书馆要从法律、图书馆协会、个体图书馆三个层面构建保护与利用相平衡的、严密有效的个人信息保护体系。

为用户赋能。为更好地践行用户权利,把用户主体地位落到实处,必须预防权利贫困。 权利贫困是多种因素合力作用的结果,个人能力不足是内因,也是主因。特殊群体因为个人能力局限更易陷入权利贫困。真正的权利平等必须通过能力的平等来实现,解决权利贫困的根本之道是提高个人能力。信息素养的差异性在客观上造成了用户权益保障的不平等,因此图书馆要加强用户尤其是特殊群体的信息素养培训,增强用户信息意识,提升用户信息能力,树立信息伦理观念,减少数字融入障碍,使用户得以高效享用用户画像服务,促进平等服务和打破信息茧房。

4.2 不断改进优化算法

人工智能技术本质是以数字算法为核心和辅以计算机技术的产品。算法和数据对人工智能成效至关重要。算法代表着用系统的方法描述解决问题的策略。同样问题可用不同算法来解决,而一个算法的优劣将影响到算法乃至人工智能的效率。

用户画像服务主要涉及画像建模算法和推荐算法两种类型的算法。近几年,画像建模算法多用统计、聚类分析、贝叶斯网络、主题模型、神经网络等类型算法,推荐算法多用基于内容的推荐、协同过滤推荐、基于知识推荐、基于关联规则推荐、基于图论推荐、混合推荐等类型算法。每一类型算法都具体有多种算法,每一种具体算法都在不断改进发展。实践中,每种算法都有其优缺点,仅靠一套通用的架构模型很难适用于所有的推荐场景,往往会采取多个算法的组合。

随着信息技术的发展,图书馆要积极采用新技术,结合图书馆特点来不断改进算法、优化算法,使算法挖掘出的规律更接近于客观现实,达到画像准确、推荐精准的成效。图书馆要定期审核、评估、验证算法机制、模型、数据和应用结果,不得设置有违法律法规、伦理道德的算法模型。

4.3 构建资源画像

图书馆要整合纸本资源与数字资源,利用语义挖掘、机器深度学习等数据挖掘技术,通过著录、标引、解析、链接来多维度提取馆藏资源属性特征(题名、责任者、出版者、出版时间、媒体类型、语种)、内容特征(学科分类、主题词、关键词)及利用状况特征(借阅者特点、利用方式、利用频次),实现数据化和知识元化解构、重组与关联,建立资源标签体系,从而构建多维度动态的资源画像。图书馆传统标引粒度较粗,与精准的用户标签不相匹配,需要大规模地改造原有的标引,实现适度的细粒度标引,构建立体清晰且适用性强的画像[21]。

4.4 保障智识自由,打破信息茧房

图书馆面对主动推送与智识自由之间的张力,要坚持适度的原则,适度干预、适度推荐,避免过度服务。既要充分满足用户需求给予良好体验,又要避免频密推送烦扰用户,引起用户反感乃至排斥。当然何为适度并没有一个清晰、客观的标准,更多取决于用户的主观感受,因此需要双方的调适,这期间用户的服务评价反馈就极端重要,图书馆要根据评价反馈调整推送的强度。

尽管当前国内外对于“信息茧房”形成原因和机理研究尚处于开放性探索阶段,没有稳定理论体系[18],但是,从用户和技术视角看,“信息茧房”的形成是用户主动或被动、长时间地获取同质化信息所致,一方面是用户数字素养欠缺,存在信息回避等选择性信息行为;另一方面,在所想即所见的算法时代,算法是“信息茧房”的诱因,起到了推波助澜的作用。

打破“信息茧房”的关键是异质信息的获取,在保证推荐结果准确性的同时要保证推荐内容的多样性。为此,图书馆要帮助用户提高信息素养,增强主动搜寻并获取异质信息的意识和能力;要不断优化和改进算法来防止需求固化和窄化, 挖掘用户潜在信息需求,呈现不同偏好权重的信息,适当减少按照用户兴趣和相关性推荐信息,推荐一定比例的“信息冷点”[22]、逆向信息、随机信息等偏好之外的异质信息,力求推荐信息的多样性,限制每日推送数量;在实体或者虚拟空间构建多元渠道以帮助用户接收多样化信息,要为用户创造信息偶遇的机会,发挥“有温度的文化社交中心”[23]作用,帮助具有较大差异性的不同群体形成更有利于异质性信息传播的“弱关系”网络。

4.5 线上线下融合发展,实现普遍均等服务

图书馆个性化服务是一项系统工程,要充分利用线上线下两种路径,既要努力开展用户画像服务,也“应当同时提供不针对其个人特征的选项”[20],保障所有用户的平等权益。

图书馆应拓展用户画像服务群体,让包括特殊群体在内的更多用户均等受益。 开展用户信息素养培训,提高其数字技能,增加馆内智能终端配置数量,提供智能终端借用服务,尽可能消除经济障碍,实现智能终端使用自由,方便特殊群体应用线上服务,从而让更多用户留下数字足迹,从而获取用户画像服务。

图书馆要强化线下服务,实现线上线下融合发展,防止简单以线上服务取代线下服务的倾向。在信息技术日益上升为社会资源再分配的重要力量的情况下,必须保障线下服务与线上服务资源配置与服务设计的平等地位。图书馆要呼吁政府加快构建覆盖城乡、便捷高效、保基本、促公平的公共文化服务体系,保障公众基本公共文化权益,同时要采取多种形式开展各类用户需求调研,实现更贴近特殊群体的分众服务,以弥补其不能获取用户画像服务的缺憾。

4.6 依法处理个人信息,建立合规完备的个人信息保护体系

个人信息处理包括个人信息的收集、存储、使用、加工、传输、提供、公开、删除等活动。图书馆作为个人信息处理者要承担保障个人信息安全的责任,建立合规完备的个人信息保护体系,防止信息丢失、不当使用、篡改、未经授权访问或披露,实现个人信息的有效保护和充分利用的平衡。

《网络安全法》(2016年)、《公共文化服务保障法》(2016年)、《公共图书馆法》(2017年)、《民法典》(2020年)、《个人信息保护法》(2021年)都要求保护个人信息。按照“特别法优于一般法”规则,《个人信息保护法》是专门调整个人信息处理和保护的法律,具有特别性,总体上相比以上其他法律享有优先适用的地位。本文以《个人信息保护法》为依据,阐释法律对图书馆处理和保护个人信息的要求。《个人信息保护法》要求以“可证明”的方式开展数据保护工作,不仅形式合规,更要实质合规。

图书馆要构建以“告知—同意”为核心的个人信息处理核心规则,应当遵循合法、正当、必要和诚信原则;应当具有明确、合理的目的,并应当与处理目的直接相关,采取对个人权益影响最小的方式收集个人信息;应当限于实现处理目的的最小范围,不得过度收集个人信息;应当遵循公开、透明原则,公开个人信息处理规则,明示处理的目的、方式和范围;注重未成年人个人信息保护;赋予用户充分权利,用户拥有自主决定权,即同意权和撤回权,同时用户有权查阅、复制、可携带、更正、补充、删除个人信息,有权要求图书馆对其个人信息处理规则进行解释说明,有权要求图书馆建立申请受理和处理机制。

图书馆要建立并明示个人信息保护政策。个人信息保护政策内容要重点围绕“告知—同意”原则—— 这一个人信息保护制度的基石来展开。《信息安全技术个人信息安全规范》规定个人信息保护政策内容应包括但不限于:图书馆的基本情况;收集、使用个人信息的业务功能,收集的个人信息类型;个人信息收集方式、存储期限、涉及数据出境情况等个人信息处理规则;对外共享、转让、公开披露个人信息的有关情况;个人信息主体的权利和实现机制;提供个人信息后可能存在的安全风险,及不提供个人信息可能产生的影响;个人信息安全基本原则、数据安全能力及个人信息安全保护措施;处理个人信息主体询问、投诉的渠道和机制,以及外部纠纷解决机构及联络方式。除此以外,参照国际上多个国家图书馆个人信息保护政策还可以包括未成年人个人信息保护、个人信息保护政策更新等事项[24]。个人信息保护政策要以显著方式告知供用户查阅,并定期审查、及时改进,语言要简单明了,清晰易懂,便于用户理解。

图书馆要完善内部管理制度,建立覆盖个人信息处理全过程的操作规程,制定第三方合规处理个人信息的监管制度,以有效监督管理内部人员及第三方。依据个人信息内容及敏感程度制定个人信息分级分类标准及管理制度,对敏感信息、未成年人信息采取保护特别措施;合理确定个人信息处理的操作权限,采取符合最小授权的访问控制策略,对批量修改、拷贝、下载个人信息等重要操作设置内部审批流程;对处理敏感个人信息、对外提供或公开个人信息等高风险处理活动进行事前影响评估;定期对图书馆处理个人信息遵守法律、行政法规的情况进行合规审计;定期对馆员进行个人信息安全教育和培训,必要时设置专职数据馆员,馆员对个人信息应当予以保密,不得泄露或者向他人非法提供;制定并组织实施个人信息安全事件应急预案,履行个人信息泄露通知和补救义务。

图书馆要加强技术保护。图书馆要积极采用新的信息技术,将管理和技术手段结合,加强大数据环境下的网络安全防护技术建设。在个人信息使用时,采用加密法(如SSL)、假名法、掩盖法、哈希函数和模糊法等多种数据脱敏技术增强个人信息安全性。这些方法各具特点,安全性、实用性、准确性和高效性在个人信息保护应用中存在不同的局限性,“大数据环境下信息脱敏技术有效性在减弱”[25],需要针对具体情况综合运用以达到去标识化、匿名化的要求。通过防火墙、非法入侵监测报警系统、网络隔离等技术手段保障数据存储安全,利用区块链技术打造用户画像数据管理防火墙。图书馆要加强用户数字行为安全保障。填报用户个人信息时图书馆应给予独立和封闭的空间、输入界面,自动或者提示用户清除网络检索或浏览痕迹,增设插件功能提醒用户注意个人隐私保护,建议读者使用复杂密码、定期修改密码,不轻易披露个人信息。

5 结 语

目前, 用户画像服务对图书馆而言还是新生事物,其应用研究更多处于理论探讨状况,应用实践尚处在萌芽状态,偶见小规模、试验性质的案例,并未面向所有用户大规模可复制、可推广地开展,因此用户画像服务在实践中可能存在的问题尚未浮现。文化和旅游部日前发布的《“十四五”公共文化服务体系建设规划》明确提出“构建公共文化服务用户画像和知识图谱,为差异化服务提供数据支持”[23],因此用户画像服务大规模进入图书馆是未来可期的大概率事件。大规模应用的情况下,如同其他行业一般,图书馆用户画像服务失灵的风险自始至终也将存在。对此,图书馆要保持足够警醒,高度重视这一风险,在风险暴露之前采取行之有效的举措予以规避、控制、化解,防止给图书馆事业带来无可挽回的损失。

参考文献:

[1] 柯平.业务新常态[J].图书馆建设,2020(5):4-5.

[2] COOPER A.About face 3.0:the essentials of interaction design[M].New York:John Wiley Sons,2007:10.

[3] 国家标准化管理委员会.信息安全技术 个人信息安全规范[EB/OL].[2022-09-01].http://c.gb688.cn/bzgk/gb/sho wGb type=onlinehcno=4568F276E0F8346EB0FBA0 97AA0CE05E.

[4] 单轸,邵波.国内图书馆领域用户画像研究的冷思考:困境与出路[J].图书馆学研究,2019(5):8-13.

[5] 廖运,卢明芳,杨思洛.大数据视域下智慧图书馆用户画像研究[J].国家图书馆学刊,2020(3):73-81.

[6] BISHOP J,LEWIS P R.Blaise-line and the British National Bibliography:profiles of users and uses[J]. Journal of librarianship information science,1985(2): 119-136.

[7] 郑宝鑫.基于用户画像、信息挖掘技术的手机游戏产品推广[C]//广东省通信学会.广东通信2010青年论坛优秀论文集.[出版地不详]:[出版者不详],2010:127-130.

[8] 吴国芳.绍兴图书馆图书检索垂直引擎研究及应用[J].绍兴文理学院学报(自然科学),2014(7):18-21.

[9] 李业根.基于大数据的图书馆信息营销策略[J]. 图书馆学刊,2014(10):7-9.

[10] 王丽,谭凯波,黄云.用户画像在图书馆个性化服务应用中的问题及对策[J].数字图书馆论坛,2021(10):66-72.

[11] 孙山.70.5%受访者体验过互联网用户画像 感觉符合实际的不足一半[EB/OL].[2023-02-06].http://news.youth. cn/gn/202101/t20210113_12661879.htm.

[12] 刘炜,周德明.从被颠覆到颠覆者:未来十年图书馆技术应用趋势前瞻[J].图书馆杂志,2015(1):4-12.

[13] 刘海鸥,李凯,姜波.移动图书馆推荐系统中的用户画像与资源画像情境化融合研究[J].图书馆,2021(6):66-71.

[14] 焦艳鹏,刘藏.知识获取、人工智能与图书馆精神[J].中国图书馆学报,2021(4):20-32.

[15] 范并思.阅读推广与图书馆学:基础理论问题分析[J].中国图书馆学报,2014(5):4-10.

[16] IFLA.The glasgow declaration on libraries,information services and intellectual freedom[EB/OL].[2023-02-15].http://www.ifla.org/faife/policy/iflastat/gldeclar-e. html.

[17] 蒋永福.图书馆学通论[M].哈尔滨:黑龙江大学出版社, 2009:158.

[18] 朱红涛,李姝熹.信息茧房研究综述[J].图书情报工作, 2021(18):141-149.

[19] 中华人民共和国公共图书馆法[EB/OL].[2022-09-01]. http://www.npc.gov.cn/npc/c12435/201811/3885276ce afc4ed788695e8c45c55dcc.shtml.

[20] 中华人民共和国个人信息保护法[EB/OL].[2022-09-01]. http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672 c74491a80b53a172bb753fe.shtml.

[21] 陈丹,罗烨,吴智勤.基于大数据挖掘和用户画像的高校图书馆个性化服务研究[J].图书馆研究与工作,2019(4): 50-53.

[22] 杨天才.运用零数据破除信息茧房的研究[J].图书与情报,2020(4):15-20.

[23] 文化和旅游部. \"十四五\" 公共文化服务体系建设规划[EB/OL].[2022-09-01].http://www.gov.cn/zhengce/ zhengceku/2021-06/23/content_5620456.htm.

[24] 徐磊.读者个人信息保护的世界图景与中国方案——以国外国家图书馆网站读者个人信息保护政策为视角[J].图书馆工作与研究,2021(12):22-30.

[25] 郭军.大数据环境下图书馆用户个人信息保护研究[J].图书馆工作与研究,2020(1):11-19.

[作者简介]

于风程 1973年生,中共山东省委党校(山东行政学院)图书和文化馆教授,研究方向为图书馆管理与信息服务。E-mail:yufengcheng@shandong.cn。

[收稿日期:2023-02-21]

猜你喜欢

用户画像风险规避图书馆
图书馆
把声音的魅力发挥到极致
安顺煤矿煤炭销售内部控制与风险管理
移动用户画像构建研究
学术资本主义视域下我国高校学科建设的风险及其规避
飞跃图书馆
基于微博的大数据用户画像与精准营销
移动互联网下手机用户使用行为特征的研究
去图书馆