基于用户画像的医学图书馆智库服务模式探讨
2019-10-23
用户画像是基于对用户大数据的挖掘、分析、提炼,将用户行为、爱好、年龄等具体特征抽象成个体或群体用户标签,作为真实用户的虚拟代表的技术。智库是基于人们对知识和信息的深度需求而产生的提供高水平信息筛选、情报分析、决策支持等咨询服务的组织,智库的核心在于“智”的体现,即服务对象精准、内容深入。用户画像代表了资源及服务的主要受众和目标群体的需求,可作为智库准确把握用户需求的有效工具。
近年来,国内图书馆界关于应用用户画像进行个性化精准服务的研究逐步升温。如从知识服务、阅读推广、场景推荐、主动定制等方面提出了基于用户画像的图书馆个性化智慧服务策略[1];通过挖掘高校图书馆研究间的用户行为规律特征,为研究间设施改进、精准服务提供了数据支撑[2];利用用户画像对图书馆阅读推广、资源推荐、精准服务模式进行了研究[3-7]等。但关于通过用户画像辅助学科深度智库服务的研究相对较少。2019年在中国智库索引(Chinese Think Tank Index,CTTI)中,高校智库有399家.其中与医学相关的药品、医疗卫生政策、健康政策等类型的智库17家,仅占4.26%。医学是直接影响人类健康发展的重要学科,其学习、教学、实践及科研的要求都较高,学科智库的构建对于该学科人才培养及发展规划至关重要。
1 医学图书馆开展专业智库服务的必要性
医学图书馆开展专业智库服务的必要性主要体现在专业特点、人员特征及机构组成等3方面。
就专业特点而言,医学兼具研究与实践,学科难度大、科研需求强烈,对学生、教师及科研人员的研究及实践水平要求较高。学科馆员不但要有扎实的学科基础,还需要学科专家的准确引领、深度指导才能有助于专业素养的不断提升。
就人员特征而言,医学专业高年级学生和教师在其学习、教学、实验、看诊、科研、报奖、立项等各项工作中,均需要高水平智库为其提供指导或决策参考。
就机构组成而言,医学院校通常会有附属医院作为其临床医院。由于机构性质、职业分工的区别,其绩效、考核评价标准、体系皆有不同,若要更加科学合理地进行考核评价,则需要专业智库提供参考依据。
2 面向医学专业的智库服务核心思路
首先,要依托“全资源”。需统筹图书馆、院系及附属医院的各类科研及实践资源,包括实体资源及人才资源。
其次,用户画像要细致、准确。医学智库服务存在教学、科研、实践及管理等多类型需求,其用户画像建模应针对不同人群、从不同维度进行。
第三,选择合适的组织服务机构。图书馆具备资源、空间、人员等优势,擅于各类资源统筹分配,用户数据收集,用户画像构建、服务的组织与提供等工作,是最适合支撑、组织、协助开展医学智库建设及服务的机构。
综上,开展基于用户画像的医学图书馆智库服务的核心思路为:以医学图书馆、院系及附属医院的各类资源及专业人员为智库资源基础,通过对用户个人属性、信息行为等数据的统计、分析、提炼,从研究方向、需求层次、资源类别等不同维度进行用户个人或群体画像建模,遵循需求对应、距离优先、场景优先的原则,进行目标用户与资源或服务的精准匹配,在图书馆组织协调下提供深度咨询服务。
3 基于用户画像的医学图书馆智库服务模式构建
按照医学专业智库服务的核心思路,本文从基础数据、画像构建、数据关联、服务应用4个层面构建了基于用户画像的医学智库服务模式(图1)。
图1 基于用户画像的医学智库服务架构
3.1 智库基础数据的采集及标引
3.1.1 用户及资源数据
用户数据:包括自身属性数据(如姓名、性别、年龄、职称、年级、专业等)、信息行为数据(如检索及借阅记录、下载点击行为、参与培训、空间利用、服务预约)以及社交互动数据(如意见反馈、资源评论、分享推荐等),其深度组合是刻画用户信息行为、反映信息需求的重要基础。
资源数据:医学因其专业性强,且兼具教学、科研及实践的多项要求,其智库资源不仅要包含各类馆藏资源,还要收集医学院系资料室、实验室及附属医院等机构的各类型资源(包括文献、场地、实验设备、医疗环境及服务专家等)。
3.1.2 数据采集及标引
在移动、互联、社交、大数据的背景下,图书馆用户及资源数据均出现了大规模、多样化、互联性、更迭性等特点。面对新型数据特点,需对其收集及处理方式进行相应调整。首先,数据类型的多样性要求采取传统问卷、实地调研以及各类系统统计相结合的方式实现数据收集与统计;其次,由于数据结构的不同,异构数据的结构化融合、分类与标引必须制定统一标准,便于数据加工及匹配;再次,数据处理模块需要具备良好的数据兼容性、较高的更新频率及计算能力,以实现及时的更新迭代,保证用户画像及资源数据实时更新。
3.2 医学用户画像构建
3.2.1 用户画像类型
个体画像:个人用户智库需求特征的刻画需要综合自身属性数据、信息行为数据以及社交数据,并通过不同维度的组织,刻画出个人用户智库服务需求。
群体画像:将具有同一特征属性的用户划分为一个群体,通过聚类分析提取群体特征,并利用语义相关性发现潜在特征,再按需从不同维度进行组织及群体画像。
受众画像:从资源或服务的利用角度,将同类型或同一资源或服务的受众划分为一个群体,并通过提取群体用户特征,深度刻画出目标用户的典型特征,亦可发掘其他关联需求。
3.2.2 针对智库服务的用户画像构建
用户画像的构建是应用各种属性标签的组合还原用户的特征及需求。从原始用户数据到用户标签的形成,应根据数据的不同属性分别采取人工整理、系统统计、数据挖掘及智能学习等方法对原始数据信息进行特征提取、聚类、标引,再将用户标签按不同维度组合,完成用户画像建模,使之成为制定差异化精准智库服务的依据。
3.2.2.1 用户画像标签提取方法
用户数据分为结构性和非结构性两类。用户的个人属性及信息行为这类事实型结构数据可通过系统提取并进行特征提取及标引;针对评论、反馈、分享等非结构性信息则要利用文本挖掘、聚类分析、语义关联等方法进行特征标签提取。
同时,还应注意数据的实时性与潜在性。用户对于智库服务的需求存在阶段性变化,如随着年级、职称、研究领域的变化,用户画像也会改变。再者,对于如分享、评论、转发等社交信息行为,均可能蕴藏着用户对某项资源或服务的态度,因此要利用深度学习、SOM神经网络聚类和优化分析等算法,分析用户对资源或服务的态度与倾向,并结合其他属性标签发现其潜在的服务需求。
3.2.2.2 用户画像构建维度
构建医学用户画像,可从专业方向、需求层次及服务类别3个维度展开,呈现出用户“在什么领域、对哪种资源或服务、有何程度的需求”。
专业需求维度:用户的研究及兴趣领域体现在所属专业、资源利用及成果产出等方面。首先从不同数据库提取用户信息行为数据的分类信息,再以教育部学科分类为基础,根据《中国图书馆分类法》及Web of Science学科分类进行人工划归、映射,从而标引用户“专业方向”,确定其当前的研究或兴趣领域。
需求层次维度:对于相同的资源或服务,处于不同学习、科研阶段的用户需求差异较大。可根据“用户身份”(包括年级、职称等)、“需求文献类型”及“在某一领域或某一研究方向发表论文数量”等指标,对用户进行科研层次维度的特征刻画。
服务类别维度:可从资源的角度,对某种智库资源或服务的受众进行群体画像。首先对智库服务进行统一标引,并根据用户预约、使用、反馈等行为数据,判断其短期或长期的兴趣点及服务需求。
3.3 用户与资源、服务的关联与映射
服务的“智慧”在于其与目标用户需求的精确匹配,因此要求在资源与资源、资源与用户、用户与用户之间建立准确的语义关联及映射,从而实现智库与用户需求的高度匹配。
一方面依据资源的学科、类型、归属、功能提供方式等属性对其进行分类标引,并通过语义分析建立资源间的知识关联及衍生关系,形成智库知识网络。
另一方面要通过用户画像的构建将用户与智库资源、人员进行特征及语义关联、需求匹配,形成资源利用网络;最后,利用用户社交互动信息建立用户与用户之间的语义关系网络,从而形成资源传播网络。
在智库知识网络、资源利用及传播网络的共同作用下,实现智库服务目标人群的锁定及扩展和智库资源与服务的精准送达。
3.4 智库服务的开展与实现
针对医学专业的智库服务内容主要包括资源推荐、专题研讨、培训讲座、深度咨询、情报分析、知识产权等。为更好地满足临床、实验、教学、评估等服务需求,智库服务主要依据用户画像开展嵌入式智库服务,也可依托图书馆信息空间预约或周期性开展。
嵌入式智库服务的特点在于需求满足准确、服务高效并贯穿需求全过程,因此要求图书馆在综合医学各院系、重点实验室、动物中心、附属医院等多方资源的基础上,帮助医疗团队或个人构建用户画像,按照需求对应、距离优先、场景优先的原则,科学地组织并分配各类智库资源,实现智库资源与用户需求的高效匹配。
图书馆信息空间的优势在于拥有多种图书馆资源及教学等软硬件设施,并配有信息技术人员及学科专家、教师,各类研修间的设置也便于开展中小型学习、交流、研讨活动。图书馆可依托信息空间,依据用户画像,按需求、内容、层次的不同,组织相关智库资源,针对目标用户开展资源推荐、专题培训、主题讨论等智库服务。
4 基于用户画像的医学图书馆智库服务策略
依据用户类型及服务功能的不同,医学图书馆智库服务可分为资源推荐服务、嵌入式服务及信息空间服务(图2)。
图2 基于用户画像的医学智库服务功能结构
4.1 基于用户画像的资源推荐服务
依据个人用户或群体用户画像进行资源推荐是智库服务的重要内容。针对个人用户,通过系统提取个人属性及信息行为数据进行分类标引,并对评论、分享数据进行语义分析,从而挖掘其潜在需求。将用户行为特征标签与潜在需求标签结合生成实时用户画像,据此进行目标用户的资源服务推送。如针对画像标签为“大四,临床医学,考研”的用户,为其推荐临床医学专业综合评价较高的考研书籍及相关培训信息。
针对群体用户,可按用户或资源特征进行不同维度的用户群分类。既可按年级、身份、职称分类,如将“研二”学生划分为用户群体进行特征提取后生成“资料检索”“论文开题”“专题指导”“信息素养教育”等特征标签,针对该用户群推荐相关书籍或检索技能、论文撰写的专题培训,以及智库中服务特征匹配的教师;也可按资源受众分类,如针对《人体解剖学图谱》,构建该书的受众画像,通过借阅记录发现该书被本科二年级学生借阅较多,并在该书评论中发现“可以将此书和3D解剖数据库一起用,对考前复习特管用”的信息,由此判断3D解剖数据库也是该书受众的连带需求资源。所以该书受众画像标签为“大学生,本科二年级,医学,考试”,据此可向目标用户群体进行书籍及数据库的推荐。
4.2 基于用户画像提供嵌入式智库服务
嵌入式智库服务强调服务的主动性及与需求对应的准确性。一方面,图书馆应定期更新用户画像,并深入到临床或科研一线提供服务;另一方面,在确保用户画像准确的前提下,按临床医疗、教学科研或学科发展等不同用户需求提供准确的嵌入式智库服务。
4.2.1 针对临床医疗的智库服务
临床医疗智库服务在医疗大数据前提下,基于用户或病情画像的诊疗决策支持、医疗信息推荐等进行智库服务。既可通过对用户大数据的多维统计分析,辅助医生进行多视角诊疗决策、病因追溯、疾病建模、自动诊疗方案建议;也可基于病情画像和诊断推荐算法,根据患者诊断治疗数据,研究生理和疾病指标进行聚类分析,实现病情画像,提取治疗参数设置并进行个性化方案推荐[8];还可基于奇异值分解技术的协同过滤与融合画像的推荐算法,帮助用户实现病情与医生的精准推荐,为患者提供自动或者半自动的分诊[9]。
4.2.2 针对科研团队的嵌入式智库服务
针对科研团队的智库服务是嵌入到整个科研过程中,在科研不同阶段,有针对性、连贯而系统地帮助科研团队在选题、规划、立项、报奖、专利申请等方面提供深度咨询服务,需要基于科研团队的群体画像,得到其当下特征标签。如“呼吸与危重症医学”“医疗器械”“临床诊疗”“呼吸系统疾病”“项目申报”“情报分析”等,经智库系统进行资源及人员匹配后,组织学科馆员、情报小组及科研申报部门相关人员对该课题组进行科研成果分析、学科前沿与热点分析、科技查新、立项申报指导等服务。
4.2.3 针对学科发展及人才评估的智库服务
医学院校管理层用户对于医学智库服务的需求主要围绕在对学科竞争情报分析及人才的评估、考核、引进等方面。此类服务内容及周期相对固定,但由于学科或单位的不同,其采用的评估标准是服务价值体现的关键因素。图书馆需利用调研、采访等方式主动收集用户需求,通过对非结构性信息的文本挖掘、聚类分析及语义关联,提取出其现实与潜在的需求特征,构建用户画像,同时应组织图书馆情报人员对其他同类标准进行调研,并协调科研、管理等部门专家进行综合评议,从而灵活、准确地制定出适合本单位及单位中不同人群的评价、考核标准。在此基础上提供的学科发展分析、人才考核、引进等智库服务能够准确、高效地为本单位发展规划提供决策支持。
4.3 基于用户画像的图书馆信息空间智库服务
图书馆信息空间的智库服务主要依托图书馆空间的场地、设备、资源及专业信息人员,其特点体现在依托用户画像进行智能预约、主题活动的组织及开展。
空间智能预约通过对传统预约系统的改进,将周期性智库服务的内容及服务人员特点体现在预约信息中,通过用户对场地、服务内容、服务人员的预约及使用行为、意见反馈等数据提取特征进行用户画像,并利用深度学习技术挖掘用户与资源的语义关联,建立语义相关性匹配模型,从而进行预约内容、人员、时间的推荐。
主题活动基于大量用户行为及属性数据。通过从年级、专业、资源及服务受众等维度的划分,针对不同群体进行特征提取及用户画像,进而针对目标用户组织名师讲坛、系列培训、阅读推荐、知识竞赛等专题主题活动。
5 结语
医学智库是助力医学学科发展、人才引进、教学实践、临床诊断、科研奖项申报的重要途径,用户画像能有效促进智库服务准确、深入和系统地展开,使之充分体现出“智慧”的特征。但随着智库发展带来的用户数据、知识资源、设备资源的快速增加,医学智库体系将面临更大的挑战,不仅要有完善的智库系统进行基础数据的收集、实时用户画像及匹配算法的不断优化,还要有具备强大的数据处理及存储能力的模块,以确保大量异构数据及生物特征数据的高效存储及处理。同时,生物识别技术在医疗及信息行业的逐步应用,也将促使人体生物特征成为用户画像的重要元素,由此带来的用户信息利用、开放与隐私保护也是需要不断深入研究的问题。