基于画像技术的澜湄水资源合作领域专家库构建研究
2021-02-04胡承芳李季王春芳马瑞包第啸
胡承芳 李季 王春芳 马瑞 包第啸
摘 要:建立澜湄水资源合作领域专家库系统,为澜湄交流提供人力资源支撑,具有重要现实意义。当前专家库系统共享渠道缺乏,数据来源单一且系统缺乏智能推荐功能。针对该问题,提出了基于画像技术的澜湄水资源合作领域专家库系统的设计思路,建立多源融合的人员信息来源渠道,构建基于时空属性的用户画像模型和人才画像模型。以新型技术为支撑,基于大数据、云平台构建了模型之间的映射反馈机制,实现基于澜湄合作需求的人才智能推荐功能,为澜湄流域水资源合作实现专家智能推荐支持。成果为澜湄水资源国际合作项目、交流活动提供人力资源信息支撑。
关键词:数据库建设;用户画像;人才画像;专家库;澜湄水资源合作
中图法分类号:G250.74 文献标志码:A DOI:10.19679/j.cnki.cjjsjj.2021.0620
在全球气候变暖、湄公河国家不同程度地面临水问题挑战、水治理能力有待提高的背景下,开展水资源领域的技术交流与人才培养具有重要意义,建立澜湄水资源合作领域专家库系统,能为澜湄交流提供人力资源支撑。
澜湄水资源合作领域专家库,旨在通过录入的澜湄水资源合作领域在册专家的各项专业特征,匹配相关活动需求,如澜湄六国面临澜沧江湄公河流域的洪旱灾害或应急调度等情况时,通过智能搜索匹配,第一时间提供符合任务需求的专家人员清单,提高事件处理效率,同时在专家库构建过程中逐步与在册专家建立联系渠道。
我国专家库构建的覆盖范围广,遍布多个省级政府部门和高校。在澜湄水资源合作领域,前期通过澜湄基金综合信息平台项目的实施,澜湄水资源合作交流信息库系统为该领域专家库构建奠定了基础。在澜湄水资源合作机制下,配合澜湄水资源信息共享的同时,开发出具有人才画像功能的澜湄水资源合作领域专家库,能进一步提升工作人员能力,促进合作伙伴关系,加强六国和协调机构间的沟通协作。
1 专家信息库建设现状及问题
目前,我国各领域专家库的构建研究已相对成熟,但对基于画像技术的专家库构建研究尚在新兴阶段[1],主要集中在科研教育机构对画像技术在信息化管理中应用的探索上。中国科学院云计算中心围绕地方政府发展产业的需要,坚持以人才带动创新,以创新驱动产业,为甘肃省白银市建设了人才大数据平台,围绕人才信息采集和人才库构建,开发了“归根”人才信息的征集、查询、审核流程和人才地图(人才分析统计)功能[2]。浙江中医药大学以大数据学生画像技术为支撑,与高校的思想政治教育结合,通过有效挖掘和分析,充分利用在教育、教学活动中形成的海量数据,为提高和改革高校思想政治教育提供策略参考[3]。湖南软件职业学院以高职工匠型人才为对象开展研究,分析高职院校工匠型人才培育现状,基于用户画像技术对高职工匠型人才相关数据进行采集和标签化处理,按用户数据采集、用户数据处理、用户数据标签化三个步骤构建高职工匠型人才用户画像库[4]。
通过对现有的专家库系统进行分析,发现信息化技术在澜湄水资源合作人力资源领域应用存在以下问题:
1.1 不同单位及机构之间缺乏人才信息共享途经
中国已经举办了多场澜湄流域水资源国际合作交流学习论坛会议,通过对多场宣传学习活动的总结,发现不同主办方机构之间的人员信息缺乏共享渠道,比如同一位专家来华次数、参加活动情况、专业领域等信息保存于各主办方机构内部,相互之间缺乏信息共享与互通。在专家推荐方面,已承办活动的机构取得了丰富的经验,但经验总结没有纳入可共享专家信息平台。
1.2 专家信息来源单一问题
其他行业已有的专家信息数据库大多存在数据源单一、信息资源不够丰富的问题。专家信息多以个人主动提供的方式进行采集,信息內容具有较强的主观性,信息丰富程度参差不齐,专家的专业类别存在一定的模糊性[5],标准不统一。
1.3 专家信息库缺乏智能推荐功能
其他行业已有的专家信息库系统功能集中在信息的汇总、管理与分发方面,主要满足用户查询检索功能。部分信息库在互动方面更进一步,提供按标签搜索专家的功能,但在智能推荐方面还有进一步发展的空间。用户画像及人才画像技术在信息库的应用方面还不成熟,尚待完善。
2 系统设计目标
澜湄水资源合作领域专家库以澜湄水资源合作为背景,以国际合作专家、科研人员的人员信息管理和智能推荐为目标,以新型技术为支撑,基于大数据、云平台,实现国际合作人员信息领域分类、基础查询操作。本文设计澜湄水资源合作领域用户画像模型和人才画像模型,构建了模型之间的映射反馈机制和澜湄流域水资源合作人员智囊库,为澜湄流域水资源合作实现专家智能推荐支持,为澜湄水资源国际合作项目、交流活动提供人力资源信息支撑。
3 数据来源
专家人员的信息采集是数据库构建的基础资源,是系统运行的基础支撑。当前行业内已有的人员信息库大部分采用以固定模板为依托的定向信息采集,形式主要以发放个人信息登记表为主,数据来源相对可靠、规范。但该种信息采集模式存在数据来源单一、信息资源不够丰富的问题,且信息内容的主观性较强,丰富程度与个体选择差异相关。基于这种情况,澜湄水资源合作领域专家库数据来源采用了多源融合技术,以专家个人信息主动提供为主,以基于网络信息的多方信息采集为辅,进行专家信息的全面采集,构建丰富的专家个人信息画像,达到全面、丰富、客观地表达人员信息的目的。澜湄水资源合作领域专家库的数据来源构成如下所述。
3.1 用户表单录入
专家库平台提供个人注册功能,对于进入专家人员库的用户,通过填写系统表单进行个人信息录入。个人信息通过系统管理员审核后,对符合要求的人员按照分组录入系统人员信息库。用户表单录入的優点是信息格式规范、数据来源直接、数据搜集成本较低,但影响的受众范围受限于平台的宣传力度,且对系统管理人员的审核提出了较高要求。
3.2 澜湄合作活动信息提取
专家库平台以澜湄水资源合作为背景,人员信息除了主动录入渠道外,还可以结合澜湄交流平台机构,以国际项目合作、人员培训、技术交流培训班等活动为依托,对活动的人员信息进行提取。专家库信息若采用人工表单录入,该工作维护量较大,因此可考虑在专家库系统中添加报名模块,专家可直接通过系统网页报名,省略不必要的录入程序[6]。澜湄水资源合作中心在自身打造的专家库中加入专家来华参加活动的登记操作,登记后的专家信息可以直接进入专家库系统,这一设计思路为专家库的信息采集提供了良好的借鉴。
3.3 网页信息爬虫输入
澜湄流域互联网上拥有丰富的专家人员信息,相关的新闻活动页面包含专家的领域介绍和研究方向等内容。采用3.1和3.2所述的两种方法录入的专家信息如果得不到及时更新、维护,将导致部分专家信息仅停留在入库阶段,给专家库管理带来较大困难[7]。网络爬虫是按照一定的规则,自动地抓取互联网信息的程序或者脚本。专家系统通过网络爬虫从澜湄流域各国互联网平台搜取相关的专家信息,按照指定格式录入系统后台数据库,借助第三方渠道实现专家信息提取,通过程序定制有效提高专家库更新频率。
3.4 文献信息提取数据
文献信息为各国科研工作者提供了技术交流的媒介,同样也为专家库提供了信息来源渠道。从专业的参考文献库中提取专家信息,具有针对性强、研究领域明确、时效性高的特点。澜湄水资源合作专家库按照制定的关键词,定期从文献检索库中提取、补充相关专家信息,实现数据资源信息的多元化。
3.5 国内外机构官网信息提取
官方网站是公开团体主办方体现其意志想法,公开团体信息,具有权威、公开性质的一种网站。澜湄水资源合作领域不同国家官方机构都提供了官网进行信息查询,专家库可从官网中提取相关人员的信息。
4 基于画像模型的人员智能推荐方法
4.1 人才画像及用户画像概念定义
4.1.1 用户画像
用户画像最早由交互设计之父Alan Cooper提出,他认为用户画像是真实用户数据的虚拟表示,通过挖掘数据,对用户典型信息进行分析,将用户的静态和动态数据标签矢量化,建立以用户为目标的模型,根据需求方的目标、行为及观点的差异所构建的目标用户模型[8]。将该模型区分为不同的类型,每种类型抽取出典型、共性的特征,赋予名字、图像以及人口统计学的要素、场景等加以描述,由此产生数字化的人物原型[9]。
4.1.2 人才画像
人才画像是人才管理者依据某个岗位上某类人才某些可量化的特征在表现过程中所携带的证据信息,用抽象化的简易图像或标签来定义人才所属的类型[10]。通过分析挖掘人才的基本信息、工作经历、专业领域等信息,可以形成人才在专业领域的画像。人才画像是针对特定业务需求,对人才特征的标签化描述。人才画像就是给人才“贴标签”,标签是通过对人才信息分析得到的高度精练的特征标志,可让人们更容易理解人才,且方便计算机处理。
4.2 用户画像模型
用户画像是根据现实用户的情况通过一系列的标签定义来形成对该用户的形象描述,从而构成该用户的特征信息。数据库系统通过用户画像能够以数字化的方式来了解用户的特征,发现其适合的领域、研究方向,以及适合参加的活动类型。用户画像除了基本特征属性之外,还包括时间维度、活动地域,是时空属性的集合。
本文根据澜湄水资源合作领域专家库系统的需求特点,设计了用户画像模型。该模型由四大板块组成:基本信息、专业知识、澜湄合作相关性、时空关联,见图1。
(1)基本信息记录了用户个人的基础信息,包括姓名、性别、职业、所在国别、所属单位、学习经历、任职经历等。通过基本信息的刻画与描述,能够初步掌握该人员的基础信息。
(2)专业知识板块记录了用户个人的专业信息,主要用来展现用户的技能、知识储备、专业能力,包括该人员所取得的专业领域成果,如学术专著、期刊论文以及发明专利等。通过专业知识领域的描述,能够掌握该人员所擅长的专业领域以及取得的成绩。
(3)澜湄合作相关性板块记录了用户个人与澜湄水资源合作相关的活动信息,包括参加的国际合作项目和国际合作论坛研讨班等活动的记录,从而掌握该人员在澜湄水资源国际合作中的活跃程度及主要领域。
(4)时空关联模块是本系统为用户画像模型所制定的特殊属性模块。目前其他常规的用户画像模型普遍缺少时间属性以及地域属性。在澜湄水资源合作领域,项目合作具有跨国性质,因此地域相关性是人员信息的重要内容。在时间维度上,由于专业人员随着时间的推移所研究的领域也会发生变动,通过记录时间信息可以掌握该人员在较长的时间段内研究方向发生变化的轨迹。通过记录地域信息,将该人员与地域空间信息高度关联,可以了解该人员服务地域的特点,为后续地理信息空间分析提供基础数据资源。
用户模型以上述四大模块为标签库进行标签制定,将人员信息与相应的标签匹配并填入内容信息,构成信息丰富的人员画像,为专家库系统在后续的数据分析中全面进行人员分析提供基础支持。
4.3 人才画像模型
人才画像是对众多的用户形成的用户画像进行抽象、归纳、总结,采用一定的技术标准和评价方法对人员的适应性进行评价,形成符合某一专业领域的人才评价模型。该模型为该专业领域的一个标准模板,后续以该模型為参考,进行人员适应性评价。
澜湄水资源合作领域专家库系统将人才分为基础研究型、应用研究型、技术开发型、成果转化型、科技管理服务型:基础研究型人才指实验性或理论性研究型人才,研究基于现象和可观察事实的基本原理的专业人员;应用研究型人才是指能将专业知识和技能应用于所从事专业的社会实践的人才类型,是熟练掌握社会生产活动一线基础知识和技能、从事一线生产工作的专业技术人才;技术开发型人才是指掌握技术手段,通过技术开发创造、升级新产品,为澜湄水资源合作产生经济效益的人才;成果转化型人才指能对科学研究与技术开发所产生的具有实用价值的科技成果进行后续试验、开发、应用、推广直至形成新产品、新工艺、新材料——发展新产业的人才;科技管理服务型人才指擅长管理科研项目全生命周期过程的人员,对课题、经费、成果等科研活动进程动态管控,协助澜湄科技项目顺利推进并成功完成的管理人员。
澜湄水资源合作领域专家库系统以上述5种类型为蓝本进行人才的类别划分,但在实际的应用中,人才并不能够简单地划分为单一类别,大部分情况下,人才以复合型方式存在。例如,在澜湄水资源合作节水领域,一个专家可能既擅长基础研究,同时也擅长技术开发,并且具有成果转化型人才特征能将成果应用于实际,该名专家就同时具有三个类别的标签,是复合型人才。专家库系统通过给不同的领域设定权重来判断专家人员复合型人才特征。
澜湄水资源合作领域专家库系统根据上述5个类别分别建立各自的人才画像模型。以澜湄流域水资源合作资深专家为依托,通过对一部分人才数据进行类别预先划分,寻找各自类型的标准人才标签,形成人才画像。以应用研究型人才为例,模型应该涵盖的标签包括基础信息、专业知识领域、具备的技能、能力素质、所属国别、研究项目所在澜湄流域的地理位置等信息。
4.4 基于画像技术的智能推荐
目前常规的专家库基本都能实现专家信息录入并按指定信息进行查询的功能,由于查询功能相对单一,查询结果与用户搜索的初衷不能完全匹配。本文设计的澜湄水资源合作领域智能专家库,基于画像技术实现智能匹配,克服了以一维属性进行查询的单一性。以多维属性集合为目标进行人员信息的智能匹配,以人员搜索的任务定制为起始端,提高了人员智能匹配的精确性,降低了对操作员专业技术上的要求。
不同的用户在人员搜索目的上具有较大的差异性。技术生产单位关注在澜湄水资源合作领域具有本项目及专业上相关经验的国际合作专家推荐;流域管理平台机构关注服务于流域基础共用平台技能方面的专家人员推荐,例如注重能够在流域数据共享方面提供帮助的专家;教育机构关注在澜湄水资源合作领域对开展技术培训及研讨会有兴趣的潜在用户。本系统根据不同定位机构关注内容的差别,分析定制了不同的人员筛选任务类别模板。
以澜湄流域技术交流研讨会为例进行分析,过去几年,中国举办了多场澜湄流域水资源国际合作交流学习论坛会议,这些活动极大地提高了中国的水资源合作国际影响力,为加深澜湄流域国家的交流与合作起到了促进作用。以水生态技术交流研讨会为例进行人员筛选分析。在数据库建库期间,依据用户画像模型,将专家、学者和学生的个人信息以标准化形式存入人员信息数据库。水生态方面的研究专家,其标签属性中的专业领域将标记为水生态。组织水生态技术交流研讨会的机构为了寻找适合参加研讨会的国际专家、学者和学生人选,将进入专家库系统,开启任务定制模块,将任务类别设置为技术研讨会。人才画像模型根据5大类进行权重设计,人员类别缩小至水生态领域专家、学者及学生,将人员曾经参加的学术活动与水生态相关活动高度关联,人员的学术成果聚焦至水生态领域。通过任务匹配进行人才画像模型的定制,产生与水生态高度关联的人员画像模型模板。如图2所示,在智能搜索模块中,以该模板为参照对数据库的用户个体信息进行筛选遍历,寻找出适合筛选条件的用户。水生态技术交流研讨会成功举办之后,进入该系统反馈填写,对参加研讨会的人员进行关联度反馈,对系统推荐的人员进行推荐相关度质量评价。系统再根据反馈评价开启智能学习功能,不断调整筛选策略,提升筛选准确度。
人才画像模型不是固定不变的,它随着人员数据量的增加而不断更新并动态调整,是一个适应性模板。通过反馈机制,判断所推荐的人员是否符合要求,从而通过学习、调整,产生新的模板,使人才模型逐渐贴合用户的需求。
5 专家信息库平台构建
澜湄水资源合作领域专家库平台采用BS网络架构技术构建,由数据资源层、应用支撑层、表示层构成,应用逻辑层由应用支撑层和应用层组成。如图3所示,数据资源层包括系统运行所需的各种数据库,是系统运行和数据存储的保证,为整个系统提供数据资源支撑。应用支撑层实现系统基础信息管理及相关参数设置,包括运行环境参数设置、用户权限管理设置、系统日志管理、人员参数设置等。应用层实现专家库系统的核心功能,包括基础功能模块和智能推荐模块,其中基础功能模块实现专家库系统的基本编辑查询功能,智能推荐模块基于人才画像技术实现专家库系统的智能推荐,根据用户指定的任务形式定制推荐合适的专家。表示层是系统连接逻辑层与用户层之间的用户界面,接受来自客户端会话层的请求命令,传送给应用层,并反馈应用层服务结果。为了保证系统正常运行,需要配合系统建设质量体系、标准规范体系、安全保障体系以及运行维护与支撑体系,以四大体系支撑系统正常稳定运行。
6 结论
澜湄水资源合作领域专家库建设为国际合作宣传交流、项目执行推选优秀合适的国际人才,能全面展示澜湄流域国家水资源合作领域人才分布状况,对推动国际合作具有重要意义。建立澜湄流域水资源合作国际人才数据库,不仅为澜湄水资源合作提供基础决策支撑,也为国际合作提供智库,及时反映澜湄流域水资源合作的热点趋势变化。下一阶段将结合时空分析技术,为国际政策制定高层提供基于空间位置关系的澜湄流域水资源热点关系图,为国际项目合作提供智能优质的国际人才推荐,成为澜湄水资源合作交流的重要人力支撑平台。
參考文献:
[1]雍志娟.基于专业领域知识服务体系的人才画像描绘及应用[J].科技与出版,2018(5):41-43.
[2]彭朝林,马军峰,陈前华.基于大数据的地方党政人才管理创新实践:以甘肃省白银市人才大数据平台为例[J].宁夏大学学报:人文社会科学版,2020,42(5):133-138.
[3]李光耀,宋文广,谢艳晴.智慧校园学生画像方法研究[J].现代电子技术,2018(12):161-163,167.
[4]罗校清.用户画像技术在高职工匠型人才培养中的应用[J].河北职业教育,2020,4(3):48-51.
[5]闫锦源.科技咨询专家管理系统的回顾与思考[J].产业科技创新,2019(21):96-97.
[6]王长熠,张静.国内社科专家库建设现状调查研究[J].广东技术师范学院学报,2015(5):92-96,115.
[7]向秦,陈满,蔡萌.湖北省科技管理专家库的构建与优化[J].科技创新与应用,2021(20):191-193.
[8]丁一琦 ,杨骞 ,朱梦月 . 基于用户画像的高校图书馆精准知识服务研究 [J]. 电脑编程技巧与维护,2020(12):71-72,83.
[9]茶利强,余添李,施菡,等. 用户画像在企业人才标准构建中的应用[J]. 管理观察,2019(6):39-40.
[10]焦特,杨倩,雷亚萍,等. 基于人才画像技术的新生代科研人才动态多维开发研究[J]. 现代商业,2020,585(32):62-64.
收稿日期:2021-10-17
基金项目:国家重点研发计划项目(项目编号:2018YFD1100405)
国家自然科学基金青年基金资助项目(项目编号:41301435)
作者简介:胡承芳,女,博士,正高级工程师,主要从事水利行业大数据分析及水利行业空间信息技术应用研究。
E-mail:huchfang@163.com
Research on the construction of expert database of Lancang-Mekong Water Resources Cooperation based on image technology
HU Chengfang1 MA Rui2 WANG Chunfang3
(1.Changjiang River Scientific Research Institute,Wuhan 430071,China;2. Lancang-Mekong Water Resources Cooperation Center ,Wuhan 430071,China;3.Institute of Hydroecology,MWR&CAS,Wuhan 430079,China;4. China Water Resources Beifang Investigation,Design and Research Co.Ltd,Tianjin 300222,China;)
Abstract:It is of great practical significance to establish an expert database system for lancang-Mekong water resources cooperation to provide human resources support for lancang-Mekongexchanges. Conventional expert database system lacks of multifarious data sources and intelligent recommendation routes.Aiming at the problem,this paper puts forward the design idea and method of expert database system of Lancang-Mekong water resources cooperation based on image technology,make abundant personnel information sources,build a portrait model of users based on the space-time attribute,supported by new technology,Based on big data and cloud platform,the mapping feedback mechanism between models is constructed to realize intelligent recommendation function of talents based on LMC demand. The experts database provides human resource information support for LMC international water resources cooperation projects.
Key words:Database construction;User portrait;Talent portrait;Expert database;Lancang-mekong Water Cooperation