融合多源数据的高校人才画像:数字模型构建与实践探索研究
2024-01-01解博超张烨青王佳弘李颖郑娅峰
摘 要:在教育数字化时代,人才队伍建设已成为高校提升核心竞争力的关键。基于高校教师大数据形成人才画像,精准描绘人才成长轨迹,在高校人才的选、用、育、留等环节可以发挥重要作用。该研究通过融合师德师风、教育教学、科研创新和社会服务等方面的多源数据,运用数据挖掘、机器学习、可视化等技术,构建了人才分类评价体系,形成数字人才画像模型,并实现了人才画像系统的设计与开发。该研究可以为高校高层次人才管理、教师职业发展规划、教学科研评价等工作提供有益借鉴。
关键词:高校人才画像;多源数据;数字模型构建;可视化
中图分类号:G4 文献标志码:A 文章编号:2096-0069(2024)06-0077-07
一、问题的提出
人才是推动教育发展的第一资源,建成一支规模适中、结构优化、分布合理的高素质人才队伍,对于高校的未来发展具有至关重要的作用。在教育数字化时代,精准刻画人才发展规律,为高校高层次人才的招聘、培养、评价和职业发展提供科学依据,已成为提升高校核心竞争力的关键。国务院发布的《中国教育现代化 2035》指出,要加快信息化时代教育变革;教育部办公厅发布的《关于开展人工智能助推教师队伍建设行动试点工作的通知》提出,要通过形成高校教师大数据,建立教师数字画像,推进教育信息化和教师队伍现代化建设。
高校作为人才培养的重要阵地,建立人才数字画像成为精准识别、评价和激励教师的重要手段。高校人才数字画像可以帮助管理者更准确地了解教师的能力、专长、教学风格、科研兴趣及发展需求,从而优化资源配置,提升教学质量和科研水平。这种数字化的管理方式已经获得了学术界的广泛认可。然而,现有的数字画像大多来自单一的数据源,如教师的教学评价、科研成果等,无法全面反映教师的综合情况,从而使画像的准确性和有效性受到一定的影响。
随着信息技术的发展,教师数据采集的手段也日益多样化。例如,通过多模态的数据采集,可以实现对教师教学视频、课堂互动、学生反馈等多方面信息的全面记录和分析,从而得到更为细致和深入的教师画像。此外,通过社交媒体、学术数据库、在线教育资源等渠道,可以获取到更为丰富和全面的信息,如学术影响力、合作网络、研究方向等。
因此,本研究通过融合多源数据的方式,实现对高校教师全面、深入地理解和分析,构建出更为准确和有效的高校教师数字画像模型。具体来说,本研究将从师德师风、教育教学、科学研究、社会服务等方面采集多源数据,运用数据挖掘和机器学习等技术,构建出包含教师教学能力、科研实力、个人特质等多维度的数字人才画像模型。这一模型将为高校高层次人才管理、教师职业发展规划、教学科研评价等提供有效的路径和支持。
二、研究现状
(一)人才分类评价体系
构建科学合理的人才分类评价体系对人才画像概念模型的构建至关重要。人才画像概念模型的核心内容是人才画像特征指标体系的构建。人才分类评价体系映射到人才画像上,可以分解为两部分:一是人才画像构建目标,即人才如何分类;二是人才特征指标,即如何选取人才评价指标。
众多学者在探讨人才评价维度时,均强调了多元性。例如,江轶等[1]提出的师德师风、教育教学、科学研究、社会服务、专业发展5个维度,涵盖了人才的多个方面。蔡蕾[2]则从立德树人、人才培养、科学研究、社会服务4个维度定义了一流大学人才评价体系,体现了对人才培养的全面关注。针对不同人才类别的差异化评价,崔平毅等[3]指出,针对不同岗位类别、不同学科类别、不同层次人才类别的考核对象,应差异化调整考核标准及对应指标的权重分布。这一观点得到了郑虹等[4]的支持,他们认为对于教学型人才、基础研究型人才、工业应用研究型人才等不同类型的人才,应分别注重教育影响力、学术影响力、行业影响力的评价。这种差异化评价的思路有利于更准确地评价人才的综合能力,避免“一刀切”的评价方式。
高校作为人才培养和科学研究的重要基地,其人才评价体系应更加科学、合理。对于教学、科研、社会服务等不同岗位的职责要求和工作特点,应完善评价指标体系,各有侧重。对于职业成长期的人才和职业成熟期的人才,也应根据其不同特点进行重点评价,以更好地发挥其潜力。李晋[5]认为,高校人才评价体系应按照高校的目标功能和发展规律进行构建,摒弃“唯期刊至上”的价值取向,克服简单量化科学研究成果特别是“唯论文”带来的弊端。这一观点具有很强的现实针对性。
尽管学者已经对人才评价的维度和具体评价指标的选取进行了广泛讨论,但仍有一些领域值得进一步探索。例如,如何更加科学地确定各评价指标的权重分布,如何避免主观因素对人才评价的影响,如何结合新技术和方法(如大数据、人工智能等)来优化人才评价体系等,这些问题都值得在未来的研究中深入探讨。
(二)人才画像
随着科学技术的发展,教育领域开始重视大数据中隐藏的信息价值,关注如何利用数据科学探索不同学科、不同层次的人才成长规律。近年来,大数据技术在辅助教师专业发展、评价高层次人才等方面均有不同程度的应用。
从教师专业发展的角度来看,蒋伟伟[6]利用大数据分析,为教师专业发展培训方案的制定提供了精准的数据支持。这种全方位、精准化、个性化的专业培养和培训服务,不仅有助于提升教师的专业素养,同时也为教育质量的提升奠定了坚实的基础。
在人才评价方面,可以通过建立人才评价系统,利用大数据模型来全面呈现人才的综合素质情况。例如,王运武等[7]提出通过人工智能赋能教师智能评价,形成立体、全面、动态的评价体系;姚占雷等[8]构建的面向科研人才评价的画像标签库,为科研人才的分类分级评价提供了全新的视角和方法。这种动态更新、适用性强的评价模型,不仅优化了现有的人才评价体系,也为后续的研究和实践工作提供了新的思路。
此外,针对特定领域的人才画像构建,李勇等[9]对人工智能热点领域的人才进行了深入研究,从基本资历、专业知识、工具技能和能力素质4个维度构建了人才画像模型;张海涛等[10]从思政素养、知识储备、通用能力、职业能力和情报智慧5个维度构建了“情报学+”人才的画像,为持续探索可复制、可推广的“情报学+”人才的培育模式奠定了基础。这些研究不仅揭示了各领域杰出人才的群体特征,也为人才的选拔和培养提供了有力的数据支持。
值得一提的是,国外学者在数据支持人才选拔方面也进行了一些前瞻性的探索。例如,帕纳戈普洛斯·乔治(Panagopoulos George)等[11]利用无监督的机器学习技术,通过集群有效性指标分析“学术新星”,为人才的早期识别提供了新方法;巴蒂斯塔·安东尼奥·阿布雷乌(Batista Antonio Abreu)等[12]则通过深度学习和线性回归模型,使用入职首年的数据预测高校教师的科研能力,这种预测模型对于高校的人才选拔和培养具有重要的参考价值。
由此可以看出,基于教育大数据的人才画像在教育领域的应用正在逐渐深入,特别是在教师专业发展、高层次人才评价和特定领域人才画像构建等方面。这些应用不仅优化了现有的人才管理流程和模式,也为后续的研究和实践工作提供了新的思路和方法。
三、人才画像的设计与开发
本研究旨在基于多源数据,构建人才分析模型,确定分析维度和指标项,并完成相关数据计算。在此基础上,开发人才画像可视化平台,以期为学校人才的“主动唤醒、重点培养”提供数据支撑,促进教师发挥潜能,积极参与学校的“双一流”建设。人才画像主要包含数据源、数据预处理、模型构建与计算、人才画像可视化、人才画像应用5个层级。具体构建框架如图1所示。
(一)数据采集与获取
高校的三大基本职能为人才培养、科学研究和社会服务,师德师风建设则是高校落实立德树人根本任务的内在要求和重要保证。因此,数据的采集和获取主要围绕个人基本信息、科研能力、教学能力、社会服务和师德师风五个方面来进行。经需求调研和文献分析后,按数据归属梳理相关数据来源与特征,如表1(见下页)所示。对于已有业务系统中的结构化数据,通过脱敏和去标志化等手段进行处理;对于半结构化和非结构化数据,采用爬虫工具爬取后,再通过数据结构转换、分词、自定义正则表达式等方式转化为结构化数据,以便后续使用。
(二)数据预处理
数据预处理包括数据集成和数据清洗两部分工作,其中数据清洗主要解决原始数据中数据异常、数据重复、数据缺失和不规范等问题。对于异常数据,主要包括使用简单统计量分析法对明显不在合理范围内的数据进行删除或修改,以及对空格、制表符、回车符、换行符等特殊字符进行清除。对于重复数据,主要包括对同一来源重复数据的剔除和对不同来源重复数据的选择。对于数据缺失和不规范等问题,则需要通过人工干预的方式进行补录或修改。
(三)模型构建与计算
基于个人基本信息、科研能力、教学能力、社会服务和师德师风5个方面的数据,确定分析内容和比较维度,进一步将维度细化,如教学能力包含教学工作量、教学成果、教学评价等。同时,将各个维度细分为指标项,融合涉及基本信息、学业背景信息、教学信息、科研信息、获奖信息、社会服务及影响力等各个方面的多源数据,形成人才指标数据池,用以支撑各个维度的不同指标,如表2所示。
基于融合多源数据的人才指标数据集和个人、学院、学校等不同层次的分析需求,确定不同指标的计算方法及权重,明确人才分析模型的可操作性和可实践性。对于同一维度下的不同指标,将其使用适当的函数进行标准化处理后求和,得到维度得分,如公式(1)所示:
(1)
同时,考虑到数据较为稀疏且不同维度数据量度的差异,采用统计学方法,对每位教师近五年的数据进一步进行归一化和标准化处理。处理后的分数具备可加性和可比较性,同时便于展示和理解。
(四)人才画像可视化与人才画像应用
根据以上模型和指标,可为教师动态生成个性化人才画像,并针对特定群体勾勒人才群体画像。人才画像可视化平台的主要功能包括数据转换、视图映射和可视化呈现。通过数据转换,将模型数据和指标数据转化为可以映射到图表的视图标准形式;通过视图映射,将数据表转化为坐标、长度、角度等图形元素;通过合理的可视化手段,特别是充分发挥雷达图、桑基图、词云图等适用于维度分析、发展变化分析、群体比较分析的图表的应用价值,将图表关联、下钻、筛选等功能与需求有效融合,充分发挥数据价值。人才画像可视化平台的构建支持对深度数据信息及其关联的探索,为高校人才专业发展及人才队伍建设的科学决策提供有效支撑,有助于个人发展和管理绩效提升。
四、人才画像应用场景
(一)助力个人发展
人才画像可以通过直观的可视化形式,从横向、纵向等多个维度呈现教师关键信息,为管理者和教师自身提供清晰的画像描述。构建人才画像,能够全面展示数据,提升教育管理的科学性和精准性,促进人才的全面发展。
1.个人画像展示
基于多源数据支持的人才指标所构建的人才画像,可以从个人特质、学术成就、创新能力、发展潜力等方面描绘教师个人数据并进行可视化展示。其中,个人画像展示页面具体包括基本信息、在校信息、教学信息、科研信息、校内岗位历程、行政职级历程、奖励信息、职称信息历程、课表信息和考核信息等。借助个人画像展示页面,可以较好地展示个人信息、勾勒成长年轮。
2.个体群体比较
个体群体比较展示主要从两个方面展示人才近五年在各个维度的发展情况,一是以雷达图的形式展示个人、所在学院和全校在各个维度上的得分;二是展示在各个维度上,个人在学院中的排名。人才画像的一个重要作用便是能促进人才对自身更加客观和深层次的认知与评价。将个人与不同群体在各方面进行横向对比,能够明晰个人能力素质的优势与短板,使个体明确自我定位。
(二)助力管理者
基于人才群体画像,学校可动态掌握人才成长过程,基于多层分析进行特定群体之间的多维比较,挖掘满足特定条件或具备特定潜质的人才,加强人才队伍及后备力量。在上述应用的基础之上,服务学校“依数治理”的目标,为学校发展提供更加科学、客观、全面、智能的辅助决策。
1.人才精准选拔
人才画像可以通过灵活的筛选、查询功能,为高层次人才评选和奖项评选提供数据支撑。按照评选要求,根据年龄、学科及不同维度的能力指数调整阈值和权重,对全校人才进行筛选和排名,提供参考名单,助力人才的定向动员和精准培育。在人才管理中引入数据,能够提升管理效能,为高校人才队伍建设、人才选拔,甚至人才引进等提供科学有效的支撑。
2.群体基本画像
对于高校重点培育、支持的后备人才队伍,可依托人才指标数据池中的基本信息模块展示群体画像。在分院系、分年度统计每年培育人数的基础之上,汇集了性别、政治面貌、民族、年龄段、入选时年龄、学科门类、毕业院校等信息,为高校人才工作部门从多角度了解后备人才队伍概况提供了数据看板支撑。
3.群体维度分析
分析每年重点培育的后备人才队伍在各个维度的得分情况,并与学校整体均值比较,不难发现,每年入选的后备人才在各个维度上具有互补性,且各项指标均有不同程度的波动。这反映出学校每年遴选后备人才时会有不同方面的倾斜和侧重,从而保证在各个方面有突出表现的人才都能够被挖掘和培养。基于比较数据,一方面,了解以往入选人员的长处和短板,有针对性地制订入选人员的指导和培育计划;另一方面,结合各个批次的数据,鼓励相同方向、能力互补的研究者组建研究团队。
4.培育质量分析
通过分析后备人才队伍的成果对比情况,及其在获得资助前三年和入选后三年在各二级维度、各项指标上的得分情况,可以直观展示人才培育质量。进一步,对于每批入选的后备人才,可以下钻到个人数据展示,个性化分析其在各个维度上的进步与退步情况。
五、总结与反思
本研究融合教学、科研、社会服务等多源数据,构建多层分析模型,并与数据驾驶舱强大的可视化功能相结合,服务于高校“依数治理”的目标,为学校人才队伍建设工作提供了数据层面的支持,并为其他各级单位建设基于人才画像的人才发展分析平台提供了有益借鉴。具体体现在以下几个方面:第一,多维度数据融合的创新实践。本研究通过创新性地融合多源数据,构建了一个全面的高校教师数字画像模型。该模型不仅涵盖了教师的基本信息,还包括了科研、教学、社会服务及师德师风等多个关键维度。多源数据融合不仅丰富了教师画像的内容,也为高校人才管理提供了更为细致和深入的分析视角。通过这种方式,高校管理者能够更准确地识别和评价教师的综合能力和潜力。第二,动态可视化平台的开发与应用。在数字画像模型的基础上,本研究开发了一个动态可视化平台,通过直观的图表和图形,将复杂的数据信息转化为易于理解的视觉展示。这一平台不仅为教师提供了一个自我评估和职业规划的工具,也为高校管理者提供了一个强有力的决策支持系统。通过实时更新的数据和动态的图表,高校管理者可以更直观地了解教师的发展轨迹和群体特征,从而在人才的选、用、育、留、评等方面作出更加科学、合理的决策。第三,科学决策支持的人才管理优化。本研究的数字画像模型和可视化平台,为高校人才管理提供了基于数据的科学决策支持。通过这一模型,高校能够更加精确地识别和培养人才,优化资源配置,提升教学质量和科研水平。此外,模型的应用还有助于激发教师的潜力,促进其职业成长,从而在整体上提高高校的教育竞争力。随着模型的进一步优化和应用,有望在更广泛的教育领域内推动人才管理的创新和发展。
尽管本研究在构建高校教师数字画像方面取得了一定的成果,但仍有一些问题需要在未来的研究中加以解决:第一,个人数据安全与隐私保护。随着大数据技术在教育领域的广泛应用,数据隐私和安全问题日益凸显。在未来的研究中,需要重点关注如何设计和实施有效的数据保护措施,以确保教师个人信息不被泄露或滥用。这包括但不限于数据加密技术的应用、访问控制策略的制定及对数据处理流程的严格监管。第二,动态评价指标体系的持续更新。教育环境和科研政策的不断变化要求评价指标体系能够及时更新,以反映最新的教育趋势和评价标准。在未来的研究中,需要建立一个动态的评价指标调整机制,定期对指标进行审查和更新,确保评价体系的时效性和准确性。同时,也需要考虑如何利用社交媒体分析、在线学习平台数据、多模态数据等丰富评价指标的内容。第三,跨学科能力的综合评价。跨学科研究已成为现代科研的重要趋势,未来的数字画像模型需要能够识别和培养具有跨学科能力的人才。同时,未来的研究应关注如何整合不同学科的评价标准和成长路径,构建一个能够支持跨学科人才发展的综合评价体系。这不仅有助于促进学科间的交流与合作,也能为高校培养更多具有创新能力的复合型人才。
参考文献
[1] 江轶,陈若松.全面考核和突出重点相结合 科学开展高校人才评价[J].中国高等教育,2022,699(20):39-41.
[2]蔡蕾.基于OKR模式的我国一流大学建设高校人才评价改革路向研究[J].教育发展研究,2021,41(7):7-12.
[3]崔平毅,居占杰.地方本科院校高层次人才队伍建设探析[J].河南工业大学学报(社会科学版),2018,14(4):92-97.
[4]郑虹,薛佳佳.关于新发展阶段高校高层次人才引进、培育的思考[J].人才资源开发,2022,483(24):30-32.
[5]李晋.去“SCI至上”后的高校人才评价体系重构探究[J].常州工学院学报,2021,34(3):80-84.
[6]蒋伟伟.大数据驱动下学术创新评价与预测模型构建及应用服务研究[J].图书情报导刊,2022,7(4):36-43.
[7]王运武, 李雪婷, 王藤藤, 等. 人工智能助推教师队伍建设:新诉求、潜能与应用场域[J]. 数字教育, 2022, 8 (6): 13-20.
[8]姚占雷,陈红伶,许鑫.科研人才分类分级评价研究[J].西南民族大学学报(人文社科版),2020,41(6):234-240.
[9]李勇,陈晓婷,黄格.基于招聘数据的人工智能人才画像与培养对策[J].重庆高教研究,2021,9(5):55-68.
[10]张海涛,张春龙,张鑫蕊,等.新文科背景下“情报学+”人才的时代意蕴.中国图书馆学报,2022,48(4):67-78.
[11]PANAGOPOULOS G,TSATSARONIS G,VARLAMIS I. Detecting rising stars in dynamic collaborative networks[J]. Journal of Informetrics,2017, 11(1):198-222.
[12]BATISTA-JR A DA,GOUVEIA F C,MENA-CHALCO J P. Predicting the Q of junior researchers using data from the first years of publication[J]. Journal of Informetrics, 2021,15(2): 101130.
(责任编辑 李强)
Portrait of University Talents with Multi-Source Data: A Study on Digital Model Construction and Practical Exploration
Xie Bochao1, Zhang Yeqing1, Wang Jiahong1, Li Ying1, Zheng Yafeng2
(1.Department of Network Security and Informatization, University of International Business and Economics, Beijing, China 100029;
2.Centre for Educational Science and Technology, Beijing Normal University, Zhuhai, Guangdong, China 519087)
Abstract: In the era of education digitalization, the construction of university talent team has become the key to enhance its core competitiveness. To form a talent portrait based on the big data of college teachers and accurately depict its growth trajectory will play an important role in the selection, education and retention of college talents. By integrating multi-source data on teachers’ morality, education and teaching, scientific research and innovation, and social services, and using data mining, machine learning, visualization and other technologies, the research constructs a talent classification and evaluation system, forms a digital talent portrait model, and realizes the design and development of the talent portrait system. The research can provide useful reference for the management of high-level talents, teachers’ career development planning, teaching and research evaluation in universities.
Key words: Talent portrait; Multi-source data; Model construction; Visualization
基金项目:2023年度国家自然科学基金面上项目“虚拟实验环境下科学探究过程自动监测与适应性反馈研究”(62377005);2022年度高等教育科学研究规划重点课题“融合多源数据的教师全息画像构建与应用研究”(22XX0303)
作者简介:解博超(1992— ),男,北京人,硕士,研究方向为数据分析与数据可视化; 张烨青(1989— ),女,江苏南通人,硕士,研究方向为教育数据挖掘;王佳弘(1992— ),女,北京人,硕士,研究方向为数据应用数据分析; 李颖(1988— ),女,天津人,硕士,研究方向为教育信息化;郑娅峰(1979— ),女,河南洛阳人,教授、博士生导师,研究方向为在线学习分析与人工智能教育应用,系本文通信作者。