面向社会公众的高等教育评价智能信息服务模型框架研究
2023-12-18邱均平付裕添徐中阳等
邱均平 付裕添 徐中阳等
关键词: 高等教育评价; 智能信息服务; 模型框架; 社会公众
DOI:10.3969 / j.issn.1008-0821.2023.12.011
〔中图分类号〕TP311; G64 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 12-0122-11
得益于对教育事业不断地支持与投入, 我国教育发展已步入新的阶段。教育评价作为推动教育发展的重要一环, 在实现高质量、内涵式发展的时代命题下也被赋予了新的发展要求。2020 年10 月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》对我国教育评价改革工作提出了新部署、新要求, 并提出到2035 年, 基本形成富有时代特征、彰显中国特色、体现世界水平的教育评价体系[1] 。
教育评价中的高等教育评价兴起于20 世纪初欧美等国家(地区), 是现代高等教育快速发展的产物[2] 。与欧美发达国家(地区)相比, 我国高等教育评价事业起步虽晚, 但异常活跃, 尤其近年来数智技术在我国快速兴起与发展, 为我国高等教育评价的研究与实践应用带来了新的契机, 使我国的高等教育评价事业在更加现代化和专业化的方向上取得了快速进步[3] 。其中, 数字化高等教育评价信息平台的建设成为当下的亮点, 中国科教评价网作为我国首家以科教评价为核心的数字化平台, 自2004年起连续多年发布教育评价报告, 并提供了较为全面的高等教育评价信息服务, 受到社会各界的广泛关注与认可, 而后诸多科研机构、高等院校、企业组织等也陆续建立起了一批高等教育评价数字化平台, 在当下共同形成了良好的竞争局面[4] 。
与早期高等教育评价信息服务主要用于辅助教育部门、高等院校进行重点高校确定、高校绩效考核、高校发展横向对比等不同[5] , 在我国高等教育事业不断发展、普及化水平不断提高、社会人才需求不断增长的新环境下, 由于社会及广大家长和考生对高等教育评价信息的需求激增, 各机构与平台纷纷将服务重点转向社会公众。但通过对现有数字化平台进行深入了解后发现, 其虽作为社会公众获取高等教育评价信息与服务的主要媒介, 在面对社会公众对评价信息内容、应用和服务方式等全面需求变化以及信息获取精准化与泛在化时, 却仍多是依靠人工进行相关数据采集与评价信息形成, 以网站端信息展示与用户链接访问的被动服务为主, 总体上数据采集处理效率与智能化程度均相对较低,各平台所载信息范围虽广, 但面向用户服务角度的易用性与个性化层面仍有较大不足。同时, 数智技术的不断发展也使得信息的组织与利用形式发生了深刻变革[6] , 而现有数字化平台以人工形成评价信息、网站展示为主的高等教育评价信息服务方式,已难以应对当下社会公众作为其主要服务群体对高等教育评价信息需求激增与利用方式的不断变化。面对此种情形, 如何基于新技术和新思维开创高等教育评价信息服务新方式, 解决社会公众高等教育评价信息需求新变化与当下服务方式滞后的矛盾问题将成为新的主要问题。
时下, 智能信息服务作为一种运用数据分析和领域智能的用户服务解决高效方案, 其核心是依靠大数据算法、机器学习、人工智能等技术, 根据数据和场景特征以及用户不断变化的信息需求, 智能地对数据进行处理、分析、挖掘、提取, 并将形成的信息进行理解、优化后, 帮助用户更加科学、智能、高效地开展活动[7] 。由此可见, 智能信息服务可通过对数据的智能分析和挖掘, 产生满足用户需求的信息群, 并使用户能够通过与智能服务平台的交互来获取智能化的信息服务的作用特点, 适用于化解社会公众需求新变化与服务方式滞后的矛盾。
因此, 本文将以智能信息服务为核心, 分别构建社会公众用户高等教育评价信息需求挖掘模型、需求——资源映射模型以及总体智能信息服务模型,提出具体的信息智能服务方式, 并对总体模型进行评价论证, 以期为相关研究等提供理论参考, 并助推我国高等教育评价信息服务的转型与突破。
1社会公众用户高等教育评价信息需求挖掘与资源映射模型
社会公众用户对高等教育评价信息(以下简称“教评信息”)与服务需求的个性化、多元化、智能化等特征对教评信息的采集、处理、形成、存储、挖掘、应用和服务带来了巨大挑战, 需要重新挖掘和分析其对教评信息与服务需求的内容、方式、广度和深度, 并精准匹配对应教评信息资源。
1.1社会公众用户需求挖掘
1.1.1社会公众用户范围
社会公众是一个宽泛的概念, 需要确定相关主要群体以判断核心服务需求。通过对教评信息需求用户来源调查后发现, 主要涉及3 类群体: ①需要了解高校及学科发展的人群, 如考生、家长等, 该群体以院校信息、专业信息、历年报考录取信息等需求为主; ②教育咨询服务机构与科研单位, 该群体需要基于教评信息了解相关高校以及相关专业的发展情况, 以便开展商业咨询或科研活動; ③校友群体, 作为除政府主管部门外关心高校发展的最大群体, 通常是除财政拨款以外, 高校获得发展经费的重要来源, 还是为学校发展建言献策的主要群体。故教评智能信息服务应以挖掘此3 类主要群体的需求为起始。
1.1.2社会公众用户需求挖掘模型
全面且准确地获取用户特征与需求是实现高等教育评价智能信息服务的重要前提和基础。鉴于数字化线上平台是目前教评信息交流与服务的主要媒介, 因此, 可从用户平台数据入手, 利用数据挖掘、人工智能等技术分析挖掘其中所隐含的用户兴趣、偏好等知识, 并通过对初步形成的用户信息知识库进行再挖掘来构建精准的用户画像, 以实现用户需求发现。其中, 用户画像可以描述为一个从海量数据中获取的, 由用户特征、偏好等信息构成的形象集合[8] , 其技术作为当下用户需求分析的新兴技术,可通过对用户数据的建模、抽象用户实体标签化、汇集用户标签, 以达成精准的用户画像。本文将以用户画像技术为基础, 从用户数据采集、处理、预测3 个层面出发, 划分数据采集模块、数据处理模块、数据分析模块、用户画像模块、需求预测模块、需求分发模块6 个基本模块, 构建基于用户画像的社会公众用户需求挖掘模型, 如图1 所示。
1) 数据采集模块。首先, 用户画像是由所有被采集数据为基础构建的, 构建的详细水平、需求发现结果的真实与否都取决于用户数据种类、数量及质量, 不同种类的数据不仅代表用户不同的属性与特征, 也反映了用户部分的特定需求。考虑到数据的易得性, 可主要对用户的基本信息、动态信息、互动信息、偏好信息、反馈信息进行采集, 以实现用户画像的精准描述。
2) 数据处理模块。作为用户画像构建的中间模块, 主要实现对数据采集后的处理、分析和挖掘。由于数据间类型与结构不同, 需要对数据进行清洗、集成、规约、转化等预处理, 以清除异常数据、清洗重复数据、填补缺失数据、标准数据类型, 并在标准化数据的基础上实现数据的分类、聚类、关联与融合。
3) 数据分析模块。该模块作为用户画像构建的核心模块, 主要对用户数据进行更深层次的分析与推理, 以实现用户特征识别、典型用户选取与用户标签提取。首先可通过分析用户行为完成对用户特征的识别与提取, 然后应用K-means 聚类算法进行用户聚类分析, 提取聚类结果中具备特征类型的用户群, 并运用改进型RFM 模型选取用户群中具有代表性的典型用户, 最后通过TF-IDF 算法得出各类典型用户特征关键词及权重值, 并按权重值大小作为用户标签选取的依据, 实现用户标签的提取[9] 。
4) 用户画像模块。该模块是用户画像的实施模块, 核心是将提取出的用户标签依据内涵划分为自然、偏好、情景、社交4 类维度标签, 并通过组合形成个体用户画像、群体用户画像以及资源受众画像3 种类型。个体用户画像是根据用户特征关键词为依据对个体用户进行的画像刻画; 群体用户画像则是在个体用户画像的基础上, 把具有相似属性的个体用户画像进行关联、聚类分析后构建的总体画像; 资源受众画像则是以某一热点资源需求为核心对受众用户进行的画像。
5) 需求预测模块。该模块一方面根据已构建的用户画像, 通过协同过滤算法或聚类算法, 对教评信息资源标签进行相似度匹配来完成用户现实需求的识别; 另一方面可结合教评信息资源知识库的自我数据挖掘与预测功能, 实现用户潜在需求的挖掘以及未来需求的预测。
6) 需求分发模块。该模块主要基于用户画像的需求与预测发现结果, 通过算法向对应用户进行分发。
1.2用户需求——资源映射
将用户需求与教评信息资源进行精准匹配, 是实现高等教育评价智能信息服务的重要依据与保证,需要在用户需求知识库与教评信息资源库之间建立映射模型来实现需求与资源间的关联。这种映射关联可由用户需求知识库和教评信息资源库两者关键词间的匹配来实現, 如图2 所示。
首先, 依靠相关人员的专业知识, 基于高等教育评价资源内容建立标准关键词库, 利用智能分词、语义分析等NLP 技术(自然语言处理技术)实现用户需求知识库与教评信息资源库中内容的关键词化, 并自动标注与分类; 然后, 通过将标准化后的用户需求关键词和教评信息资源关键词与标准关键词库进行对照, 根据满足用户—资源—词库三者关键词的共同对应关系来达成映射。其中, 在用户需求与教评信息资源匹配过程中需要在匹配原则制定与匹配阈值确定的基础上建立匹配关系模型, 而后在教评信息资源库中获取与用户需求相匹配的知识资源, 按照资源匹配度的排列顺序依次推送给用户, 并通过对用户推送结果满意度的反馈收集进而对匹配模型算法作出更新改进。
2高等教育评价总体智能信息服务模型设计
2.1构成要素
①服务主体。高等教育评价智能信息服务是一项需要以服务提供主体为核心, 多方协作的复杂工作, 主要是由高校、科研机构、私营企业等组织建立的高等教育评价机构; ②服务对象。服务重点面向社会公众用户开展, 涉及上述3 类主要用户: 需要了解高校及学科发展的人群、教育咨询服务机构与科研单位以及校友群体; ③服务内容。主要涵盖全方位、多层次的教评信息, 如国内外大学评价、研究生评价、地区教育评价, 以及更为深入的如学科评价、专业评价等评价内容, 此外还包括对教评信息再提炼后提供的其他服务内容, 如高校分析服务、志愿测评服务、专业填报服务等; ④基础设施。主要是高等教育评价智能信息服务的平台基础与技术基础; ⑤服务环境。好的服务环境能为高等教育评价智能信息服务的构建带来更为便利的条件, 涉及到的服务环境主要包括政策文件、资金支持、服务主体对服务对象的意识行为等。
2.2高等教育评价总体智能信息服务模型
当前, 信息服务的基本关系可以概括为如图3所示的关系结构[10],高等教育评价智能信息服务作为信息服务中的一种个例, 也满足信息服务中各元素间的基本关系。
因此, 本文将在信息服务基本关系结构的基础上进行扩展、改进, 并结合上文中已构建的用户需求挖掘模型、用户需求——资源映射模型, 提出高等教育评价总体智能信息服务模型框架, 如图4 所示。
2.2.1数据资源层
高等教育评价数据资源来源复杂且异构特征明显, 涵盖①有关政府部门的统计数据资料(汇编、年鉴、报表等); ②相关高校的网站信息和国内外教育评价网络信息; ③有关刊物、书籍、报纸、内部资料等; ④国内外高等教育评价机构、评价工作研究团队相关数据库信息[11] , 此外还涉及用户信息、业务信息等其他数据资源。数据资源层主要为其后各层业务的正常有序运行提供必需的数据资源保障, 汇聚存储多渠道、多类型的数据资源, 并利用数据采集技术、数据库技术等实现大规模的数据采集、存储、调用、更新、序化等工作, 形成具有完整数据类型、动态数据配置、状态合理有序、数据流转稳定的数据资源中心。
2.2.2技术支持层
高等教育评价智能信息服务的内核是在技术的支撑下实现教评信息形成与服务业务的智能。技术支持层是实现数据高效处理、业务场景嵌入、信息智能服务的支撑层面, 并依据不同业务需求类型进行合理的技术组合与配置, 在相关技术有效部署的基础上, 主要依靠4 个技术群来支撑实现业务智能, 如表1 所示。
2.2.3信息处理层
信息处理层处于高等教育评价智能信息服务业务流程的中枢位置, 以数据资源与技术支撑为基础,完成由原始评价数据资源向教评信息资源转变与输出的过程。根据数据流动及智能信息服务的实现路径, 该层设计5 个核心模块, 依次为数据汇集模块、数据处理模块、需求分析模块、需求——资源映射模块以及管理模块。①数据汇集模块主要对高等教育评价相关数据以及通过各业务节点形成的二次数据进行采集、清洗、去噪、存储等工作; ②数据处理模块主要利用相关数据处理与分析技术, 实现数据标准化转换、数据类型规范、相关数据关联、数据挖掘以及知识单元形成; ③需求分析模块主要是对采集到的用户相关数据进行分析和标签化处理,并基于形成用户4 个维度偏好的标签划分不同的用户群体并完成用户画像, 后通过协同过滤算法或聚类算法与教评信息资源标签, 进行相似度匹配以完成用户需求分析; ④需求——资源映射模块主要通过将标准化后的用户需求关键词及教评信息资源关键词与已建立的标准关键词库进行匹配, 并根据满足用户—资源—词库三者关键词的共同对应关系实现资源映射; ⑤管理模块主要实现用户访问控制、配置管理、资源分配、任务管理[21] 、服务模块调用等, 通过对系统内不同模块之间的统一管理, 共同实现教评信息的形成与智能服务。
2.2.4智能服务层
智能服务层是高等教育评价智能信息服务的输出层面, 主要在数据资源层与信息处理层管理模块的协作下, 输出最准确的服务内容并选取最合理的智能服务方式, 依靠智能推送服务、智能检索服务、智能咨询服务、智能产品服务、智能知识服务、智能专项服务6 种不同的智能服务方式来满足用户的多样需求。
2.2.5用户交互层
用户交互层是用户与高等教育评价智能信息服务系统平台进行前端交互的层面, 支持用户利用计算机、智能手机等终端设备, 通过网络门户、APP客户端、微信公众号、微博平台等媒介, 接入用户交互层来实现注册登录、检索浏览、提问咨询、服务获取与评价反馈等功能。此外, 该层还支持用户全时段的实时互动访问, 可随时随地获得服务响应与反馈, 真正实现用户—平台—教评信息资源间的即时连接与泛在服务。
3高等教育评价信息智能服务具体方式
3.1智能推送服务
智能推送服务是智能服务中最为主动的方式,通过分析用户数据来对用户需求作出预判, 主动为用户提供信息推送服务。该服务以平台中用户需求精准识别与预测功能为基础, 同时支持用户主动订阅、平台链接推送、授权第三方工具推送等形式,实现大学评价信息资源、学科评价信息资源、“双一流” 评价信息资源、动态评价信息资源、网络评价信息资源以及特色评价信息資源等的智能推送, 改变以往由于信息大规模推送而缺少个性化、精准化特征的现象, 真正做到“因人而宜” 地推送适应用户需求场景、需求偏好、需求动机与当前实际的教评信息。此外, 还可依据用户需求分析与反馈数据建立准确的个人用户需求推送模型, 形成面向个人的信息推送记录库, 做到推送时间与内容的高效准确。
3.2智能检索服务
智能检索服务可根据用户的不同习惯、表达方式、专业知识等提供不同的检索模式, 并通过获取用户对检索结果的评价与反馈来优化检索策略, 贴近用户的真实需求。在检索准确度上, 主要综合分析用户过往检索数据、检索行为特点等, 将更符合用户需求的教评信息资源靠前排列, 减小低相关度检索结果的干扰, 最大程度地提升检索效率, 做到用户一次性的最优结果获取; 在检索技术上, 智能服务平台依靠兼容的多种检索技术, 把握深度优先和广度优先的策略, 挖掘用户检索输入中最准确的需求语义; 在检索条件上, 支持大学、学科、关键词、主题、内容、类型、地址、时间等多条件下的教评信息资源检索, 以及多信息资源库协同下的跨库检索。此外, 智能检索服务还可通过微信公众号、APP 客户端、WAP 网站等实现移动端检索,跨越时间和地域的阻碍, 并利用移动互联网技术优势拓展智能检索服务功能。
3.3智能咨询服务
当前, 人工智能机器人已逐步应用于智能参考咨询服务中, 其借助于参考咨询知识库, 可实现信息咨询的自动化处理, 具有精准实时、无服务时间限制、操作简单、便于管理的优势[22] 。教评信息智能咨询服务融合了人工智能的技术理念和信息咨询的方法逻辑, 通过设计合理有效的推理机制, 对用户咨询问题进行更为准确的逻辑判断、语义理解与需求识别, 并通过友好的人机接口和解释系统为用户提供知识化的智能咨询服务[23] 。
3.4智能知识服务
智能知识服务主要向用户提供教评信息资源经凝练加工后且具有辅助指导作用的知识, 通过知识统计与挖掘方法, 为用户提供教评信息资源之外的可视化知识来辅助指导用户理解与运用教评信息,如知识图谱、数据统计图、信息关系图等。
3.5智能产品服务
智能产品服务是对知识服务层的进一步深化,通过融合人的智慧, 与数智技术形成蕴含丰富服务价值、利用价值和经济价值, 且具有增值性、科学性、前瞻性特征的知识产品和情报产品, 以满足用户的决策服务需求。具体的智能产品服务包括: ①咨询类决策产品, 主要依据用户不同阶段、不同类型的需求, 生成个性化的咨询决策报告, 辅助用户进行决策分析; ②情报类发展产品, 面向大学、学科的建设与发展, 为相关用户提供大学、学科竞争力分析、建设水平评估、人才评估报告、需求分析报告、发展态势报告、服务规划报告、平台发展报告等情报产品; ③工具类应用产品, 主要面向组织和个人提供用户画像、群体画像、在线词典、在线百科等应用产品, 以实现用户快速利用教评信息资源的目的。
3.6智能专项服务
智能专项服务是针对用户特定需求, 由教评信息服务团队深度探究发现用户专项需求后, 为其开展全程式、跟踪式的智能专项服务。该服务主要由专项服务团队在智慧、精准、高效理念指导下, 基于智能信息服务平台并通过问卷调查、线上交流、VIP 访谈等多元化、多频次、多层次的研讨方式,发现用户明确的信息、知识、空间、产品等服务需求。此外, 还可利用实践调研、文献调研、案例分析等方法, 提前预测用户潜在需求并积极开展智能专项服务。
4高等教育评价智能信息服务模型评价论证
为系统论证高等教育评价智能信息服务模型的有效性, 保证模型在宏观上能够有效运行以支持相关业务及流程的开展, 拟采用基于熵权的模糊综合评价方法对模型进行评价论证。
4.1评价指标选取
考虑到高等教育评价智能信息服务模型在本质上与情报系统、信息系统相似, 因此, 在相关系统成熟评价指标体系的基础上, 改进形成了适合本模型的评价指标[24-25] , 同时, 考虑到模型架构与内容的多样性, 本研究邀请了高等教育评价领域专家、智能计算领域专家、相关数字化平台高层管理人员, 与潜在用户共10 位专家进行论证, 通过以模型原理展示论述与专家提问解答相结合的方式, 向专家们展示该模型的设计理念、基本要素、机制设计及业务流程, 并发放调查问卷。评价指标及问卷调查结果如表2 所示, 其中各指标评判分数集均为{好、较好、中等、较差、差} ={5、4、3、2、1}。
4.2熵权法确定评价指标权重
运用MATLAB 数据处理软件, 根据熵权法的计算步骤进行程序编写[26] , 分别得到一级指标、二级指标的权重值, 如图5 所示。
4.3模糊综合评价
依据前期专家评分形成的各模糊评价矩阵以及二级指标层的权重集, 利用模糊综合评价模型进行分析[27] , 结果如表3 所示。
根据模糊综合评价分析结果显示, 本模型在模型建设评价一级指标中, 最终评价结果内的最大值为0.446, 其相对评判是“较好”; 在模型性能评价一级指标中, 最终评价结果内的最大值为0.429,其相对评判是“较好”; 在模型应用评价一级指标中, 最终评价结果内的最大值为0.554, 其相对评判是“好”。分析结果说明, 本模型虽在各一级指标评判中均可达到“较好” 及以上的程度, 但在建设和性能方面仍有较大的后期优化提升空间。
进一步对本模型进行总体模糊综合评价分析后结果如表4 所示, 得到本模型总体属于“好” 的隶属度为0.412, 属于“较好” 的隶属度为0.375, 属于“中等” 的隶属度为0.183, 属于“较差” 的隶属度为0.030, 属于“差” 的隶属度为0.000, 按照上述評判分数集的标准进行隶属度加权量化测度,得到最终模型总体测度评价值为4.169, 对应“好”的评判结果。
综上, 通过选取模型评价指标、专家问卷调研, 运用基于熵权的模糊综合评价法对模型进行评价论证, 可以初步认为该模型能有效地支撑高等教育评价智能信息服务的建设与开展。
5结语
新技术环境下, 数智技术在驱动新一轮经济社会变革的同时, 也成为推动高等教育评价事业发展的新助力。运用数智技术创新面向社会公众的高等教育评价信息服务, 是高等教育评价事业在数智时代浪潮下发展进步的必要途径。从现实出发, 构建面向社会公众的高等教育评价智能信息服务模型框架, 在能够精准化满足社会公众对高等教育评价信息需求日趋变化的同时, 也更合理地为高等教育评价信息新时代下的服务方式开展了探索, 这对今后更为科学地应用高等教育评价信息具有重要的意义。
本文针对社会公众高等教育评价信息需求变化与当前服务方式滞后的矛盾问题, 以智能信息服务为核心、数智技术为驱动, 建立了社会公众用户高等教育评价信息需求挖掘及需求——资源映射模型,构建了涵盖数据资源层、技术支持层、信息处理层、智能服务层、用户交互层的高等教育评价总体智能信息服务模型框架, 提出了具体的信息智能服务方式, 并论证了模型的有效性。期望为研究人员在高等教育评价智能信息服务相关研究中, 与时俱进地挖掘用户新需求、融合新技术、开展新理念等提供一定的参考。