APP下载

基于文本分析的大专院校人才培养质量评估方法研究

2023-11-06杨国龙

电脑知识与技术 2023年27期

杨国龙

(湛江幼儿师范专科学校,广东 湛江 524084)

0 引言

本研究为了拓展和深化专科类高校人才培养评估手段以及专科类高教人才培养方式的理论探讨空间。将信息挖掘、文本信息分析等技术从网络舆论管理等领域应用到高校人才培养质量评估,而且该技术应用于大专院校人才培养质量评估具有一定的创新性。其次,采用新的研究思路及工具方法对专科类院校的人才培养质量进行评估,通过编写程序抓取互联网海量的文本信息,再根据神经网络模型来判断文本中的情感倾向和主体观点,对专科类高校人才培养质量进行精准评估,得以在科学决策的基础上综合评判大专院校人才培养方案,进而保障大专院校人才培养质量及持续改进[1]。最后,本文旨在于对大专院校人才培养质量评估方法进行研究,进一步完善和改进高职院校人才培养质量评估体系,对大专院校人才培养体系结构进行宏观调整及监督,有助于保证专科类高校人才培养体系处于较高水平,借助信息挖掘和信息分析技术,通过社会舆论等反馈对人才培养质量评估体系进行优化,可为高职类的院校制定人才培养方案提供决策支持。

1 国内外发展现状与趋势

随着我国经济的快速发展,各行各业人才市场的需求也不断加大。国家实施高职扩招战略可进一步促进职业教育模式改革。因此,构建与高职扩招相适应的人才培养质量保障机制作为职业教育改革的重要内容,通过探索多元化人才培养体系的关键因素具有一定促进意义。

当前的教育数据分析离不开大数据技术,通过对教育数据挖掘,可及时获得教育领域相关信息,进一步挖掘教育数据的深层价值,为人才培养质量方案制定提供数据参考。除此之外,利用大数据可以完成大量教育数据的收集、处理和分析,为制定教学指导措施提供决策支持。在此基础上,因大数据、深度学习等技术的不断发展,产生了另外一种数据挖掘技术,即是文本分析技术,该技术也可应用于语义理解、机器翻译、问答系统和信息检索等多个领域[2],因此,数据挖掘技术的国内外发展现状与趋势如图1所示。

图1 国内外发展现状与趋势

1.1 文本分类研究现状

在20 世纪50 年代,国外学者H.P.Luhn提出词频的概念,进而开始研究了文本分类技术。随后,IBM公司将词频引入到文本分类技术,促进文本分类领域发展。除此之外,学者Maron等人利用关键词实现了文本的自动分类。

随着数据特点的越来越复杂,当时文本分析领域的研究方向主要是机器学习的文本分类方法。学者Kim等人研究了深度学习模型并应用到文本分类中,而且在句子建模中采用了卷积神经网络,实验结果表明,在多个数据集上处理效果较好。学者Mikolov 等人对神经网络语言模型进行研究,提出利用RNN进行语言建模进而增强语言模型的表征能力。学者Komninos等人研究了词嵌入在深层网络中影响,并得出了采用上下文的词嵌入方法在实现分类上效果明显。而国内学者曾谁飞等人结合了双向长短期记忆网络与双词嵌入可以较好完成文本特征提取[3]。

1.2 文本情感分析研究现状

在2003 年,自从国外学者Nasukawa提出了情感分析含义,相关专业的研究者在此基础上进行深入研究。比如,根据情感词典的研究方法,学者Kim 等人利用情感词典来制定情感得分的计算方法,为了提高准确性,通过对文本中情感词的情感得分进行求和计算得出整个文本情感极性。在分析文本情感倾向性分类时,因部分文本的特征准确性不足,针对该问题,国内学者魏广顺等人为了提高情感分类准确性,从而设计出一种文本特征加权方法,该方法利用TF-IDF算法实现特征加权,最后,设计分类器对倾向性进行分类判断。学者张志华对卷积神经网络模型等内容进行了研究,分别提出了三种不同的情感词向量学习模型,利用预测情感强度值,建立一种基于有监督的排序模型,得出的实验效果较好[4]。

2 人才培养质量评估分析步骤

本研究对社会评价的大专院校人才培养质量评估方法及内容分三步进行分析,首先对高职类院校人才培养质量评价的数据进行收集及预处理,然后,根据获取的相关数据,利用改进情感词典的文本情感强度计算方法及神经网络文本分类来建立分析模型,最后,基于建立的分析模型对大专院校进行人才培养质量进行评估,如图2所示。

图2 人才培养质量评估分析步骤

2.1 人才培养质量数据收集及预处理

为了提高人才培养质量评估准确性对相关数据进行收集,由于互联网数据不断更新及结构不同,采用不同数据收集方法,利用网络爬虫的策略,完成实验数据集获取,将采集的原始数据通过筛选及标注等处理后,基于筛选的数据结合高职院校人才培养质量评价指标体系,比如评价指标包括课程建设、教学能力与人才培养模式改革等内容,进而完成人才培养质量评价数据集构建,为大专类院校人才培养质量分析及改进提供数据支撑[5]。

2.2 基于人才培养质量数据建立分析模型

基于获取人才培养质量相关数据,分析数据集计算情感强度,在网络评价中,参考口语化及网络用语等词汇,组成了社交网络词典。然后将社交网络词典等加入到基本情感词典,借鉴基于改进情感词典的文本情感强度计算的方法,建立了分析模型[6]。在分类模型中,利用循环神经网络的循环结构,结合注意力模型与循环神经网络的循环结构,形成文本分类模型,并对人才培养评价数据中更重要的关键词分配相对较高权重,在指标分类准确度上,保证该建立模型的效果。

2.3 基于分析模型评估人才培养质量

基于建立的人才培养质量分析模型进行评价,利用该模型具体分析大专类院校人才培养质量存在问题,采用的文本分析是借鉴TF-IDF算法实现特征加权,利用分类器进行分类判断。此外,可通过社会网络数据为人才培养质量监督提供反馈,得以在科学决策的基础上综合评判大专高校人才培养方案及其效果的优劣程度,为改善大专高校人才培养质量提供研究方向[7]。

3 人才培养质量评估方法介绍

本文利用文本分析对大专院校人才培养质量评估方法进行介绍,分别对文献调研、文本分析法和质化计量进行分析,利用人才培养质量评估为后续制定大专院校的人才培养计划提供参考方向,如图3所示。

图3 人才培养质量评估方法介绍

3.1 文献调研

通过文献调研可广泛收集国内外有关高职院校的人才培养数据和人才培养质量评估的相关文献,结合高职类院校人才培养的最新研究动态,采用科学知识图谱等工具,对国内外高职院校人才培养及其质量评估的研究方向、引文关系及发展趋势与热点进行分析,为全面把握该领域内的发展态势及进展,从理论和方法上全面系统地研究人才培养质量的相关问题,利用网络工具软件对高职院校的人才培养质量进行评估分析[8]。

3.2 文本分析法

根据大专院校人才培养质量分析数据,对相关文本数据进行有效整理,将获取的无结构原始文本转化为结构化且计算机可识别及处理的信息,将文本进行科学抽象。在此过程中,采用文本分析法是利用分词算法和词频统计方法而得到的特征项来表示文本向量中的指定维度,用以描述和代替文本,最后使用可视化的工具将其展示,得到的相关数据用于高职院校人才培养质量评估更方便。

3.3 质化计量

质化计量是基于扎根理论,立足媒体平台和社交平台,通过编写程序抓取挖掘的大专院校人才培养相关的文本信息,利用得到的相关数据信息,可采用面板回归、工具变量法、PSM-DID和RDD等多种计量实证方法进行分析,研判质化计量人才培养质量的综合评价因素,以及大专高校人才培养体系的建设重点和发展方向,给予制定高职院校的人才培养计划提供参考[9]。

4 人才培养质量评估技术分析

本文介绍了通过采用Python语言完成了在百度知道、新浪微博和百度贴吧等平台上实现精确的关键词检索和文本挖掘算法编写工作,以及对广东省高水平高职院校的评价指标进行分析和网络神经情感判断进行高强度训练,进而完成AI训练工作,人才培养质量评估技术分析如图4所示。

图4 人才培养质量评估技术分析

在数据获取过程中,为了获取方式的高效性,从而保障文本数据源的完整及客观性。在抓取媒体平台和社交平台关于高校人才培养质量反馈的文本信息过程中,确保获取数据信息较全面而且无偏差,依托关键词进行全平台抓取,以保证数据源的完整及可靠,另外为了应对该平台中数据信息抓取的反制措施,可通过使用模拟浏览器的方式绕过障碍。因社会上对高校的人才培养质量评价所能产生的文本不仅存在于传统媒体和自媒体,更多是在社交网络平台,鉴于平台上的反爬虫措施和抓取难度,本文利用文本抓取工具的选取与运用,采用Python语言编写高效率的程序,模拟浏览器登录的方式抓取指定文本信息[10]。依托现有的情感词典,再组织社交词典和领域词典改进文本的算法,另外可采用神经网络模型处理文本中的高频词和情感关键词两者间关联问题,结合注意力模型对关键词给予分配更高的权重。最后,根据文本分析的结果,借鉴网络提供参考数据从而完善大专院校人才培养质量评价体系[11]。

5 人才培养质量评估过程

本文根据“漏斗法”逻辑结构,对人才培养质量评估得到的社会文本进行预处理、结合多种词典和模型数据进行分析,将数据实现可视化展示,深入挖掘大专院校人才培养体系与网络文本信息反馈之间的规律及意义。利用网络信息挖掘技术和大数据分析技术,可以精准分析人才培养质量存在问题,也可通过个案调查、访谈和相关资料进行分析及验证,实现高职类高校人才培养质量评估[12],研究路径如图5所示。

图5 人才培养质量评估过程

5.1 采用社会网络信息对高校人才培养质量进行评估分析

通过互联网产生的海量大数据,在媒体平台和社交平台上获取有关于高等学校人才培养质量的信息,有效解决传统人才培养质量评估研究中数据难以获取,数据不够客观的问题,为高校人才培养建设工作提供精准社会信息及数据反馈,以便于科学决策与方案改进。

5.2 质量评估体系与人才培养体系交叉验证

研究理论是为实践服务,对于高校人才培养体系的建构,是为了学生在社会实践质量服务,也反馈在社会网络文本上;同时,人才培养体系的运作情况可以用来验证质量评估体系的客观科学性。由此,本文对高校人才培养质量体系研究可供大专院校的人才培养制定参考借鉴。

6 总结

本研究对大专类高校人才培养质量评估研究中采用新的研究思路及方法,介绍了编写程序抓取互联网海量的文本信息的方法,介绍神经网络模型来判断文本中的情感倾向和主体观点,对专科类高校人才培养质量进行精准评估,得以在科学决策的基础上综合评判大专院校人才培养活动及其效果的优劣程度,从而保障大专院校人才培养质量的持续改进。也可借助信息挖掘和信息分析技术,循环使用评估体系、利用社会舆论反馈提高人才培养质量。