APP下载

基于文本可视化的医学生计算机学习意愿分析*

2022-05-06何宝琴

智库时代 2022年20期
关键词:公共课医学生可视化

何宝琴

(厦门医学院)

近年来,各大医院都积极进行信息化建设工作,同时社会中也涌现出了一批互联网医院,全面推进智慧医院建设已成为必然趋势[1],这就意味着将来要在医院、医疗行业工作的医学生们,除了学好医学专业知识外,也应掌握计算机技能。对于医学生而言,其了解计算机知识的核心方式是计算机公共课,然而由于医学专业的特殊性,学生学习压力大、课程量大,所以在实践的过程中也遇到了一定的困难,有关问题主要体现在三方面:第一,对于医学生来说很多计算机的理论知识比较晦涩难懂,因此在学习的时候有排斥心理,对计算机课程的学习兴趣比较低;第二,由于计算机不是医学的核心专业,医学生普遍不重视计算机课程,投入时间也比较少[2];第三,学生来自于全国各省份地区,计算机水平差异较大。这些原因导致计算机教学未能取得良好的效果。由此可见,了解学生的学习意愿并激发他们的学习兴趣,针对计算机公共课进行改革具有一定的必要性与重要的意义[3],计算机教师应积极思考这一问题,主动迎接挑战。基于此,本研究面向大一医学生进行了调查,共采集了731名学生与计算机学习意愿相关的信息与数据,并通过文本可视化的方式针对调查结果进行了分析,确定了与计算机学习意愿相关的影响因素,并结合有关理论与笔者的思考,提出了改革计算机公共课的具体建议与对策。

一、文本可视化

随着数字时代的到来,数据量从TB级别跨向PB、EB级别[4],而人脑并不擅长处理如此大量的信息,因此利用机器的计算能力对海量数据进行分析挖掘成为一种趋势。文本可视化作为数据挖掘的一种重要技术,涉及了文本挖掘、统计分析、数据可视化等技术,它对人和机器都具有可读性。文本可视化是以动态或静态的视觉符号、图形图像展示文字中的内涵及规律[5],常见的文本可视化包括图形、图表、词云、地图、网络、时间线等形式,它使人们能够通过视觉的方式观察数据,了解其中潜藏的有价值的信息。本文分为四个步骤进行文本数据可视化,包括信息收集、数据预处理、文本挖掘、数据可视化,具体流程见图1。

图1 文本可视化流程

二、分析步骤

(一)信息收集

信息收集是指根据系统需求或用户需要利用各种设备、网络抓取、问卷调查等各种方式采集原始数据的过程。本研究基于网络调查了大一医学生学习计算机知识的意愿,内容为主观题“你对大学计算机这门课程有什么建议或意见?”被调查者共有731人,均为大一医学生,入学时间为2020年,专业涵盖临床医学、麻醉学、精神医学、口腔医学、药学等,其中男生261人,女生470人。调查问卷的发放数量为731份,全部顺利回收。对于收集的数据,本文利用python进行数据预处理、文本挖掘以及数据可视化。

(二)数据预处理

本文中回收的答卷为文本信息,文本数据属于非结构化数据的一种,非结构化数据具有结构不规则、不完整、没有预定义模型等特点,非结构化的数据在数据存储、管理以及分析挖掘上都会比结构化数据面对更多的挑战。由于文本数据的非结构化的特殊性,其数据预处理步骤尤为重要。我们所收集完成的原始数据质量并不高,存在不一致、重复、不完整、含噪声等问题,因此不能直接用于数据分析,需要先进行预处理。我们进行如下预处理过程:第一,数据清洗,去除无效数据。首先作答时间小于10秒视为无效答卷,其次答案毫无意义,例如“无”“没有”“没建议”“好”也视为无效答卷。我们将回收的731份答卷进行清洗后得到有效答卷657份。第二,标准化,文本数据是一种复杂、不规则的数据类型,它除了包括中文字以外,还会出现标点符号、表情包、阿拉伯数字等,而这些字符会干扰我们数据分析的结果,需要在预处理时过滤掉。第三,中文纠错,对文本中的错别字进行纠错。

(三)文本挖掘

文本挖掘是通过自然语言处理技术将非结构化信息转换为结构化信息,并挖掘其中规律,进行文本处理包括以下步骤:第一,进行词语切分,即将每个句子拆分为一系列的词,具体来讲,便是把一句话分为若干个词。第二,无意义词汇过滤,在分析学生学习意愿过程中,类似于“老师”“希望”“以后”这些词汇都是没有分析意义的,需要将这些词汇过滤掉。第三,相似词聚类,在中文中,很多词汇是相似的,例如“操作”“上机”“实践”等词汇在我们当前语境下意思相同,即操作计算机,因此需要把这些相似的词汇进行聚类。

(四)数据可视化

通过可视化处理可以将数据转换为相应的图形,目前数据可视化已成为了一种新的学科,文本可视化属于该领域的一个重要分支,是指通过图像以及图形等展示文本信息,让读者能够比较直观、快速地获取文章中内涵与规律。词云是最近比较热门的文本数据可视化技术[6],它是一种漂亮、有创意和强大的文本可视化工具之一。词云是一个基于关键词的文本内容可视化,它的核心技术是把文章中的重要词语提炼出来,并按照频率在二维空间上以不同的字体大小美观地排版,使读者能够迅速从词云图中掌握海量文本的核心信息。词频分析主要研究的是某个词汇出现的频次,能够帮助我们从大量的主观意见中抓住关键点。在研究学生计算机学习意愿的过程中引入词云分析技术,能够帮助我们更快、更准确地找到学生们最关注的问题和最迫切的学习需求。我们根据词频生成词云图,如图2所示,在图中显示的文字越大,说明其出现频次越高。从图中,不用去看调查数据的文本,就很容易知道学生们的最核心需求是什么。与此同时,用户可以设计词云的形状、色彩、方向等,使得词云更加美观,可以称之为一个兼具审美特征和文学元素的艺术作品。

图2 计算机学习意愿词云图

三、学习意愿分析与课程建议

从图2我们可以得到以下信息:第一,出现频率最高的词汇是“操作”,这里的“操作”指的是学生在计算机上进行实践。不难得出对于上课形式,大部分的学生希望有更多的上机操作机会,而不是大量的理论知识。第二,图2中多次出现“办公”“实用”“软件”等高频词汇,可见对于课程内容,学生们希望课堂更加注重实用性,以办公软件或常用软件为主。第三,在图2中多次出现关键词汇“简单”“慢”“基础”“生动”等,我们能够看出,有部分同学认为计算机是枯燥难懂的知识,对于计算机的学习还没开始就已经出现畏难情绪,学生们希望老师在上课时能以通俗易懂且具有趣味性的方式讲述。针对上述现象,笔者结合观察与总结的经验,提出了计算机公共课改革的三方面建议。

(一)激发学习兴趣

在教学改革过程中,学生是否有兴趣学习是教学改革是否成功、教学是否能达到理想效果的关键因素,基于上述学习意愿的分析结果,本文提出三点激发学生学习兴趣的建议。

第一,大学计算机公共课课程内容体系可采用理实结合模式,并且理论不应该与实践完全脱节,以实践为基础才能激发学生的学习欲望,充分发挥主观能动性。在计算机公共课中,计算机编码、计算机工作原理、网络原理、计算思维这几个部分都属于偏理论的章节,对于医学生而言比较抽象难懂,以纯理论的讲解,学生的接受度不高,可以在讲述时结合实践。例如笔者在进行字符编码教学时,先给学生们发了一份乱码的文档,请同学们分析乱码产生的原因,再结合计算机编码原理讲述乱码产生的过程,最后学生们自己动手修复乱码文档。在这个过程中学生们学习兴趣浓厚,同时也体验到发现问题、分析问题、解决问题的科学思维过程。

第二,对于教学难点,可以结合案例或学生感兴趣的热点新闻事件深入浅出地讲解,把枯燥的知识点转换为学生感兴趣的内容。例如,笔者在讲述DNS的工作原理时,结合了当下互联网中最常见的一些网络诈骗手段、广告弹出现象以及常见网络故障来讲述,学生在听这部分内容时,学习兴致很高,不但掌握了理论知识,更提高了防骗意识。

第三,与专业结合。对于医学生来说,没有兴趣的主要原因之一是没有意识到计算机对于医学的重要性。针对这一问题,可以在计算机课程教学中结合医学专业案例与专业前沿技术,将计算机在医疗上最新的研究进展与应用融入课程知识体系中,这样能够大大提升学生的学习兴趣。例如将人工智能与智慧医疗相结合,将网络原理与互联网医院相结合等。

(二)计算思维的培养

2006年周以珍教授提出了一个改变计算机教学理念的概念——计算思维[7],自此大学计算机公共课渐渐地从原来的以技能教学为主向以计算思维的培养为主倾斜,全国高校计算机基础课程教育正掀起计算思维改革的热潮[8]。一线教师们已经意识到新变化的意义和重要性,越来越重视计算思维内容的教学。然而计算思维是一个比较抽象的概念,它指的是利用计算机科学的基本概念来解决问题、设计系统和理解人类行为的思维过程,只是单纯地讲述概念与理论对医学生来说较为难以理解与接受。因此对于计算思维的培养,需要分析医学生的特点与实际,融入课程知识与实践。例如在讲解计算机硬件原理时结合排序、递归思想,在EXCEL函数讲解时融入算法理念,采取这种方式不但能提高知识的接受程度,并且可以让学生们真正实践计算思维,而不是停留于理论。

(三)教学难度设置

由于学生来自于全国各个省份,初中、高中计算机课程难度与课时均不同,有些偏远地区的学生甚至从未接触过计算机,因此在教学过程中如何设置课程难度成为亟需解决的问题。目前常见的做法是分层次教学[9],即在开课前进行计算机水平测试,依据测试结果进行分班,根据学生计算机水平来设置课程难度。这样的分层次教学虽然能够有效解决计算机水平差异较大的问题,但并不是每个学校和专业都有条件实施分层次教学。在医学院校实施分层次难度较大,其主要原因是医学生普遍课多,每个班课表差异较大,分班时难以协调上课时间。因此,针对这两种不同的情况我们采取不同的策略。首先,有条件实施分层次教学的学校优先采用分层次教学法,该方法已经在实践中被证明能够有效解决学生计算机水平差异问题。其次,无法实现分层次教学的学校,可以采用线上线下结合的教学方式。对于比较基础且大部分同学都已经掌握的内容,采用线上学习与测试,测试通过的学生可以不用学习这部分内容,而基础较差的学生在线上自学并通过测试。这样既照顾到基础比较薄弱的学生,也能够让已经掌握该内容的学生不用重复学习。

四、结语

本文基于文本可视化的方式研究分析了大一医学生的计算机知识学习意愿,总结了医学生的特点与实际,分析了其学习的需求,并结合有关理论与笔者的思考提出了具体的改进建议。针对文中提到的课改建议,笔者进行了实践检验,结果表明,新的教学方式得到了学生们的普遍好评与认可。由于计算机技术本身的不断发展,社会对计算机技能需求的不断变化,以及学生计算机水平的逐年提高,计算机公共课教学改革还需要继续研究、探索和实践,任重而道远。

猜你喜欢

公共课医学生可视化
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
医学院校就业指导课教学现状及对策研究
思维可视化
医学生科研能力培养中人文精神教育策略的思考
自然资源可视化决策系统
以医史学史料为载体提高医学生人文素质
Factors Affecting Memory Efficiency in EFL
On the Importance of English Vocabulary
On Memory Theory in English Vocabulary Learning