APP下载

大数据背景下医学生数据素养培养研究*

2021-01-15胡珊珊范怀玉

医学信息学杂志 2020年12期
关键词:数据挖掘医学生案例

胡珊珊 范怀玉

(济宁医学院医学信息工程学院 日照 276826)

1 引言

随着我国医疗信息化的深入发展,医疗卫生领域进入大数据时代[1]。借助于大数据分析和挖掘技术,发现其隐藏的规律,将促进基础研究、药物研发、健康服务以及临床诊疗等领域的重大变革[2]。数据素养正是一种通过数据分析和挖掘发现数据价值的重要素养[2],医学生应具备基本的数据素养来应对大数据时代的医疗环境。目前医学生数据分析和挖掘能力比较弱,数据素养难以达到理想水平。因此应采取有效措施来提升医学生数据素养水平[3]。数据素养教育是培养学生数据素养的重要途径,高校在其中发挥着重要作用[4]。数据素养涉及数据意识、数据能力和数据伦理等多方面内容,其核心是对数据进行分析、挖掘的能力,数据挖掘课程是高校培养学生数据素养的重要课程[5]。本文在分析数据素养概念和构成要素的基础上,以数据挖掘课程为载体,探讨医学生数据素养培养模式。

2 数据素养概念

数据素养是指人们正当、有效地发现、评估和使用数据信息的意识和能力,主要包括数据意识、数据能力和数据伦理3方面内容。其中数据意识是指对数据敏感,具备判断力和辩证思维,能够充分感知数据价值;数据能力是指利用工具对数据进行分析和挖掘的技能;数据伦理是指在获取、使用与发布数据的过程中遵守法律法规和道德规范[3,6]。数据能力是数据素养的核心组成部分,按照数据挖掘和分析流程可分为数据获取、整理、分析、呈现、应用能力[7]。数据挖掘是一门综合型交叉学科,其内容涉及计算机科学、统计学、机器学习、人工智能、模式识别、数据库技术等多个领域,是数据分析和挖掘的技术支撑,是学生数据素养培养的优质载体课程[5,8]。

3 医学生数据素养培养模式

3.1 教学目标

3.1.1 问题分析 数据挖掘通常以概率论与数理统计、计算机算法等为前导课程,包含大量公式推导和算法分析,理论性较强[9]。医学生由于其专业背景,在计算机和统计学等方面知识储备比较薄弱,学习难度大,难以理解数据挖掘算法,更难以将数据挖掘技术应用到医疗大数据中。医学生数据分析和挖掘能力与职业需求之间存在巨大差距。

3.1.2 教学目标 医学生是数据挖掘技术的应用人员,课程教学目标应侧重于数据挖掘技术应用,让学生借助所学知识和方法,运用数据挖掘技术对现实生活中的数据进行挖掘分析,获取隐藏的有价值信息,从而指导决策。同时在教学过程中注重学生数据素养培养,包括培养数据意识、提高数据能力和树立数据伦理。结合医学生专业特点与培养目标,数据挖掘课程教学应重思想,轻细节,弱化公式和原理推导,注重挖掘算法实际应用。教师在讲授数据挖掘算法基本思想基础上,重点讲授如何实施一个完整的数据挖掘项目,使学生掌握数据挖掘技术在现实生活中的应用。同时学生在执行项目过程中学习数据挖掘方法和步骤,在利用挖掘结果辅助决策时感受数据价值,在潜移默化中提升自身数据素养。需要注意的是实现数据挖掘流程中各个模块对于医学生较为困难。因此数据挖掘课程教学应借助某一种数据挖掘工具,通过调用已开发好的包和函数来实现各个模块,使学生能够从抽象的原理、算法以及复杂的算法实现中脱离出来,将关注点更多地集中在数据挖掘技术应用层面上。

3.1.3 数据挖掘工具选择 目前常用的数据挖掘工具一般有 WEKA、RapidMiner、KNIME、Orange以及R等[10]。其中R作为一款开源免费软件,在统计和制图方面有显著优势,同时提供大量第3方数据挖掘功能包[11],可以被数据挖掘流程各个模块无缝调用,学生只需调用函数并指定参数即可。R是数据挖掘的理想工具,本文以R语言为基础开展数据挖掘课程教学。

3.2 教学方法

3.2.1 概述 数据挖掘课程内容比较抽象,医学生不容易理解,学习兴趣不高,因此在课堂教学过程中引入案例教学。教师依据教学内容和目标设计案例,将相关知识点融入到案例中。案例选择既要有针对性,又要考虑医学生专业特点,选取生活中真实发生的事件作为案例,如垃圾邮件分类、药品推荐等,让学生感受到数据挖掘的现实意义,激发对理论知识探究的积极性。教学形式上,案例教学过程采用现场编写代码的方式。教师利用R语言对数据挖掘过程进行现场编码和调试,将每阶段的处理结果以最直观的形式展示给学生,让学生体验数据挖掘中数据变换的流程。这种现场编码的教学形式能够充分激发学生学习兴趣,提高其分析解决问题能力,提升数据素养。

3.2.2 案例讨论 以对案例的数据挖掘过程为主线组织教学。数据挖掘流程可分为数据收集、预处理、挖掘、挖掘结果评价和分析决策等阶段[12]。教师要对教学内容进行整合与重构,将知识点嵌入到数据挖掘流程各个模块中。案例讨论过程以数据挖掘流程贯穿其中,重点讲述怎样调用R语言中的函数进行案例数据收集、预处理、挖掘以及利用挖掘结果进行分析决策,将各模块前后衔接成一个完整的数据处理过程,让学生在数据处理过程中提升自身数据素养。例如以药品推荐为案例,讲授数据挖掘中经典的关联规则Apriori算法,见表1。

表1 “药品推荐”案例教学过程

3.2.3 案例分析 案例教学将数据素养培养融入到案例分析的整个过程,围绕数据获取、整理、分析、呈现、应用5种能力展开,这恰好与数据素养的5个能力维度相对应。教师在分析案例的过程中帮助学生树立数据意识和数据伦理。例如对用药数据进行挖掘,可以获得治疗某种疾病的高频用药以及药品间的关联规则,在分析决策阶段,教师引导学生对挖掘结果进行分析和评价,发现医生用药特点和规律,从而指导临床用药决策。此外医疗数据中可能含有涉及患者隐私的信息,如姓名、联系方式、家族病史等,在数据预处理阶段要对这些信息进行屏蔽,保护患者隐私,让学生懂得在法律和道德允许的范围内正确使用数据。

3.3 教学过程

3.3.1 理论教学 由于数据挖掘课程课时有限且涉及的知识点较多,仅利用课堂时间难以有效开展案例教学,因此在课程教学中引入翻转课堂。课前,教师根据教学内容布置任务,学生利用线上教学资源学习相关课程内容。例如在讲解关联规则Apriori算法时,学生可提前学习频繁项集、关联规则、支持度、置信度、兴趣度等概念以及R语言中的相关函数等。课中,以案例分析为基础开展课堂教学,师生围绕案例问题展开讨论交流和合作探究,共同完成数据挖掘的完整流程,使学生在分析和解决问题的过程中理解和掌握数据挖掘算法在实际中的应用,从而提高数据处理能力以及数据素养。课后,学生结合个人课堂学习情况,自主地对所学知识进行复习巩固和拓展延伸,例如利用教师发布的测试题进行在线知识测评,或通过教学平台学习更多的数据挖掘案例,进一步拓展思维、提升能力。这种翻转课堂的教学模式使学生在课下进行知识学习,课堂上在教师引导下针对案例问题展开讨论,在分析和解决问题的过程中完成知识的内化,不仅提高课堂效率,更激发学生学习主动性和积极性,促使教学主体由教师逐步向学生过渡,真正实现学生为主体、教师为主导的教学理念。

3.3.2 实验教学 数据挖掘是一门实践性较强的课程,实验教学必不可少。通过实验教学使学生利用课堂所学理论知识解决实际问题,使学生在掌握数据挖掘理论和方法的基础上提高利用、分析数据的能力。实验教学采用项目教学法,学生围绕具体项目展开实验学习。在实验教学过程中,教师以理论教学内容为依据,在充分考虑医学生专业发展的基础上设计实验项目,如疾病风险预测、临床辅助诊断等,以真实案例激发学生实验探究的主动性。确定项目后,学生自由分组,每组3~4人,通过分工合作完成项目挖掘,要求学生实施数据挖掘的整个流程并完成实验报告。学生在项目实施过程中掌握数据挖掘各种算法以及这些算法在实际中的应用。通过实验教学不仅提高学生利用所学知识对实际问题进行分析和挖掘的技能,提升数据素养,也锻炼团队协作、沟通交流能力。

3.3.3 考核方式 课程考核是教学过程中的重要环节,是评价学生学习效果的有效手段。传统考核方式通常以期末考试为主,侧重于考查学生对理论知识的掌握情况,忽视对学生实践能力的评价,更难以反映医学生真实的数据素养和数据能力水平。因此采用多元化的考核方式,开展过程性评价,将期末考试、实验、平时成绩综合起来作为学生最终课程成绩。期末考试主要考查学生对数据挖掘原理和算法的掌握情况;实验成绩主要评价小组完成项目质量、团队协作和成员参与及表现等情况,反映学生解决实际问题时的数据分析处理能力;平时成绩以学生课堂讨论问题的参与度为主要依据,同时结合考勤和作业等多个方面的表现。多元化的过程考核方式不仅对学生理论知识、动手能力和数据技能进行考核,也对学生在学习过程中展现的学习态度、方法和主动性等进行综合评价,能够有效促进学生发展以及数据素养提升。

4 结语

大数据时代的到来对医学生数据素养提出更高要求,掌握必备的数据技能可使学生更好地适应当前大数据医疗环境。对医学院校而言,不仅要培养学生医学专业素养,还应培养数据素养,使其成为综合型医学人才。目前我国医学生数据素养难以达到理想水平,必须构建科学合理的课程体系,积极探索数据素养培养新模式,不断提升医学生数据素养。在培养过程中,重点培养医学生在数据获取、整理、分析、呈现和应用等方面的能力,同时使医学生树立数据意识和数据伦理,能够认识到数据价值并在法律和道德规范的约束下正确使用数据。医学生数据素养培养是一项系统工程,需要医科院校、教师和医学生多方共同参与合作。在这个过程中,学校和教师要互相配合,开发、整合多种教学资源,为学生提供丰富多样的学习资源和完善的学习环境;医学生要充分发挥主动性,探索适合自身的学习方式,在学校和教师引导下不断提升数据素养。

猜你喜欢

数据挖掘医学生案例
案例4 奔跑吧,少年!
探讨人工智能与数据挖掘发展趋势
医学生颈痛情况及相关因素分析
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
随机变量分布及统计案例拔高卷
发生在你我身边的那些治超案例
医学生怎么看待现在的医学教育
一个模拟案例引发的多重思考
人文教育要给医学生另一种智慧
浅谈医学生创新意识的培养