医学生数据素养评价体系构建及调查研究*
2020-11-25王于心贺培凤贾晨晨刘鸿齐
王于心 贺培凤 于 琦 贾晨晨 刘鸿齐
(山西医科大学 晋中030600) (山西医科大学第二医院 太原030001)
1 引言
在大数据技术发展前期,国内外不少研究者对信息素养进行探索,随着数据管理的深入,逐渐发现仅用信息素养已不能完整概括大数据时代数据管理能力相关指标。数据素养以信息素养为基础,但不限于信息素养,包含信息素养核心要素且得到升级,更能够适应大数据时代需求[1]。学界对数据素养主要的研究思路是“溯源——成长——精准——架构”,对此全面的解释是:数据素养溯源于信息素养,在信息素养拓展中得到深化,在信息素养不同诉求中精准概念,最后在信息素养的教育中得到架构[2]。本文所论述的数据素养主要是指科研及相关工作人员在从事科学研究时应具备的一种能力。
2 数据素养研究现状
2.1 概念尚未明确
2.1.1 国外 国外最先提出数据素养概念,其中最为著名的是西班牙马德里卡洛斯三世大学的数据素养列表,见表1,首次创新性地将数据素养模型上升到理论,可以看出对于数据素养的要求集中在理解、获得、管理、处理、利用数据5大方面。Milo Schield等[3]指出数据素养是科研者能够根据自身科研需求,从不同数据来源中对数据进行获取、处理、总结,最终得到结论的一种能力。Tibor Koltay等[4]认为数据素养不仅仅是获取研究数据,而是能够对获取数据进行批判式的选择与利用。还有一些学者认为科学数据素养的核心能力包括正确理解、评价、管理、利用数据等[5]。Clarence Maybee 和 Lisa Zilinski通过分析目前现有的数据素养模型,结合相关理论,找出影响数据素养的关键因素,首次概括总结出数据素养应包含的7大类要素,提出数据素养通用模型,见表2。
表1 数据素养能力列表
表2 数据素养通用模型要素
2.1.2 国内 张静波等[6]认为数据素养主要强调的是科研人员对数据采集、组织管理、分析处理以及协调共享的能力。孟祥保等[7]认为数据素养包括3个层次:第1层是具有数据意识,能够意识到数据的重要性;第2层是具有处理、利用数据的技能;第3层是具有数据道德。杨晓琼等[8]对数据素养概括为4个方面,分别是数据意识、评估、技能、道德。纵观国内外不同学者对数据素养概念的解释,可以看出学者们对数据素养中的意识、利用处理、共享、道德等方面较为关注。
2.2 缺乏统一评价体系
经过多年研究与探索,欧美国家在数据素养标准建立方面已很成熟。虽然亚洲国家通过借鉴欧美国家如ACRL、SCONUL等标准,结合本国实际情况制定相应的素养体系,但是仍未形成系统的具有权威性的数据素养标准。目前国外已有相关的数据素养标准或指标体系,但针对医学生的数据素养指标体系大多是基于现有的高等教育指标体系标准,如澳大利亚[9]开展的高等教育数据素养测评中发现通用的高等教育指标体系并不适用于医学生。我国数据素养标准面临着与模式相互分离的问题,成熟的数据素养模型应能够协调标准模型之间关系,然而现有的大多数数据素养研究往往将标准与模式分离研究, 二者并没有被有效联系并加以实质性运用[10]。
2.3 缺乏数据素养教育
目前国内已有部分大学开展数据素养教育课程,但是开设院校较少且课程量不足,如哈尔滨工业大学和南京大学开设的大数据算法和用 Python 玩转数据课程等,都偏向于编程或理论,未实现专业化[11]。由于医学生专业特殊性,在课程安排上大部分是相关的专业课程,关于数据素养的课程不仅设置单一,且课程量仅为18~36个学时,难以满足现实需求[12]。此外学生缺乏数据素养意识,在接触有关课程时会因其不是医学专业课或是意识不到重要性而忽视数据素养的培养。医学生应具备良好的数据素养能力,从而及时正确获取与分析数据信息,掌握学科最新的科研成果,为以后的科研奠定基础[13]。
3 医学生数据素养评价体系设计
3.1 原始指标选取
调查对象为有科研数据需求的医学类博士研究生和硕士研究生。阅读相关文献并分析归纳现有成果构建指标,选取出现频次较高、专家认可度高、具有代表性的指标纳入评价体系中,最终构建一个包含5个1级指标、53个2级指标的医学生数据素养能力评价指标体系。
3.2 评价体系分析
数据分析利用普通最小二乘法(Ordinary Least Squares, OLS)多元回归模型,设定若干控制变量,从3个层面递进展开,见图1。第1层为客观现状与主观认识;第2层进一步分析5项1级客观现状指标以及相对应的自我认识指标,自我认识指标中采用李克特量表,分为5个等级:非常不符合、比较不符合、一般、比较符合、非常符合;第3层探讨5项1级客观指标与主观认识中各具体指标间的验证关系,确保该验证体系的客观性与真实性。
图1 研究框架
4 研究对象与方法
4.1 研究对象
选取山西医科大学、山西中医药大学、长治医学院的在校研究生,采取方便抽样方法,共发放问卷650份,回收有效问卷616份,有效回收率94.77%。
4.2 研究方法
问卷内容包括两个部分:第1部分是一般人口学资料,包括性别、学历等。第2部分是数据素养问卷,包括数据意识(6题)、数据收集(4题)、数据使用(4题)、数据存储(6题)、数据群益(5题)5个维度,满分100分,问卷Cronbach′sα系数为0.920,具有良好的信效度。
4.3 结果与分析
4.3.1 调查对象基本情况(表3)
表3 调查对象基本情况
4.3.2 单因素分析 调查结果显示不同学科之间数据素养总分在55~68之间,处于中等水平,但各学科之间水平参差不齐。其中综合得分最高的学科分别是基础医学(68.90±17.81分)和公共卫生(67.63±17.99分),最低的学科是影像(55.00±19.92分),见表4,具有统计学意义(P<0.05)。
表4 山西省医学研究生不同学科数据素养的单因素分析
5 讨论与建议
5.1 体系构建有利于提高数据素养水平
通过评价体系结果可知医学研究生数据素养水平处于中等,且学科之间差异显著,尤其是在数据使用和数据权益方面。该体系构建能够较准确地了解该地区医学生数据素养能力,发现医学生在数据素养方面的优势和不足,从而促使医学生对数据素养多重内涵进行思考,激发主动提高数据素养的动力。
5.2 数据权益意识缺失
数据是一种财物,如果没有正确的使用与保护意识,轻则导致数据丢失,重则出现学术不端、财产受到侵害等问题[14]。调查结果显示医学研究生数据权益意识不强,大部分专业的医学研究生不能清楚了解数据权益具体内容,更无法有效保护个人数据安全。如今每个高校针对研究生会开展防止学术不端系列讲座,本评价体系中针对数据相关权益设置了问题,能够了解医学生数据道德水平,同时高校可根据评价系统反馈结果适当进行课程改革,使医学生在数据使用的开始阶段就养成正确的数据道德观,树立版权意识,培养数据管理、共享的大数据思维,提升数据素养能力。
5.3 构建信息化校园
医学类高校作为国家高水平医学科研人员的基地,应以处理分析相关研究课题为导向,围绕课题研究,培养医学生在实际科研过程中分析、处理、存储数据的能力以及数据共享意识与创新能力。通过评价体系反馈结果可知医学研究生在数据使用方面仍然存在较多问题,对此应加强学科数据化教学建设,搭建大数据交流与共享平台,减少实验数据重复收集成本,努力为学生交流、探索提供良好的环境。
6 结语
目前我国在数据素养评价体系建设方面仍处于摸索阶段,对数据素养标准讨论未形成统一定论,特别是在医学领域数据素养研究发展任重道远。数据素养应在不断学习中得以提升。本评价体系的构建在一定程度上可以帮助了解医学生数据素养情况,通过测评结果对教学模式进行针对性改进,提升医学生数据素养能力水平。