应用型高校大学生数据素养现状调查分析
——以北京联合大学为例
2024-03-26任艳莉赵庆龄
任艳莉,赵庆龄
(北京联合大学 图书馆,北京 100101)
0 引言
随着数智时代的到来,数据素养已成为人们不可或缺的能力,在教育领域更是备受关注。提高大学生的数据素养有助于拓宽他们的视野,促进他们在科研以及生活实践中由经验决策向数据驱动决策转变的能力。据相关文献调研,当前许多大学生在数据收集处理、数据质量的辨别、数据分析以及应用等方面还存在不足,数据隐私和安全意识较为缺乏。北京联合大学作为一所具有典型性和代表性的应用型高校,注重内涵式发展,培养适应国家特别是北京地区经济社会发展需要的高素质应用型创新人才。应用型高校的大学生不仅要有较强的动手能力和实践能力,而且要具备良好的数据素养,才能更好地适应当今数智时代社会发展和建设的需要。为测算应用型高校大学生数据素养的实际发展水平,本研究以北京联合大学的大学生为考察对象,通过问卷调查的方式,开展了大学生群体数据素养现状的实证研究,为了解应用型高校大学生数据素养现状以及提升大学生的数据素养水平提供参考。
1 数据素养研究现状
1.1 数据素养概念与构成要素
Milo Schield于2004年发表的文章《信息素养、统计素养和数据素养》开创了学界对于数据素养研究的先河,认为数据素养主要由批判性思维和统计技能两个方面组成;还有学者从知识和技能两个方面对数据素养进行了诠释。黄如花等[1]调研了国内外开设的数据素养课程,把数据素养专项教学分为“数据伦理”和“数据检索”初级阶段、“数据分析与评价”和“数据组织”进阶阶段、“数据交流”和“数据保存”高级阶段提升人们的数据素养。本研究参考《美国数据素养发展框架》《欧盟教育者数字素养框架》等相关政策文件和国内外学者对数据素养的研究,立足于大数据时代大学生核心素养能力需求,对高校大学生数据素养的关键要素进行梳理与整合,归纳出大学生的数据素养主要包括数据意识与基础知识、数据获取能力、数据分析能力、数据管理能力、数据评估能力和数据伦理等方面。
1.2 文献回顾
国内外学者对数据素养的研究主要集中在数据素养的内容框架、现状分析、影响因素、提升路径等方面。关于数据素养的内容框架,黄如花等[2]通过对国际数字素养与技能框架的内容分析,发现了其特点和不足。惠恭健等[3]构建了我国学生数据素养能力模型。孟祥保等[4]从数据管理和数据利用两个视角阐述了数据素养定义的代表性研究。现状调查分析一直是数据素养实证类研究的重点,学生数据素养现状也是国内学界一直关注的焦点。郝媛玲等[5]通过对高校研究生或特定学生群体的数据素养现状进行调查,发现存在数据技能薄弱的问题。现有研究大部分集中在对研究生、科研人员等群体数据素养的理论框架或实证研究方面的探讨,而应用型高校的大学生群体作为未来社会发展的一支重要力量,对其数据素养的研究尚未得到足够的重视,实证研究尚未深入开展。因此,本研究聚焦北京联合大学的大学生数据素养现状开展调查研究,为推动应用型高校大学生数据素养内涵式发展提供借鉴。
2 研究设计
选取北京联合大学的大学生为研究对象,通过联系各年级、各专业学生,用问卷星的方式针对性发放问卷,尽量扩大问卷发放群体的覆盖范围,使收集到的问卷数据尽可能真实反映大学生的数据素养现状。调查问卷发放与回收时间集中在2023年3—6月,回收问卷798份,其中763份有效,有效率达95.6%。
2.1 调查对象基本情况
本次调查对象总计763人,基本情况如表1所示,从性别看:男生占41.9%,女生占58.1%。从年级看:大学一年级占23.6%,大学二年级占24.2%,大学三年级占27.3%,大学四年级占24.9%。从学科看:人文社科类占42.5%,理工类占36.3%,其他类占21.2%。以上数据显示,本次调查对象的性别、年级以及学科构成上比较符合北京联合大学的大学生实际分布情况。
2.2 大学生数据素养调查问卷的编制与验证
本研究以黄如花、张弘、周志强、孟祥保等学者的数据素养评价框架为基础,借鉴其中的数据意识与数据知识、数据获取能力、数据分析应用能力、数据管理能力、数据评估能力、数据伦理等维度,编制了面向应用型高校大学生的数据素养调查问卷。问卷的第一部分是样本基本情况调查;第二部分是对数据素养各维度的调查,包含21个题项,涵盖数据素养能力6个维度,采用李克特五级量表来进行测量,很差赋值1分,较差赋值2分,一般赋值3分,较好赋值4分,非常好赋值5分。
2.2.1 项目分析
使用SPSS 26.0对量表进行项目分析,即鉴别各题项的区分度。由项目分析结果可知,高分组学生与低分组学生每一个题项的临界值比(CR)均达到显著性水平(P<0.01),与总分相关系数(R)均大于0.5,说明调查问卷的题项区分度达到要求。
2.2.2 探索性因子分析
将763份有效调查问卷随机分为两部分,一部分用于探索性因子分析(n=382),另一部分用于验证性因子分析(n=381)。差异性检验显示,两部分样本在性别、年级、专业的分布上都没有显著差异。为了检验调查数据是否适合作探索性因子分析,需要对数据进行信度和效度检验。KMO值(Kaiser-Meyer-Olkin)为0.869,Bartlett球形检验值为2 417.256,在自由度为55的条件下以及P<0.001水平上显著,说明各题项间有共享因素的可能性,表明数据样本适合作探索性因子分析。
对问卷的21个题项进行一阶因素分析,经主成分分析,提取特征值大于1的因子,然后对因子分析结果进行最大正交旋转,同时结合碎石图,最终确定由19个题项、6个公因子构成的维度结构。所有题项的因子载荷均大于0.5,累积方差解释率为77.97%,大于60%的门槛值,比较理想。结合所含题项内容,将6个公因子分别命名为:数据意识与基础知识、数据获取能力、数据分析应用能力、数据管理能力、数据评估能力、数据伦理。
信度检验结果显示,这6个因子(数据分析应用能力、数据获取能力、数据意识与基础知识、数据管理能力、数据评估能力、数据伦理)的Cronbach’α系数分别为0.848、0.822、0.818、0.812、0.815、0.731,均大于0.7,表明其内部具有较高的一致性。综上所述,本量表具有较高的信效度。
数据意识与基本知识是指发现数据源、数据价值意识以及数据基本理论知识和技术知识。这一维度包含3个题项:数据价值意识、获取及应用意识、数据基础理论知识及工具使用。数据获取能力是指数据检索、收集等能力,包含3个题项:独立获取数据、根据需求设定检索式、熟悉各类数据库及数据获取。数据分析应用能力是指使用常见的数据分析工具或者本学科数据分析软件对科学数据进行分析,以及使用分析结果指导判断或预测发展趋势等能力,包含4个题项:使用常见的数据分析工具(如SPSS、Excel等)、掌握数据统计和分析方法、使用本学科专用数据分析软件分析解释科学数据、正确使用数据分析结果撰写学术论文或报告。数据管理能力包含3个题项:科学规范存储数据能力、存储安全意识、判断有用信息与无用信息。数据评估能力是指鉴别有价值数据的能力,包含3个题项:评价数据与质疑数据、检验数据的可靠性与有效性、辨别数据质量。数据伦理是指在数据使用过程中遵守学术道德与规范,并能够按照引用规范合理引用数据,包含3个题项:数据使用过程中遵守学术道德与规范、合理引用数据并规范标注、了解数据伦理在学习和工作中的原则。
2.2.3 验证性因子分析
验证性因子分析的被试样本数为381,通过验证性因子分析检验探索性因子分析的六维结构是否能够支持另外的样本数据。参照前人研究,运用AMOS 24.0软件,采用最大似然法进行验证性因子分析,通过模型拟合指标判断拟合效果,对探索性因子分析得出的量表进行检验和评价。规范卡方为2.466、近似误差均方根(RMSEA)为0.076、适配度指标(GFI)为0.930、规范拟合指数(NFI)为0.927、相对拟合指数(CFI)为0.942、塔克-刘易斯指数(TLI)为0.916、增量拟合指数IFI为0.942,拟合指标均达到标准,说明模型拟合效果较好。由量表的验证性因子分析结果可知,6个因子的组合信度分别为:0.816、0.838、0.831、0.817、0.812、0.719,均大于0.7,表明量表的可靠性较好。各题项的标准化系数均大于0.5,6个因子的平均方差萃取量(AVE)大于0.5,组合信度(CR)均大于0.7,说明量表的收敛效度较好。综合以上分析,可认为本次问卷数据的信度效度水平达标,表明问卷具备科学性和可靠性,具有一定的参考应用价值。
3 研究结果分析
3.1 应用型高校大学生数据素养水平的整体状况
对问卷收集整理后进行数据素养现状分析,将问卷第二部分的问题回答转化为具体分值,计算出每一个维度的平均得分,平均分的取值范围为1~5分,得分越接近于5分说明调查对象此项能力表现越强,具体情况如表2所示。
表2 大学生数据素养的描述性统计结果
从整体上看,大学生数据素养各维度均值都大于3,处于中等略偏上水平。其中,数据伦理得分最高,说明大学生在该维度的发展水平高于其他3个维度,主要得益于近年来国家和学校更加重视数据伦理与道德的教育,陆续出台了相关政策文件,进一步加强了这方面的教育。数据获取能力得分均较低,表明当前大学生数据获取能力培训机制还需要进一步强化。
3.2 大学生数据素养人口学变量的差异分析
分别采用独立样本t检验和单因素方差法,探究不同性别、不同年级和不同学科大学生之间的数据素养水平是否存在显著性差异。独立样本t检验是一种双总体t检验,用于检验两组非相关样本数据之间的差异,在本研究中检验不同性别、高年级与低年级大学生在数据素养的6个维度上是否存在显著性差异。方差分析用于检验两个及两个以上样本均值是否存在显著性差异,单因素方差分析是检验一个控制变量的不同水平对于观测变量的影响是否显著。在本研究中用单因素方差分析法检验不同学科的大学生在数据素养的6个维度上是否存在显著性差异。
对样本数据进行偏度-峰度分析,6个维度偏度的绝对值均小于3,峰度的绝对值均小于8,表明样本数据基本符合正态分布,可以采用独立样本t检验和单因素方差分析法探究大学生数据素养在人口统计学变量上是否存在显著性差异。
3.2.1 不同性别大学生数据素养得分情况及差异分析
采用独立样本t检验研究不同性别的大学生数据素养发展水平差异,结果如表3所示。数据伦理(P=0.039)在0.05水平上差异显著,数据评估能力(P=0.002)在0.01水平上差异显著,即不同性别的大学生在数据伦理、数据评估能力两个维度存在显著性差异。根据均值可知,女生的数据伦理发展水平高于男生,男生的数据评估能力高于女生。较男生而言,女生性格更加严谨细致,对于数据的使用和标注也更注重学术道德规范。而男生对于数据价值的鉴别能力更高。数据意识与基础知识(P=0.092)、数据获取能力(P=0.787)、数据分析应用能力(P=0.510)、数据管理能力(P=0.082)4个维度的P值均大于0.05,即男生和女生在这4个维度无显著差异。
表3 大学生数据素养性别差异分析
3.2.2 不同年级大学生数据素养得分情况及差异分析
把大一、大二的学生划分为低年级组,把大三、大四的学生划分为高年级组,采用独立样本t检验研究高年级组和低年级组大学生数据素养发展水平差异,结果如表4所示。数据意识与基础知识(P=0.003)在0.01水平上差异显著,数据获取能力(P=0.000)、数据分析应用能力(P=0.000)、数据管理能力(P=0.000)、数据评估能力(P=0.000)、数据伦理(P=0.000)在0.001水平上显著,即高年级大学生和低年级大学生在数据意识与基础知识、数据获取能力、数据分析应用能力、数据管理能力、数据评估能力和数据伦理6个维度均存在显著性差异,根据均值可知,高年级学生的发展水平显著高于低年级学生。
表4 不同年级大学生数据素养差异分析
3.2.3 不同学科大学生数据素养得分情况及差异
本研究对所调研的大学生群体根据专业划分为人文社科类、理工类和其他类,人文社科类主要包含哲学、经济学、法学等文科类专业,理工类主要包含数学、物理学和工程与技术科学等专业,其余专业则归为其他类。采用单因素方差分析探究不同学科大学生数据素养的6个维度是否存在显著性差异,单因素方差分析结果如表5所示。不同学科大学生在数据意识与基础知识(P=0.002)、数据获取能力(P=0.000)、数据分析应用能力(P=0.000)、数据管理能力(P=0.000)、数据评估能力(P=0.000)、数据伦理(P=0.000)6个维度P值均小于0.05,存在显著性差异。经事后检验多重比较,在数据意识与基础知识、数据获取能力、数据评估能力以及数据伦理4个维度,理工类大学生均显著高于人文社科类大学生和其他类大学生,人文社科类大学生与其他类大学生无显著差异。在数据分析应用能力维度,理工类大学生和其他类大学生都显著高于人文社科类大学生,理工类大学生和其他类大学生无显著差异。在数据管理能力维度,理工类大学生显著高于人文社科类大学生。整体来看,理工类大学生的数据素养水平较高,人文社科类大学生的数据素养水平较低。
表5 不同学科大学生数据素养差异分析
4 结论与建议
4.1 研究结论
本文以典型的应用型高校-北京联合大学为例,采用问卷调查的方式对于大学生数据素养现状开展了研究。研究结果发现:大学生数据素养整体水平中等略偏上,数据伦理均值最高,数据获取能力均值较低。人口学变量上的差异分析表明,女生的数据伦理发展水平显著高于男生,男生的数据评估能力高于女生。高年级组学生数据素养各维度发展水平均显著高于低年级组学生。理工类学生在数据意识与基础知识、数据获取能力、数据评估能力以及数据伦理4个维度显著高于人文社科类大学生和其他类大学生,在数据分析应用能力和数据管理能力维度两个维度显著高于人文社科类大学生。整体而言,理工类学生水平较高,人文社科类学生水平较低。
4.2 建议
4.2.1 加强数据素养培训宣传力度
应用型高校的学生动手能力和实践能力较强,但数据意识不强,非常有必要宣传数据素养培训的重要性。一方面要加大教师对数据素养教育的重视程度;另一方面要在学生中广泛宣传,加强学生的数据意识,进而提高大学生的整体数据素养。
4.2.2 制定分层次数据素养教育培训模式
目前,应用型高校大学生的数据素养整体水平还不高,尤其是数据获取能力存在欠缺;不同年级、不同学科的大学生数据素养水平存在显著差异。学校教务部门在加大对大学生数据素养教育培训力度的同时,要根据不同年级、不同学科制定分层次的数据素养教育培训模式,设置不同的课程内容。作为高校第二课堂的图书馆,可以成立以图书馆数据馆员为主要成员的数据素养服务小组,拓展线上线下多种培训形式。通过嵌入大学生教学课堂,开展通识教育相关课程、举办数据素养大赛等形式多样的教育实践活动,建立和健全数据素养教育保障制度,为大学生数据素养的提升保驾护航。
4.2.3 构建大学生数据素养学习实践共同体
不同年级、不同学科的大学生数据素养水平存在显著差异,可以通过活动沙龙、案例分享、结成同伴互助小组等方式组建数据素养实践共同体,水平高的学生指导水平低的学生在良好的实践共同体环境支持下实现提升和发展。
4.2.4 提升大学生数据素养学习的主动性
大学生作为数据教育的主体,首先要加强数据素养知识和技能的主动学习,并积极应用于专业学习和研究,积累经验,提高对数据素养理论的深入理解。平时要积极与老师和同学沟通交流,针对性地提高自己的数据素养。学校和教师团队也要尽量为大学生的数据素养学习和交流实践等活动创造良好的环境氛围,鼓励学生勤奋学习,积极探索,不断提升数据素养学习的积极性。