面向财经专业研究生的数据素养教育体系构建研究*
2019-02-18
(浙江财经大学图书馆 浙江杭州 310018)
1 引言
大数据时代,“数据密集型科研第四范式”已成为学术研究的趋势。研究生在进行科学研究时需接触大量的数据,具备数据处理、分析、利用等技能是研究生开展科研工作的基础。所以能否在科研过程中具备数据敏感度、数据批判思维、合作探究意识,是否知晓国际上科学研究中关于数据共享及保存等方面的政策、规范、法律等都给研究生提出了新的挑战。
普拉多(Prado)等人将数据素养定义为信息素养的组成部分,使个体能够获取、解释、评价、管理及伦理上使用数据[1]。张静波(2013)认为数据素养是研究者在科学数据的采集、组织和管理、处理和分析、分享与利用等方面的能力,以及在数据的生产、管理和发布过程中的道德与行为规范[2]。基于前人研究,本文将数据素养定义为对数据具有敏感性、批判性,能够合理并恰当地发现、获取、处理、分析、利用、交流及伦理上使用数据的能力。
目前,我国研究生数据素养教育正处于起步阶段,在校研究生个体数据素养差异较大。邓李君(2017)对当前数据素养教育现状进行调研分析认为:我国数据素养教育环境尚未形成、数据素养教育理论缺乏针对性、教育形式单一、内容创新不足[3]。笔者在前期以问卷形式调查了研究生对数据素养的需求,有75.27%的人文社科类研究生认为自己处理、分析、利用数据的能力不足,通过研究数据素养对研究生科研创新能力的影响得出:数据素养对研究生的科研创新能力的影响是正相关[4]。财经专业属于人文社科类研究,但是其科研基础不可避免需要大量的财经数据,如股票市场数据、企业财务数据等。虽然多数财经院校的培养计划中都含有财经数据统计等相关课程,但由于财经专业研究生生源丰富,学生本科阶段培养存在差异,或有纯文科性质或其他学科背景的学生,研究生数据素养参差不齐,所以对财经专业研究生进行数据素养教育尤为重要。
2 研究现状
目前“数据素养教育”是图情学科的研究热点之一,大致可分为宏观与微观两个方面。宏观层面:黄如花(2016)研究了在高校和社会中对数据素养的要求及可提供数据素养教育的机构,并论证了数据素养的教学形式可以是多样化的[5]。王维佳等(2017)通过分析欧美大学图书馆开展数据素质教育实践的内容形式和特点,探讨我国大学图书馆回应用户数据素养需求[6]。微观层面:郝媛玲,沈婷婷(2016)对上海地区高校文理科研究生的数据素养现状进行调研并作对比分析,揭示文科和理工科研究生在数据素养教育方面存在的问题[7]。黄如花(2016)以《信息检索》 MOOC课程学生为调查对象,分析学生数据素养课程学习情况、数据素养需求情况以及学科背景与数据素养需求之间的差异。国外研究如Marsh等设计了一种数据驱动教学(Data Driven Decision Making,简称 DDDM)的指导框架,用来干预教师的教学实践[8]。Carlson则认为,需要将数据素养教育整合至具体的学科文化和嵌入实验室实践之中,使科研人员认识到数据管理是其科研流程中的一个规范的正式环节[9]。Maybee等运用扎根理论方法深度了解营养学和政治学学生对信息素养和数据信息素养课程大纲的需求[10]。
通过梳理国内外相关文献可知,国外数据素养教育起步较早,国内数据素养教育环境尚未形成,各大高校数据素养的差异性较大。近年来国内关于“数据素养教育”的研究主要集中在学习国外先进的数据素养教育经验,探讨国内数据素养教育现状,抑或从宏观层面探讨数据素养教育的可行性,且多以图书馆的视角探讨高校数据素养教育的模式,尚未有专门针对专业院校研究生的数据素养教育探讨。本研究是基于财经专业研究生教育的特点,结合研究生科研的实际需求,构建有财经专业特色的研究生数据素养教育体系,以期为财经专业研究生进行数据素养教育提供借鉴。
3 财经专业研究生数据素养教育环境
3.1 数据素养教育需求的迫切性
数据素养是研究生选取和研究课题时亟需具备的重要能力,良好的数据素养能力不仅有助于研究生针对研究课题进行多层次分析,也有助于提高研究成果的含金量。财经专业研究生相比于其他专业院校研究生而言,更多地与经济、金融类专业数据接触,经常需要运用各类数据统计分析软件,或通过调研获取一手数据或查找专业数据库获取二手数据,这就需要财经专业研究生具备数据意识、数据获取、数据管理、数据分析、数据规范等数据素养能力。黄如花教授通过研究不同学科数据素养的差异性发现:经济类学生对数据收集统计、数据分析和建模的需求最高,在笔者调研的212名财经类研究生中,有15.09%的学生不知道使用数据分析软件,50.94%的学生只会使用1~2种数据分析软件,知晓并能使用4种或以上的仅有3.77%。在数据分析工具上,大多只依赖SPSS等基础数据分析软件,专业的金融经济类数据分析软件以及MATLAB、SAS等较复杂软件使用率依旧不高。调查财经类研究生数据分析方法的情况,得到5.66%的学生能掌握0种数据分析方法,43.4%的学生能掌握1~2种数据分析方法,能掌握4种及以上分析方法的学生仅占11.32%。郝媛玲在《高校文理科研究生数据素养意识比较》一文中指出整体上研究生对科学数据的开放范围较小,数据共享意识较弱。科研能力培养是贯穿于研究生教育全过程的重点,合理构建研究生培养模式是提高创新型研究生科研能力的关键,是提高研究生培养质量的重要标志。财经专业研究生科研能力的培养离不开财经数据的动态分析,所以研究生能否有相应的渠道及时获取全面、准确的财经数据并能进行分析是其科研能力的重要表现。
3.2 数据素养教育现状
高校方面,虽然部分高校图书馆在积极地进行数据素养教育的尝试,推出了相关数据处理分析软件应用的培养计划,旨在提高学生的数据处理能力。如北京大学图书馆加大对数据素养与统计数据系统的宣传力度,并为科研人员提供了统计数据分析服务与 SPSS网络版的升级;上海交通大学专门针对在校师生开展了如 SPSS 统计软件的应用、Matlab 的使用技巧与提高等系列讲座。但这些只停留在入门水平,缺乏对于深层次数据素养培养的思考。教师资源上,当下的教师教育计划中缺乏和数据素养相关的课程,只有少数师范学校开设了“教育测量与评价”课程,这远远不能满足职前教师自身数据素养能力的基本要求。而好的师资力量是为高校学生提供高质量数据素养教育的基础。对于财经类研究生,整体数据素养能力在逐年提高,但在高质量数据分析的学术研究所占比例偏低。财经类研究生的培养过程中,许多高校相对注重SPSS软件的教育,对于其他较为复杂的数据处理软件的理论与实践相对欠缺。当前研究生数据能力的培养更加注重动手能力,理论教学较为单一,不利于研究生的论文选题和研究方法的选择。此外,研究生所在环境的学术氛围会对研究生参与科研的主观动机产生影响。目前高校对研究生数据伦理通识教育普遍是以学术道德讲座的方式进行,数据伦理日常教育由导师负责指导,学术委员会或学校的相关规范对研究生科研数据规范进行制约。但整体效果并不理想,研究生数据规范意识教育与数据伦理教育亟待加强。
4 研究设计
本文选择扎根理论这一探索性研究方法。1967年,美国学者Strauss和Glaser[11]最早提出扎根理论法的概念及其运用方式,其核心是通过对收集资料的不断比较、思考、分析,最终提出概念并建立理论,是一种非常科学且被广泛应用的质性研究方法。扎根理论适用于未经探索的但需要探索的所有社会现象,尤其适用于有待解决的社会问题及互动过程。扎根理论认为知识是积累而成的,是一个不断从事实到现实理论(中域理论),再到形式理论(广域理论)演进的过程。本文研究的首要任务是建立介于广域理论和微观操作性假设之间的适用于特定情景的中域理论,运用扎根理论构建研究生数据素养教育体系,可以从前人研究的基础上开展。本文在中国知网数据库中以“数据素养”“教育体系”“研究生”等作为关键主题词进行检索,时间界限为2015年到2017年,共得到37篇相关度较高的文献。依据步骤对收集到的37篇文献中选择更具参考价值的26篇文献进行文本编码,依次进行开放式编码、主轴式编码以及选择性编码等三阶段的编码工作。
4.1 开放式编码
开放式编码是扎根理论的第一步也是最为重要的一步,其所提炼出来的范畴能否涵盖并反映原始资料的本质内涵将会对接下来的编码产生直接的影响。本文对已有研究中提到的概念、属性等进行反复的思考与对比,最终提炼出27个初始概念组。将其中一些属于同类概念的划分为一个大类,并用一个概括性更强的词语进行概括,反映这组同类概念的实质,最后提炼出了6个范畴,具体如表1所示。
表1 开放性编码范畴化
4.2 主轴式编码
主轴式编码是编码程序的第二步,其主要任务是发现各个范畴之间的联系,进一步区分主范畴和副范畴。本文将第一阶段中提炼的6个范畴进行详细对比和分析,得到了3个主范畴:①数据动手实践教育、数据分析应用教育这2个副范畴可以形成一个主范畴,命名为能力培养体系;②数据理论通识教育、数据服务保障这2个副范畴可以形成一个主范畴,命名为教育支撑体系;③数据思想教育、数据规范教育这2个副范畴可以形成一个主范畴,命名为思想规范体系,具体如表2所示。
表2 主轴式编码形成的主范畴
4.3 选择性编码
选择性编码是编码的第三个阶段,其主要分析重点是第二阶段得出的主范畴,在主范畴中挖掘出核心范畴,最后用“故事主线”的形式来描述资料反映的现象或事件。本文的“故事主线”是按照“因果条件—现象—情景—行动—结果”这一路线来构建财经专业研究生数据素养教育体系。以目前财经专业研究生数据素养教育存在的问题作为主要关注的现象,分析该现象产生的原因,推断出财经专业研究生数据素养教育体系构建所需的情景以及应该采取的行动,从而实现该体系的构建。最终经过分析、总结,归纳出财经专业研究生数据素养教育体系的核心范畴由能力培养体系、教育支撑体系、思想规范体系三个方面构成。实际上,这三个核心范畴具有内在的逻辑递进关系,即教育支撑体系是整个体系构建的基础;能力培养体系是整个体系构建的核心内容和根本;思想规范体系是整个体系构建的制约与监督。
4.4 理论饱和度检验
理论饱和度检验是指当新数据不会导致新理论产生时,研究理论则被认为是饱和的。本文从37篇文献中剩余的11篇中随机抽取,没有发现新的范畴,结果符合本文建立的财经专业研究生数据素养教育体系模型。因此,可认为本文的理论模型饱和度较好。
5 财经专业研究生数据素养教育体系的构建
编码确定核心范畴为教育支撑体系,能力培养体系,思想规范体系。教育支撑体系是整个体系构建的基础,一个良好的教育支撑体系是有效开展数据素养教育的前提保证。能力培养体系是整个体系构建的核心内容和根本,是研究生数据素养能力最为直接的体现。思想规范体系是整个体系构建的制约与监督,主要是为规范研究生的科学研究,防止学术不端行为的出现。在此基础上结合研究生科研的环境因素与接触的人员构建了本文的数据素养教育体系模型,具体模型如图1所示。
图1 数据素养教育体系模型
5.1 能力培养体系
数据能力的培养是研究生数据素养教育的核心内容和根本。能力培养体系涉及到导师、学院、教务处、实验中心四个部分。作为研究生的第一负责人,导师对研究生的数据能力培养影响重大。对学生进行数据素养能力嵌入式教学,适当开展数据素养方面的讲座培训,促进学生科研创新的同时也为深入数据素养的研究提供基础,使师生能够共同从科研、日常学习和生活中体会到数据素养的深层次内涵。学院可从教学方面入手,在制定教学课程的同时,把数据素养教育融入实践当中,在理论知识的基础上加入大量场景性案例,以传统的第一课堂为基础,引入具有创新性的第二课堂、反转课堂、MOOC等特色授课形式。教务处则着重于数据文化的宣传,给研究生创造一个良好的数据素养环境,如定期举办数据素养竞赛,设置相应奖项吸引研究生,提升研究生数据素养的认可度。实验中心则是理论与实践相结合的场地,建立健全实验中心基础设施,为研究生的数据研究提供实验平台。在资金允许的情况下,可引入高端设备,最大程度地为学校的数据实践教育提供便利。
5.2 教育支撑体系
教育支撑体系是研究生数据素养教育的重要保障,涉及到图书馆、信息化中心和共享中心三个部门。图书馆是科学研究重要的文献信息保障部门,担当着文献信息、学术记录的保存和管理角色。信息化中心则为学术研究提供网络基础设施和技术支持,在技术方面保障数据安全,提供数据存储平台,是研究生查询和获取各种数据资源的基础。共享中心是各种文献信息、学术记录的分享平台,研究生可以通过该平台进行数据分享、管理、查询、浏览和获取。大规模数据的聚集和整合有助于更多的合作和创新,提高科研产出的效率,促进科研成果的转换。研究数据集的知识产权和伦理道德问题同样需要规范化和组织化。图书馆、信息化中心和共享中心三位一体的协作方式可保障数据素养教育的正常进行。
5.3 思想规范体系
思想规范体系是整个体系构建的制约与监督,该体系涉及到研究生院、科研处和学位委员会三个部门。研究生院可与图书馆联合进行数据意识教育,共同探讨数据意识教育的内容并根据各自的特长和优势分担教育任务。研究生院还可与科研管理部门合作,一是深化课程体系改革,注重意识、法规与道德的双重教育,形成符合研究生意识规范的教学内容。二是把数据意识教育纳入思想政治教育体系,形成具有财经特色、符合研究生需求的数据意识与数据伦理道德教育。科研管理部门与学位委员会加大对数据规范利用的教育及相应的规章制度建设,加强对数据合理规范使用的监督力度。例如,定期抽查研究生论文中使用的数据,若出现数据抄袭、数据造假等学术不端行为,视情节轻重给予相应纪律处分直至取消其学位申请资格。
6 结语
本文以财经专业研究生的数据素养教育为研究对象,研究和分析了财经专业研究生数据素养教育的需求与问题,并采用实质性扎根理论的方法进行了三个阶段的编码,通过选择性编码确定能力培养体系、教育支撑体系、思想规范体系3个核心范畴并构成数据素养教育体系的模型,丰富了数据素养教育的理论研究,基于此提出了相应建议,为财经专业研究生培养提供借鉴。