大数据背景下统计学本科教学体系研究
2018-05-02程胜
程胜
摘要:本文归纳了大数据发展的特点,分析了统计学面临的挑战,就统计学本科教学体系中存在的问题进行了梳理,并提出了教学改革的方向和相应措施。
关键词:大数据;统计学;教学体系
中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2018)16-0169-02
一、引言
大数据的本质是实体社会的虚拟化,无处不在的海量信息正改变着整个世界和日常生活方式。大数据之所以“大”,首先在于数据采集成本低、数据累积速度快,由于计算机技术的发展和普及,人们记录、采集数据的成本较以前有了极大地降低,而且数据累积速度更加快捷。其次,数据来源多元化,如从产品全生命周期阶段来看,贯穿设计到制造、从使用到维护、直到维修整个阶段都会产生许多结构或非结构数据。大数据不仅体量大,增长速度快,而且数据的多样性,即数据的来源、种类也日益复杂。再次,数据处理速度快,快速的处理是大数据内在要求,大数据的时间价值十分重要,如GPS位置信息,快消品网站、金融交易及用餐时间的外卖网站点击流等,由于用户众多,短时间内产生的数据量十分庞大且具有强时效性就要求处理速度快速化。最后,数据价值密度低,正是由于数据产生量巨大,数据自动采集成本低,数据被记录完整的可能性较以前有了极大提升,但也意味着包含了大量噪音信息。这也使得有用信息的提取及数据规律的探寻面临前所未有的挑战。
本质上,大多科学研究活动并非从事先设想好的理论架构或科学原理来演绎、推理科学问题,而是从数据本身出发,运用不同分析方法归纳总结和发现科学规律。大数据环境下问题越来越复杂,使演绎研究变得愈发困难。高维、高频的不同来源、不同结构、不同形式的海量数据可以快速、方便地被整合,使原来处于孤立、分散的数据更加容易地联系起来,为发现数据背后的规律打开了更宽广的视图,更能发现小数据时代不易发现的新现象、新知识和新规律。
在大数据时代,部分传统的统计方法在来源多元性、多重结构的大数据环境下失效,也难以完成复杂的计算和存储。当然,尽管大数据提供了强大的数据分析条件,但也得付出如人力成本、时间成本和计算成本等。大数据并不能提供一个适宜于所有问题的解决方案,仍需要采用适合的统计方法来解决不同的问题,如抽样、相关分析、因果推断仍是可选手段。因此,大数据背景下,如何发展统计学学科?如何开展适应时代要求的统计学教育活动及培养人才?这些命题都需要统计学者思考。
二、本科统计学教学体系存在的问题
大数据为传统统计分析方法提供了可观测足够多的样本,但也提出了如何删选、提取数据,如何整合异质性多元数据、复杂结构数据的难题,同时在实际中,数据并非单纯的越多越好,大数据所负载的信息价值存在边际递减效应,当数据体量越大,信息收集边际成本在增加,而信息价值在递减,如何平衡信息成本和效用同样是一个巨大挑战。因此,如何培养适应大数据时代的统计学人才以满足市场需要是目前高校教学体系改革的重要问题。目前,大多国内本科统计学教学体系存在以下几个问题。
第一,培养目标和大数据契合度不高。传统的本科统计学专业培养体系更多地关注如何培养学生收集、整理和分析数据的能力,而大数据时代数据的获取较为容易且更为全面,与计算机技术的融合愈发紧密,传统意义上的数据分析模式已经不能适宜于大数据的数据结构特征。这就需要统计学专业人才的培养目标从传统的应用型向数学、统计学、计算机科学高度融合的复合型转变。
第二,培养方案中缺乏对数据收集、抽样的训练环节。大多数高校本科统计学培养过程都是基于统计技术开展的,如强调回归分析、协整、预测、时间序列及判别、聚类等分类技术的运用,而忽视了如何开展数据收集、如何抽样的教学训练。另外,大数据的生成与采集在人为的设计框架之下,可能存在系统性偏差,抽样可以与大数据交叉验证。
第三,教学内容与大数据关联性不强。目前大多高校统计学教学都围绕着统计学原理、计量经济学、应用回归分析、时间序列分析等课程开展。但是在大数据环境中,统计学离不开数学和计算机科学的支撑。同时,大数据应用领域包括经济、管理、生物、传播学等多个领域,教学内容的学科交叉是大数据背景下统计学人才培养的重要基础。另外,统计学的培养体系须注重教学内容的模块化,因此,教学内容则要从不同培养的目标出发,设计如经济统计、管理统计、金融统计、生物统计等方向的教学内容模块,并引导学生从多个模块中寻求大数据关联,发现新规律,创造新知识。
第四,实践环节薄弱。由于数据边际成本降低,过去以模型驱动的教学体系已不适应实际应用的需求,以模型出发,收集数据以证明模型或机制的正确与否往往无法逃离人为设计机制的嫌疑,且更多地是“过去式”规律的研究。大数据时代,更多需要从数据出发,以相关分析为基础,以因果关系检验为主要工具,探寻大数据间隐藏的、不被认知的科学规律。因此,尽管大多高校都设计了教学实习、认知实习及毕业实习等环节,但由于应用领域的细分,统计学学生在实习过程中,往往因为没有相关领域的基础知识,实习的效果并不明显。
三、本科统计学教学改革的方向和措施
由以上分析可知,大数据的来临是统计学人的机遇,同样也是挑战,统计学人才的培养不能再在理论到理论的闭环中转圈,只有结合大数据的特点,积极开展教学内容、教学实践的调整和改革,才能在新的时代环境中,培养具有扎实理论的复合型人才。
第一,重构教学体系,重新设计教学内容。大数据的出发点在于体量巨大的数据,更加注重数学基础、统计学理论知识和计算机技术的训练,更加关切数据应用。因此,统计学教学体系的改革要从基础和应用两方面着手,一是加强高等数学、概率论、统计学知识的基础训练,培养学生严谨的逻辑思维和扎实的基础知识;二是增加计算机技术的课程,加强学生对网络技术、网络计算的架构认知,了解计算机并行计算、优化计算的算法设计特点,开设JAVA设计课程,培养学生良好的編程习惯,提高编程能力;三是基于不同的应用,开设多门选修课程,引导学生基于兴趣开展相关领域的专业知识学习。有意识地培养适应与不同行业需要的统计学新型人才。
第二,创新教学模式。教学模式的创新必须遵从以发挥自身优势为原则,以解决实际问题为目的,以市场需求为导向,各培养院所应结合自身特点,设计合理的教学模块,改革教学模式,体现大数据时代统计学专业人才培养的方向。大数据背景下统计学的教学模式须强化案例教学,在讲授基础知识的同时,也应注重以新现象、新问题、新案例为基础,积极开展课堂讨论和交流,引导学生如何将知识转化成能力,提升学生发现问题、分析问题和解决问题的能力。同时,课堂教学中,也可以论坛的形式,老师和同学们一起来厘清问题的结构、边界、层次及面临的解决困境,共同提出解决问题的方法逻辑及工具清单。同样,教学模式的改革也要注重科学研究能力的培养,可设立多导师组制度,以研究问题为主轴,以多个学科组成的导师组为辅助,帮助学生解决学习中的各种实践和理论问题。另外,教学模式的改革需要從个性化的、行业化的角度开展实践,培养单位需从自身的学科特长、遵从学科优势发挥的原则,创新适宜于自身特点的特色教学模式、特色教学内容,以培养个性化的行业大数据分析人才。
第三,加强实践环节。传统的统计学课程体系中经管设计了课程实践、认知实践等内容,但由于较少涉及到实际案例及应用,学生实习效果不佳。大数据背景下,实践环节需要从两个方面加强,一是强化学生计算机技术的实践环节,目前大多统计学学生的计算机基础较为薄弱,不了解云计算的逻辑框架,不了解并行计算的原理,不了解数据库的基本结构就不能很好地利用计算机技术架构数据平台。二是加强以项目式训练的实践环节,大数据具有行业分布广,市场导向性强,专业知识要求高的特点,这就要求以系列不同类型、不同行业的项目开展学术训练,如此不仅能拓展学生的专业视野,提升学生动手参与解决实际问题的能力,也将提前完成学生就业的磨合期,让学生能够更加从容地、专业地参与到实际工作中。
统计学作为一门具有较强应用特征的显性学科,在大数据浪潮中,只有真实面对自身学科局限,探索学科前沿,以充分发挥其基础性作用为基石,才能在新背景、新形势下得到更好地发展。同时,统计学本科培养单位也应结合大数据的特点和自身优势,开展课程体系和课程内容的适时调整,强化统计学基础知识与计算机技术的高度融合,凸显教学模块化的设计理念,注重教学实践环节的训练和导向性,培养适宜于大数据要求的多学科交叉、复合型人才。
参考文献:
[1]李金昌.基于大数据思维的统计学若干理论问题[J].统计研究,2016,33(11).
[2]王燕,李彦.大数据时代下的统计学重构研究[J].中国林业经济,2016,(03).