应用型本科应用统计课程教学内容的改革探索
2014-11-12孙晓坤王淑娟佟小华
孙晓坤,王淑娟,佟小华
(大连理工大学城市学院,辽宁大连,116600)
一、应用型本科应用统计课程教学现状
(一)应用统计课程教学内容的现状
在不同的高校中,应用统计课程使用的教材不尽相同,如贾俊平的《统计学》[1],刘春英主编的《应用统计学》[2]等,内容基本涉及数据收集、整理、图表展示、概括性度量、概率论部分、统计推断、及线性回归问题、时间序列、统计指数等。这些教材有很大一部分存在理论性较强、实例较少的特点,其中有的章节难度较高,如方差分析。随着高校招生人数的增加、生源的减少,学生的基础和能力有强有弱,怎样选择恰当的应用统计教学内容变成课程教学中的一个重要的研究方面[1]。
(二)应用型本科学生的特点与“应用型”人才需求对学生实际能力的要求
应用型本科的学生往往思维灵活,创造力丰富,对感兴趣的方面可以投入大量的时间精力去学习创造,但对数学类知识不感兴趣或数学基础较弱的学生也比较多。这对应用统计课程内容和课程教学都提出了要求。应该选择哪些教学内容,怎么安排这些内容,用什么方法教授可以调动学生学习的兴趣,都是应用统计课程改革中必须考虑的问题。
二、应用型本科应用统计课程教学内容的改革探索
(一)立足实际选择内容,合理安排知识体系
由于统计数据类型多样,视分析目的不同,可能要使用不同的统计方法进行分析。为此,课程教学内容的改革探索在立足于应用型本科院校学生的实际需求的基础上,借鉴国内外优秀的统计教材,选择各个领域中比较常用的方法。同时优化重组知识体系,按数据的收集、整理、展示,描述统计学和推断统计学的顺序安排知识体系。避开抽象的理论推导,将重点放在实用性知识与方法上,并多多引入实际背景的介绍。例如,对于统计指数的编制方法,从指数的编制思想入手,结合其发展史先介绍针对单个项目的简单统计指数,再介绍针对一个项目组的简单综合指数,最后介绍加权综合指数。
(二)教学内容的选择注重基础性与实用性
即使是同一类型的数据,也存在不同的分析角度,分析方法也可能有简有难,因此有必要确定哪些方法更基础,实用性更广,更符合学生应用实际。下面给出一些有别于传统教学内容的一些改革点。
(1)统计数据的图示方法有很多种,如条形图、饼形图、直方图、累积频数图、茎叶图、箱线图等。但在实际应用中,使用较多的只有前三个,其他复杂情形的图形完全可以作为学生以后使用时的后续知识格外补充。
(2)对数据的对称性分布可以用偏态系数(记为SK)描述,中文教材中一般用式(1)的公式进行计算,公式繁琐,计算量大。
(3)在概率论的基础知识部分,为加深对定义的理解,我们从各类概率和统计的中英文教材中引入简单便于理解的定义和实例。古典概型部分,考虑到对学生的知识体系的铺垫,适当补充了预备知识:加法原理、乘法原理、排列、组合等。
特别地,针对理论性较强的全概率公式和贝叶斯公式,通过“概率树(Probability tree)”的直观化方法降低理解上的难度。
例如,设某工厂有三条生产线A、B和C,生产同种产品。其中A完成20%的生产任务,B完成70%的生产任务,C完成剩余 10%的生产任务。由于各条生产线机器自身的缺陷以及使用年限等原因,A、B、C三条生产线的次品率分别为0.03、0.01、0.05。① 从三条生产线的产品中随机取出一件产品进行检测,求其是次品的概率。② 如果已知取出的产品是次品,求它分别由生产线A、B、C生产的概率。
为便于分析,分别设A、B、C代表三条生产线的产品,D代表“取出的次品”。在处理时先用传统的全概率公式和贝叶斯公式进行求解。但由于背景中涉及到的信息量较多,对于数学基础较弱的学生而言,容易混淆各个事件的层次与关系。这种情形下可以通过绘制“概率树”讨论问题。引导学生分析,首先要有生产线,才能有产品及其品质,因此把“树”形图的“根部”置于最左侧用一点表示,从“主干”的生产线,经“支干”的正品或次品,最右端的“末梢”给出从“根部”到“末梢”途经所有事件积事件的概率,可绘得概率树如图1。从概率树的图形中很容易就能找到构成“次品”的各个小部分,直接求和 P (次 品)= 0.006 + 0.007 + 0.005 =0.018;另一方面,第②问所求的概率实际上就是构成P(次品)的三个概率值占P(次 品)的比例:
图1 概率树
借用概率树的角度,可以将纯理论性的全概率公式和贝叶斯公式包含的信息简单地显示出来,大大降低了理解与接受的难度。
(4)时间序列部分,首先给出了年份型和季度型两种类型的数据,并分别提出问题,根据现有数据,分析未来一年可能出现的结果。再从古典模型分析角度介绍时间序列的构成因素(包括长期趋势、季节性因素、循环性因素、随机性因素)和构成模型(加法模型、乘法模型)。
事实上,由于时间序列出现的形式有很多,如随机序列,其分析法就很复杂,因此在这一部分我们重点介绍存在明显趋势和季节性因素的序列。以较为常见的季度型数据为例,详细说明分析步骤:第一步是绘制折线图,从中观察是否存在长期趋势和季节性因素;第二步应用观测值选择恰当的方法分析长期趋势,如移动平均法和一元线性回归法;第三步,分析观测对象呈现的模型,将观测值和趋势值代入此模型求得季节性因素;由于在短时间内,时间序列中循环性因素和随机性因素影响过小都可忽略不计,第四步重点介绍应用已得到的现存信息进行预测的方法[2]。
三、从应用角度出发,注重统计分析方法的介绍
为使学生能够掌握基础的数据分析方法与解读方法,结合实际遇到的各类数据,每介绍一部分知识,都先给出一个引例,提出分析的目的,引发学生思考;再据此以问题的方式引出分析步骤的介绍;最后解释答案包含的信息。例如,在介绍“统计数据的概括性描述”时,引入根据两名射击运动员射击成绩选优的实例,再结合实际数据介绍可用于选优的统计量:均值、众数、中位数和标准差等。
又如,社会经济变量间关系的分析经常会用到两个变量间的相关与回归分析,此时,我们通常关心如何确定这两个变量间存在关系?若存在关系,深浅程度多大?如何确定二者的关联方式?这都是需要考虑的方面。
给出引例:某超市为研究促销费用对贸易额的影响,调查了过去 8个月的促销费用(£1000)和相应的贸易额(£10000),收集到数据如表1所示。
表1 贸易额数据
从实际情形考虑,显然促销费用数额不同,相应的贸易额会随之发生变化,因此促销费用对贸易额起到约束作用,也就是视促销费用为自变量,记为x,贸易额为因变量,记为y。先一般性提出下面的问题:① 从变量值的结果上可以看出 x与y间有一定的关系,那么这种关系有多深?② 如果这种关系足够深,变量x以何种方式制约变量y的变化?能否把这种关系数量化,确定变量x对变量y制约的关系方程?再依次介绍分析步骤。首先直观化观察两个变量间是否存在关系,其方法是散点图,从中不但可以看出两个变量间是否存在关系,还能看出这种关系是线性的还是非线性的,从而确定之后用线性还是非线性的方法分析。由于第10章重点介绍两个变量间线性的相关关系,需要了解一旦两个变量呈线性相关,二者线性相关程度的量化结果,引出皮尔逊相关系数的介绍;一旦相关系数表现为高度线性相关,必然关心两个变量间的近直线关系可用哪一条直线来近似代替,在此简单介绍下用最小二乘法得到一元线性回归模型的思路,重点放在用一元线性回归模型来刻画两个变量关系;最后说明如何用模型进行预测。这样层层铺垫,就使分析方法和步骤清晰明了地呈现出来,让学生有整体直观的印象。
这种“以实例引出问题,通过解决问题介绍方法”,是课程教学内容改革在实践中实现的重要途径,有助于引起学生的兴趣,刺激学生思考,也方便知识内容的接受与理解。
[1]贾俊平.统计学[M].北京:清华大学出版社,2006.
[2]刘春英.应用统计学[M].北京:中国金融出版社,2008.