APP下载

东北地区数学专业教师大数据分析的数学模型与高性能计算方法

2015-05-30张哲

课程教育研究 2015年6期
关键词:最小二乘法数学模型大数据

张哲

【摘要】在信息来源广,传播迅速的今天,海量信息充斥着社会的各个行业,大数据时代已然到来。学会处理、分析并利用大数据将会对生产生活产生积极的影响。为了满足教师队伍管理现代化及教育体系科学化的要求,更需要利用现代手段关注、分析和预测教师大数据。本文作者收集了1994年-2014年东北地区数学专业教师收入、教龄、税收、职业病情况等相关大数据,利用高性能计算方法,与回归分析、最小二乘法等数学模型[1]巧妙结合,以期对所获数据加以推断和预测。本文所获结论可以作为教师生活工作状况调研的重要案例,所涉及到的模型和方法为设计处理大数据的通用软件提供重要参考依据,为人们更好地融入到大数据时代提供可靠的支持。

【关键词】教师 大数据 数学模型 matlab 最小二乘法

【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2015)06-0155-02

大数据,或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产[2]。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对那些含有意义的数据进行专业化处理。本文将以东北地区数学专业教师大数据为基础,通过“加工”实现数据的“增值”,使其为决策与预测服务。

一、东北地区数学专业教师大数据来源及准备

通过查阅资料与调查,收集到东北三省各高校数学教师相关大数据,包括教师教龄(?誗年)、收入(?誗元)、税收(?誗元)和职业病情况等方面的实际数据。由于得到的数据信息量大,轻重各异,所以首先需要进行数据预处理,即清除异常数据、错误纠正、格式标准化等,再通过数据挖掘技术,利用一系列相关算法和数据处理技术从大量的数据中提取人们所需要的重要信息,也就是上面所提到的实现信息的“增值”,同时大大提高数据处理效率,下面具体介绍本项目所采用的模型和计算方法。

二、东北地区数学专业教师大数据分析与结果

收集并处理好教师教龄、收入、税收和职业病情况等方面的数据后,本文主要针对三个方面进行了详细的分析:

1.教师收入随年份的变化

(1)数据范围:1994年-2014年东三省各高校数学教师收入(单位:元);

(2)计算条件:matlab软件,最小二乘回归分析,高性能计算工作站;

(3)求解过程:年份作为自变量x,收入为因变量y,从总体上看,二者统计关系大致符合一元线性的正态误差模型[3],即对给定xi的有最小二乘一元线性回归公式yi=b0+b1xi+εi,其中:

b■=■, ■=■■x■b0=■-b■■, ■ =■■y■

其中εi是由變量可能的内在随机性、未知影响因素等随机扰动造成的误差。总之,它可看成是众多细小影响因素的综合代表。最后,由Matlab提供polyfit函数实现回归函数拟合[4];

(4)结果分析:计算结果表明,随着年份的增加,教师收入也在不断增加。估计的因变量的系数b1约为191,也就是说,每过一年,教师收入大致可增加近191元。

2.教师职业病情况与教龄的关系

(1)数据范围:1994年—2014年东三省各高校数学教师教龄(单位:年)、职业病情况;

(2)结果分析:首先利用matlab软件,以横轴为某年东三省数学教师教龄,纵轴反映相应教龄的平均职业病情况(为方便,规定越接近纵轴正方向,职业病越严重)利用matlab软件绘制图形[5],发现教师教龄越长,职业病也愈加严重。每一年的教师职业病情况均可绘制一张图表,通过将这11张图表的最高值(即每一年职业病的最高值)做比较,发现其趋势是先逐年下降,最后趋于稳定。

3.对教师专业发展阶段的研究

(1)数据范围:2014年东三省各高校数学教师收入、教龄、税收和职业病大数据;

(2)计算条件:IBM处理器、大数据挖掘分类算法;

(3)求解过程:用神经网络研究方法(即模拟生物上神经元工作的方法)。图中每个椭圆形节点接受输入数据,将数据处理后输出,输入层节点接受教师信息的输入,然后将数据传递给隐藏层,隐藏层将数据传给输出层,输出层输出教师专业发展处于哪一专业成熟阶段;

(4)结果分析:若将教师专业成熟过程分为三个阶段:形成期、发展期和成熟期。那么利用IBM处理器和以上算法,在所调查的教师中,约70%处于发展时期,是其基本适应教育教学工作的时期;约20%处于形成期,是形成良好心理素质和正确教育思想的关键时期;约10%处于成熟期,是掌握教学主动权,成为学校教学骨干的时期;

(5)研究意义:研究东三省高校数学教师专业发展成熟阶段,可以基本掌握教师资源结构,从而能够遵循不同发展阶段的不同特征、观念、心理、发展需求,制定相应教研活动、政策和制度,促进教师全面持续发展[6]。

三、结果讨论

1.数据呈现以上结果的原因

(1)随着国家科教兴国战略的深入实施,教师的工资和待遇将被逐步纳入国家工作人员统一管理,教师的收入将得到很大的提高。另一方面,数学能力的培养是学习各专业、走入各行业的基础,国家将加大数学知识的教育力度,进而数学专业教师所付出的辛苦也更加不可小觑,综合以上几个重要原因,教师收入随年份增加而增加也是符合经济理论的。

(2)教龄越长,职业病也越严重的依存关系,我们容易理解。但随着时间的推移,职业病的严重性呈现下降趋势正是反映了我国科技的革新:环境的改变、教学设备和教学技术的更新使得教师的课堂教学更加高效和轻松便捷,如多媒体、电子白板使得课堂不再“尘土飞扬”。

(3)在对教师专业发展阶段的研究中,处于专业发展时期的教师所占比例最高,达到近70%。实际上,他们多数处于青壮年的人生阶段,是社会的中坚力量,又曾在高等教育多样化与综合化的背景下受到过良好的教育,并具有较丰富的教学经验和紧跟新时代的创新思想,自然在专业发展的角度也占有较大比例。

2.合理的相关预测

大数据最有价值的特点就是其“预见性”。上述数值结果表明,在经济平稳发展和社会稳定的前提下,东三省数学专业教师的收入在未来的几十年依旧处于增长趋势,教师职业病总体减轻,专业发展越来越成熟,使得教师队伍整体素质越来越高,而未来教师的考核奖励制度也会变得更加严格和全面。

3.建议

(1)无论是对教师行业还是其他行业感兴趣,都要关注其变化,分析其形势及趋势,以便对此行业的认知更加科学合理。

(2)本文采用的大数据处理所用模型和方法,可以进一步推广到其它相关领域,使之成为研究大数据的更通用的工具。

本文利用matlab软件、最小二乘法模型及IBM处理器分析了东北地区数学专业教师大数据,得出的结果对于掌握该地区数学教师基本情况并预测其发展趋势有着重要的作用,还为热心同类问题的研究者提供高效的方法和技术。当我们不能有效处理所获取的大数据,它们就是一些平凡的数字和符号。如果我们能够很好地驾驭大数据,它们必定会为我们带来诸多的方便。

最小二乘法模型在处理大数据时有一定的优势[7],统计分析,神经网络算法和遗传算法都是处理大数据的有效方法,如果能将这些方法有机的结合起来,将更能获得许多满意的数值分析结果。当大數据超过计算条件的时空允许时,不仅耗时费力,甚至使得计算成为不可能,通常需要采用并行算法等高效计算手段。在高性能计算方面,我们并没有用到并行算法,如果能利用并行算法,所处理的数值结果容量会更大更有参考价值。

参考文献:

[1]蔡锁章主编.数学建模:原理与方法.北京:海洋出版社,2000.

[2]维克托迈尔舍恩伯格.大数据时代.浙江:浙江人民出版社,2012.

[3]吴翊,吴孟达,成礼智编著.数学建模的理论与实践.长沙:国防科技大学出版社,1999.

[4]张德丰编著.Matlab数值分析与仿真案例.北京:清华大学出版社,2011.10(21世纪高等学校规划教材计算机应用)IBSN 978—7—302—26254—1.

[5]杨德平等编著.Matlab基础教程.北京:机械工业出版社,2013.221世纪高等院校计算机辅助设计规划教材 ISBN 978—7—111—41023—2.

[6]王少非.新课程背景下的教师专业发展[M].上海:华东师范大学出版社,2005.

[7]R.Hanson and M.Norris,Analysis of Messurements Based on the Singular Value Decomposition,SIAM J.on Sci.and Stat.Comp,2:3(1981).

猜你喜欢

最小二乘法数学模型大数据
AHP法短跑数学模型分析
活用数学模型,理解排列组合
古塔形变的数学模型