面向大数据时代的数学建模课程思考
2018-01-27吴兴蛟李英娜刘英莉
吴 晟,吴兴蛟,李英娜,刘英莉
(昆明理工大学信息工程与自动化学院,云南昆明650500)
0 引言
人们为了解世界,需要使用一种精确的语言来描述世界中某些特定现象,从而将现实世界现象理想化。数学建模就是一种使用数学方法解决各种实际问题的桥梁。随着计算机技术的发展,数学建模成为一种越来越重要的知识技能和科研技能[1]。
在信息爆炸时代,信息的积累已经到了开始引发变革的程度,信息不仅变多,而且增长速度变快,甚至引发信息形态的变化,于是出现了“大数据”这个全新的概念[2]。
大数据时代下数学建模背景的改变会带来一些具有时代特性的更改。在教学实践中,如果还采用原先的教学模式难免使学习的知识跟不上时代步伐,因此需要对教学模式进行适当改进,使学为所用,让学习跟上时代步伐。
1 传统模式下的数学建模
传统的数学建模一般着重于模型加程序,主要体现在研究内容、研究方法、研究结果3个方面[3]。传统的数学建模一般注重于模型的运用和程序的编写,对于数学建模课程的讲授着重于模型的了解及模型的运用。
(1)创新作用:数学建模是一个理论创新过程,是将已有方法、理论在合理保障下运用新领域的过程,是用数学思维和语言规范现实问题的方式。通过建模,可以开阔思维,锻炼不同角度思考问题的能力。
(2)综合作用:数学建模是一个综合学科的建模过程,也是一个团队合作过程,将实际问题抽象为数学问题后使用计算机技术或者算法对问题进行求解;再使用书面语言描述求解过程。建模问题源于实际,用于解决实际问题。实际问题本身不受任何方法或者领域的约束,数学模型是为了用于解决实际问题,本身属性决定其具有综合性。
(3)桥梁作用:数学建模的桥梁作用主要体现在4个方面,一是沟通实际世界与理论研究;二是从课堂过渡到科研;三是联系多学科,实现学科间交叉运用;四是促使非专业科研人员上升为科研人员。数学建模的实质是运用数学的方法创建一个描述现实世界某一事物的过程[4],是将现实世界事物抽象的过程,是建立客观的现实世界标准描述的过程。数学建模需要经过问题发现—抽象—解决的科研过程,只是周期相较科研来说较短,然而科研所要求的精确和审慎在建模中也有充分体现。实际问题的学科划分是社会分工的区分,划分并不能真正把问题进行分解,需要多学科协同,建模就整合了多学科资源,建模要求对问题进行探究,对问题主要矛盾的选取是衡量研究者是否是一个合格科研人员的基本因素。
数学建模的运用已经渗透到了方方面面,可以说有问题的地方都有模型,对于数学建模在教学和学生学习阶段的重要性不言而喻[5-9]。
2 大数据时代下的数学建模
大数据定义一直饱受争议。IBM将大数据的定义概括为三V:数量(Volume)、种类(Variety)和速度(Velocity)[10]。数据的处理容量一般都是基于PB、TB而言的。大数据时代下对于数据的处理与发现有以下特征[11]:①数据收集是一种技术与业务并存的方式;②大数据技术与具体的领域结合更加紧密;③数据隐私成为又一敏感话题;④数据挖掘和分析技术成为社会高端技术;⑤大数据运用平台越加广泛。
针对这一背景,对于数学建模课程有以下建议和思考:
(1)将大数据的思维带入数学建模课堂中。大数据开启了一次重大的时代转型,大数据正在改变我们的生活以及理解世界的方式,成为新发明新服务的源泉,而更多的改变正蓄势待发。数学建模中的大数据思维方式主要涉及以下几方面[12]:①强调整体性,大局观。主要是对于建模数据的处理环节,传统建模问题涉及的数据处理方式是强调使用部分数据替代整体数据的方式,也就是采用抽样或者其他统计方式进行,往往强调的是局部样本代替总体进行规律探寻,这种方式下会造成信息缺失和信息遗漏;而大数据下数据建模强调的是一个都不能少,也就是要使用全量数据进行规律发掘,这样就要求模型对于数据的容错率提升。②强调多样性。小样本时代,数据获取都是通过不断的核实和处理过的,数据具有天然的准确性,但是在大数据时代背景下,首先应该承认数据的多样性,也承认那些非结构数据的合理性,要对这些数据进行处理。除了考虑处理结构数据也要考虑处理非结构数据。这就对于建模数据处理方式以及建模工具的探索必须有足够多的了解以及应用,同时开始将建模的关注点从那些结构化数据转移到非结构化数据上。③注重数据的平等性。在小样本时代一般使用权值思想处理一些问题,强调数据贡献度;但是大数据下,每个数据都应该考虑同样的贡献度,都应该得到相同的对待。④数据来源的多样性以及数据的关联性。小样本强调数据的来源需要来自于同一领域,但是大数据时代需要的数据是来自不同领域的,数据来源考虑广泛性。传统的建模是一个针对某个领域的研究,大数据下的建模关注的是事物之间的连续性,正如数据挖掘中的啤酒与尿布的问题发现一样。考虑问题时,不应该忽略数据间的关联性。最后应该考虑数据的增长性。数据是在不断更新的,数据规律的发现具有时效性。每次规律发掘总有时间起止点,只有在时间起止点的规律才是正确的规律,因为事物是不断变化的。
(2)介绍大数据下建模数据处理的几个阶段性工作。大数据处理的关键是对于数据的预处理,数据的预处理是为了保证数据的质量,数据的预处理对于模型的保障有着重要的作用。数据处理主要是涉及数据的准确性、完整性、一致性、时效性、可信性以及可解释性[13]。一般来说采用数据清洗、集成、变换、规约几种方式进行数据处理[14]。
(3)带领学生进行大数据建模实践认知。针对这个方面可以采用泰迪杯数据挖掘大赛数据,或者腾讯数据挖掘大赛数据,让学生真切理解何为大数据,摆脱那种纸上谈兵的不实际行为。让学生在老师的指导下真切地去操作数据,去体会数据处理的过程。
(4)介绍大数据挖掘处理平台。工欲善其事必先利其器,现在的大数据处理如果都从零开始,使用统计和自己编写算法无疑是困难的,现在网络对于大数据处理的支撑工具纷繁多样。根据大数据处理平台的技术范围可以概括为存储平台、计算平台、分析挖掘平台、数据可视化平台以及集成5类。
根据其性质也可以分为线上线下两种,如阿里云大数据处理平台就是一款集成与线上的处理平台,还有SPSSModeler是一款便于处理大数据的线下分析平台,熟练掌握这些平台可以帮助学生开展实验研究,部分大数据挖掘处理平台见表1。
(5)不断探究大数据下模型的适用性。以前的模型想运用于大数据分布式处理平台,就得有一定的改进。从教师的角度出发,研究一些大数据下适用的算法是一种科研的态度也是一种科研的责任。
(6)组织参加课外数学建模比赛和参加大学生数学建模竞赛。培养学生建模能力的有效方式就是让学生自己去实践,“高教杯”数学建模竞赛也有对于大数据的分析处理,这项比赛能让学生将所学内容用到实际上去,全方位地促进学生对于问题的解决能力。
(7)培养学生对于新知识的自学能力。对于新知识的掌握是一种持久自我发展的有效方式,不断学习新的知识,不断将新知识融入到实际应用中。培养学生的自学能力一般有以下方式:为学生创造一个主动参与讨论的课堂气氛;课堂上课程结束之后有10多分钟思考与消化该堂知识的时间,让学生学会自我思考自我总结;每次课程结束之后布置一些课外自学内容;承认学生间的差异性,在对于问题的讨论或者讲述的时候不应该不加考虑地否定学生观点,而是要引导其发现正确的答案。
表1 部分大数据挖掘处理平台
3 结语
[1]FrankR,WilliamP,StevenB.数学建模[M].4版.北京:机械工业出版社,2009:1-2.
[2]迈尔-舍恩伯格,库克耶,盛杨燕,等.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:序1-2.
[3]韩中庚.数学建模方法及其应用[M].北京:高等教育出版社,2009:5-6.
[4]司守奎,孙兆亮.数学建模算法与运用[M].北京:国防工业出版社,2015:3-4.
[5]宋云燕,朱文新.浅析大学数学教学中数学建模思想的融入[J].教育与职业,2015(10):76-77.
[6]张美玲,赵有益,薛自学.大学数学教学中数学建模思想的渗透[J].赤峰学院学报(自然科学版),2017(4):207-208.
[7]杜金姬,秦闯亮,苑倩倩.数学建模在应用技术人才培养中的作用:以信阳学院为例[J].河南教育(高教),2017(2):79-81.
[8]李军成,贾倩倩,陈国华.数学建模竞赛对大学生本科毕业论文创新度的影响分析[J].教育现代化,2017(6):38-40;46.
[9]黎勇.数学建模与大学生创新意识和创新能力培养的思考[J].教育现代化,2017(6):35-37;46.
[10]周苏,冯婵璟,王硕苹,等.大数据技术与应用[M].北京:机械工业出版社,2016:3-4.
[11]曾剑平.互联网大数据处理技术与应用[M].北京:清华大学出版社,2017:5-6.
[12]黄欣荣.大数据时代的思维变革[J].重庆理工大学学报(社会科学),2014(5):13-18.
[13]韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2012:55-56.
[14]张良均,王路.python数据分析与挖掘实战[M].北京:机械工业出版社,2015:60-61.