机器学习与教育教学的思考
2015-01-21刘晓薇
摘 要:分析了目前在人工智能领域主要的机器学习算法所蕴涵的知识性质,指出了机器学习与教育理论存在的相似性,同时根据机器学习的特点讨论了对教育的启发,并且对机器学习在教学教育中的应用提出了建议。
关键词:机器学习;知识复杂性;知识默会性;数据挖掘
中图分类号:G641 文献标志码:A 文章编号:1673-291X(2014)35-0107-04
引言
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、模糊论、逼近论、凸论、统计学、算法复杂度理论等多门学科[1]。机器学习是根据生理学、认知科学等对人类学习机理的了解,重新组织已有的知识结构,建立人类学习过程的计算模型或认识模型,发展各种学习训练理论和学习训练方法,研究适合各种领域的训练学习算法并进行理论上的分析,建立面向特定任务和应用的学习系统。当前,在人工智能和模式识别领域影响比较深远并具有代表性的机器学习算法有朴素的贝叶斯算法、ADABOOST算法、SVM支持向量机算法、神经元网络及其的改进的深度学习算法。机器学习在工业制造、医疗诊断、数据挖掘,尤其是生物识别,如指纹、人脸、虹膜等方面的应用得到快速发展。如指纹自动识别,已经彻底改变了安防工业的发展方向。这里探讨这些成功的机器学习算法对教育教学的借鉴意义。
一、机器学习原理蕴含的知识性质
(一)机器学习与知识的默会性
知识的默会性是相对于显性知识而言的,是指有些知识只可意会却不可言传,在生活中经常使用但却无法清晰表达的知识,这种知识不能通过语言、文字或其他确定意义的表达方式予以直接传递。这种知识具有非逻辑、不清晰、前言语等性质特点。著名的两种意识的理论是波兰尼默会认识论的一块基石,是把握默会认识的结构的基本出发点[2]。“默会知识包括两种意识,附属意识(subsidiary awareness)集中意识(focal awareness)。”[3] 认知者把各种细节、关联线索作为辅助对象整合进集中对象,在附属意识和集中意识之间建立起动态转换关系,这就是波兰尼所理解的默会认识的基本结构。在波兰尼的理论中,默会认识不仅要依赖于来自认知对象的各种信息,还要依赖于我们,即认知主体本身的诸项机能,还要依赖各种经验和理论等以往的背景知识,只有在整合了各方面的附属意识的基础上,才有可能产生认知的质的飞跃,达到对研究主题的集中认识[4]。
机器学习具有默会知识相类似的初步基本结构,样本及其提取的特征相当于默会知识的经验和理论,而学习机器,也就是分类器,相当于认识者,而训练后的分类器的结构及参数就是集中的认识。在默会知识理论中,波兰尼认为主体的意向性只有统合了主体的存在,比如以往的个人经验知识、身体活动等,才有认识的活动过程。他认为,人的认知建构并非先天范畴,而是一种意会的统合能力,包括以往的经验、知识、情感、价值等因素。而机器学习中,不管是哪种分类器,都需要大量的充分样本。目前看,还没有一种分类器能够适应所有的分类,都需要根据不同的物体,提取最显著的特征点,然后再根据特征点的特性选择合适的分类器。比如目前在人脸检测中成功应用的Adaboost分类器和HAAR特征结合的应用,在其他领域的分类效果就远不如在人脸检测中那么成功。
(二)机器学习与知识的复杂性
知识的复杂性包含了3个方面的内容:(1)自然科学知识的复杂性。在现代科学研究的历史进程中,人们不断发现,无论是生命的进化、社会的发展以及宇宙的起源,都存在着当前思维模式、科学工具所无法企及和解决的复杂现象。彭家勒指出,“基本现象的简单性是隐藏在可观察得到的总现象的复杂性下面,但是这种简单性就其本身来说只是表面的,它隐藏着极其复杂的机制。”[5] 莫兰认为,世界的存在不可能是纯粹有序的,因为在一个绝对有序性的世界里事物不会有质的突变,也就不会有新的事物产生,但也不可能是绝对无序的,因为一个纯粹无序的世界任何事物都将化为虚无,而不可能存在[6]。所以,世界的基本性质是有序和无序的交错混和,而这正构成了事物“复杂性”的基础。(2)人文社会的复杂性,人文社会的发展同样是有序性与无序性相结合,存在理性与非理性相结合的混沌性特征,具有偶发性、不可逆性、非线性等特点[7],使得人文社会科学领域作为无机系统(物质、材料)、有机系统(生物、生命)和社会系统(社会的结构、组织、文化、制度、意识等)的混合系统更具有复杂性的机理和特质。(3)认知过程的复杂性,在认知客体的外部环境一定的前提下,认知客体的描述过程还要受到认知主体诸多因素的影响,比如认知主体的记忆力、认知主体的逻辑分析能力,认知主体的应变能力,认知过程的环境影响因素等,这些因素最终都会对主体的认知能力造成一定程度的影响,从而导致认知困难,即产生复杂性。我们把这种由于主体认知能力自身因素以及环境因素影响所导致的复杂性,叫做主观复杂性,又叫认知复杂性。认知过程是一种自组织的过程,是一种有序和无序的有机结合。有序是指在认知过程中的意图、步骤和策略,无序是指认知过程中的偶然性[8]。
机器学习在复杂性方面表现出的特征是:(1)分类器的非线性,许多客观事物都无法用线性分类器进行分类,当前多数传统分类、回归等学习分类方法为浅层结构算法,其局限性在于能够得到的样本有限,对复杂函数的表示能力有限,使得针对复杂分类问题其泛化能力受到制约。对于这种情况,SVM(支持向量机)采用的办法就是首先在低维空间中完成计算,然后通过核函数转换,将输入特征空间映射到高维特征空间,在高维特征空间中构造出最优分离超平面,从而把二维平面上无法区分的非线性数据分开[9-10]。深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现强大的从少数样本集中学习数据集本质特征的能力[11-12](隐含层多的好处是可以用相对少的参数表示复杂的函数)。(2)分类器的多元性,面对事物的复杂性,采用单一的分类器很难取得实际效果,Adaboost算法针对不同的训练集训练同一个单元分类器,即弱分类器(实际应用中不同的训练集是通过调整每个样本对应的权重实现的),然后把这些在不同训练集上得到的分类器通过并联或串联的方式集合起来,构成一个更强的分类器,即强分类器。数学理论证明,只要每个弱分类器分类能力比随机猜测要好(即概率大于0.5),当弱分类器的个数趋向于无穷个数时,强分类器的错误率将趋向于零。深度学习的实质,是通过构建具有很多隐含层的神经元网络机器学习模型,以及海量的训练数据,来学习训练更有用的特征,从而最终提升分类或预测的准确性。区别于传统的浅层神经元网络学习,深度神经元网络学习的不同在于:一是强调了神经元网络模型结构的深度,通常有5层、6层,甚至10层以上的隐含层节点;二是明确突出了每层特征自学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,使得分类或预测更加智能化。与之前构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富的内在信息和特征。endprint
(三)机器学习与知识的不确定性
知识的不确定性主要指:(1)知识的情境性,即任何知识都具有一定的境域性与条件性,(2)知识具有社会文化的制约性。一个人处于不同的社会、历史位置上,他认识事物的“视角”以及对同一事物的理解都会有所不同,这种差异不仅构成了个体思维的先决条件,而且深刻影响到个体的思维方式,影响到个体提出问题的类型与方法等。(3)认识理论本身的不确定性,一切理论本质上都是猜测性、试探性或假说性的,理性的批判是获得知识增长的惟一途径,只有通过不断的“猜想、反驳、实证”,这样才能逐步排除错误,接近客观真理。所有科学知识都是观察与实验的结果,有一定的时空限制,并不具有绝对的确定性与必然性,而是具有一定的偶然性、或然性[13-14]。
在面对知识的不确定方面,机器学习或者专家系统提出了的可能性理论、主观Bayes方法等传统方法以及粗糙集理论、灰色系统理论、概念图等新方法。灰色系统理论认为,尽管客观系统表现复杂,数据离乱,但是这些系统内在随机变量都是在一定幅值和一定时区内变化的灰色量,一般都具有总体的功能,这些变化的灰色系列变量可以通过某种生成弱化其随机性,从而显示其蕴含的内在某种规律。粗糙集利用使用属性及属性值的约简,去除导致事物不可分的冗余信息,从而对数据进行分析和推理,从中发现隐含的知识和潜在的规律。这些算法在语音识别、文本分类、故障诊断、工业监控、医疗等方面获得了许多成功的应用。
二、机器学习对教育的启示
从以上分析可看出,机器学习蕴涵了知识学习中的默会性、复杂性以及不确定性等多种特征。本文试图从机器学习中积累的许多成功经验来探讨这些经验在教学实践中的应用。
1.一个高效的分类器,一定要针对具体事物提取最有效的特征点,样本要广泛,涵盖面广,训练要充分。这些理论应用对教育教学的启示是:(1)教师在教学过程中,要试图找到适合学生理解某种知识的独特阐释框架。(2)要扩大学生的阅读范围,一个人阅读的范围越宽广,就像训练的样本越广泛,得到的信息量越大一样,其缄默认识的潜在范围也就越大,各种类推与观念以及新的观察方法就愈可能从中涌现出来,这样,新理论或新发现的出现机会也就越大。(3)在机器学习中,只有通过训练,才能发现事物的显著特征,就像默会知识,学生只有通过实践的方式或亲身参与的方式,去学习和获取对他们的成长与发展极为重要的个人实践知识,即隐性的知识,讲解式教学设计的再好,即便是启发式的教学,也不能代替学生的实践。(4)机器学习不是样本越多越好,而是充分考虑的泛化能力,对于教育也是一样,并不是考题越多越好,考题要有代表性,要能够培养或者启发举一反三的能力。
2.现在大热的深度学习算法已经引起全球各大公司高度重视,香港中文大学发表的论文表明基于深度学习的人脸识别系统的识别率已经超过了人的识别率。深度学习就是多层次的神经元网络、具有非线性、复杂性的等特点,深度学习和支持向量机带给我们的启示:(1)教育革新要加强多学科的协同合作,教学理论的创新,首要的是加强不同层次的、多学科的共同分工协作,广泛吸取教育学、心理学、哲学等人文社会学科的研究成果,借鉴自然科学的方法论和研究成果。克服狭隘的学科边界意识,通过多方面、多层次的研究主体的共同参与,形成一种高效运行的教学理论创新共同体。(2)要坚持开放的态度。受多因素、多种变量影响的教学现象,是一个非线性的、动态的、不可逆的教学过程,这就决定教学理论研究不能是封闭的,而应该是开放的、多元的。从知识的复杂性可以看出,企图从复杂的教学过程中抽象归纳出一个本质的东西,如课程教学的本质、艺术教学的本质、德育教学的本质等类似研究,都易于陷入还原论的思维中,难以得到创新性的观点。因此,在教学理论和模式的探讨中,坚持开放理论价值取向,坚持多元化的思维方式,是教学理论研究创新的内在要求。
3.概率论、模糊算法以及粗糙集理论在机器学习和专家系统的成功应用表明,面对知识的不确定性,我们在教学过程中应着重培养学生批判性的思维能力,培养问题意识、怀疑意识,破除学生对知识的确定性盲目崇拜,使学生意识到人类所有的知识或多或少都是不确定的、未终结的。意识到知识的社会性、实效性、情境性和模糊性,意识到所有的真理都是相对的、有条件的。具体到实践中,就是要重视模糊分类、价值差异等方法,严格限制标准化考试与测验在整个考试结构的比重成分,鼓励学生提出自己的独特见解,大力倡导以对话、讨论或自主探究为基础的互动教学方式,学会以开放的、批判的眼光看待知识,鼓励学生对问题反应与解释的多样化、异质化,而不是同一化,这样才能培养更有创造力人才。
三、机器学习在教育教学中的应用
机器学习经验应用于教育,或者将机器学习当成工具应用于教育教学,侧重在要求教育的开放性、多元性、非线性。然而在信息社会跨向大数据时代,盲目追求开放性的松散结构的教学教育方法,可能与教学教育的初衷背道而驰。因此,要秉承严谨的科学态度,建立积极有效的科学评估系统和数学模型。而目前基于开放型网络的教育还是停留在基于数据(包括多媒体、文字)共享的教学方法上,如当前火爆的翻转课堂、MOOC(大规模开放在线课程)主要还是侧重视频共享的信息积累的基础上,这种类型的在线教育本身很难改变学习的本质,在这场教育革命的浪潮中,由在线教育引发的教育由数据共享到过程数据行为的变化监控(教育环境、实验场景、时空变化、学习变化、教育管理变化),才有可能引起教育改革的质的变化。 通过数据挖掘和机器学习,分析每个学生的学习行为、兴趣以及老师的教学行为基础上,通过数学建模找出适合每个学生的学习内容和教学方式,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能,成为未来教育发展的主要方向。
1.通过数据实时反馈和机器学习来研究适合学生的学习模式,及时修正学生的课程内容和教学模式。大数据与传统数据的本质区别在于数据的过程性、个性化,比如我们现在不仅仅通过测验了解学生阶段性的学习成果,并且通过在线系统检测到学生在学习过程中花费的时间、理解程度、参与度、对知识点的偏好等实时数据;如根据学生鼠标停留时间和点击次数来判别学生有没有回头复习和主要问题处理,统计学生在网上提问的次数和参与讨论的多少来判断学生学习的积极性并进行诱导和评价,而不是基于自己的教学经验,夹杂主观因素来分析学生的共同点、学生的学习偏好、学习遇到的难题等。只要通过分析整合学习的行为记录,就能轻而易举得到学生学习过程中的规律,结合更详细的学生背景和操作细节,我们还能观测到不同学生族群在学习上更多的相关元素。机器学习和数据挖掘能够分析出同样是80分的学生,哪个是通过逻辑思维能力得出,哪个是依靠良好的记忆力获得的,然后我们根据这些反馈信息找出学生能够接受的教学模式。对于教育研究者来说,我们将比任何时候都更接近发现真正的学生,以获得更进一步改善的机会。endprint
2.通过机器学习和数据分析预测教学模式的效果,通过分析教师发表的论文、选用的教材、制作的课件、参与的课题、学生的成绩、学生对老师的评价等各种信息的评价分析,可以预测出当前老师采用的教学模式可能产生的影响。老师的一言一行,从课题到教室,出考题、改考卷、引导讨论、回答学生问题、进行个别辅导等等,都可留下重要且值得分析的数据。这些种种数据的收集,在交叉比对学生的学习与考试记录,从而能提供教育管理者及一线老师许多有用的信息。比如说,老师在学习平台上改考卷、提供评语的方式,都有可能与改进学习的成绩紧密相关。同时,参考同类型教学资源以及授课的环境和实际需求,利用大数据的分析模型,通过机器学习和数据挖掘,可以找到学生、老师、教学模式之间最佳的匹配方式。这样,既可避免无效和负面的教学方法造成的资源浪费,更能够增加老师教学的能力和效率。
3.通过机器学习和专家系统、数据挖掘等算法来处理海量数据带来的学习困扰,苏迦特分析,只有三种最基本的东西在今后的大数据时代是学生用的到和必须学的东西:“第一是阅读,第二是搜索,第三是辨别真伪”,在信息泛滥的社会,学生和老师很难抵挡各种信息的诱惑,怎么处理好有用信息获取和个人隐私之间的平衡,是困扰当前互联网开发教育教学面临的比较重要的问题。大数据未被妥善处理会对用户的隐私造成极大的侵害,同时伪造或刻意制造的数据,以及在传播中被歪曲的信息,往往会导致错误的结论,诱导分析者得出不客观的结论。基于目前很多专家系统,通过各种知识信息的处理方法再经过学习和训练,我们可以去除很多不真实的数据,自动分析信息的价值,并自动提供推荐,从而帮助提供给我们最有价值的数据,甚至直接帮我们设定好教学模型和各种教学素材。
结语
机器学习一直是科学家在研究人类思考、决策的过程中总结的多元化、综合性知识的成功应用,而这些人工智能领域内的成功应用对我们当前的教育教学也带来深刻的启示作用。知识爆炸性的成长、多学科的交叉、新媒体的应用,对我们的教育及教育工作者也是全新的挑战,大数据的到来以及机器学习、数据挖掘对当前教育理念的更新将是革命性的。人与机器的主流社会关系也将产生质的改变,转向人与数据之间的关系。今后社会的竞争的核心将是服务和创新。从大数据挖掘中成功应用的机器学习算法原理中来反思当前的教育理念,同时将机器学习用来分析当前的海量数据,及时反馈更新我们的教学模式,不失为一种新的尝试和启示。
参考文献:
[1] Bishop,C.M.模式识别与机器学习,Springer?ISBN 978-0-387-31073-2,(2006).
[2] Michael Polanyi.Knowing and Being,The University of Chicago Press,Chicago,1969:138.
[3] Michael Polanyi.Personal knowledge,Routledge,London,1958:70-78.
[4] Michael Polanyi.Study of Man,The University of Chicago Press,Chicago,1958:25.
[5] 普里戈金.从混沌到有序[M].上海:上海译文出版社,1987:26.
[6] 陈一壮.埃德加·莫兰的“复杂方法”思想及其在教育领域内的体现[J].教育科学,2004,(4).
[7] 刘晓薇,神经元学说对教育理论研究的启示[J].教育学术期刊,2009,(10).
[8] 普利高津,等.从混沌到有序[M].曾庆宏,等,译.上海:上海译文出版社,1987:10.
[9] Corinna Cortes and V.Vapnik,Support-Vector Networks,Machine Learning,20,1995.
[10] Nello Cristianini and John Shawe-Taylor.An Introduction to Support Vector Machines and other kernel-based learning methods.
Cambridge University Press,2000.ISBN 0-521-78019-5 .
[11] Hinton,G.E.,Osindero,S.and Teh,Y.,A fast learning algorithm for deep belief netsNeural Computation 18:1527-1554,2006.
[12] Yoshua Bengio,Pascal Lamblin,Dan Popovici and Hugo Larochelle,Greedy Layer-Wise Training of Deep Networks,in J.Platt et al.
(Eds),Advances in Neural Information Processing Systems 19 (NIPS 2006),pp.153-160,MIT Press,2007.
[13] 波普尔(Popper K·R·).客观知识[M].舒炜光,等,译.上海:上海译文出版社,1987.
[14] 波珀(Popper K·R·).科学发现的逻辑[M].查汝强,邱仁宗,译.北京:科学出版社,1986.
Thinking about machine learning and education teaching
LIU Xiao-wei
(School of mathematics and computer science,Jiangxi Science & Technology Normal college,Nanchang 330013,China)
Abstract:Analysis of the current in the field of artificial intelligence machine learning algorithms mainly contained the nature of knowledge,has pointed out the similarities of the machine learning and education theory,at the same time,according to the characteristics of machine learning is discussed enlightenment to education,and suggests the application in education and teaching of machine learning.
Key words:machine learning;knowledge complexity;knowledge is tacit;data mining
[责任编辑 仲 琪]endprint