APP下载

《数据挖掘》教学设计

2016-09-10董正武任静

中国信息技术教育 2016年19期
关键词:空气质量数据挖掘分析

董正武 任静

● 学习者分析

本课的教学对象为七年级学生,这个年龄段的学生自主和独立意识较强,具备一定的信息搜集、处理、表达能力,喜欢在学习的过程中体验和理解事物,但分析思考问题缺乏深度。在日常学习、生活中,学生经常要对数据做搜集、整理、运算、统计和分析工作,但他们的认知大多只停留在表层,仅学会了数据加工的一些基本操作,缺乏从数据挖掘角度分析数据的意识,更不会运用统计学方法寻找蕴藏在数据之中的规律,借助它解决学习和生活中的实际问题。

● 学习内容分析

本课是苏科版七年级初中信息技术第三章第3节的内容,主要包括“数据挖掘的作用”和“数据挖掘的过程”两个部分,可深入细分为“什么是数据挖掘”“数据准备”“数据挖掘”“规律表示”四个内容。教学中,为了让学生深刻体会数据挖掘的意义和价值,教师应鼓励他们对数据进行多角度加工与分析,找到规律或有用的信息,用恰当的方式直观地表达出来,学会搜集、分析身边的数据,用数据说话,让数据挖掘更好地服务于生活与学习。

● 教学目标

知识与技能目标:理解数据挖掘的概念,体会数据挖掘的作用。

过程与方法目标:尝试进行数据挖掘,经历数据挖掘的一般过程。

情感态度与价值观目标:树立用数据说话、用数据指导生活的思想意识。

● 教学重难点

重点:数据挖掘的概念及数据挖掘的一般过程。

难点:数据准备及挖掘的过程。

● 教学策略

数据挖掘是一种强大的分析数据的方法,因涉及到专业软件和统计学术语、数学模型等,会让学生难以理解。而日常使用的WPS表格,作为数据挖掘的有效工具,可以让学生在分析具体数据的过程中,掌握数据挖掘的方法。因此,本节课教学应让学生从已有经验出发,运用WPS表格中的简单工具,学习数据挖掘的一般方法。

“数据挖掘”对学生而言,是一个全新的概念,概念的建构需要一步步地不断累积,从表层到内涵,逐步深化。学生只有在了解了“数据挖掘”的基本含义,并尝试挖掘的基础上,才能体会其作用和意义。所以,笔者设计了层层递进的学习活动(情境再现,感受数据挖掘—案例研习,认识数据挖掘—比较空气质量,尝试数据挖掘—同比空气质量,再探数据挖掘—畅想未来,展望数据挖掘),并且在活动中适时搭建学习所需的“支架”,来帮助学生完成知识的建构。笔者通过一系列的活动,让学生在做中学,在学中思,在思中用,在情境化的技术活动中,归纳出数据挖掘的方法,从而树立用数据说话、用数据指导生活的思想意识。

● 教学过程

1.情境再现,感受数据挖掘

活动1:情境再现,感受数据挖掘。

①猜一猜:不同的人群浏览同一个网页时,所看到的内容是否一致。

②观察凤凰网的广告区域截图,在组内交流(如下页图1,不同人群浏览的同一网页,推送的广告不同)。

③京东为什么能够根据个人喜好推送商品?

小结:京东在挖掘和分析用户浏览行为的基础上,进行定向产品推广。

设计意图:思维总是由问题开始的,激发问题,能让学生积极主动地参与到学习活动中。以京东广告推送功能来设置情境,把两种不同的浏览行为对照比较,设置悬念,第一时间抓住学生,激发学生学习新知识、新技术的渴望。

2.案例研习,认识数据挖掘

活动2:学生观看视频,并思考、总结。

①安保为什么使用热力图(如图2)?(对百度的定位数据、搜索数据进行挖掘,把握人群密集点动态趋势,帮助警方提前疏导、化解安全风险)

②百度大数据对旅游有什么作用(如图3)?(对用户搜索数据深入挖掘,预测热门旅游景点)

③导航是如何规划路径的(如图4)?(对道路环境、天气情况、特征日等数据进行挖掘和分析,得出每条道路在不同环境或不同时间的路况规律,确定最优的交通路线)

师生对数据进行分析、总结(如表1)。

小结:数据挖掘是指从大量数据中寻找其规律的技术。数据挖掘的目的主要有三个:把握趋势、预测和求最优解。

设计意图:选取日常生活中运用数据挖掘的三个典型事例视频——热力图、旅游预测、导航,借助半成品表格作为输出支架,归纳出数据挖掘的概念和数据挖掘的三个目的。体会挖掘数据价值性的同时,认识数据加工的重要性,为数据挖掘的学习做好铺垫。

3.比较空气质量,尝试数据挖掘

师:图5中空气质量预报实现了数据挖掘的哪一种目标?(把握趋势)盐城市空气质量如何?借助熟悉的WPS表格工具,尝试挖掘空气质量状况。

活动3:比较盐城、秦州、淮安等周边城市空气质量状况。

①登录中国空气质量在线监测分析平台(http://www.aqistudy.cn/historydata/),建立盐城周边三市空气质量状况工作表(如图6)。

影响空气质量的因素很多,AQI指数是衡量空气质量的重要指标。

教师演示:浏览数据,提取数据,组成工作表(如图7)。

②计算各市4月份空气质量指数AQI的平均数。(提示:AVERAGE公式使用方法以及自动填充柄的使用)

③比较4月份空气质量状况。(结论:质量指数平均值大小依次是盐城、秦州、淮安)

师:根据质量指数,利用函数工具计算平均数,得出空气质量状况,其实就是数据的挖掘。数据挖掘的一般过程如图8所示。

设计意图:从全国空气质量在线监测分析平台搜集数据,选择WPS函数工具挖掘数据,并对挖掘结果加以解释,来建构数据挖掘的一般过程。在尝试数据挖掘的过程中,学会运用计算思维解决问题,借助流程图总结挖掘过程,有助于学生从整体上把握知识,进一步促进认知体系的构建。

4.同比空气质量,再探数据挖掘

师:通过挖掘比较,我们得出盐城市4月份空气质量在周边城市当中最好,各市以前的空气质量状况如何?

活动4:比较各市2014年、2015年空气质量数据,说明哪一年空气质量更好(如图9)。

①在选定城市后,思考如何同比质量。

②选取函数或图表工具,完成挖掘。

③规律表示。

④从“我的数据分析报告”中的各组中任选城市,从“2014年数据、2015年数据”工作表中,选取数据到“同比空气质量”进行分析(如下页表2)。

小组汇报挖掘过程和得出的结论,形成对数据挖掘的新认识。

小结:用平均数比较,各市两年的数据基本相同,但是合格月份数不一定相同,同比AQI低的月份数也不相同。学生同比之后发现,2015年空气质量好于2014年。

设计意图:学生借助分析报告,以分组合作的形式,再次经历挖掘数据的过程,找到规律或有用的信息,加深对挖掘过程的理解。鼓励学生对数据进行多角度的加工与分析,选择合适的工具进行挖掘,体现了多元化的思想。

5.畅想未来,展望数据挖掘

观看视频(如上页图10,图10中左图为京东慧眼的视频截图,右图为基因测序的视频截图),想象:数据挖掘技术的广泛应用,对生活会产生怎样的影响?

如今,数据挖掘改变了传统的生活模式,未来将会产生更加深远的影响。因此,我们应学会搜集、分析身边的数据,用数据说话,挖掘数据创造出更智慧的生活方式。

设计意图:通过视频播放,让学生深度感受“数据挖掘”与生活息息相关,挖掘数据将给人们生活带来的改变,培养学生搜集、分析身边的数据,用数据说话的意识。

点 评

如今,数据挖掘已被广泛应用在各个领域。什么是数据挖掘?顾名思义就是从庞大的数据中挖掘宝藏(信息、知识、见解等)的方法和过程。显然,对于初学者而言,这是一个全新的概念,仅靠上述说明难以理解它的含义。在传统教学中,教师往往让学生背诵记忆这些内容,学生并没有形成概念的深层理解。为此,董老师从理解数据挖掘出发,选取数据挖掘的三个典型事例——热力图、旅游预测、导航,精心组织学习活动,在半成品表格的引导下,归纳出数据挖掘的三个目的——把握趋势、预测和求最优解,体会挖掘数据的价值,进而概括出数据挖掘的概念。

为了构架起理论与实践相结合的桥梁,活动3通过比较城市之间的空气质量状况,引导学生经历了数据挖掘的一般过程。数据挖掘首先要准备好数据,现实世界中的数据是庞杂的,如何组织学生获取数据,建立好数据工作表是本节课的一个难点,董老师让学生从全国空气质量在线监测分析平台搜集数据,只是把各市4月份的AQI数据复制过来,既降低了学生的操作难度,又让学生学会了根据挖掘的需要选取、整理和集成数据,为后面的数据处理和挖掘奠定了基础。

在掌握数据挖掘基本概念的基础上,活动4以小组合作的形式,让组内成员选择不同的城市和数据挖掘方法,比较各市2014年、2015年的空气质量数据,以说明哪一年空气质量更好。这样既将已掌握的数据挖掘方法与过程进行推广,将其迁移应用于新情境之中,培养和发展学生的计算思维能力,又鼓励学生学会对数据进行多角度的加工与分析,选择合适的工具进行挖掘,从而得出新的、更有价值的信息。

猜你喜欢

空气质量数据挖掘分析
乌海市雾对空气质量的影响
分析:是谁要过节
回头潮
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
Units 13—14解题分析
一本面向中高级读者的数据挖掘好书