了解分析方法,发掘数据价值
2021-09-24李维明
主持人
李维明,教育部普通高中信息技术课标修订组核心成员,正高级教师(教授)
主持人语:自2019年9月采用新课标新教材开展教学以来,北京、天津、山东、海南、辽宁等5个省(市)大多完成了必修模块的教学,部分省(市)还进行了学业水平合格考试,取得了良好的成效。2020年,教育部又组织专家对课标进行了修订,颁布了最新版的《普通高中信息技术课程标准(2017年版2020修订)》,更加明晰了学科核心素养的内涵和内容模块的结构,增强了教学应用的方向感。当下,新课标新教材的教学实践已经进入到选择性必修模块教学的新阶段,怎么选择、怎么教学是必须面对的重要问题。为配合选择性必修课程的教学,本期继续“普通高中信息技术新课程实施”之选择性必修模块的教学等系列专题的研讨,以飨读者。同时,也希望广大信息技术教师、教研人员积极参与,献计献策,共同促进学科新课标新课程的顺利实施、健康发展。欢迎大家不吝赐稿。(358211798@qq.com)
如前所述,数据分析是运用科学的分析方法与工具,对数据进行分类整理,提取与发现有价值的信息、形成结论的过程。怎样去进行分析、如何挖掘数据的意义,正是本单元需要研究的主要内容。同时,在活动过程中形成对数据特征、数据价值、数据管理思想与分析方法的认识,是本单元教学追求的核心目标。
● 了解数据分析的基本方法
数据分析方法是指对收集来的数据进行分析,提取有用信息、形成结论的过程和方法。《普通高中信息技术课程标准(2017年版2020修订)》(以下简称《标准》)要求本单元的学习,要了解常用的数据分析方法,并例举了对比分析法、分组分析法、平均分析法和相关分析法等简单的、常用的数据分析方法,这是在教学中必须要了解的内容。
对比分析法,也叫比较分析法,简称对比法,是通过实际数与基数的对比来提示实际数与基数之间的差异,借以了解相关活动的成绩和问题的一种分析方法。在科学探究活动及事务管理活动中常常用到这种分析方法。
分组分析法是指通过统计分组的计算和分析,来认识所要分析对象的不同特征、不同性质及相互关系的方法。分组就是根据研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的对象总体划分为若干个不同性质的组,使组内的差异尽可能小,组间的差异尽可能大。分组分析法在分组的基础上,对现象的内部结构或现象之间的依存关系从定性或定量的角度做进一步分析研究,以便寻找事物发展的规律,正确地分析问题和解决问题。
平均分析法,顾名思义就是用平均数来反映数据在某一特征下的水平,即通过特征数据的平均指标,反映事物目前所处的位置和发展水平。再对不同时期、不同类型单位的平均指标进行对比,说明事物的发展趋势和变化规律。
相关分析法是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。
时下,最火热的数据词汇莫过于“大数据”。大数据可以概括为5个V,即数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值性(Value)、真实性(Veracity)。与大数据相随而来的数据仓库、数据安全、数据分析、数据挖掘等逐渐成为各行各业争相追捧的焦点。伴随大数据的“得道”,大数据分析也应运“升天”。有关大数据分析的内容,《标准》中虽未做硬性要求,但作为了解数据管理与分析技术的新发展的内容,这里也应提一下。
大数据分析是指对规模巨大的数据进行分析,其方法很多,其中最常用的方法有数据可视化分析法和数据挖掘分析法。数据可视化是指将数据转换成适当的可视化图表,从而将隐藏在数据中的信息直观地呈现出来,以帮助人们更直观地理解数据中所隐藏的变化趋势,挖掘数据更深的内涵。数据挖掘是将记录下来的数据,通过使用一系列的方法、工具或算法,发现数据中隐含的、未知的、有价值的信息,如规律、趋势等,用来帮助人们解决现实生活中的问题,或为相关领域的决策提供支持。
数据分析的方法很多,其主要作用是作为工具帮助人们分析、挖掘数据背后的信息。所以,不管使用什么方法,通过对数据进行分析,发现其蕴含的价值意义才是数据分析的真正目的。
● 发掘数据蕴含的价值意义
数据有其独特的意义,数据中蕴含着巨大的价值。怎么去发现数据中的信息,挖掘出其中的含义,使其发挥作用,体现价值?这里引用一个实际的案例,来看看如何正确选用数据分析方法和工具,通过分析并解释数据,实现数据的价值。
案例:数据分析促进教学内容的优化。
某小学每年进行学生体质健康测试,积累了大量数据,这些数据反映了学生体质健康水平,也反映了体育课教学的基本情况。通过对这些数据的分析,发现学生50米跑的成绩普遍不理想。最直接的原因是由于学校场地的限制,实现不了常态化50米跑训练。为了解决这一问题,学校采用了数据分析的方法,将体重评分、肺活量评分、50米跑评分,坐位体前屈评分、1分钟跳绳评分等数据用SPSS软件进行了相关性分析,发现50米跑和1分钟跳绳呈现中度正相关(如下页表1)。
既然发现50米跑和1分钟跳绳二者有着正相关关系,学校就对体育课堂教学做出了一个微小的调整,即在每节室外体育课中增加一个5分钟跳绳练习环节,以跳绳练习弥补50米跑的不足。经过近一年的实施,对同一批学生进行体质健康检测,学生跳绳平均分和50米跑平均分均有明显提升;同时,年级综合平均分从83.71提高到87.7。将此策略推广到其他年级,让2020级学生从入校就参与到该项实验中,该年级的跳绳平均分和50米跑平均分也高于2019级同期水平(如表2)。这说明,数据分析改进了课堂教学的策略,提高了教学的有效性,提升了学生体质健康水平。
在这个案例中,该校首先做到了“正确选用数据分析方法和工具”,然后分析这些数据,并正确地解释了这些数据,从而实现了数据的价值,促进了该校体育教学水平的提高,提升了学生体质。
● 教学建议
本单元的教学,可按照《标准》的建议,总的方略就是,在实践中选用适当的数据分析工具,分析、呈现并解释数据,并结合恰当的案例分析、认识数据挖掘对信息社会问题解决和科学决策的重要意義。在具体实施教学时,可结合选用的教材,让学生参照其中项目的设计,开展项目活动。通过项目活动的开展,选择、应用数据分析的工具,深入地分析教学提供的数据,大胆地提出自己的看法,合理地解释相应数据,得到问题解决的办法,做出科学的判断和决策。
数据蕴含价值,数据更是财富。在开展数据分析、挖掘数据价值的同时,也必须重视数据的安全防护。一方面要了解数据特别是大量的数据保护相关的法律法规及安全规范;另一方面更要注重数据存储、访问等相关安全,只有数据安全了,数据的分析才能正常实施,数据的挖掘才会更有意义。