数据的分析要点精讲
2016-11-19徐菊萍
徐菊萍
1. 统计量
频数:一般地,我们称落在不同小组中的数据个数为该组的频数,也称次数,是在一组依大小顺序排列的测量值中,按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数据个数.
如有一组测量数据,数据的总个数N=148,最小的测量值0.03,最大的测量值31.67,按组距为3.000将148个数据分为11组,其中分布在15.05~18.05范围内的数据有26个,则称该数据组的频数为26.
频率:频数与数据总数的比为频率.
相同条件下的n次试验中,事件A发生的次数n(A)称为事件A发生的频数.比值n(A)/n称为事件A发生的频率.
例1 为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参赛.为了解此次竞赛的成绩,从中抽取了部分学生的成绩(得分取整数,满分为100分)进行统计.请你根据尚未完成的频数分布表和频数分布直方图(如图2),解答下列问题.
(1) 补全频数分布表;
(2) 补全频数分布直方图;
(3) 在全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?
(4) 若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的学生约有多少人?
【解析】频数分布表和频数分布直方图是我们进行数据统计的基本图表,频数分布表考查的是频数、频率、样本容量三者之间的关系:频率=频数÷样本容量.频数分布直方图是根据频数分布表中的数据绘制的.本题中,样本的优秀率可以看成全校的优秀率,所以全校的优秀人数等于全校人数乘样本的优秀率.
解:(1) 如下表:
(2) 如图3;
(3) 在全体参赛学生中,竞赛成绩在80.5~90.5分范围内的人数最多.
(4) 900×0.24=216(人),
∴该校成绩优秀的学生约有216人.
【点评】填写频数分布表时,要注意各频数之和为样本容量,各频率之和为1.绘制频数分布直方图时,可以简单地将各小长方形的高取成频数,当所选的样本具有一定的代表性和广泛性时,就可以利用样本的结果估计总体的相关结果,如第(3)、(4)题,
2. 用样本估计总体的思想
抽样调查的目的,就是根据数据反映的集中程度和离散程度对总体进行估计,作出合理的判断和预测,如图4.
例2 某地区为筹备中学生运动会,要从某校八年级9个班中抽取48名女生组成花束队,要求队员的身高一致,现随机抽取10名八年级某班女生体检表 (各班女生人数均超过20人),身高如下(单位:厘米):
165 162 158 157 162 162 154 160 167 155
(1) 求这10名学生的平均身高;
(2) 该校能否按要求组成花束队?并说明理由.
【解析】本题主要考查用样本估计总体的思想.
解:(1) 这10名学生的平均身高为165+162+…+155/10=160.2(厘米).
(2) 能.理由如下:由于样本中的162厘米出现的次数最多,从而可估计一个班级至少有6名女生的身高为162厘米.从而可估计全校身高为162厘米的女生人数为6×9=54>48,所以该校能按要求组成花束队.
3. 识图能力、数据观念
涉及有关统计图表的问题,需要从统计图表中准确提取信息,分析数据的含义.
例7 2012年1月7日,第十届厦门国际马拉松赛在鹭岛鸣枪开跑.图5是本次全程马拉松、半程马拉松、10公里赛程、5公里赛程的各项参赛人数占全体参赛人数比例的扇形统计图.
(1) 求参加全程马拉松赛的人数占全体参赛人数的百分比;
(2) 已知参加10公里赛程的人数为7200人,求参加全程马拉松赛的人数.
【解析】本题综合考查从扇形统计图中获取信息的能力,可结合扇形统计图提供的信息及题意解答此题.
解:(1) 参加全程马拉松赛的人数所占的百分比为l-34.4%-12.9%-35.5%=17.2%.
(2) 全体参赛人数为7 200÷34.4%≈20 930(人).
参加全程马拉松赛的人数为20 930×17.2%≈3 600(人).
【点评】掌握扇形统计图的意义是解决本题的关键.
(作者单位:江苏省南京师范大学附属苏州石湖中学)