大于中位数与大于等于中位数数据个数的区别
2022-11-17相剑利
相剑利
【摘要】中位数是刻画数据集中趋势的统计量之一,反映数据集中趋势的位置代表值.由中位数的定义可以得到结论:这组数据中大于等于中位数的至少有一半,大于中位数的至多有一半.
【关键词】中位数;大于中位数;大于等于中位数
1中位数的意义
将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数;如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.
例如:一组数据有20个,这些数据由小到大排列后分别记为a1,a2,a3,…,a20.
根据中位数的定义,这组数据的中位数为
a10+a112,
那么a11≥a10+a112,a10≤a10+a112.
于是可以得到结论:
(1)这组数据中大于等于中位数的至少有一半.因为后10个数据a11,a12,…,a20都大于等于中位数,而且前10个数据a1,a2,…,a10中也可能有等于中位数的,所以这组数据中大于等于中位数的至少有一半.
(2)这组数据中大于中位数的至多有一半.因为后10个数据a11,a12,…,a20有可能都大于中位数,但前10个数据a1,a2,…,a10中不可能有大于中位数的,所以这组数据中大于中位数的至多有一半.
2应用结论解决问题
例1为了解甲、乙两座城市的邮政企业4月份收入的情况,从这两座城市的邮政企业中,各随机抽取了25家邮政企业,获得了它们4月份收入(单位:百万元)的数据,并对数据进行整理、描述和分析.下面给出了部分信息.
a.甲城市邮政企业4月份收入的数据的频数分布直方图如图1(数据分成5组:6≤x<8,8≤x<10,10≤x<12,12≤x<14,14≤x≤16):
b.甲城市邮政企业4月份收入的数据在10≤x<12这一组的是:
10.010.010.110.911.411.511.611.8
c.甲、乙两座城市邮政企业4月份收入的数据的平均数、中位数如下:
平均数中位数甲城市10.8m乙城市11.011.5
根据以上信息,回答下列问题:
(1)写出表中m的值;
(2)在甲城市抽取的邮政企业中,记4月份收入高于它们的平均收入的邮政企业的个数为p1.在乙城市抽取的邮政企业中,记4月份收入高于它们的平均收入的邮政企业的个数为p2.比较p1,p2的大小,并说明理由.
解(1)由题意可得m为甲城市的中位数,由于总共有25家邮政企业,所以第13家邮政企业的收入作为该数据的中位数,
因为6≤x<8有3家,8≤x<10有7家,10≤x<12有8家,
所以中位数落在10≤x<12上,
所以m=10.1.
(2)甲城市由4月份收入的数据可得p1=12;乙城市中位数为11.5,说明大于等于11.5的至少有13家,这些数据都高于平均数11.0,则p2至少为13个.
所以p1<p2.
例2某商场为了解甲、乙两个部门的营业员在某月的销售情况,分别从两个部门中各随机抽取了20名营业员,获得了这些营业员的销售额(单位:万元)的数据,并对数据进行整理、描述和分析.下面给出了部分信息.
a.设营业员该月的销售额为x(单位:万元),甲部门营业员销售额数据的频数分布直方图如图2(数据分成5组:10≤x<15,15≤x<20,20≤x<25,25≤x<30,30≤x≤35):
b.甲部门营业员该月的销售额数据在20≤x<25这一组的是:
21.322.122.623.724.324.324.824.9
c.甲、乙两部门营业员该月销售额数据的平均数、中位数如下:
平均数中位数甲部门22.8m乙部门23.022.7
根据以上信息,回答下列问题:
(1)写出表中m的值;
(2)在甲部门抽取的营业员中,记该月销售额超过23.0万元的人数为n1.在乙部门抽取的营业员中,记该月销售额超过23.0萬元的人数为n2.比较n1,n2的大小,并说明理由.
解(1)24.0.
(2)n1>n2.理由如下:
由甲部门抽取的营业员该月的销售额的数据可知n1=11.
因为在乙部门抽取的20名营业员该月销售额数据的中位数是22.7万元,说明大于22.7万元的至多有10家,那么大于23.0万元的也至多有10家,所以n2≤10.
所以n1>n2.
例32022年是中国共产主义青年团建团100周年.某校团委组织七、八年级学生开展主题为“成团百年,勇当先锋”的团史知识学习活动.为了解这两个年级学生团史知识的学习情况,从七、八年级的学生中,各随机抽取了20名学生进行测试,获得了他们的成绩(百分制,且成绩均为整数),并对数据(成绩)进行了整理、描述和分析,下面给出了部分信息.
a.该校七年级抽取的学生测试成绩的数据的频数分布直方图如图3(数据分为5组:75≤x<80,80≤x<85,85≤x<90,90≤x<95,95≤x≤100):
b.该校七年级抽取的学生测试成绩的数据在85≤x<90这一组的是:
858585868788
c.该校七、八年级抽取的学生的测试成绩的数据的平均数、中位数、众数如下:
平均数中位数众数七年级85.2m85八年级87.189.590
根据以上信息,回答下列问题:
(1)写出表中m的值;
(2)此次测试成绩90分及90分以上为优秀.记该校七年级抽取的学生中成绩优秀的人数是x1,八年级抽取的学生中成绩优秀的人数为x2.比较x1,x2的大小,并说明理由.
解(1)85;
(2)x1<x2.理由如下:
由七年级抽取的学生测试成绩的数据可知
x1=5.
由八年级抽取的20名学生测试成绩的数据的中位数是89.5分可知成绩大于89.5分的至多10个,
因为成绩均为整数,而且众数等于90分,说明成绩从小到排第11个恰好是90分,
于是成绩90分及90分以上的恰好为10个,
故x2=10.
所以x1<x2.