R语言直方图绘制
2018-01-18耿秀华冀建平
耿秀华 冀建平
摘要:R语言是近年来流行的一种用于统计分析的语言,本文介绍了R语言中用来绘制直方图的函数-histogram ()函数,通过举例的方法描述了如何利用histogram()函数设置条件变量,绘制单面板、多面板、多变量等直方图。
关键词:histogram()函数;R语言;直方图
中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2018)09-0219-02
1 综述
R是一套完整的数据处理、计算和制图软件系统,同时也是一种数学计算的环境,它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。在R网站上提供了统计及各个有关应用领域几乎所有最新的成果和代码公开的软件包。
直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。直方图是表示资料变化情况的一种主要工具。用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,对于资料分布状况一目了然,便于判断其总体质量分布情况。在制作直方图时,牵涉统计学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键数位是分组数和组距。
2 示例
本文所有图形均使用了R中自带的数据iris(鸢尾花),在R平台中使用命令“>iris”可以直接查看,共有五列:
Sepal.Length(萼片长度)、Sepal.Width(萼片宽度)、Petal.Length(花瓣长度),Petal.Width(花瓣宽度)、Species(品种),其中Species中有三种类型:setosa、virginica以及versicolor。
(1)【示例1】输入命令
>histogram(~Petal.Length|Species,data=iris)
该图形以Species(品种)为条件变量,绘出了花瓣长度直方图,见图1。
(2)【示例2】输入命令
>histogram(~Petal.Length|Species,data=iris,nint=20,main="花瓣长度直方图(多面板)")
该图形利用参数nint设置三个面板中总箱体数量为20,所绘图形见图2。
(3)【示例3】输入命令
>histogram(~Petal.Length,group=Species,data=iris,nint=20,main="花瓣长度直方图(单面板)")
该图形使用了分组变量,将直方图叠加在了一个面板,所绘图形见图3。
(4)【示例4】输入命令
>histogram(~Petal.Length+Petal.Width,group=Species,data=iris,nint=20,main="花瓣长度+花瓣宽度直方图(多面板)",col=rainbow(20))
该图形使用了两个变量:Petal.Length+Petal.Width,所绘图形如图4所示。
3 结语
用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,對于资料分布状况一目了然,便于判断其总体质量分布情况。在制作直方图时,牵涉统计学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键数位是分组数和组距。
参考文献
[1]Emmanuel Paradis.R语言初学者指南[M].Institutdes Sciences de lEvolutionUniversite Montpellier IIF-34095 Montpellier cedex2005.
[2]R Development Core Team.R语言简介[M].2006.
[3]张金龙.R语言初步-数据处理、绘图与编程[R].2010.