APP下载

R语言直方图绘制

2018-01-18耿秀华冀建平

数字技术与应用 2018年9期
关键词:R语言直方图函数

耿秀华 冀建平

摘要:R语言是近年来流行的一种用于统计分析的语言,本文介绍了R语言中用来绘制直方图的函数-histogram ()函数,通过举例的方法描述了如何利用histogram()函数设置条件变量,绘制单面板、多面板、多变量等直方图。

关键词:histogram()函数;R语言;直方图

中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2018)09-0219-02

1 综述

R是一套完整的数据处理、计算和制图软件系统,同时也是一种数学计算的环境,它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。在R网站上提供了统计及各个有关应用领域几乎所有最新的成果和代码公开的软件包。

直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。直方图是表示资料变化情况的一种主要工具。用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,对于资料分布状况一目了然,便于判断其总体质量分布情况。在制作直方图时,牵涉统计学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键数位是分组数和组距。

2 示例

本文所有图形均使用了R中自带的数据iris(鸢尾花),在R平台中使用命令“>iris”可以直接查看,共有五列:

Sepal.Length(萼片长度)、Sepal.Width(萼片宽度)、Petal.Length(花瓣长度),Petal.Width(花瓣宽度)、Species(品种),其中Species中有三种类型:setosa、virginica以及versicolor。

(1)【示例1】输入命令

>histogram(~Petal.Length|Species,data=iris)

该图形以Species(品种)为条件变量,绘出了花瓣长度直方图,见图1。

(2)【示例2】输入命令

>histogram(~Petal.Length|Species,data=iris,nint=20,main="花瓣长度直方图(多面板)")

该图形利用参数nint设置三个面板中总箱体数量为20,所绘图形见图2。

(3)【示例3】输入命令

>histogram(~Petal.Length,group=Species,data=iris,nint=20,main="花瓣长度直方图(单面板)")

该图形使用了分组变量,将直方图叠加在了一个面板,所绘图形见图3。

(4)【示例4】输入命令

>histogram(~Petal.Length+Petal.Width,group=Species,data=iris,nint=20,main="花瓣长度+花瓣宽度直方图(多面板)",col=rainbow(20))

该图形使用了两个变量:Petal.Length+Petal.Width,所绘图形如图4所示。

3 结语

用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,對于资料分布状况一目了然,便于判断其总体质量分布情况。在制作直方图时,牵涉统计学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键数位是分组数和组距。

参考文献

[1]Emmanuel Paradis.R语言初学者指南[M].Institutdes Sciences de lEvolutionUniversite Montpellier IIF-34095 Montpellier cedex2005.

[2]R Development Core Team.R语言简介[M].2006.

[3]张金龙.R语言初步-数据处理、绘图与编程[R].2010.

猜你喜欢

R语言直方图函数
符合差分隐私的流数据统计直方图发布
二次函数
二次函数
函数备考精讲
用直方图控制画面影调
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
基于空间变换和直方图均衡的彩色图像增强方法
注重统计思维培养与应用为主导的生物统计学课程建设
基于直方图平移和互补嵌入的可逆水印方案