浅议R语言解决概率统计问题
2018-01-26辽宁省盘锦实验中学辽东湾分校赵盼盼
辽宁省盘锦实验中学辽东湾分校 赵盼盼
概率论与数理统计是研究和解释随机现象统计规律性的一门数学学科,作为理工科学生必修课程之一,它是一门将理论和实际联系在一起的学科,有着很强的理论性和应用性。在过去半个世纪中,概率论逐渐发展成为一个与数学很多其他分支相互影响的学科。概率统计广泛应用于社会、经济、管理等各个领域。随着教学手段的日益更新,基于此门课程理论与实践并重的特点,我们可以利用更多的工具解决学习和教学中遇到的问题。数学软件能用来辅助教学,展现数学的思想和方法,提高教学效率。目前应用较多的软件有Excel,Matlab, Mathematica,Maple,SAS等,虽然它们的运算功能十分强大,但基本都是商业软件,价格昂贵。而R语言是免费软件,且统计功能强大,十分适合辅助教学。
一、R语言简介
R软件是一个开放的统计编程环境,是S语言的一种实现。R软件是由Auckland 大学的 Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发的,目前由R核心开发小组维护。
R不仅是一个完全免费的统计软件,而且还具有强大的数据分析功能,能提供数据分处理、统计分析、图形显示工具。利用R软件的内嵌统计函数,可以很容易地学习和掌握R软件的语法,还可以编制自己的函数来扩展现在的R语言。
目前R语言在国外生物统计、医药统计等统计领域和科研领域中得到了广泛应用,近年来在我国,R语言已受到越来越多的学者的关注和学习。
二、R在概率统计中的应用
1.随机变量的期望和方差
例:设随机变量的分布列如下所示:
求E(X),D(X)。
在R中输入如下命令:
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> mean<-sum(X*p) #计算期望
> Y<-X^2
> Z<-sum(Y*p)
> sd<-Z-mean^2;mean;sd #计算方差,输出期望和方差的值
2. R语言与参数估计
总体是由总体分布来刻画的。在实际问题中,我们根据问题本身的专业知识或以往的经验或用适当的统计方法,有时可以判断总体分布的类型,但是总体分布的参数还是未知的,需要通过样本来估计。
下面是用R语言估计参数的例子:有一大批糖果,现从中随机取16袋,称得重量(以g 计)如下:
设袋装糖果的重量近似服从正态分布,试求总体均值的置信水平为0.95的置信区间。
分析:这里 1-α=0.95,α/2=0.025,n-1=15,t0.025(15)=2.1315,由给出数据算得未知时的置信水平为的置信区间代入数据得的置信水平为的置信区间为
而利用R语言只需要输入命令:
> x<-c(506,509,500,501,506,509,495,514,519,501,494,497,507,499,511,495)
> t.test(x)
回车得结果,如下:
3.R语言与假设检验
在数理统计分析中,由估计量估计总体的参数可以获得总体参数的无偏估计,但总体参数始终是不可知的。我们在统计推断过程中,需要对参数提出一定的假设,然后对提出的假设进行假设检验,由统计量推断总体的参数。
下面是一个t-检验的例子:
下面列出的是某工厂随机选取的20只部件的装配时间(min):
分析:这是一个关于均值的检验问题。可以提出如下假设:
因为总体方差未知,故采用t-检验方法。检验统计量为:
利用R语言只需要输入命令:
> X<-c(9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7)
> t.test(X,alternative="greater",mu=10)
运行后结果如下:
R在检验的同时还给出了区间估计。另外,在t-检验的命令中,参数alternative 反映了备择假设的情况,其取值可以是“two.sided”“less”“greater”。two.sided (默认) 表示双边检验less表示单边检验greater表示单边检验
通过本文的介绍,读者对R语言在概率统计中的应用有了初步的认识和了解,同时也可以看到R的语法简单,程序可读性强。本文叙述的只是R语言的一小部分内容,读者可以通过查看相关资料进一步掌握R语言。由于R语言是一个自由、免费的软件,非常适用于教学、科研以及统计分析。目前,利用和掌握好R语言对我国统计事业的发展有着很大的推动作用。
【参考文献】
[1]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.
[2]林正炎.概率统计课程改革的若干建议[J].高等教育研究,2001(1):6-7.
[3]林彤. EXCEL在概率论与数理统计中的应用[J].东北电力大学学报,2013,33(6):52-55.
[4]邓安生.浅谈MATLAB在概率统计教学中的应用[J].新余高专学报,2009, 14(2):87-89.
[5]薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007.
[6]叶文春.浅谈R语言在统计学中的应用[J].中共贵州省委党校学报,2008(4):123-125.