Excel在直线相关分析中的应用
2011-10-26褚启龙哈建利
褚启龙,哈建利
(湖北职业技术学院医学院,湖北 孝感 432000)
Excel在直线相关分析中的应用
褚启龙,哈建利
(湖北职业技术学院医学院,湖北 孝感 432000)
在医疗卫生和科研工作中,经常需要观察2组变量之间是否存在线性相关关系。利用Excel软件进行直线相关分析,结果准确且方便快捷,可提高非统计专业人员工作效率。
Excel;直线相关;应用
在医疗卫生和科研工作中,经常需要观察2组变量之间是否存在线性相关关系,即对资料进行直线相关分析。传统分析方法是使用计算器,先按公式逐步计算,求出相关系数r值,然后再按照相应公式计算统计量t值,并查t界值表确定P值,最后得出结论。由于直线相关分析中的计算公式多而复杂、步骤繁多,因而计算量大且易混淆,对一般医务工作者来说有一定难度,需耗费大量时间。如今,利用计算机完成统计分析工作已成为人们的首选。目前,虽有SAS、SPSS等专业统计软件可供选用,但这些软件操作较复杂,且价格昂贵。Excel是Office家族的成员之一,几乎每台计算机上都有安装,众多医药卫生和科研工作者常用以记录和整理实验数据,但许多人并不知道Excel还可提供一些经典统计分析方法。笔者根据多年应用Excel软件的经验,谈谈如何利用Excel进行直线相关分析,以期提高工作效率。
1 安装Excel“分析工具库”
(1)使用“分析工具”前,应检查“工具”菜单,确定Excel当前是否安装了“分析工具”。如果在“工具”菜单中没有“数据分析”命令项,则需通过调用加载宏安装“分析工具库”[1]。
(2)单击“工具”菜单,在其下拉菜单中选中并单击“加载宏”,弹出“加载宏”对话框,见图1。
(3)在对话框的“当前加载宏”列表框中选中“分析工具库”,并在左侧复选框中打“√”,然后单击“确定”按钮,关闭对话框。至此,已安装“分析工具库”。
图1 当前加载宏对话框
2 输入数据求出相关系数
(1)打开Excel工作表,输入分析数据。例如:某医生分别用皮肤氧测定仪和血氧分析仪测定10名健康成年男子的动脉氧分压(mmHg),皮肤氧测定仪测定结果(X)分别为:77、78、79、80、81、82、83、84、76、79;血氧分析仪测定结果(Y)分别为:87、90、89、90、91、89、91、92、86、88。现问 2 种测定结果是否存在直线相关关系?如何解决这一问题呢?首先应输入数据。X用A列表示,分别输入A2~11的区域;Y用B列表示,分别输入B2~11的区域,见图2。
(2)先求出相关系数r值。在“工具”菜单选项卡中单击“数据分析”,弹出“数据分析”窗口,在“分析工具”中选择“相关系数”;然后单击“确定”按钮,出现“相关系数”窗口,见图3。将光标移至“输入区域(I)”,选定 A2~B11间的数据,点击“确定”按钮,出现相关系数值,见图4,本例r=0.843 621 558。
图2 数据输入截图
图3 相关系数窗口
3 检验2组数据总体上是否存在相关关系
对于同一样本来说,相关系数r和回归系数b的假设检验是等价的,2者t值相等[2],也就意味着同样2组数据无论是用r还是b进行假设检验,其结论是完全一致的。由于Excel没有提供对r进行假设检验的功能,但可对b进行假设检验,故可用回归系数b的假设检验代替相关系数r的假设检验,具体操作如下。
图4 相关系数值截图
(1)先在“工具”菜单选项卡中单击“数据分析”,弹出“数据分析”窗口,在“分析工具”中选择“回归”;然后单击“确定”按钮,出现“回归”窗口,见图5。
(2)首先,将光标移至“Y值输入区域”,选定B2~11间的数据;其次,将光标移至“X值输入区域”,选定A2~11间的数据;最后,在“置信度”左侧复选框中打“√”,单击“确定”按钮,出现分析结果,见图6。
图5 回归分析窗口
图6 分析结果截图
(3)结果分析。图6所示数据中主要看方差分析结果,其中“Significance F”表示 P 值。一般来说,若 P<0.05,表明有统计学意义,即总体相关系数ρ≠0;反之,则表明无统计学意义,总体相关系数 ρ=0。本例 P=0.002 156 606,即 P<0.01,表明 2 组数据之间存在直线相关关系,其相关系数r=0.843 621 558。
本文通过具体实例,详细说明了利用Excel对2组数据进行直线相关分析的方法,多次重复计算结果完全相同。同时,笔者也用SPSS软件对上述数据进行验证性分析,与Excel分析结果完全一致,充分说明这种分析方法稳定、可靠且结果准确。其分析结果直接给出精确的P值,无需使用者查t界值表确定P值范围,仅需使用者对统计学基本概念和基本方法有所了解即可。这种方法方便快捷,可节约大量宝贵时间。同时也提示在医学统计学教学过程中,应把如何分析统计结果作为教学重点,既降低了这门课的难度,提高了学生学习兴趣,又注重了其实际应用效果。另外,Excel还可与Word、PowerPoint和SPSS等软件进行数据交换[3],使之充分发挥作用。本方法操作简便,计算快速、准确且稳定可靠,值得大力推广。
[1]刘钢.Excel在统计分析中的应用[M].北京:人民卫生出版社,2002.
[2]杨树勤.卫生统计学[M].第2版.北京:人民卫生出版社,1990.
[3]陈雄新,曾建一,蔡岳华.Excel在四格表χ2检验中的应用技巧[J].现代预防医学,2006,33(10):1867~1870.
TP317.3
B
1671-1246(2011)17-0047-03
Vol.29 2011 No.17