用SAS软件实现配对设计定量资料的统计分析
2011-01-27胡良平贾元杰鲍晓蕾军事医学科学院科技部生物医学统计学咨询中心北京100850
胡良平,贾元杰,鲍晓蕾 (军事医学科学院科技部生物医学统计学咨询中心,北京100850)
前几期已经介绍过在进行一项科研课题研究时,先要进行合理的科研设计,在设计中特别要注意的是三要素、四原则和设计类型,从而使实验方案更加科学、完善和合理。从这期起开始介绍获得实验数据后如何使用SAS编程,并能正确解释SAS输出结果。先来看一个例子。
例1 观察阿托伐他汀治疗异常脂蛋白血症的临床效果,选取无肝、肾、甲状腺功能异常,无糖尿病病史,门诊首次就诊测定血脂水平达到入选标准,或停服其他调脂药物1个月以上、复测血脂水平达到入选标准者共21例,男9例,女12例,年龄(52± 4)岁。21例病人晚餐后口服阿托伐他汀10 mg,治疗时间为6周。服药前与服药后第6周末分别禁食12 h,前臂静脉采血检测血清总胆固醇(TC),数据见表1[1]。
类似例1的例子在临床科研中经常会遇到,即考察某种药物的治疗效果,选取一组病人给予某种药物治疗一段时间,测量一组病人治疗前、治疗后定量指标值,分析治疗前后的定量指标值是否有差异,得出这种药物的疗效如何。对于这类课题可以选用配对设计定量资料假设检验的方法进行统计分析。
表1 阿托伐他汀治疗前后病人血清总胆固醇值aTable 1 V alues of serum total cholesterol of patients before and after the treatment with atorvastatin (cB/mmol·L-1)
1 配对设计
1.1 配对设计的定义和特点 在试验中仅涉及一个试验因素的两个水平,在这两个水平作用下获得的相同定量指标的观察结果是成对出现的,这种成对出现的数据有三种情况,即三种配对方式。(1)自身配对 每一对中的两个数据来自同一个体(如服药物前、后或同一个体的对称部位分别接受不同处理);(2)同源配对 每一对中的两个数据来自亲代相同的两个个体,如每窝选两只条件相近的动物或性别相同的双胞胎,每对中两个个体分别服用不同的药物或接受不同的处理;(3)条件相近者配对 每一对中的两个数据来自条件接近但并非同源的两个个体,如将性别、体重、年龄、病情等中的单个或多个重要非实验因素各方面都十分接近的每两个个体配成一对,若配对条件由多个非实验因素复合而成,称为复合型配对条件[2]。配对设计下的数据具有一一对应的特点,人们关心的结果是各对数据的差值,其优点在于能排除个体变异对结果评价所带来的干扰,在比较两种处理效应时,可比性更好[3]。
在实际工作中应根据具体情况选取“配对方式”。若试验因素的两个水平(假设为A、B),A为空白对照或安慰剂对照,B为真实处理,则自身配对方式能最大限度地排除个体差异的影响,但前后比较时间间隔不宜过长,否则可能会受到混杂因素影响或自身发生某种变化,失去自身配对的均衡性[4]。若A、B均为真实的处理,如两种不同药物,可采用同源配对,同源配对条件达不到时,可采用条件相近者配对。但按条件配对的形式不可轻易使用,仅当配对条件是对定量观测结果有影响的全部重要非试验因素的复合型因素时,其结果和结论才是基本正确的。
1.2 配对设计定量资料统计分析方法的合理选用 (1)当检测指标为定量资料且仅有一个定量指标时称之为配对设计一元定量资料,若每对中的两个数据的差值服从(或近似服从)正态分布,采用配对设计一元定量资料t检验,反之采用配对设计一元定量资料符号检验或符号秩和检验。(2)当检测的定量指标为在专业上有一定联系的多个定量指标时称之为配对设计多元定量资料,采用配对设计多元方差分析。
2 实例解析
2.1 应用 SAS软件分析配对设计一元定量资料 例2 沿用例1中的资料,试问阿托伐他汀治疗前后血清TC值的改变有没有统计学意义?
对问题的分析与SAS实现 此资料仅有一组病人,涉及一个试验因素,该因素的表现型是“测量时间”,其原型是“用药与否”。故其两个水平分别为“治疗前”、“治疗后”,只有一个定量指标为“血清TC”,测得的每一对数据来自同一个病人,故此定量资料属于配对设计一元定量资料。应对病人治疗前后心率的差值进行正态性检验,若差值服从正态分布,可采用配对设计一元定量资料的t检验分析此定量资料;反之,可采用符号秩和检验。应用SAS进行分析,程序如下。
程序说明:第1步为建立数据集,“input”表示输入变量y1、y2,变量 y1、y2代表“治疗前、治疗后血清TC值”。“d”代表两者差值,配对设计一元定量资料t检验的本质是:对差值d与0之间的差别是否有统计学意义进行假设检验。第2步为调用univariate过程对此定量资料进行分析。其中“normal”选项是要求系统对数据进行正态性检验,“var d”表示要分析的定量变量是“d”。ods语句用来将统计分析结果输出成网页格式。
data a; /*第1步*/ input y1 y2@@; d=y2-y1; cards; 7.67 5.87 7.78 5.26 8.14 5.47 7.25 5.95 7.32 5.74 7.65 5.46 7.43 5.69 8.35 5.34 7.49 5.56 6.93 5.84 7.78 5.57 7.6 5.79 7.6 6.07 7.31 6.11 7.08 5.71 8.15 5.67 7.45 5.39 7.7 5.7 8.57 5.6 7.42 6.14 7.49 5.22 ; run; ods html; proc univariate normal; /*第2步*/ var d; run; ods html close;
SAS输出结果及结果解释:
SAS系统单变量分析过程(univariate process)变量:d
这部分给出了原始数据 y1与 y2对应相减后所得差量(变量名为d)的算术平均值、标准差、变异系数等简单统计量的计算结果。
基本统计测度位置 变异性均值 -1.952 86 标准偏差 0.567 45中位数 -1.93 方差 0.322众数 … 极差 1.92四分位极差 0.74
这部分给出了变量 d的基本统计测度,如算术平均值、中位数、众数、标准差、方差、极差(即最大值与最小值之差)、四分位极差(即第三四分位数与第一四分位数之差)。
这部分给出了正态性检验结果和t检验结果。查验正态性检验的结果,d变量正态性检验的结果: W=0.963 159、P=0.581 9,说明差值服从正态分布,故选用配对设计一元定量资料t检验的结果。
位置检验:Mu0=0检验 统计量 P值学生t t -15.770 7 Pr>|t| <0.000 1符号 M -10.5 Pr≥|M| <0.000 1符号秩 S -115.5 Pr≥|S| <0.000 1
正态性检验检验 统计量 P值Shapiro-Wilk W 0.963 159 Pr<W 0.581 9 Kolmogorov-Smirnov D 0.085 92 Pr>D >0.150 0 Cramer-von Mises W-Sq 0.023 7 Pr>W-Sq>0.250 0 Anderson-Darling A-Sq 0.208 918 Pr>A-Sq >0.250 0
统计结论:t=-15.770 7,P<0.000 1,故按α=0.05水准,认为给药前后血清 TC差量的平均值与0之间的差异有统计学意义。
专业结论:因给药后与给药前的血清 TC差值的平均值-1.952 86<0,结合统计学结论,可认为阿托伐他汀能降低血清TC的水平。
2.2 应用 SAS软件分析配对设计多元定量资料 在科研工作中,经常需要同时对多个指标进行综合分析,从而得出一个概括性的结论来。这时要用多元方差分析,如何用SAS实现?
例3 研究国产苯磺酸左氨氯地平的降压疗效及对代谢的影响,选取2002年10月到2003年3月符合1999年WHO/ISH诊断原发性高血压标准的门诊初发高血压病人25例,男13例,女12例,年龄22~66岁[(48.4±11.5)岁],体重指数(24.3± 2.9)kg/m2。排除继发性高血压,糖尿病,肝、肾及其他内分泌代谢性疾病。治疗前后测定以下指标:血压、心率、空腹血糖(FPG)及空腹胰岛素(FPI)、三酰甘油、总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、尿素、肌酐、尿酸、胆红素、丙氨酸氨基转移酶等[5]。此例中仅拿血压的收缩压与舒张压两个定量指标示例配对设计多元定量资料方差分析的SAS实现,数据见表2。试问国产苯磺酸左氨氯地平对降低血压是否有疗效?
对问题的分析与SAS实现 此例测量的指标为两个定量指标,只有一组受试对象,同一指标下测得的两个数值来自于同一个体的两个时间点,属于配对设计二元定量资料,采用二元方差分析。实现此分析的SAS程序如下。
程序说明:程序中第1步是数据步,“d1”和“d2”分别代表两个指标治疗前后数值的差值;第2步是过程步,调用MEANS(均值)过程计算“x1、 x2、y1、y2、d1、d2”统计量的数值;第3步是二元方差分析过程步,调用 GLM过程(一般线性模型过程)对“d1”和“d2”进行二元方差分析,“ss3”表示应用GLM过程中第3种算法,此过程中“manova H= intercept”语句是进行多元方差分析,即检验总体中两定量指标的均值向量是否为(0,0)′。
表2 苯磺酸左氨氯地平治疗前后舒张压与收缩压的指标值aTable 2 Values of diastolic pressure and systolic pressure before and after the treatment with levamlodipine benzenesulfonate (ρ/mm Hg)
data b; /*第1步*/ input x1 x2 y1 y2@@; d1=x2-x1;d2=y2-y1; cards; 143 122 101 70 149 124 96 91 143 128 85 94 143 120 92 75 144 119 100 82 160 119 97 75 111 110 106 74 137 123 93 80 153 115 100 85 141 108 106 89 127 115 100 82 137 114 94 81 148 133 104 65 156 127 106 90 147 135 95 72 157 133 104 75 131 127 100 76 132 106 98 81 144 124 94 76 158 119 86 81 151 142 93 89 164 132 100 73 141 115 103 87 142 135 86 79 137 114 100 82 ; run; ods html; proc means; /*第2步*/ var x1 x2 y1 y2 d1 d2; run; proc glm; /*第3步*/ model d1 d2=/ss3; manova H=intercept; run; ods html close;
SAS输出结果及结果解释:
这部分给出了4个原变量(x1、x2、y1、y2)和两个新变量(d1、d2)所对应的样本含量、平均值、标准差、最小值和最大值。
均值过程变量 N 均值 标准偏差 最小值 最大值x1 25 143.84 11.560 28 111 164 x2 25 122.36 9.295 519 106 142 y1 25 97.56 6.144 645 85 106 y2 25 80.16 7.215 031 65 94 d1 25 -21.48 10.708 719 2 -41 -1 d2 25 -17.4 10.267 261 9 -39 9
一般线性模型分析过程
这部分给出了分别对 d1、d2两个变量所做的分析结果,为配对设计一元定量资料的方差分析,等价于配对设计一元定量资料的t检验。对 d1做分析的结果 F=100.59、P<0.000 1,说明 d1的平均值与0之间的差异有统计学意义。同样对 d2作分析的结果 F=71.8、P<0.000 1,说明 d2的平均值与0之间的差异有统计学意义。
多元方差分析结果
这部分给出了配对设计定量资料二元方差分析结果,同时考虑两项指标,采用了4种统计分析方法,通常只看第1种。Wilks’λ=0.113 82,对应的F=89.53,分子和分母自由度分别为2和23,对应的 P<0.000 1,说明就两个指标整体而言,服药前后的差异有统计学意义。
统计结论:针对两个指标整体而言,服用苯磺酸左氨氯地平治疗前后血压值差异有统计学意义(Wilks’λ=0.113 82、F=89.53、P<0.000 1)。对于反映血压的两个指标“舒张压”和“收缩压”,服药前后的数值差异有统计学意义(F=100.59、P<0.000 1;F=71.8、P<0.000 1)。
专业结论:服药前收缩压平均值为143.84,服药后为122.36;服药前舒张压平均值为97.56,服药后为80.16;另外,收缩压和舒张压服药前后的差值的均值分别为-21.48和-17.4。因此综合考虑两项指标,国产苯磺酸左氨氯地平对于降压是有效果的。
[1] 陈 凌,秦永文,郑 兴.阿托伐他汀治疗异常脂蛋白血症的临床效果[J].药学服务与研究,2002,2(4):224-226.
Chen Ling,Qin YongWen,Zheng Xing.Effects of atorvastatin on lipid profile modification in patients with dyslipoproteinemia [J].Pharm Care Res,2002,2(4):224-226.Chinese with abstract in English.
[2] 胡良平.医学统计学:运用三型理论分析定量与定性资料[M].北京:人民军医出版社,2009:49.
Hu LiangPing.Medical statistics-analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:49.Chinese.
[3] 方积乾.医学统计学与电脑实验[M].上海:上海科学技术出版社,2001:75.
Fang JiQian.Medical statistics and computer experiments [M].Shanghai:Shanghai Science and Technology Press,2001: 75.Chinese.
[4] 王仁安.医学实验设计与统计分析[M].北京:北京医科大学出版社,1999:32.
Wang Ren’an.Medical experiment design and statistical analysis[M].Beijing:Peking Medical University Press,1999:32. Chinese.
[5] 刘 明,卞金陵,秦永文,等.国产苯磺酸左氨氯地平的降压疗效及对代谢的影响[J].药学服务与研究,2004,4(2):145-146. Liu Ming,Bian JinLing,Qin YongWen,et al.Effects of levamlodipine benzenesulfonate on blood pressure and metabolism in patients with hypertension[J].Pharm Care Res,2004,4(2): 145-146.Chinese with abstract in English.