|
【摘要】 给出用Excel电子表格计算确切概率的方法。
【关键词】 Excel电子表格; 确切概率法; 实际频数与理论频数
在医药试验中常常进行病例对照研究,用以检验对照组和处理组之间是否有显著性异,这类问题的原始数据如果属于计数资料,可以将资料整理成如下四格表。
表1 四格表
组别具有某种特征不具有某种特征合 计对照组aba+b处理组cdc+d合计a+cb+da+b+c+d
在统计处理上,根据样本容量n(n=a+b+c+d)的大小选取统计方法[3]:①当样本容量n>40,且理论频数T>5时,用χ2 检验;②当n>40,但1
1 Fisher确切概率法
其检验步骤如下[3]:
① 先计算四格表的实际频数T0=|ad-bc| /n ;
② 保持表1的第4行和第4列的合计值不变,让四格表中的数据发生变化,得到一系列四格表;
③ 按T0 的公式计算每个四格表的实际频数与理论频数之差的绝对值作为Ti ;
④ 计算Ti≥T0 对应的四格表发生的概率:
Pi=(a+b)!(a+c)!(d+b)! / ai!bi!ci!di!n!
⑤ 令 P=Ti≥T0Pi
⑥ 由P的大小做出推断。
2 Excel电子表格用于确切概率法的操作
下面用具体的实例介绍其操作步
例1 在某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,资料如下表2,问活动型与稳定型患者PHA反映阳性率有无差异[1]?表2 两型慢性布鲁氏病的PHA皮试反应
病人分型阳性数阴性数合计活动型11415稳定型3710合 计42125
① 打开Excel新建一个电子表格。
② 计算T0
在A1中输入T0= ,在B1中输入=ABS(1*7-3*14)/25,回车③ 保持四格表周边合计数不变,产生四格表
在A2中输入"0", 在B2中输入"=15-A2", A3中输入"=4-A2", 在B3中输入"=6+A2"。
④ 计算四格表的Ti
在A4中输入Ti=,B4中输入"=ABS(A2*B3-B2*A3)/(A2+A3+B2+B3)",回车后,B4中显示的结果为2.4。
⑤ 按上述Pi 公式计算Pi
在A5输入在"Pi=",在B5中输入
"=if(B4>=B1,fact(A2+B2)* fact(A2+A3)* fact(A3+B3)* fact(B2+B3)/(fact(A2) fact(B2) fact(A3)* fact(B3)* fact(A2+B2+A3+B3)),0)"
其中fact表示阶乘,B5显示结果为0.01660079。
⑥ 将B5中的结果复制到C5,注意复制采用选择性粘贴中的数值,结果C5中的结果为0.01661 。
⑦ 将A2单元格中的0删除,输入1,再将B5单元格中的结果按上述第6步复制的方法复制到C6中,如此重复进行,直到将A2单元格中数值从0递增变化到B2,A3,B3中有一格的数值为0止,此处当A2中的数值为4时,A3单元格的值为0 。
⑧ 最后将C5、C6、C7、C8、C9单元格的值求和得到P,这里P=0.2668,其结果于与参考文献结果一致。
3 结束语
由于确切概率法是直接计算概率,检验效率较其它方法高,不管样本容量的大小,都可以使用,在实际应用中,确切概率法的计算量较大,在样本容量较小时,人们偏重应用大样本的方法,这是不太合适的。在Excel电子表格下,利用上面提供的方法做四格表确切概率法,具有快速、简便、计算精度高等特点。每做一次检验,只需将四格表左上角的数值改变,就可以迅速计算出每个四格表对应的概率Pi ,省去许多重复性的工作。在医药试验中,由于人力、物力,财力等因素的限制,其样本容量往往较小,因而用确切概率检验的时候较多,上述方法为确切概率法提供了一种快速,准确的途径。
【参考文献】
1 杨树勤.卫生统计.第2版.北京:人们卫生出版社,1988,89~91.
2 陈华福.统计电算化教程.第1版.北京:冶金工业出版社,2001,68~72.
3 马斌荣.医学统计学.第4版.北京:人们卫生出版社,2004,85~91. |
|