中国医药导报2015年6月第12卷第18期CHINAMEDICALHERALDVol.12No.18June2015窑工作探讨窑[基金项目]江苏省卫计委指导性科技项目渊JSFPC2014012冤遥[作者简介]林洁渊1987-冤袁女袁汉族袁硕士曰研究方向院卫生统计与药物警戒流行病学遥[通讯作者]孙志明渊1973-冤袁男袁汉族袁硕士袁副研究员曰研究方向院药物警戒流行病学遥样本量渊samplesize冤是指承受研究实施的样本所包含之观察单位数袁或样本例数遥除个别设计方法外袁在研究设计中必须确定需要多少实验对象或观察对象遥样本量对研究效果有重要影响袁在小样本研究中尤其如此[1]遥一系列规范的的医学研究报告袁如加强观察性流行病学研究报告质量的声明和临床试验报告统一标准等均要求在研究报告中描述野如何计算样本含量冶[2-6]遥开展一项研究袁往往因为各种因素渊人力尧物力尧经费等冤限制袁只能对总体中的一部分进行研究袁即研究样本袁然后由样本统计量推断总体参数遥样本过小袁结果不稳定袁不能真实地反映总体规律曰而样本量过大袁会增大研究的难度袁并造成人力尧物力的浪费[7]遥所以合理的样本量袁一方面袁可以在既定的经费下保证精确度和可靠性曰另一方面袁可以在既定的精确度和可靠性合理利用资源袁保证抽样推断的最大效果遥目前可以用于估计样本含量的软件很多袁其中较常用的有SAS尧Stata尧PASS等遥SAS是由美国北卡罗来纳州立大学1966年开发的统计分析软件袁在国际上被誉为统计分析的标准软件袁在各个领域得到了广泛应用[8]曰Stata是Statacorp于1985年开发的统计程序袁在全球范围内被广泛应用于经济学尧社会学及流行病学等领域曰PASS是由Hintze等人研发袁专门用于计算SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较林洁1袁2孙志明1袁21.国家人口计生委计划生育药具不良反应监测中心袁江苏南京210036曰2.江苏省计划生育科学技术研究所袁江苏南京210036[摘要]目的分析和探讨运用SAS尧PASS尧Stata3种软件在两均数渊率冤比较中进行样本量估计的结果差异袁推荐合适的样本量估计软件遥方法通过设定不同的参数情况袁分别运用3种软件计算各自样本量袁并且与公式计算结果进行比较遥结果在两均数比较时袁Stata和PASS的样本量估计结果最准确袁不同的参数会影响SAS的结果曰在两个率比较时袁SAS最准确袁PASS的准确性与样本量大小有关系袁Stata结果偏大且受不同参数的影响遥结论不同软件计算结果并不一致袁综合考虑推荐用SAS软件进行两样本均数渊率冤比较的样本量估计遥[关键词]样本量估计曰SAS曰PASS曰Stata[中图分类号]R181[文献标识码]A[文章编号]1673-7210渊2015冤06渊c冤-0133-05ComparingthedifferencesbetweenSAS,PASSandStataforsamplesizecalculationLINJie1,2SUNZhiming1,21.NPFPCContraceptivesAdverseReactionMonitoringCenter,NationalPopulationandFamilyPlanningCommission,JiangsuProvince,Nanjing210036,China;2.JiangsuInstituteofPlannedParenthoodResearch,JiangsuProvince,Nanjing210036,China[Abstract]ObjectiveToanalyzethedifferencesbetweenSAS,PASSandStataforsamplesizecalculationinatestoftwomeans(rates)andrecommendtheappropriatesoftwareforsamplesizecalculation.MethodsBysettingdifferentpa鄄rameters,samplesizeswerecalculatedusingthreekindsofsoftwarerespectivelyandcomparedwiththeformularesults.ResultsIntwosamplemeanstest,StataandPASShadthemostaccurateresults,theresultsinSASwereaffectedbydifferentparameters.Intwosampleratestest,theSASresultswerethebestofthree,theaccuracyofPASSwasrelatedwiththesamplesize,theresultsinStatawerelargerthanothersandaffectedbydifferentparameters.ConclusionTheresultsarenotconsistentusingdifferentsoftware,SASisrecommendedfortwosamplemean(rate)ofsamplesizecalcu鄄lation.[Keywords]Samplesizecalculation;SAS;PASS;Stata133窑工作探讨窑中国医药导报2015年6月第12卷第18期CHINAMEDICALHERALDVol.12No.18June2015样本量的统计软件袁操作简便快捷遥然而各软件计算结果是否一致袁研究者该选择何种类型的样本量计算软件是研究中亟待解决的实际问题遥本次研究的主要目的是以计算两均数渊率冤之差的样本量为例来比较SAS尧Stata尧PASS3种软件的结果差异袁探讨各软件计算样本量的优缺点遥1资料与方法1.1两均数比较1.1.1样本量计算公式两均数比较时袁样本量取决于以下4个条件院淤假设检验的第玉类错误琢曰于假设检验的第域类错误茁袁或检验效能1-茁曰盂两总体均数之差啄曰榆滓总体标准差[9-11]遥假设两组样本量相等袁所需样本量可由下式估计院1.1.2参数设置根据公式渊1冤假设第玉类错误琢=0.10袁0.05袁0.01曰检验效能1-茁=0.80袁0.90袁0.95曰组1总体均数滋1=1袁两总体均数之差啄=0.10袁0.20袁0.30噎袁2.0曰总体标准差滓=1曰双侧检验遥1.1.2.1SAS9.3程序院procpower;twosamplemeansmeandiff=0.10.20.30.40.81.21.62stddev=1groupweights=(11)power=0.80.90.95alpha=0.010.050.1ntotal=.;run;1.1.2.2Stata10命令院sampsi1.11袁a(0.1)power(0.8)sd1(1)不同参数下袁Stata命令语句类似袁只需替换samp鄄si命令后面的两组均数值袁以及第玉类错误琢尧检验效能power和组1标准差sd1括号里的值遥1.1.2.3PASS11主菜单选择PASS11关于两均数比较样本量估计的参数设置主菜单选择见图1遥n1=n2=2渊u琢+u茁冤2滓2啄2渊1冤图1PASS11关于两均数比较样本量估计的参数设置1.2两个率比较比较两样本率的目的是推断它们各自所代表的总体率是否相等遥1.2.1样本量计算公式两个率比较样本量取决于以下3个条件院淤假设检验的第玉类错误琢曰于假设检验的第域类错误茁袁或检验效能1-茁曰盂两总体率p1袁p2[9-11]遥假设两组样本量相等袁所需样本量可由下式估计院渊2冤134中国医药导报2015年6月第12卷第18期CHINAMEDICALHERALDVol.12No.18June2015窑工作探讨窑图2PASS11关于两个率比较样本量估计的参数设置1.2.2参数设置根据公式渊2冤假设第玉类错误琢=0.10袁0.05袁0.01曰检验效能1-茁=0.80袁0.90袁0.95曰两总体率p2=0.10袁驻p=0.025袁0.05袁0.10袁噎袁0.80曰双侧检验遥1.2.2.1SAS9.3程序[12]院procpower;twosamplefreqgroupweights=(11)pdiff=0.0250.050.10.20.30.40.50.60.70.8refproportion=0.1power=0.80.90.95alpha=0.100.050.01ntotal=.;run;1.2.2.2Stata10命令院sampsi0.1250.1袁a(0.1)power(0.8)不同参数下袁Stata命令语句类似袁只需替换sampsi命令后面的两个率的值袁以及第玉类错误琢尧检验效能power括号里的值遥1.2.2.3PASS11主菜单选择PASS11关于两个率比较样本量估计的参数设置见图2遥2结果2.1两均数比较的样本量估计结果通过给参数琢尧茁和啄/滓赋予不同的取值袁分别运用3种软件和公式计算得出的两均数比较样本量估计结果袁见表1遥从表1中可以看出袁无论第玉类错误渊琢冤尧检验效能渊1-茁冤以及总体均数之差与总体标准差的比值渊啄/滓冤如何变化袁Stata估计的样本量与公式计算结果完全一致遥PASS的结果与公式计算也基本结果一致袁但发现琢=0.05或0.1袁1-茁=0.80袁啄/滓=4.0时袁公式计算的样本量为1袁而PASS为2袁可能是因为通过PASS软件估计的样本量最小值为2袁为了验证这一假设袁于是增大啄/滓至1000袁发现PASS的结果仍为2袁于是可得结论PASS估计的样本量下限为2遥SAS的结果略大于其他3种方法袁发现当琢和1-茁一定时袁随着啄/滓的增大袁样本量增加的幅度有增大趋势曰当琢和啄/滓一定时袁随着1-茁的增大袁样本量增加的幅度有减小趋势曰当1-茁和啄/滓一定时袁增幅随琢变化的趋势不明显遥通过模拟发现袁SAS仅比公式多出1尧2例袁所以可以忽略遥2.2两个率比较的样本量估计结果通过给参数琢尧茁和驻p赋予不同的取值袁分别运用3种软件和公式计算得出的两个率比较的样本量估计结果袁见表2遥从表2中可以看出袁无论第玉类错误渊琢冤尧检验效能渊1-茁冤以及率差渊驻p冤如何变化袁SAS估计的样本量与公式计算结果完全一致遥当所得样本量逸117时袁发现PASS与公式计算结果一致曰当样本量臆101时袁PASS135窑工作探讨窑中国医药导报2015年6月第12卷第18期CHINAMEDICALHERALDVol.12No.18June20150.010.050.10.10.20.30.40.81.21.620.10.20.30.40.81.21.620.10.20.30.40.81.21.6223365842601463717106157039317599251174123731013878209542338586262148391811815713941761002612861238310139782110642336584260146371710615703931759925117412373101387820954233658426014637171061570393175992511741237310138782095429767443311864721128210252623413233159617134291911082712752978746333188492314102103527235133341610717144291911082813862976744331186472112821025262341323315961713429191108271275297674433118647211282102526234132331596171342919110827127535638913962235625149259965028916341191172165542241136341696356589339822558271611260