Sas中能进行区间估计和假设检验的过程及语句很多,我们主要介绍:Means(summary)过程Univariate过程Capability过程Ttest过程区间估计与假设检验Procmeansdata=classclmmaxdec=2alph=0.01;Varheight;Run;Procmeansdata=classmeanvarclmalpha=0.01maxdec=3fw=8;Varheightweight;Outputout=mclassmean=var=vhvwlclm=lcuclm=uc;Run;注:means过程只能对均值进行区间估计大前提是该变量服从正态分布Means过程做区间估计Procunivariatedata=classcibasic(alph=0.01);Varheight;Run;注:可以对均值、标准差及方差进行区间估计大前提是该变量服从正态分布Univariate过程做区间估计•Proccapabilitydata=class;•Varheightweight;•intervalsheightweight/method=4,6alpha=0.1,0.05;•intervalsheight/method=6alpha=0.05,0.025type=lower;•Run;Method=4为计算均值的置信区间,method=6为计算标准差的置信区间Typer=lower(twoside,upper)分别表示计算单侧置信下限、置信区间、单侧置信上限大前提是该变量服从正态分布Capability过程做区间估计Dataclass0;Setclass;H0=height-62.33;Procmeansdata=class0tprobt/*prt*/;VarH0;Run;注:means过程只能对均值=0进行假设检验,大前提是该变量服从正态分布Means过程做假设检验Procunivariatedata=class;Varheight;Run;注:缺省情况下对均值=0进行假设检验大前提是该变量服从正态分布Univariate过程做假设检验•Procunivariatedata=classmu0=62;•Varheight;•Outputout=t_testt=t_valueprobt=p_value;•Run;ProcCapabilitydata=class;Varheight;Run;注:缺省情况下对均值=0进行假设检验大前提是该变量服从正态分布Capability过程做假设检验•ProcCapabilitydata=classmu0=62;•Varheight;•Run;PROCTTEST格式•PROCTTEST选项;•CLASS变量;•PAIRED变量串;•BY变量串;•VAR变量串;•FREQ变量串;•WEIGHT变量;•RUN;•Procttestdata=classh0=62alpha=0.01;•Varheight;•Run;Var语句用来指定要分析的变量,var变量须为数值型如果使用var语句而不使用class语句,ttest过程将执行单组样本均数与给定值(默认为0)的t检验如果忽略var语句,则输入数据集中的全部数值型变量(除了by,class,freq以及weight语句中已使用的变量外)将被作为分析变量来使用Var语句不能和paired语句同时使用大前提是该变量服从正态分布ttest单组样本的t检验ttest配对的t检验•简便法(x)常规法(y)•2.41002.8000•2.90003.0400•2.75001.8800•2.23003.4300•3.67003.8100•4.49004.0000•5.16004.4400•5.45005.4100•2.06001.2400•1.64001.8300•1.06001.4500•0.77000.9200现有两种方法测定血液中的某种物质的含量,简便法和常规法,对12个人同时用两种方法进行测定,分析两种方法是否显著不同?Procttestdata=ah0=0alpha=0.05/*缺省选项*/;pairedx*y;Run;对配对的t检验的说明•Paired语句用来指定配对t检验中要进行比较的变量对。组成变量对的变量或变量列表可用“*”或“:”连接•用星号连接表示星号左侧的每一个变量将与星号右侧的每一个变量组成变量对•用冒号连接表示左侧的变量只与右侧相应位置上的变量组成变量对,所以用冒号连接的变量列表必须包含相同数目的变量•对于每一个变量对,ttest过程用左侧的变量减去右侧的变量,将所得的差值作为新的变量执行单组样本均数比较(与0或指定的数值进行比较)•一个变量自身组成的变量对将被忽略•Paired语句仅在配对资料的t检验时使用,且不能和class语句、var语句一同使用Paired语句设置举例•Paireda*b;•Paireda*bc*d;•Paired(ab)*(cd);•Paired(ab)*(cb);•Paired(a1-a2)*(b1-b2);•Paired(a1-a2):(b1-b2);•a-b•a-b,c-d•a-c,a-d,b-c,b-d•a-c,a-b,b-c•a1-b1,a1-b2,a2-b1,a2-b2•a1-b1,a2-b2左栏中的“-”是破折号表示“到”,“至”的意思,右栏中的“-”是减号•Procttestdata=classalpha=0.01;/*h0=-3.3*/•Classsex;•Varheight;•Run;Class语句用来指定作为研究变量的分组变量。Class变量可以为数值型或字符型,但只能包含两个水平Ttest过程依据class变量将输入数据集中的观测分为两组,从而对两组的均数进行比较。可以用format语句来设置class变量的格式两组独立样本均数比较的t检验正态性检验前面的区间估计和假设检验都要假设变量为正态,所以在进行区间估计或检验之前一定要进行正态性检验Procunivariatedata=classnormal;Varheight;Run;自编程序进行区间估计和假设检验•当要进行的估计或检验没有现成的过程或语句可用时,可以自编程序进行估计或检验。•下表给出一公司生产的60个抽样轴承滚珠直径(单位:厘米)试求轴承滚珠直径方差的98%的置信区间•1.7381.7291.7431.7401.7361.7411.7351.7311.7261.737•1.7281.7371.7361.7351.7241.7331.7421.7361.7391.735•1.7451.7361.7421.7401.7281.7381.7251.7331.7341.732•1.7331.7301.7321.7301.7391.7341.7381.7391.7271.735•1.7351.7321.7351.7271.7341.7321.7361.7411.7361.744•1.7321.7371.7311.7461.7351.7351.7291.7341.7301.740示例•datazhoucheng;•inputx@@;•cards;•1.7381.7291.7431.7401.7361.7411.7351.7311.7261.737•1.7281.7371.7361.7351.7241.7331.7421.7361.7391.735•1.7451.7361.7421.7401.7281.7381.7251.7331.7341.732•1.7331.7301.7321.7301.7391.7341.7381.7391.7271.735•1.7351.7321.7351.7271.7341.7321.7361.7411.7361.744•1.7321.7371.7311.7461.7351.7351.7291.7341.7301.740•;•Procunivariatedata=zhouchengnormal;•Varx;•outputout=bmean=mstd=s;•run;示例续•datac;•setb;•k1=cinv(0.01,59);•k2=cinv(0.99,59);•a1=59*s**2/k2;•a2=59*s**2/k1;•keepk1k2a1a2;•run;总体均值已知时,如何自编这个程序?两组均数差别比较的U(Z)检验•将20名贫血患儿随机分成两组,分别用新药和常规药进行治疗,测得血红蛋白增加量如下,假设两组患儿的血红蛋白的总体标准差分别为6.9(新药)和5.3(常规),问新药与常规药疗效在显著水平alpha=0.05下有无差别?(假设血红蛋白的含量服从正态分布)•新药:24362514263423201519•常规:14182015222421252723自编U检验程序•Datatemp;•Inputx1-x10y1-y10;•M1=mean(ofx1-x10);•S1=6.9;•M2=mean(ofy1-y10);•S2=5.3;•U=abs(m1-m2)/sqrt(s1**2/10+s2**2/10);•P=2*(1-probnorm(u));•keepm1m2up;•Cards;•24362514263423201519•14182015222421252723•;•Run;方差未知但相等时,如何自编这个程序?