第3章统计实验(多元正态总体检验)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1实验零多元正态总体检验(均值向量检验)1.实验目的:本实验讨论利用多元正态总体检验中的均值向量检验方法去判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。通过该实验,能够起到如下的效果:(1)理解多元正态总体检验中的均值向量检验方法的作用、思想、数学基础、方法和步骤;(2)熟悉如何利用多元正态总体检验中的均值向量检验方法,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现多元正态总体检验中的均值向量检验方法的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。2.知识准备:多元正态总体检验中的均值向量检验是从判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。其思想和步骤是:1.假设“需判断的总体均值等于预先判断的向量(单正态总体检验)”或“需判断的两个总体的均值相等(双正态总体检验)”;2.在该假设下,构造适当的统计量并给出其分布;3.根据观测数据算出其统计量的值;4.根据预先确定的检验水平查阅相应的分布表确定临界值和拒绝域;5.根据结果判断接受或拒绝原假设,得出结论。(具体见书【1】第三章)3.实验内容:一、单正态总体检验:人出汗多少与人体内钠、钾含量有一定关系。今测20名健康成年女性出汗多少(X1)、钠含量(X2)、钾含量(X3),其数据如下表1:表1健康成年女性出汗情况的基本数据序号X1X2X3序号X1X2X313.748.59.3113.936.912.725.765.18124.558.812.333.847.210.9133.527.89.843.253.212144.540.28.453.155.59.7151.513.510.164.636.17.9168.556.47.172.424.814174.571.68.287.233.17.6186.552.810.996.747.48.5194.144.111.2105.454.111.3205.540.99.4利用多元正态总体检验中的单正态均值向量检验方法判断“(X1,X2,X3)的均值是否等于(4,50,10)”【1】(假设总体服从正态分布,分别取检验水平为0.05、0.01)。2二、双正态总体检验:为研究日、美在华投资企业对中国经济环境的评价是否存在差异,今从两国在华投资企业中个抽10家,让其对中国的政治、经济、法律、文化等环境打分,其数据如下表2:表2日、美在华投资企业对中国经济环境的的基本数据序号政治经济法律文化序号政治经济法律文化16535256011555540652755020551250604570360453565134545357547540407014505050705703030501555503075655403565166040456076045306017655545758654025601850603580960503070194045306510555535752045504570其中1-10号为美国在华投资企业的代号,11-20号为日本在华投资企业的代号。数据来源:国务院发展研究中心APEC在华投资企业情况调查。利用多元正态总体检验中的双正态均值向量检验方法判断日、美在华投资企业对中国经济环境的评价是否存在显著的差异(假设它们均服从正态分布,且有相同的协差阵,分别取检验水平为0.05、0.01)。4.实验步骤:一、单正态总体检验:1.读入数据:SAS程序:Datasweat;inputX1-X3@@;cards;3.7048.509.303.9036.9012.705.7065.108.004.5058.8012.303.8047.2010.903.5027.809.803.2053.2012.004.5040.208.403.1055.509.701.5013.5010.104.6036.107.908.5056.407.102.4024.8014.004.5071.608.207.2033.107.606.5052.8010.906.7047.408.504.1044.1011.205.4054.1011.305.5040.909.40;run;语句解释:3“Datasweat;”指将数据输入到文件“sweat”中;“inputX1-X3@@;cards;”指将后面的数据对应地赋予变量X1-X3;其中“@@”指按顺序读取一行中的数据输入到“X1-X3,X1-X3,…”;如果没有“@@”,则只读取每行中的前3个数据按顺序分别输入到“X1-X3”;2.计算协方差矩阵:SAS程序:Proccorrcov;run;语句解释:“Proccorrcov”指调用计算相关矩阵的程序;其中“cov”指计算样本协差阵;运行结果及解释:图1变量信息图4变量的样本相关系数矩阵图2变量的样本协方差矩阵图3变量的一些统计量图1中指分析的变量为“X1,X2,X3”;图2中是样本协差阵,及自由度=n-1=20-1=19;图3是变量的一些简单统计量;图4是变量的样本相关系数阵。3.计算F统计量:SAS程序:Prociml;n=20;p=3;average={4.6445.49.965}`;x0={45010}`;S=19*{2.879368410.0100000-1.8090526,10.0100000199.7884211-5.6400000,-1.8090526-5.64000003.6276579};I=inv(S);a0=(average-x0);4F=n*(n-p)*a0`*I*a0/p;printS;printI;printF;run;语句解释:“Prociml;”指调用矩阵运算的程序;“n=20;p=3;”指输入样品数为20,变量维数为3;“average={4.6445.49.965}`;”指将第2步中计算的样本均值输入到变量“average”中,其中符号“{}”指输入变量为行向量;“`”指将行向量装置为列向量;“x0={45010}`;”指将待检验的总体均值输入到变量“x0”;“S=…;”指将第2步中计算的样本协差阵经过计算成离差阵,再输入到变量“S”中(注意SAS程序中的样本协差阵和书【1】中定义的不一样),其中“{}”指输入变量为矩阵,每一行数据的结尾用“,”分隔;“I=inv(S);”指计算矩阵S的逆矩阵,并输入到变量“I”;“a0=(average-x0);”指计算主效应,即,样本均值与检验的总体均值之间的差,并输入到变量“a0”;“F=n*(n-p)*a0`*I*a0/p”指计算构造的统计量“F”(见书【1】第三章P34);“printF;”指输出变量“F”;运行结果及解释:F=2.9045463;4.确定检验水平分别为0.05、0.01的临界值:因为n=20,p=3,所以统计量F服从F(3,17),查表知:检验水平为0.05、0.01的临界值分别是3.2,5.19,因此它们的拒绝域分别为:F3.2和F5.19;实验结论:因为F=2.9045463;而且检验水平为0.05、0.01的拒绝域分别为:F3.2和F5.19;所以按0.05、0.01的检验水平,均接受原假设,即没有理由拒绝总体均值(X1,X2,X3)=(4,50,10)的假设。二、双正态总体检验:1.读入数据:SAS程序:Dataeconomic;inputX1-X4Y1-Y4@@;cards;65352560555540657550205550604570604535654545357575404070505050705703030505550307555403565604045606045306065554575654025605060358060503070404530655555357545504570;run;2.计算协方差矩阵:SAS程序:Proccorrcov;run;运行结果及解释:图5变量的样本协方差矩阵图6变量的一些统计量3.计算F统计量:SAS程序:Prociml;n=10;m=10;p=4;averageX={644330.563}`;averageY={51.5514070.5}`;SX=(n-1)*{54.44444444-18.88888889-13.33333333-27.22222222,-18.8888888956.666666671.1111111134.44444444,6-13.333333331.1111111135.8333333328.88888889,-27.2222222234.4444444428.8888888956.66666667};SY=(m-1)*{55.833333336.6666666719.44444444-0.83333333,6.6666666743.333333335.5555555621.66666667,19.444444445.5555555650-11.11111111,-0.8333333321.66666667-11.1111111135.83333333};S=SX+SY;I=inv(S);average=averageX-averageY;F=(n+m-p-1)*n*m*average`*I*average/(p*(n+m));printaverage;printSX;printSY;printS;printI;printF;run;运行结果及解释:F=6.2213532;4.确定检验水平分别为0.05、0.01的临界值:因为n=10,m=10,p=4,所以统计量F服从F(4,15),查表知:检验水平为0.05、0.01的临界值分别是3.06,4.89,因此它们的拒绝域分别为:F3.06和F4.89;实验结论:因为F=6.2213532;而且检验水平为0.05、0.01的拒绝域分别为:F3.06和F4.89;所以按0.05、0.01的检验水平,均拒绝原假设,即有理由拒绝日、美在华投资企业对中国经济环境评价的均值相等,也就是认为它们存在显著的差异。5.思考与练习:⑴利用SAS软件对课本【1】中习题1和习题2进行分析。参考文献【1】于秀林、任雪松(1999):《多元统计分析》,中国统计出版社。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功