奥鹏远程教育中心助学服务部地大《统计学》第五章假设检验课堂笔记主要知识点掌握程度假设检验是统计推断的组成部分,本章讨论的主要内容是:对总体的未知参数作出某种假设,然后抽取样本,构造适当的统计量,对假设的正确性进行判断的一套程序。学习本章时,重点理解假设检验的基本思想和基本原理,掌握假设检验的步骤,并利用这些方法对未知参数的假设进行检验。本章例题较多大家看懂后要多做练习,掌握巩固。知识点整理一、假设检验的一般问题参数估计:用样本假设检验:对u提出假设,用检验假设是否成立.(一)什么是假设检验(了解)假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。它是进行经济管理和决策的有利工具。(二)假设检验步骤(掌握)1、提出原假设和替换假设;2、确定统计量;3、规定显著性水平;4、计算检验统计量的值;5、进行决策。(三)假设检验中的小概率原理(理解)所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,我们可以作出是否接受原假设的决定。(四)假设检验中的两类错误(理解)假设检验是根据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对正确,它也可能犯错误。所犯的错误有两种类型:1.弃真错误,又称错误。2.取伪错误,又称错误。二、假设检验方法(一)假设检验不同类型(掌握)1.双侧假设检验奥鹏远程教育中心助学服务部、单侧假设检验(二)均值检验(掌握)1.总体方差已知【例5.3】某机床厂加工一种零件,根据检验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。试问新机床加工零件的椭圆度总体均值与以前有无显著差别?解:按照假设检验的五个步骤进行第一步:建立假设第二步:选统计量奥鹏远程教育中心助学服务部第三步:规定水平.令=0.05(已知)第四步:计算检验统计量第五步:决策【例5.4】某纺织厂生产人造纤维,已知其平均拉力强度为1.56公斤,标准差为0.22公斤。现在进行某种工艺改革试验,改革后可以提高生产效率。若改革后质量没有明显下降,则可以进行全面改革,否则就不准备改革。现抽取了50个单位为样本,测得样本的平均拉力强度为1.46公斤,人造纤维的拉力强度服从正态分布。试利用样本的观察结果,对是否进行这项工艺改革作出决策。解:(1)建立假设(2)确定统计量已知.选Z统计量(3)确定.奥鹏远程教育中心助学服务部令.。因为拒绝域在左侧,所以(4)计算检验统计量.(5)决策.因为故拒绝,接受.2、总体方差末知用代替,这时需用统计量代替Z统计量.【例5.6】某机器制造出的肥皂厚度为5公分,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3公分,样本标准差为0.3公分,试分别以0.05,0.01的显著性水平检验机器性能良好(即厚薄合乎规定)的假设。解:首先,建立原假设和替换假设然后,选择检验统计量,由于总体方差未知,用样本代替,故用统计量。根据题中所给条件:,,,,统计量的计算为:【例5.7】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由120个轮胎组成的随机样本作了试验,测得平均值和标准差分别为,。已知轮胎寿命的公里数近似服从正态分布。我们能否根据这些数据作结论,该制造商的产品同他所说的标准相符?()解:这是一个右单侧检验问题,总体方差未知,用检验统计量。由于,落入拒绝域,故拒绝,接受,可以认为该制造商的声称是可信的,其生产的轮胎平均寿奥鹏远程教育中心助学服务部公里。总结:总体方差未知,小样本,必须用t检验,若是大样本,z、t差别不大,但t更精确些。(三)总体比例的假设检验用z统计量进行检验(四)两个总体均值之差的检验1、两正态总体方差已知【例5.9】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出产品抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为,测得公斤,公斤。问这两种方法生产出来的产品的平均抗拉强度是否有显著差别。()解:由于检验两种方法生产出的产品在抗拉强度上是否存在显著差别,并未涉及方向,所以是双侧检验。由于,所以拒绝,这两种方法生产出的产品其抗拉强度有显著差别。2、两正态总体方差未知两总体方差未知却相等的条件下,选用t作为检验统计量。t值计算为:【例5.10】一个车间研究用两种不同的工艺组装某种产品所用时间是否相同。让一个组的10名工人用第一种工艺组装该种产品,平均所需时间为26.1分钟,样本标准差为12分钟。另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且,试问能否认为用第二种方法组装比第一种方法更好?解:两个总体均服从正态分布,虽然未知,但知道,因此可用t作为检验统计量。根据题意,若认为第二种方法比第一种方法好,就是认为用第二种方法组装的平均时间比第一种方法少,即提出假设:奥鹏远程教育中心助学服务部这是个右侧检验问题,拒绝域在分布曲线的右侧,临界值为正值。t的自由度为临界值为:若计算出的t值大于,则拒绝。由题中给定的条件:由于,故接受,不能认为第二种方法组装更有效。3、两总体比例之差的检验设两个总体服从二项分布,这两个总体中具有某种特征单位数的比例分别为,但未知,可以样本比例代替。这时两个比例之差近似地服从以为数学期望,为方差的正态分布。因而,可以选择Z作为检验统计量:【例5.11】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训;乙厂:调查40人,14人参加技术培训。奥鹏远程教育中心助学服务部能否根据以上调查结果认为乙厂青年工人参加技术培训的人数比例高于甲厂?()解:这是一个左侧检验问题,拒绝域在分布曲线的左侧,临界值为负值。由题知:由于,所以接受,即不能认为乙厂青年工人参加技术的人数比例高于甲厂。三、假设检验方法的总结(一)假设检验与参数估计的关系在参数估计中,我们是根据样本所提供的信息,对未知的总体参数进行估计,即求出置信区间,并以一定的概率保证总体参数落在该区间内。越小,置信区间就越宽。在假设检验中,当确定和选择检验统计量之后,临界值的位置就已经确定,实际上,由临界值围成的接受域就是以为中心的置信区间。检验假设是否成立,就是看的统计量是否落在这个置信区间内。如果假设为真,的统计量落在置信区间外的可能性是很小的;而如果一旦落在外面,利用“小概率原理”就可以推断为伪。越小,置信区间越宽,接受域也就越大,从而就使得犯“弃真错误”的可能性变小。因为假设检验和参数估计对同一实例而言,用的是同一个样本,同一个统计量,同一种分布,因此也可以利用置信区间进行假设问题的检验。【例5.12】一种元件,要求其使用寿命应达到1000小时。现从一批这种元件中随机抽取了49件,测得其平均寿命为950小时。已知该种元件寿命服从标准差为100小时的正态分布,试在显著性水平0.05下确定这批元件是否合格。奥鹏远程教育中心助学服务部实际问题中,使用寿命高于规定标准自然成为合格品,所以我们更关心置信区间的下限值:由于样本均值,所以拒绝,即认为这批元件没有达到合格标准。(二)如何建立假设附录:用Excel进行假设检验本章介绍的假设检验包括一个正态总体的参数检验和两个正态总体的参数检验。对于一个正态总体参数的检验,可利用函数工具和输入公式的方法计算统计量,并进行检验。1、两个总体均值之差的检验:已知,大样本。下面我们结合一个例子说明检验的操作步骤。【例】为了评价两个学校的教学质量,分别在两个学校抽取样本,在A学校抽取30名学生,在B学校抽取40名学生,对两个学校的学生同时进行了一次英语标准化考试,成绩如附表7-1。假设学校A考试成绩的方差为64,学校B考试成绩的方差为100。检验两个学校的教学质量是否有显著差异。(=0.05)奥鹏远程教育中心助学服务部(单位:分)学校A学校B假定我们将上表中学校A的数据输入到工作表中的A1:A30,学校B的数据输入到工作表的B1:B40。检验的步骤如下:第1步:选择“工具”下拉菜单第2步:选择“数据分析”选项第3步:在分析工具中选择“Z检验:二样本平均差检验”第4步:当出现对话框后在“变量1的区域”方框内键入A1:A30在“变量2的区域”方框内键入B1:B40在“假设平均差”方框内键入0在“变量1的方差”方框内键入64在“变量2的方差”方框内键入100在“”方框内键入0.05在“输出选项”中选择输出区域(在此选择“新工作表”)选择“确定”输出结果下表。由于,所以拒绝。即两个学校的教学质量有差异。2、两个总体均值之差的检验:未知,小样本我们还是通过一个例子说明操作的步骤。奥鹏远程教育中心助学服务部【例】工厂管理人员对采用两种方法组装新产品所需的时间(单位:分钟)进行测试,对方法A随机抽取6个工人,方法B抽取8个工人,测试的结果如附表7—3。假设组装的时间服从正态分布,以的显著性水平比较两种组装方法是否有差别。第1步:选择“工具”下拉菜单第2步:选择“数据分析”选项第3步:在分析工具中选择“检验:平均值的成对二样本分析”第4步:当出现对话框后在“变量1的区域”方框内键入A2:A7在“变量2的区域”方框内键入B2:B9在“假设平均差”方框内键入0在“”方框内键入0.05在“输出选项”中选择输出区域(在此选择“新工作表”)选择“确定”输出结果如下表。由于,接受,表明两种方法无显著差别。