第六章统计推断第一节统计推断及其特点第二节参数估计第三节假设检验第一节统计推断及其特点1.1统计推断的特点1.2总体参数和样本统计量1.3统计推断的基本条件1.4统计推断的误差2020/3/9第五章抽样推断31.1统计推断及其特点统计推断(抽样推断)—按随机原则从总体中抽取部分单位构成样本,在一定的可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。统计推断的方法:—总体参数的估计—总体参数的假设检验。2020/3/9第五章抽样推断4统计推断的特点1.统计推断必须遵循随机原则。2.对抽样误差可以事先加以计算和控制。3.具有经济性、时效性,应用广泛的特点。4.可对全面调查的结果进行检验和修正。1.1统计推断及其特点2020/3/9第五章抽样推断5利用样本统计量推断总体参数目的特点易求未知不唯一、随机变量唯一、常量性质样本的指标总体的指标含义1.2总体参数和样本统计量常见XPX、、xSpx、、样本统计量总体参数总体参数与样本统计量的比较2020/3/9第五章抽样推断6NXXX22xxxS-1n1.2总体参数和样本统计量NXXXXN21nxxxxn21NNP1nnp1PPP1ppp1样本统计量总体参数和样本统计量的计算公式总体参数2020/3/9第五章抽样推断71.3统计推断的基本条件统计推断的基本条件1.选择统计量—优良估计量。2.合适的允许误差—精确性。3.可接受的置信度—可靠性。精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。2020/3/9第五章抽样推断81.4统计推断的误差统计误差登记性误差代表性误差系统误差抽样误差可消除可消除可控制统计误差的分类2020/3/9第五章抽样推断9抽样误差1.抽样实际误差:对某一样本而言,由随机因素引起的样本统计量与总体参数在数量上的差异就是抽样实际误差。xX1.4统计推断的误差2020/3/9第五章抽样推断102.抽样平均(标准)误差:抽样平均误差是抽样平均数的标准差,它反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均差异程度。nnpx1XPP1.4统计推断的误差2020/3/9第五章抽样推断11总体标准差σ(X)和成数P的确定:总体变化不大,采用过去总体指标数值做代替;用样本标准差σ(x)或样本成数p替代;对于成数,可取P=0.5;如果有多个P值,取其最接近0.5的P做替代。1.4统计推断的误差2020/3/9第五章抽样推断123.抽样极限(允许)误差是样本统计量与被估计的总体参数之绝对离差的最大允许值,常用Δ表示,可简称为极限误差或允许误差。pxPpXx;1.4统计推断的误差2020/3/9第五章抽样推断13Δ和μ的关系:ZZZ—概率度,Z表示以抽样平均误差为标准单位对极限误差的度量值。由Z确定的概率保证程度F(Z)—置信度。1.4统计推断的误差2020/3/9第五章抽样推断14极限误差标准化的意义:Z~N(0,1)μZZZ0ΔΔSXXX2μ,XN~x1.4统计推断的误差第二节参数估计2.1参数估计概述2.2点估计2.3区间估计2.4样本容量的确定2020/3/9第五章抽样推断162.1参数估计概述参数估计就是以样本统计量来估计总体参数。参数估计要求:1.精确性—适当的极限误差范围;2.可靠性—估计结果正确的概率。参数估计—点估计和区间估计。2020/3/9第五章抽样推断172.2点估计点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计值,点估计又称为定值估计。常用的点估计量有:222()ˆˆˆ1xxXxPpSn2020/3/9第五章抽样推断18优良估计量的三个标准:XxxE—样本平均数PppE—样本成数E(统计量)=总体参数1.无偏性:2.2点估计2020/3/9第五章抽样推断192.一致性:1εXxPlimn1εPlimn参数总体统计量本样优良估计量的三个标准:2.2点估计2020/3/9第五章抽样推断20nXσxσxXX优良估计量的三个标准:2.2点估计2020/3/9第五章抽样推断213.有效性:σσ其他估计量优良估计量22cσxσ22优良估计量的三个标准:2.2点估计2020/3/9第五章抽样推断22xXpPX2122nxxxSpppP122优良估计量总体参数2.2点估计2020/3/9第五章抽样推断23推断总体反映样本的离散程度作用公式符号样本方差nxx212nxxx2xS22.2点估计2020/3/9第五章抽样推断24xXPˆp总体参数的点估计:原则:总体参数估计值就取统计量的值作用:区间估计的基础。优点:1.简单明了;2.能提供具体估计值。缺点:1.无法提供误差情况;2.估计的可靠程度无从知晓。2.2点估计2020/3/9第五章抽样推断252.3区间估计一区间估计的含义:概率P=1-α=?区间大小—估计的精确性;概率高低—估计的准确性。总体参数θ1ˆ1ˆ2020/3/9第五章抽样推断261.区间的确定:ΔΔ1.区间的中心—统计量的值,如:2.区间的半径Δ—允许(极限)误差。xxxpx、2.3区间估计2020/3/9第五章抽样推断272.概率的确定:ΔΔXx-x的分布Xxxxxxxxxxx2.3区间估计2020/3/9第五章抽样推断28只要样本平均数在以总体平均数为中心、以Δ为半径的区间内,则总体平均数就会落在以样本平均数为中心、以Δ为半径的区间内。XXxx2.概率的确定:2.3区间估计2020/3/9第五章抽样推断29αxXxP1的分布xSΔΔXXxxxx2.3区间估计其中,α为风险度1XxXP2020/3/9第五章抽样推断30ΔΔSXNx2,~XXXZZ0ZZ和极限误差的标准化:XxZNZ10,~S2.3区间估计2020/3/9第五章抽样推断31二总体平均数的区间估计:ΔΔxx1ZF:X,ZFZFZZx2.3区间估计2020/3/9第五章抽样推断32ΔΔxx1ZF:X进行区间估计,求给定,1ZFZx2.3区间估计2020/3/9第五章抽样推断332.3区间估计(1)抽样,计算x区间的中心(2)计算抽样平均误差:nX(4)计算极限误差:Z估计区间半径—(5)写出估计区间xxX,:内容步骤总体平均数的估计:已知给定,,.1XZFZZZF查表根据1)(22020/3/9第五章抽样推断34【例5-2】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为4小时。如果已知总体的标准差σ=1.5小时。试求该地区内居民每天看电视的平均时间的置信区间。(置信度是95%)2.3区间估计2020/3/9第五章抽样推断352.3区间估计小时=【解】15.01005.1nX%9541005.1ZFxnX小时小时已知:小时29.015.096.1Z小时29.4,71.329.04,29.04:X96.1975.0)(%95ZZZF由2020/3/9第五章抽样推断36ΔΔxx1ZF:X进行区间估计,求给定,2ZFZx2.3区间估计2020/3/9第五章抽样推断372.3区间估计(1)抽样,计算x区间的中心(2)计算抽样平均误差:nX(4):和根据xxxX,:内容步骤总体平均数的估计:已知给定,,.2X)(1)(2)(ZFZZZ查表计算2020/3/9第五章抽样推断38【例5-3】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为4小时。如果已知总体的标准差σ=1.5小时。试求该地区内居民每天看电视的平均时间的置信区间。(要求估计误差不超过27分钟)2.3区间估计2020/3/9第五章抽样推断392.3区间估计小时=【解】15.01005.1nX小时分钟小时小时已知:45.02741005.1xnX315.045.0Z小时45.4,55.345.04,45.04:X%74.991)3(23F2020/3/9第五章抽样推断40xxX,:2.3区间估计3.总体方差未知,总体平均数的估计总体方差未知,可用样本标准差S代替总体标准差σ,计算抽样平均误差μ。分布~nXxXxxSt12ntt2020/3/9第五章抽样推断41【例5-4】从某校学生中随机抽取25人,调查到他们平均每天参加体育锻炼的时间为25分钟,标准差为8分钟。试以95%的置信水平估计该校学生平均每天参加体育锻炼的时间。2.3区间估计2020/3/9第五章抽样推断42分钟=【解】6.1258nxS%9582525ZFxSxn分钟分钟已知:%95tF由分钟3.28,7.213.325,3.325:X06421252050.t.2.3区间估计分钟30.36.1064.2t2020/3/9第五章抽样推断43三总体成数的区间估计成数是一个特殊的平均数,它是交替标志的平均数。可以应用总体平均数的估计方法来对总体成数进行估计。2.3区间估计2020/3/9第五章抽样推断442.3区间估计抽样,计算估计区间的中心(1)p计算(2)nppp1计算(4)Z写出:(5)ppP,:内容给定F(Z),总体成数P的区间估计:步骤Z)](1[21Z,查表)(从而根据ZFZF2020/3/9第五章抽样推断45【例5-5】某工厂要估计一批总数5000件的产品的废品率,于是随机抽出400件产品进行检测,发现有32件废品。在置信度为90%的要求下,试给出该批产品的废品率的区间估计。2.3区间估计2020/3/9第五章抽样推断462.3区间估计%840032p样本废品率【解】%9032,4001ZFnn件,件已知:npp1%36.140008.0108.0%24.2%36.1645.1Z%24.10%,76.5%24.28%,24.2%8:P645.195.0Z%90ZZF,)(由2020/3/9第五章抽样推断472.3区间估计抽样,计算估计区间的中心(1)p计算(2)nppp1写出:(4)ppP,:内容给定Δ,总体成数P的区间估计:步骤计算(3)ppZ1-Z2ZZ)(得),(F查表1-Z2ZZ)(得),(F2020/3/9第五章抽样推断48【例5-6】某商场经理想了解顾客对他们服务的满意度,随机抽取100名顾客进行调查,知90人满意他们的服务。要求估计误差范围不超过6%,试进行区间估计。2.3区间估计2020/3/9第五章抽样推断492.3区间估计%nn6901001人人已知%nnp90100901【解】nPP1%31009.019.02%3%6Z%96%,84%6%