商务与经济统计07

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1SlideChapter7抽样和抽样分布2Slide本章主要内容简单随机抽样点估计抽样分布样本平均值的抽样分布样本比例的抽样分布抽样方法xpn=100n=303Slide统计推断统计推断的目的是利用样本的信息推断总体的信息总体是指感兴趣的所有元素的集合样本是总体的一个子集通过样本统计量对总体参数进行估计只要抽样方法恰当,通过样本统计量可以对总体参数进行很好的估计4Slide简单随机抽样有限总体•从一个容量为N的总体中进行简单随机抽样,是指使得任何一个样本容量为n的样本被抽中的概率相等•有限总体的简单随机抽样可以分为有放回抽样和无放回抽样•通常最多使用的是无放回抽样5Slide无限总体•只要满足以下两个条件就可以认为是从无限总体中进行了简单随机抽样•抽中的每个元素都来自于同一个总体•每个元素都是独立抽取的简单随机抽样6Slide无限总体•如果无法知道总体中究竟有多少个元素,或者总体数量太大,通常可以认为是无限总体•对于无限总体,无法使用与有限总体相同的抽样方法简单随机抽样7Slide点估计使用样本统计量直接作为总体参数的估计,称为点估计如果点估计值的期望值等于总体参数,就称这个点估计为无偏估计8Slide抽样误差无偏点估计值与总体参数之间的差的绝对值称为抽样误差抽样误差的存在是因为我们只用了部分数据(样本)来估计总体的参数||x||s||pp9Slide举例:海珠保险公司海珠保险公司招聘保险经纪人,共有900人填写了申请表并参加了考试。总经理希望知道平均考试成绩,以及有多少比例的申请者从来没有相同的工作经验。10Slide可以用以下三种方法满足总经理的要求:•统计所有900个申请者的考试成绩和工作经验•使用随机数表随机选择30个申请者作为样本进行研究•使用计算机生成随机数选择30个申请者作为样本进行研究11Slide考察所有900个申请者•考试成绩•总体平均成绩•总体标准差ix990900ix2()8090012Slide考察所有900个申请者•无相同工作经验的申请者比例•总体比例p648.7290013Slide使用随机数表随机选择30个申请者作为样本进行研究,从书上随机数表第三列开始三位随机数申请者编号744No.744436No.436865No.865790No.790835No.835902超过900190No.190436已经出现过etc.etc.14SlideNo.随机数申请人考试成绩工作经验1744小强1025无2436小丽950无3865阿花1090有4790小伟1120无5835大雄1015有.....30685阿健965无15Slide通过Excel生成随机数进行抽样ABCD1申请人编号考试成绩是否具有类似工作经验随机数211008无=RAND()321025有=RAND()43952无=RAND()541090无=RAND()651127无=RAND()761015有=RAND()87965无=RAND()981161有=RAND()第10至第901行省略16SlideABCD1申请人编号考试成绩是否具有类似工作经验随机数211008无0.72213321025有0.2829243952无0.65246541090无0.81491651127无0.51586761015有0.4821887965无0.91929981161有0.23237第10至第901行省略17SlideABCD1申请人编号考试成绩是否具有类似工作经验随机数2121107有0.0002737731043无0.001924408991无0.003035581008有0.0048161161127无0.005387185982无0.0058385101163无0.0064993941008有0.00667第10至第901行省略18Slide点估计•作为的点估计值•s作为的点估计值•作为p的点估计值xpixx29,9109973030ixxs2()163,99675.22929p2030.6819Slide值得注意的是,不同的随机数会导致不同的抽样,也就会导致对总体参数的不同的点估计值20Slide的抽样分布统计推断的过程总体均值=?从总体中抽取样本容量为n的样本x计算样本平均值x用作为的点估计x21Slide的抽样分布是指所有可能的样本平均值的概率分布的期望值E()==总体平均值的抽样分布xxxxx22Slide的标准差有限总体无限总体•当n/N.05时,可以将一个有限总体看作是无限总体•称为有限总体校正因子.•也称为样本均值的标准误xxnNnN()1xn()/()NnN1xx的抽样分布23Slide中心极限定理:只要样本容量足够大(n30),不管总体服从什么分布,样本平均值都可以认为近似服从正态分布。如果样本容量不够大(n30),只有在总体服从正态分布的条件下,样本平均值才可以认为服从正态分布xx的抽样分布x24Slide申请人平均成绩的抽样分布xxn8014.630Ex()990x25Slide在前面抽取的30个申请人作为一个样本,请问样本平均考试成绩在总体平均考试成绩+10分范围内的概率是多少?前面我们已经知道总体平均成绩为990分,则换句话说,样本平均成绩在980分至1000分之间的概率是多少?26Slidex的抽样分布x1000980990面积=?27Slide980和1000对应的z值为+10/14.6=+0.68,通过标准正态分布表,可以查到所求的面积=(0.2518)(2)=0.5036也就是说,样本平均值在总体平均值+/-10分范围内的概率为0.503628Slidex的抽样分布x1000980990面积=2(.2518)=.503629Slide的抽样分布是指所有可能的样本比例的概率分布的期望值p=总体比例的抽样分布ppppEpp()30Slide的标准差有限总体无限总体•也称为样本比例的标准误的抽样分布pppppnNnN()11pppn()1p31Slide的抽样分布当样本容量足够大的时候,可以近似认为服从正态分布与平均值的抽样分布不同的是,当满足下列条件时,才可以认为是大样本:np5andn(1–p)5pp32Slide的抽样分布如果p接近0.5,样本容量只要到10就可以认为是大样本而如果p接近于0或者接近1,则需要非常大的样本容量才可以认为是大样本p33Slide申请人中没有类似工作经验者的比例的分布已知总体比例p=0.72,则:np=30(.72)=21.65n(1-p)=30(.28)=8.45所以样本比例近似服从正态分布pp34Slidep.72(1.72).08230().72Ep35Slide样本比例在总体比例p+0.05范围内的概率为多大?换句话说,样本比例在0.67至0.77之间的概率有多大?p36Slidep的抽样分布0.770.670.72面积=?pp37Slide0.67和0.77对应的z=+.05/.082=+.61,相应面积=(.2291)(2)=.4582.38Slidep的抽样分布0.770.670.72面积=2(.2291)=.4582pp39Slide抽样方法分层抽样集群抽样系统抽样方便抽样判断抽样40SlideEndofChapter741Slide课堂练习1.样本统计量所有可能值的概率分布称为:a.样本统计量b.总体参数c.简单随机抽样d.抽样分布42Slide正确答案:d.抽样分布43Slide2.总体的特征值,例如总体平均值,称为:a.统计量b.参数c.样本d.以上都不是44Slide正确答案:b.参数45Slide3.样本的特征值,例如样本平均值,称为:a.统计量b.参数c.样本d.以上都不是46Slide正确答案:a.统计量47Slide4.一个点估计值的标准差称为:a.标准差b.标准误c.点估计d.以上都不是48Slide正确答案:b.标准误49Slide5.使得我们可以通过样本容量的大小判断样本统计量是否服从正态分布的定理是:a.Bayes’定理b.Chebyshev定理c.中心极限定理d.以上都不是50Slide正确答案:c.中心极限定理51Slide6.如果一个点估计值的期望值等于总体参数,则称这个点估计值具有:a.一致性b.稳定性c.无偏性d.以上都不是52Slide正确答案:c.无偏性53Slide7.当下面哪个条件成立时,需要在计算标准误时考虑有限总体校正因子?a.n/N30b.N/n0.05c.n/N0.05d.n/N0.0554Slide正确答案:d.n/N0.0555Slide8.从一个均匀分布的总体中抽取一个样本容量为45的样本,样本平均值服从什么分布?a.指数分布b.正态分布c.均匀分布d.无法判断56Slide正确答案:b.正态分布57Slide9.总体平均值为75,标准差为10。从中抽取一个容量为20的样本,请问样本平均值的期望值等于多少?a.2.236b.10c.75d.无法判断58Slide正确答案:c.7559Slide10.总体平均值为75,标准差为10。从中抽取一个容量为20的样本,请问样本平均值的标准差等于多少?a.2.236b.10c.75d.无法判断.60Slide正确答案:a.2.23661Slide11.总体平均值为75,标准差为10。从中抽取一个容量为20的样本,请问样本平均值服从什么分布?a.指数分布b.正态分布c.均匀分布d.无法确定62Slide正确答案:d.无法确定63Slide12.总体容量为500,平均值为10,标准差为3。从中抽取容量为81的样本。样本标准差=?a.0.3054b.0.3333c.0.9163d.364Slide正确答案:a.0.305465Slide13.海珠保险公司人事部经理已经知道此次招聘考试平均成绩为1103分,标准差为95分。抽取40个申请人作为样本,样本平均成绩超过1120分的概率有多大?a.0.1292b.0.3708c.0.6292d.0.870866Slide正确答案:a.0.129267Slide14.海珠保险公司人事部经理已经知道此次招聘考试平均成绩为1103分,标准差为95分。抽取40个申请人作为样本,样本平均成绩超过1100分的概率有多大?a.0.0793b.0.4207c.0.5793d.0.920768Slide正确答案:c.0.579369Slide15.已知海珠保险公司的员工中40%为女性。随机抽取了50名员工作为样本,女性所占比例的期望值等于多少?a.0.0693b.0.4c.16d.5070Slide正确答案:b.0.471Slide16.已知海珠保险公司的员工中40%为女性。随机抽取了50名员工作为样本,样本中女性占35%到45%的概率有多大?a.0.0693b.0.2642c.0.5284d.0.7272Slide正确答案:c.0.528473Slide17.从总体中每隔k个元素抽取一个元素,直到满足样本容量的要求,这种抽样方式称为:a.集群抽样b.简单随机抽样c.分层抽样d.系统抽样74Slide正确答案:d.系统抽样

1 / 74
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功