第3讲单样本非参数检验2二项分布检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

•问题:公司预计新招聘员工中业绩好的比例为0.6。为了验证上述推断,公司从新招聘来的员工中随机抽取32人进行业绩考核,属于业绩好的有28个(用1表示),属于业绩不好的有4个(用2表示)。分析员工业绩是否同预期一致。第3讲单样本非参数统计—2(二项分布检验)传统的非参数统计•单样本非参数检验•两样本(独立和相关)非参数检验•多样本(独立和相关)非参数检验Continue_主讲方法:◆卡方检验◆二项分布检验◆科尔莫戈罗夫-斯米尔诺夫(Kolmogorov-Smirnov)检验◆游程检验4.1二项分布检验的思想和方法现实生活中有很多数据的取值是二值的:人群可以分成男性和女性产品可以分成合格和不合格投掷硬币试验的结果可以分成出现正面和出现反面……通常这样的二值可以分别用1和0表示1为事件发生,0为不发生,取值为0和1的随机变量的分布称为:0-1分布换个角度,试验N次,以1出现的次数为随机变量,其取值范围是0-N该变量就服从二项分布0-分布和二项分布的区别第一,随机变量不同前者变量值是1和0,后者变量值是试验N次,1的可能次数第二,随机变量的取值范围不同前者取值范围是0和1后者取值范围是0-N测验:题1:男,男,女,女,女,女,男,女,女,男,女,男,男这是0-1分布还是二项分布?答案:0-1分布题2:抽查了13个人,男生6人,这是0-1分布还是二项分布?答案:二项分布定义★任意一次实验中,只有事件A(如正面)发生和不发生两种结果,发生的概率分别为P和1-P.★若在相同条件下,进行N次独立重复试验,用X表示这N次试验中事件A发生的次数(k=0,1,2…),那么X服从二项分布,记作X~B(N,P),也叫Bernolli分布。kNkkNPPCkXP)1()(二项分布检验是做什么的呢?P=0.70.8?二项分布检验就是通过样本数据检验总体是否服从指定概率P值的二项分布。二项分布检验的过程:(1)建立零假设和备择假设:样本来自的总体服从指定P值的二项分布0H1H:样本来自的总体不服从指定P值的二项分布20n★当时,可以构造统计量(德莫弗-拉普拉斯定理)(2)构造统计量)1(5.0pnpnpkZ2nk时取加号,否则取减号(正态性近似的连续型修正,提高近似程度)。二项分布与正态分布之间的关系(3)设定显著水平和确定否定域★当,零假设成立时,统计量20n)1(5.0pnpnpkZ近似服从正态分布,在显著性水平为时,否定域)1,0(N21zZZ4.1二项分布检验的思想和方法二项分布检验的过程:(4)计算统计量和做出统计决策★当,计算统计量,如果统计量值落在拒绝域20n)1(5.0pnpnpkZ21zZZ拒绝原假设;否则接受零假设。4.2二项分布检验的例题(大样本量)例子:公司预计新招聘员工中业绩好的比例为0.6。为了验证上述推断,公司从新招聘来的员工中随机抽取32人进行业绩考核,属于业绩好的有28个(用1表示),属于业绩不好的有4个(用2表示)。分析员工业绩是否同预期一致。解答过程:该问题是检验业绩好的员工是否同预期概率0.6一致,因此该问题转化为检验业绩好员工比例是否服从P值为0.6的二项分布。求解过程如下。解答过程:(1)建立零假设和备选假设0H:业绩好的新员工服从P值为0.6的二项分布1H:业绩好的新员工不服从P值为0.6的二项分布k=28,p=0.6,n=32,k=28(n/2)=16,计算统计量解答过程:(2)构造和计算统计量995.2)6.01(6.0326.0325.028)1(5.0pnpnpkZ该统计量近似服从N(0,1)的正态分布。96.1975.0zZZ解答过程:(3)设定显著水平和确定否定域在显著性水平=0.05,否定域为解答过程:(4)做出统计决策由于Z=2.995,落在拒绝域,拒绝零假设,业绩好的员工比例不服从P值为0.6的二项分布,即业绩好的新员工比例不为0.6.96.1975.0zZZ4.3二项分布检验的软件实现(1)输入数据,方法1:原始数据法,如下:•输入数据方法2:频数法注意:频数数据要加权4.3二项分布检验的软件实现(2)按照Analyze菜单→NonparametricTests→Binomial顺序选中二项分布检验计算模块,如图所示弹出对话框:待检验变量变量分类方法如果检验变量为二值变量,则选第一项;如果检验变量不是二值变量,则可在Cutpoint框后输入具体数值,小于等于该值的观察值为第一组,小于等于该观察值的为第二组。检验的P值(3)结果解读BinomialTest128.9.6.001a24.1321.0Group1Group2TotalVAR00001CategoryNObservedProp.TestProp.Asymp.Sig.(1-tailed)BasedonZApproximation.a.二项分布检验的R操作binom.test(x,N,P)4.4作业•1、用卡方检验住前面例题。•2、根据以往经验,新生儿染色体异常率一般为1%,现某医院观察了当地共400名新生儿,只发现一例染色体异常,数据见binominal.sav.问可否推断该地区新生儿染色体异常率低于一般水平?•3、某保险公司主管部门经理估计投保人中35岁以上者占65%,随机抽取38人,结果35岁以上者有24人(样本成数为0.63),设,问主管经理的估计是否可靠?4.4作业•4某地区成年人中吸烟占75%,经过戒烟宣传后,进行了抽样调查,发现100名被调查者中,有63人吸烟,问戒烟宣传是否收到了成效?

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功