六西格玛之分析阶段 S8 45 置信区间 p28

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

置信区间-0-置信区间(ConfidenceIntervals)置信区间-1-DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定多变量研究中心极限定理假设检验置信区间方差分析,均值检验卡方检验相关/回归分析Step7-Data收集路径位置理论课置信区间-2-目录置信区间介绍总体均值的置信区间总体标准差的置信区间Cp的置信区间置信区间例题置信区间-3-抽样估计:根据样本提供的信息对总体的某些特征进行估计或推断。估计量或统计量:用来估计总体特征的的样本指标;总体参数:待估计的总体指标。所以对总体数字特征的抽样估计也叫参数估计。可分为:点估计和区间估计。总体样本抽取样本零假设备择假设P-value预测总体特征统计性推断总体参数统计量参数估计置信区间-4-区间估计:根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。利用基于统计学的置信区间来量化样本的不确定性置信区间-5-设总体参数为θ,θL、θU为样本确定的两个样本量,对于给定的α(0<α<1),有P(θL≤θ≤θU)=1-α则称(θL,θU)为参数θ的置信度为1-α的置信区间。该区间的两个端点θL、θU分别称为置信下限和置信上限,通称为置信限。α为显著性水平;1-α则称为置信度,置信区间的定义置信区间-6-•它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。•置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知总体参数的区间。•置信区间的直观意义为:若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体参数真值。置信区间的意义置信区间-7-绝大多数情况下,我们计算95%的置信区间(CI)这可解释为100中大约95的CI将包含总体参数,或者我们95%确信总体参数在此区间内反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内(正态分布时Z=±2s内的概率约为95%.)如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%.95%的置信区间置信区间-8-求参数置信区间时可参考下面的通用格式:置信区间=统计量±K*(标准误差)这里,统计量=均值、方差、Cp等K=基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布我们将考虑如下的置信区间:1)总体均值u的置信区间;2)总体方差σ的置信区间;3)工程能力Cp的置信区间;4)总体比例P的置信区间;置信区间介绍置信区间-9-1-1)总体方差已知时,正态总体均值的区间估计1)总体均值的置信区间xZxZ+aas()m//22xs()x[一般公式]其中x称为样本均值;称为对应于a/2的Z值;称为抽样平均误差;称为抽样极限误差(△x)Za/2s(x)Za/2s(x)置信区间-10-[例题1]某企业从长期实践得知,其产品直径X是一个随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。[Minitab解法]①将题中的6个数据输入到Minitab中的C1列②路径:统计→基本统计→单样本Z…③输入相关参数(参考右图)置信区间-11-④输出结果:⑤结论:该产品直径的均值置信区间为(14.96,15.04)cm平均值变量N平均值标准差标准误95%置信区间C1615.00000.21910.0204(14.9600,15.0400)当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的方法与上述方法相同;大样本情况下,当总体方差未知而用样本方差代替时,由于t分布可用正态分布近似,所以对总体均值的估计也采用上述方法。[注意]置信区间-12-[例题2]某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的置信区间。[Minitab解法]①打开Minitab②路径:统计→基本统计量→单样本Z…置信区间-13-④输出结果:⑤结论:平均产量的均值置信区间为(34.0979,35.9021)件平均值N平均值标准误95.5%置信区间10035.0000.450(34.098,35.902)③输入相关参数(参考下图)置信区间-14-1-2)总体方差未知时,正态总体均值的区间估计(小样本)[一般公式]其中x称为样本均值;称为对应于a/2,自由度为n-1的的t值;称为抽样极限误差(△x)ta/2,n-1xtnxtnnn+aasms/,/,2121SSta/2,n-1sn置信区间-15-[例题3]某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→单样本t…置信区间-16-③输入相关参数(参考右图)④输出结果:⑤结论:该产品每袋重量的均值置信区间为(778.841,803.359)克;允许误差:2.262*5.419=12.26(克)平均值变量N平均值标准差标准误95%置信区间C110791.1017.145.42(778.84,803.36)置信区间-17-2)总体标准差的置信区间[一般公式](小样本)其中s称为样本标准差;称为对应于a/2的Chi-Square值;称为自由度;χ2a/2n1//scsscaann1122122SS置信区间-18-123257..s166161166161166161166161166161274916616162605221052202529752........././..csccscs假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。自由度()为16-1或15。Sigma的95%(a=.05)置信区间是:置信区间-19-[例题4]用[例题3]的10个数据求标准差的置信区间[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→图形化汇总…置信区间-20-810800790780770760中位数平均值805800795790785780775第一四分位数777.50中位数791.50第三四分位数807.00最大值813.00778.84803.36776.58807.3711.7931.28A平方0.19P值0.869平均值791.10标准差17.14方差293.66偏度-0.379718峰度-0.914935N10最小值762.00Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间95%置信区间C1摘要④结论:样本的标准差是17.14,总体标准差的95%的置信区间在11.79和31.78之间。③输出结果置信区间-21-Cpn-1CpCpn-11-/2,n-12/2,n-12ccaaCpn-1CpCpn-11-/2,n-12/2,n-12ccaa229191922989119328519157975192025192......,.,ccCP2.29CP2.29Cp3.01这就是说,我们有95%把握说真实的Cp值在1.57和3.01之间Cp=2.29(n=20)的95%置信区间计算如右:/2-1-n21,21,1的百分数上限和下限平方分布的的是自由度为和其中acccaann3)工程能力Cp的置信区间[一般公式]置信区间-22-我们将定义一个过程,其目标值为70,USL=100,LSL=40.班上的每个人都从一个平均值=70,标准差=10的分布中产生20个随机正态数字假设我们的“真实的”Cp=1.00.产生数据后,先用Minitab计算出Cp;再用前面的公式计算Cp的95%置信区间;假设班里的人数为50,我们期待至少一个CI不包含1.00准备发表你的结果Cp的置信区间Minitab模拟置信区间-23-100908070605040LSLUSLLSL40目标*USL100样本均值68.7953样本N20标准差(组内)14.7561标准差(整体)11.4249过程数据Cp0.68CPL0.65CPU0.70Cpk0.65Pp0.88PPL0.84PPU0.91Ppk0.84Cpm*整体能力潜在(组内)能力PPMLSL0.00PPMUSL0.00PPM合计0.00实测性能PPMLSL25503.49PPMUSL17227.49PPM合计42730.98预期组内性能PPMLSL5861.10PPMUSL3154.32PPM合计9015.42预期整体性能组内整体C1的过程能力1.产生20个随机数据,并保存在C12.求其工程能力置信区间-24-80706050中位数平均值75.072.570.067.565.062.560.0第一四分位数60.558中位数68.902第三四分位数79.653最大值87.14563.44874.14260.98972.8228.68916.687A平方0.39P值0.346平均值68.795标准差11.425方差130.528偏度0.123551峰度-0.887528N20最小值49.512Anderson-Darling正态性检验95%平均值置信区间95%中位数置信区间95%标准差置信区间95%置信区间C1摘要3.统计→基本统计量→图形化汇总4.求总体标准差的置信区间的上限和下限.置信区间-25-总体标准差的置信区间下限Sigma上限样本大小8.68911.42516.68720CCpBestCase)(WorstCase)p(====100406*8.6891.15100400.599现在我们可以使用这些估计的上下限来计算Cp的置信区间了我们看到这是一个包含1.00的实际Cp95%的置信区间5.求Cp的置信区间6*16.687置信区间-26-4)总体比率(或比例)P的置信区间pZpZ+aas()P//22ps()p[一般公式]其中p称为样本比例;称为抽样极限误差(△p)Za/2s(p)置信区间-27-[例题5]某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本良品率为85%,试计算当把握程度为90%时良品率的区间范围。[公式求法]已知:n=200,p=0.85,1-a=0.90,Za/2=1.645则将上面的数字代入公式中,得总体良品率P的置信度为90%的置信区间为:85%-4.15%≤P≤85%+4.15%;即为(80.85%,89.15%)置信区间-28-1.在班上随机选了10名学员,调查他们考试总成绩的结果参考下面的数据。求总体均值的95%置信区间。730,640,540,880,710,660,890,910,430,5902.对某公司的未婚员工的月平均收入进行调查的数据如下。求出月平均的收入的标准差的95%置信区间。(单位元)825,500,450,280,920,1010,590,770,860,740[置信区间的课堂练习]

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功