参数估计-1抽样估计参数估计-2抽样估计:根据样本提供的信息对总体的某些特征进行估计或推断。估计量或统计量:用来估计总体特征的的样本指标;总体参数:待估计的总体指标。所以对总体数字特征的抽样估计也叫参数估计。可分为:点估计和区间估计。总体样本抽取样本零假设备择假设P-value预测总体特征统计性推断总体参数统计量参数估计参数估计-3参数估计•目标--掌握点估计的方法和衡量好坏的标准--掌握区间估计参数估计-4参数参数是刻画总体特征的一些量分布参数二项分布(Binomial):n和p泊松分布(Poisson):正态分布(Normal):和xnxp1pxnXP!xeXPx2x212e21XP参数估计-5点估计点估计是指用于估计总体未知参数真值的统计量.常用点估计参数统计量均值x标准差s方差²s²比例p–参数估计-6点估计•常用方法---极大似然法:由Gauss和Bernoulli发明,由R.A.Fisher完善化。它的基本思想是:参数的极大似然估计量是这样一个量,它使基于总体的理论样本与实际抽出的样本观察值最大程度的相符合。理论价值很大---矩量法:由英国统计学家KarlPearson发明。基本思想是:使总体矩等于样本矩。数学上易于计算。参数估计-7点估计的衡量标准•总体均值μ的估计,可用样本均值、中位数、截尾平均等。•三个标准(评估估计量的优劣)---无偏性:样本的估计量的数学期望仍等于被估计总体参数的真值。例如:分别为和²的无偏估计。---有效性:两个无偏估计中,方差较小的被视为较有效。---一致性:当样本数趋于无穷大时,估计量依概率收敛于参数的真值。2,SX参数估计-8区间估计:根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。利用基于统计学的置信区间来量化样本的不确定性参数估计-9设总体参数为θ,θL、θU为样本确定的两个样本量,对于给定的α(0<α<1),有P(θL≤θ≤θU)=1-α则称(θL,θU)为参数θ的置信度为1-α的置信区间。该区间的两个端点θL、θU分别称为置信下限和置信上限,通称为置信限。α为显著性水平;1-α则称为置信度,置信区间的定义参数估计-10•它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。•置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知总体参数的区间。•置信区间的直观意义为:若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体参数真值。置信区间的意义参数估计-11绝大多数情况下,我们计算95%的置信区间(CI)这可解释为–100中大约95的CI将包含总体参数,或者–我们95%确信总体参数在此区间内反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内(正态分布时Z=±2内的概率约为95%.)如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%.95%的置信区间参数估计-12求参数置信区间时可参考下面的通用格式:置信区间=统计量±K*(标准误差)这里,统计量=均值、方差、Cp等K=基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布我们将考虑如下的置信区间:1)总体均值u的置信区间;2)总体方差σ的置信区间;3)工程能力Cp的置信区间;4)总体比例P的置信区间;置信区间介绍参数估计-13正态总体的各种情形的区间估计估计参数均值方差²比例两个总体间的差异的估计均值1-2方差1²/2²比例1-2比较他们是否有显著差异?参数估计-14单个正态总体的区间估计总体均值的估计(方差已知)总体均值的估计(方差未知)总体方差的估计总体比例的估计nzxnzx22ntxntxnnss1;1;2221n;12221n;2221ns1nsnp1pzpnp1pzp22ntxntxnnss1;1;22参数估计-15•均值间的差异(方差已知)•均值间的差异(方差未知但相等)其中•均值间的差异(方差未知且不相等)其中222121212122212121nnzxxnnzxx2221p2nn;212121p2nn;21n1n1Stxxn1n1Stxx2122122nns1ns1nS21222211p222121;2121222121;21nsnstxxnsnstxx221nns1nnsnsns22222121212222121两个正态总体的区间估计参数估计-16222111212122211121np1pnp1pzppnp1pnp1pzpp221n,1nFss1n,1nF1ss212222122212122221两个正态总体的区间估计•两总体比例间的差异•方差之比参数估计-171-1)总体方差已知时,正态总体均值的区间估计1)总体均值的置信区间xZxZ//22xx[一般公式]其中x称为样本均值;称为对应于/2的Z值;称为抽样平均误差;称为抽样极限误差△x)Z/2(x)Z/2(x)参数估计-18[例题1]某企业从长期实践得知,其产品直径X是一个随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。[Minitab解法]①将题中的6个数据输入到Minitab中的C1列②路径:Stat→BasicStatistics→1-SampleZ…③输入相关参数(参考右图)参数估计-19④输出结果:⑤结论:该产品直径的均值置信区间为(14.96,15.04)cmVariableNMeanStDevSEMean95%CIC1615.00000.21910.0204(14.9600,15.0400)当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的方法与上述方法相同;大样本情况下,当总体方差未知而用样本方差代替时,由于t分布可用正态分布近似,所以对总体均值的估计也采用上述方法。[注意]参数估计-20[例题2]某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的置信区间。[Minitab解法]①打开Minitab②路径:Stat→BasicStatistics→1-SampleZ…参数估计-21④输出结果:⑤结论:该产品直径的均值置信区间为(34.0979,35.9021)件NMeanSEMean95.5%CI10035.00000.4500(34.0979,35.9021)③输入相关参数(参考下图)参数估计-221-2)总体方差未知时,正态总体均值的区间估计(小样本)[一般公式]其中x称为样本均值;称为对应于/2,自由度为n-1的的t值;称为抽样极限误差△x)t/2,n-1xtnxtnnn/,/,2121SSt/2,n-1sn参数估计-23[例题3]某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:Stat→BasicStatistics→1-Samplet…参数估计-24③输入相关参数(参考右图)④输出结果:⑤结论:该产品每袋重量的均值置信区间为(778.841,803.359)克;允许误差:2.262*5.419=12.26(克)VariableNMeanStDevSEMean95%CIC110791.10017.1365.419(778.841,803.359)参数估计-252)总体标准差的置信区间[一般公式](小样本)其中s称为样本标准差;称为对应于/2的Chi-Square值;称为自由度;χ2/2n1//nn1122122SS参数估计-26123257..166161166161166161166161166161274916616162605221052202529752........././..假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。自由度(为16-1或15。Sigma的95%(=.05)置信区间是:参数估计-27[例题4]用[例题3]的10个数据求标准差的置信区间[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:Stat→BasicStatistics→GraphicalSummary…参数估计-28④结论:样本的标准差是17.14,总体标准差的95%的置信区间在11.79和32.78之间。810800790780770760MedianMean805800795790785780775Anderson-DarlingNormalityTestVariance293.66Skewness-0.379718Kurtosis-0.914935N10Minimum762.00A-Squared1stQuartile777.50Median791.503rdQuartile807.00Maximum813.0095%ConfidenceIntervalforMean778.840.19803.3695%ConfidenceIntervalforMedian776.58807.3795%ConfidenceIntervalforStDev11.7931.28P-Value0.869Mean791.10StDev17.1495%ConfidenceIntervalsSummaryforC1③输出结果参数估计-29Cpn-1CpCpn-11-/2,n-12/2,n-12Cpn-1CpCpn-11-/2,n-12/2,n-12229191922989119328519157975192025192......,.,CP2.29CP2.29Cp3.01这就是说,我们有95%把握说真实的Cp值在1.57和3.01之间Cp=2.29(n=20)的95%置信区间计算如右:/2-1-n21,21,1的百分数上限和下限平方分布的的是自由度为和其中nn3)工程能力Cp的置信区间[一般公式]参数估计-30我们将定义一个过程,其目标值为70,USL=100,LSL=40.班上的每个人都从一个平均值=70,标准差=10的分布中产生20个随机正态数字假设我们的“真实的”Cp=1.00.产生数据后,先用Minitab计算出Cp;