统计学概论中南大学第一节抽样推断概述第三节参数估计第二节随机抽样的概率分布第四节抽样设计第七章抽样推断统计学概论中南大学第一节抽样推断概述指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。抽样推断统计学概论中南大学统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样推断统计学概论中南大学随机原则的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。统计学概论中南大学并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同统计学概论中南大学按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差,但抽样误差可以事先计算并控制抽样推断的特点与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。统计学概论中南大学不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时抽样推断的应用统计学概论中南大学抽样推断理论基础大数定律中心极限定律表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。1)(limXxPn如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。统计学概论中南大学抽样推断理论基础大数定律中心极限定律表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。1)(limXxPn如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。统计学概论中南大学抽样推断的基本概念全及总体抽样总体又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常用N表示全及总体的单位数目。又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。统计学概论中南大学抽样推断的基本概念例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。n≥30称为大样本,n<30称为小样本.n/N称为抽样比.统计学概论中南大学设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则NNXXX,,210N1N根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体参数。全及指标统计学概论中南大学⒈总体平均数(又叫总体均值):miimiiiNiiffXXNXX111或全及指标⒉总体单位标志值的标准差:miiimiiNiifXXfXXN1211211或统计学概论中南大学⒊总体单位标志值的方差:miiimiiNiifXXfXXN121212211或⒋总体成数:PNNQNNP1,01统计学概论中南大学⒌总体是非标志的标准差:PQPPP1⒍总体是非标志的方差:PQPPP12有最大值时,当PQP5.0统计学概论中南大学设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则nnxxx,,210n1n指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被称为统计量,它是随机变量。抽样指标统计学概论中南大学⒈样本平均数(又叫样本均值):miimiiiniiffxxnxx111或统计学概论中南大学⒉样本单位标志值的标准差:⒊样本单位标志值的方差:miiimiiniifxxfsxxns121121111或miiimiiniifxxfsxxns12121221111或为自由度为的无偏估计2为的无偏估计统计学概论中南大学pnnqnnp1,01⒋样本成数:⒌样本单位是非标志的标准差:pqnnppnnsp111⒍样本单位是非标志的方差:pqnnppnnsp1112为的无偏估计2P为的无偏估计P统计学概论中南大学抽样方法的分类重复抽样从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样总体单位数N不变,同一单位可能多次被抽中。根据取样方式不同,可分为:统计学概论中南大学抽样方法的分类不重复抽样每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.总体单位数减少n,同一单位只可能被抽中一次。统计学概论中南大学抽样方法的分类根据对样本的要求不同,可分为:考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。ABC≠CBA不考虑各单位的中选顺序。ABC=CBA考虑顺序的重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样综合起来共有四种抽样方法统计学概论中南大学样本的可能数目考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样)!/(!nNNpnNnNnnNC1把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是多少?(0—9选6呢?)不考虑顺序的不重复抽样nNC8347680/1/1736C统计学概论中南大学样本的概率分布把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。若将样本指标的取值分别记为其相应的概率记为P1,P2,…Pn,将它们按顺序排列起来,可得如下概率分布表。,,...,21nxxxx1x2xnx……nP)(xP……nP1P2P统计学概论中南大学第二节随机抽样的概率分布样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差分布的形状及接近总体参数的程度统计学概论中南大学学生ABCDEFG成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布01230405060708090样本均值样本均值样本均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数44321101234564550556065707501230405060708090二者均值相等统计学概论中南大学样本均值4547.55052.55557.560出现次数1123445离差-15-12.5-10-7.5-5-2.50样本均值62.56567.57072.575出现次数443211离差2.557.51012.515学生ABCDEFG成绩30405060708090离差-30-20-1001020302007.7100214201747122nNnNx07.7x统计学概论中南大学平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的n1)()(XxXxE),(~2nXNx统计学概论中南大学比率的抽样分布5)1(,5)1,(~pnnpnPPPNp全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。样本比率的标准差为总体标准的。)()(PpPpEn1统计学概论中南大学比率的抽样分布教师是否博士A是B是C否D否E否F是具有博士学位的比率:P=0.5比率的标准差:=0.5从总体中按重复抽样方法随机抽取4人,计算其比率P和标准差p统计学概论中南大学比率的抽样分布样本比率离差样本比率离差ABCDABCEABCFABDEABDFABEFACDEACDF0.50.50.750.50.750.750.250.5000.2500.250.25-0.250ACEFADEFBCDEBCDFBCEFBDEFCDEF0.50.50.250.50.50.50.2500-0.25000-0.25Pnpp5.0p5245.05.01)1(1581.015375.0)(2NnNnPPffppp统计学概论中南大学全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的。n1)()(PpPpE比率的抽样分布5)1(5))1(,(~pnnpnPPPNp学生ABCD成绩60708090均值=75方差2=125从中按重复抽样方式抽取2人,计算样本的均值及方差S2。x方差的抽样分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D90906075225450907080100200908085255090909000nxxnxxSn22)(1)(221nxxSn5.62)(22mSSEnn125)(2121mSSEnn1252统计学概论中南大学0123456710020030040021nS2nS统计学概论中南大学X510样本抽样分布原总体分布xX统计学概论中南大学抽样误差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM总平均身高=168.6CM统计学概论中南大学第三节参数估计也叫抽样估计,就是根据样本指标数