问题情境均使用寿命?如何检测一批灯泡的平.2收入?如何得到中国人的平均.1况。况去估计总体的相应情样本,根据样本的的情个是通过从总体中抽取一不直接去研究总体,而时,过程具有一定的破坏性当总体容量很大或检测是:统计的基本思想方法就用样本估计总体。如何合理抽样?征?从而估计总体的相应特特征,如何通过研究抽样本的抽取呢?名学生进行检查,如何从中抽取名学生的视力状况,)班为了了解高一(:引例105081抽样方法一.简单的随机抽样一).(步骤.1抽签法)1(的样本的步骤:抽取一个样本容量为的总体中,体容量为一般地,用抽签法从总nN①编号:②制签:个个体编号;将总体中的N相同的号签上;个号码写在形状、大小将这N③搅匀:并搅拌均匀;将号签放在同一箱中,④抽签:次;个号签,连续抽取从箱中每次抽出n1⑤取样:个个体取出。的编号一致的将总体中与抽到的号签n随机数表法)2(步骤:随机数表法抽取样本的①编号:位数一致);个个体编号(每个号码将总体中的N②选数:数作为开始;在随机数表中任选一个③读数:为止。此继续下去,直到取满已经取出,则跳过,如或前面得到的号码不在编号中在编号中,则取出;若的号码的方向读下去,若得到从选定的数开始按一定④取样:本。根据选定的号码抽取样定义.2简单的随机抽样。为那么这样的抽样方法称有相同的机会被取到,,如果每个个体都个个体作为样本取出的总体中逐个不放回地一般地,从个体总数为)(NnnN适用范围.3总体容量较小合理性.4.Nn性(概率)相同,为每个个体被抽取的可能系统抽样二).(如何抽取呢?的样本进行检查,应该中抽取一个容量为人力情况,从这为了了解高一学生的视名学生个班,每班有某校高一年级共有:引例1001000.50202步骤.1①编号:个个体随机编号;将总体中的N②分段:;段,分段间隔为将编号分为nNkn,即;nNknN是整数时,取当使剩下的总体从总体中剔除一些个体不是整数时当,,nN③定首:;编号机抽样确定起始的个体在第一段中用简单的随l④取样:的个体取出。,,,通常将编号为按一定的规则抽取样本knlklkll)1(,2,.,,号并将剩下的总体重新编这时取整除能被容量nNknN定义.2样。的抽样方法称为系统抽个体作为样本,这样从每个部分中抽取一个,然后按一定的规则,将总体平均分成几部分适用范围.3总体容量较大合理性.4.Nn性(概率)相同,为每个个体被抽取的可能练习除的个体数目是那么应从总体中随机剔的样本,法抽取一个容量为决定采用系统抽样的方名学生的成绩,竞赛的为了了解参加一次知识501252.1。试叙述系统抽样的步骤的样本,为名学生中抽取一个容量要从201003.2合理?的样本,怎样抽样较为中抽取容量为的视力情况,从名,为了了解全校学生名和名、学生、高中学生分别某校有小学学生、初中:引例10070080010003分层抽样★★★三).(步骤.1①定标准分层:;各层个体数分别为层分为层将总体按一定的标准分),2,1(,,kiaki②算各层比例:;体的个体数的比计算各层的个体数与总Nai③定各层容量:;样本容量确定各层抽取的体数的比例按各层个体数占总体个Nani,④在各层抽样:)(系统抽样可用简单的随机抽样或在各层中进行抽样注意:★★★理解方法有两种:层抽取的样本容量最重要的步骤是计算各分层抽样中,,Nani)1(Nnai)2(样本容量各层在总体中的比例各层个体数抽取比例定义.2成抽样。这样的抽样方法称为分的比例实施抽样,按各部分在总体中所占后比较分明的几部分,然按不同的特点分成层次体况,常常将总体中的个更客观地反映总体的情为了使样本个部分组成时当总体由差异明显的几,适用范围.3分组成总体由差异明显的几部合理性.4.Nn性(概率)相同,为每个个体被抽取的可能例题名听众进行座谈。为听取意见,需留下众,报告会结束后有一次报告会坐满了听座位号为个座位每排排座位某电影院有的样本。抽取一个容量为开方面的意见,拟教职工对学校在校务公名。为了了解名,后勤人员行政人员名,名教职工,其中教师某学校有台进行质量检查;台冰箱中抽取从的抽样方法较为合理下面问题中,采用怎样32.40~1,40,32)3(202416120160)2(310)1(?.1辆。辆、辆、抽取种型号的轿车应该分别进行检验,这辆样的方法抽取产品质量,现用分层抽为了检验该公司的辆辆、辆、别为种型号的轿车,产量分某公司生产346.2000600012003.1.2?4200.2:.22:.82:34200004.2名学生个区中分别应抽取多少的样本,那么在这量为所有学生中抽取一个容从现要用分层抽样的方法人数之比为个区的学生名学生,且个区共有某市的学生总数。人,求该校学生人。已知高二年级共有人,高三年级抽抽的样本,其中高一年级为校学生中抽取一个容量用分层抽样的方法从某300102045.3总体分布的估计二.(一)频率分布表151页例题阅读教材:编制频率分布表的步骤.1距,求全距,决定组数和组)1(组数全距组距最后一组取闭区间;间左闭右开,根据组距分组,通常区)2(列出频率分布表。登记频数,计算频率,)3(事项:★★★频率分布表中重要注意.2;量各组频数之和为样本容N)1(样本容量频数频率)2(.1)3(各组频率之和与折线图(二)频率分布直方图频数条形图频数条形图的制作:.1距;每一段对应一个组的组)在横轴上取若干段(,1。它的高等于该组的频数以每段为底作一矩形,)2(频数条形图的优点:.2律直观地体现数据分布规骤:作频率分布直方图的步.1频率分布直方图距;每一段对应一个组的组)把横轴分成若干段(,1。组距频率它的高等于该组的以每段为底作一矩形,)2(注意事项:★★★频率分布直方图中重要.2,而不是频率;组距频率每个矩形的高是)1(应组的频率;每个矩形的面积才是相)2(.1)3(各矩形的面积之和为:频率分布直方图的优点.3律直观地体现数据分布规5.1505.1535.1565.1595.1625.1655.1685.1715.1745.1775.180cm/身高02.004.006.008.0组距频率频率分布折线图:频率分布折线图的制作.1可。中点顺次连结起来,即相邻的矩形的上底边的将频率分布直方图中各:频率分布折线图的优点.2化趋势直观地反映了数据的变总体分布的密度曲线。为总体分布的密度曲线曲线,这条光滑曲线称将趋于一条光滑那么相应的频率折线图组数足够多分组的组距取得足够小够大如果将样本容量取得足,,,5.1505.1535.1565.1595.1625.1655.1685.1715.1745.1775.180cm/身高02.004.006.008.0组距频率(三)茎叶图4引例度?体水平及发挥的稳定程如何分析该运动员的整下:各场比赛的得分情况如某篮球运动员在某赛季.50,49,44,39,37,36,36,31,31,25,24,15,12定义.1的顺序同行列出。或从大到小大共茎的叶一般按从小到上向下列出,茎按从小到大的顺序从茎相同者用一个茎个位数字作为“叶”字作为“茎”将所有两位数的十位数)(,,,123452545116679490茎叶分界线茎叶图的优点:.2叶图中得到;)所有信息都可以从茎(1)便于记录和表示;(2看出平均数;、众数以及粗略地)能直观地看出中位数(3★总体特征数的估计★★三.5引例)如下表:名运动员的成绩(环数次,射击每名运动员为此进行了一次选拔赛运动员参加比赛女两名男名运动员中选出女共男某射击队要从410,,11422男1107910896998男29107105810978女178795491074女29578768677选哪两名运动员参赛?请问:根据选拔成绩应(一)平均数定义法★★★.1个数的平均数。叫做这则个数有nnxxxxxxnnn2121,,,,记作:xnxxxn21niixn116引例平均睡眠时间。试估计该学校学生的日频率分布表)的抽样眠时间(单位:下面是某学校学生日睡,h睡眠时间人数频率5.6,67,5.65.7,78,5.75.8,89,5.8合计51733376210005.017.033.037.006.002.01频数平均数法.2则其中出现的频数分别为若数据),(,,,,,,212121nffffffxxxkkkxkkfxfxfxn22111ikiifxn11频率平均数法★★★.3则出现的频率分别为若数据,,,,,,2121kkpppxxxxkkpxpxpx2211ikiipx1平均数的性质★★★.4则的平均数为一组数据,),,2,1(xnixi的平均数为数据),,2,1(nibaxi.bxa(二)方差极差.1最小值的差称为极差。在一组数据中最大值与方差.2,,,,21xxxxn的平均数为一组数据★★★)(2s则该组数据的方差为:222212)()()(1xxxxxxnsn21)(1xxnnii方差的性质★★★.3则的方差为一组数据,),,2,1(2snixi的方差为数据),,2,1(nibaxi.22sa标准差.4)(s2ss为了了解施肥量对水稻产量的影响,在7块并排、形状大小相同的试验田上进行试验,得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455问题情景线性回归方程四.★★★注意:据取值的平均水平;)平均数刻画了一组数(1大小。取值的稳定程度、波动)方差刻画了一组数据(2动越小。方差越小,越稳定、波1020304050500450400350300·······施化肥量x15202530354045水稻产量y330345365405445450455xy施化肥量水稻产量1020304050500450400350300·······发现:图中各点,大致分布在某条直线附近。施化肥量x15202530354045水稻产量y330345365405445450455xy散点图施化肥量水稻产量。系,以便预测水稻产量施肥量和水稻产量的关回归方程近似的模拟所以,我们可以用线性线性回归方程为:.1其中niniiinininiiiiixxnyxyxnb1122111)())((niiniiixnxyxnyx1221211)())((niiiniixxyyxx★xbyaabxyˆ★注意:).,(ˆyxabxy必过定点回归直线:回归截距回归系数回归值是一种粗略的估计。线性相关的程度,也只关系的两个变量从散点图上观察有相关.,,,未必有意义但求得的线性回归方程的线性回归方程由公式都可以求出相应据对于任意给定的样本数另外例如:线性相关关系.2叫做线性相关关系。近似表示的相关关系能用直线方程abxyˆ例题五.抽样一.份。问卷是单位回收的分,则在单位抽样本,若在的分层抽取容量为从回收的问卷中按单位份,因报道需要,再成等差数列,共回收次四个单位回收的问卷依的调查,在手机垃圾短信”某报社做了一次关于“今年DBDCBA301501000,,,5.13.1一个同学的学号应为还有的同学在样本中,那么已知学号为的样本,取一个容量为现用系统抽样的办法抽,,,人,学号依次为)班共有高三(48,34,64563,2,1561.2。个号码是时,所抽到的第在)的号码(当)或(当组中抽取个位数为各组的号码,即第,依次错位地得到后面为随机抽取一个号码,记组的样本。即规定先在第方法抽取一个容量为,要用系统抽样的,,个组,组号为将其分为并依次,,个个体编号为一个总体中的46.1010100871,08,792,1,080.3ikikikikiki被抽到的概率为则个体的样本抽取一个容量为个个体的总体中在含有A,5,30.4总体分布的估计二.这一组的频率为则样本在组距与频数如下:分组后的