分层抽样系统抽样随机数法抓阄抽签简单随机抽样抽样方法)(类别共同点各自特点相互联系适用范围简单随机抽样系统抽样分层抽样三种抽样方式比较1.不放回抽样2.抽样过程中,每个个体被抽取的机会均等从总体中逐个抽取将总体均分为几部分,按简单随机抽样抽取第一个样本,然后按相同的间隔抽取其他样本将总体分成几层,分层进行抽取抽取第一个样本时采用简单随机抽样各层抽样时,采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多(间隔相同的时间或距离)总体由差异明显的几部分组成1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是().A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样D课堂练习2.从2004名学生中选取50名组成参加观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行,则每人入选的机会()A.不全相等B.均不相等C.都相等D.无法确定C3.某校高一年级有x个学生,高二年级有y个学生,高三年级有z个学生,采用分层抽样抽取一个容量为45人的样本,高一年级抽取20人,高二年级抽取10人,高三年级共有学生300人,则此学校共有________人.900如何从样本数据中提取基本信息来估计总体的情况呢?2.2用样本估计总体一、用样本的频率分布估计总体的分布二、用样本的数字特征估计总体的特征平均数、中位数、众数、极差、方差、标准差频率分布表、频率分布直方图、频率折线图、茎叶图1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表。5、画出频率分布直方图.组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距分组频数频率频率/组距[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]48152225146420.040.080.150.220.250.140.060.040.02频率分布表0.080.160.300.440.500.280.120.080.04频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积总和=?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?P174例4跟踪练习4注意第几组频数(1)第几组频率样本容量(2)纵坐标为:频率组距频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:49,24,12,31,50,31,44,36,15,37,25茎叶图甲乙0123452554161679490846336843891几种表示频率分布的方法的优点与不足1.频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。2.频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。3.频率分布折线图的优点是它反映了数据的变化趋势。如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。4.用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。用样本的数字特征估计总体的数字特征众数、中位数、平均数1.三数的概念①众数:__________________________在一组数据中,出现次数最多的数据。②中位数:________________________________________________________________________________.③平均数:____________________________________________________.将一组数据按从大小依次排列,处在最中间位置的一个数据(或两个数据的平均数)。一组数据的总和除以数据的个数所得的值.例如:5、5、5、6、6、6、6、7、7、7这一组数据,它的众数为_____;中位数为_____;平均数为________.666也可以说平均数为各个不同数字乘以相应频率的和。标准差的概念:标准差是样本数据到平均数的一种平均距离,一般用s表示。计算标准差的公式:222121[()()()]nsxxxxxxn【对标准差的理解】(1)标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平均数周围的程度。标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散。(2)在实际应用中,标准差常被理解为稳定性。(3)标准差的取值范围是什么?标准差为0的样本数据有什么特点?答:标准差是非负的。标准差为0意味着所有的样本数据都相等的特性,且与样本平均数也相等。标准差的平方s2——方差2222121[()()()]nsxxxxxxn[例2](08·山东)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()分数54321人数2010303010[例3]某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30min抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.在频率分布直方图中如何求众数?月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5众数:频率分布直方图中最高小长方形底边中点的横坐标.左图中,众数为_____.2.25在频率分布直方图中如何求中位数?月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标。在频率分布直方图中如何求平均数?月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.