12.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法..会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,理解他们各自特点,会计算数据的标准差、方差,会用样本的基本数字特征估计总体的基本数字特征,会用样本的频率分布估计总体分布.11______________________________________.2()___________________.N.抽样方法抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有①、②、③简单随机抽样是指一个总体的个数为较小的有限数,通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为④和⑤3________________4分层抽样是总体由⑥,常将总体按差异分成几个部分,然后按各部分所占的比值进行抽样,其中所分成的各部分叫做层.系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先确定的规则在各部分抽取.21..总体分布的估计列频率分布表1122[)____________________.()[)()11.iikabkittfff画频率分布直方图,将区间,标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得个矩形,这样得到的图形叫做⑦频率分布直方图的性质:ⅰ第个矩形的面积等于样本值落入区间,的频率;ⅱ由于,所以所有小矩形的面积之和为3_______________________4⑧,就得到频率分布折线图,随着样本容量的增加,折线图会越来越近于一条光滑曲线,称之为总体密度曲线.茎叶图也能用来表示数据,茎是中间的一列数,叶是从茎旁边上长出来的数,当样本数据较少时,用茎叶图表示数据的效果更好.31________()____________().样本的数字特征估计总体的数字特征众数、中位数.一组数据中出现次数⑨的数据叫做这组数据的众数.将一组数据按照从大到小或从小到大排列,处在⑩上的一个数据或中间两位数据的平均数叫做这组数据的中位数.1222122()_____________________________________________________()________________________.()nnnxxxxsssxxxax平均数和方差的计算.ⅰ如果有个数据,,,,则⑪叫做这组数据的平均数,⑫叫做这组数据的方差,而叫做标准差.ⅱ公式⑬ⅲ当一组数据,,,中各数较大时,可将各数据减去一个适当的常数,得到12122_______________________________________.nnxaxxaxxas,,,,则⑭21212213(1,2)____________________.4nniixxxxsyyyyaxbinys数据,,,的平均数为,方差为,则数据,,,,其中,,的平均数⑮,方差⑯.总体平均值和方差的估计人类的长期实践和理论研究都充分证明了同样本的平均数估计总体平均值,用样本方差估计总体方差是可行的,而且样本容量越大,估计就越准确.122212222221222222121(1)[()()11()][()][()]nnnnxnxxxxxxnxxxxxnxnnxxxnxaxba①简单随机抽样;②分层抽样;③系统抽样;④抽签法;⑤随机数表法;⑥差异明显要的几部分组成;⑦频率分布直方图;⑧连接频率分布直方图中各小长方形上边的中点;⑨最多;⑩中间位置;⑪;⑫;⑬;点指南;⑮;⑯:⑭2s.(150)5055A5,10,15,20,25B1,2,3,4,5C2,4,8,16,32D3,13,23,33,1.43现要从已编号~的枚最新研制的某型号导弹中随机抽取枚进行发射试验,决定采取系统抽样的方法确定选取的枚导弹的编号可能是....0010511,2,3,4,5.110110..Dnkknk由题设,共分个系统,每个系统个个体,第个系统的号码是若在其中抽取的号码为,则第解析:易错个系统应抽的号码是,其中由此可知应选系统抽样号码确认规点:律应用错误.285481362ABCD.1某单位有老年人人,中年人人,青年人人.为了解他们的学历水平,从中抽取容量为的样本,最适合的抽样方法是.简单随机抽样.系统抽样.分层抽样.先从老年人中剔除人,再分层抽样3616313616229.D由题设,个体有明显差异,因此应选择分层抽样,但抽样比例若是∶,不能得到整数解值,而先剔除名老年人后按比例∶,即∶,能从各层中抽取整数个个体,故选析:22A.1B2C03.D3x一个样本数据的茎叶图如下,其中位数为,则的值为...2023221.2Axx解析:易由于样本数据为偶数,所以,求解,故选中位数是样本数据由小到大排列后的中间数据,而非任意排列的错点:中间数据.100(cm).120,130130,140140,15018140,1504.a从某小学随机抽取名同学,将他们的身高单位:数据制成频率分布直方图如下,由图中数据可知若要从身高,,三组内的学生中,用分层抽样选取人参加一次活动,则从身高在内的学生中选取的人数为人.0.0350.0200.0100.005101.120,1300.0301010030130,1400.0201010020140,1500.0101010010140,15010.0308103013200aa根据,求得身高在内的学生有人,身高在内的学生有人,身高在内的学生有人,则从身高在内的学生中选取的人数为解析:人.()Nn误认为纵轴上的数据为频率而计算错误,或分层抽样每层按比例其中为样本总体数量,为样本容量抽取错误理解而求易错点:解错误.123123108.535,35,35355..nnxxxxxxxx若数据,,,,的平均数为,方差为,则数据,,的平均数为,方差为 12235,3576.53535310538.5.nxxx由已知,,,的平均数为,标准差为解析:题型一用样本估计总体121甲、乙两人参加某体育项目训练,近期的五次测试成绩情况如图.分别求出两人得分的平均数与方差;根据图和算得的结果,对两人的训练成绩作例1:出评价.101312141613141212141013121416135131412121413.15甲、乙两人五次测试的成绩分别为:甲 分 分 分 分 分乙 分 分 分 分 分甲的平均得分为,乙的平均得分为解析:222222222222221[101313131213141351613]41[1313141312131213514130.8.2]ssss甲乙乙甲,由可知乙的成绩较稳定.从折线图看,甲的成绩基本上呈上升状态,而乙的成绩在平均线上下波动,可知甲的成绩在不断提高,而乙的成绩无明显提高. 平均数与方差是重要的统计数字特征,分别反映平均水平和波动状态,它们的实际意义应联系实际分评析:析判断.104两台机床同时生产直径为的零件,为了检验产品质量,质检员从两台机床生产的产品中各抽出件进行测量,结果如下:如果你是质检员,在收集上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符素材1:合要求?机床甲109.81010.2机床乙10.1109.9102222222222109.81010.21010.1109.91010.1[10109.8101010410.210]0.021[10.11010109.91041010]0.005.xxxxss甲乙甲乙甲乙解,,故平均直径不能反映质量优劣.,析:22ss乙甲<,说明乙机床生产出的零件直径波动小,由此,从质量稳定性的角度判断,乙机床生产的零件质量更符合要求.题型二抽样方法及实际应用2(20100)10某电视台在一次对收看文艺节目和新闻节目的抽样调查中,随机抽取了名电视观众,相关的数据如下例:广东卷表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计55451001254035212040由表中数据直观分析,收看新闻节目的观众是否与年龄有关?用分层抽样方法在收看新闻节目的观众中随机抽取名,大于岁的观众应该抽取几名?在上述抽取的名观众中任取名,求恰有名观众的年龄为至岁的概率.204058184042272455154519140273()9因为在至岁的名观众中有名收看新闻节目,而大于岁的名观众中有名观众收看新闻节目,所以直观分析,收看新闻节目的观察与年龄有关.由题中所给条件,收看新闻节目的共名,随机抽取名,则抽样比例为,故大于岁的观众应抽取解:人析.123,121213231211122122313254032040252()()()()()()()()()()1012040636.1035aaabbaaaaaabbababababababP抽取的名观众中,大于岁的人设为,,至岁的人设为,,则从人中抽取人的基本事件有:,,,,,,,,,,,,,,,,,,,,共种,其中恰有人在至岁的有种,故所求概率抽样方法是样本估计总体的关键第一步,同时三种不同的抽样方法适用的情境也各不相同,高考中通常将抽样方法渗入直方图、茎叶图、数据统计分析和概率计算间进评析:行考查.2(2009)101.12ABB一个总体分为,两层,用分层抽样的方法从总体中抽取一个容量为的样本.已知层中每个个体被抽到的概率都为,则总体中素材:湖南卷的个体数为1211010.2分层抽样是等概率抽样,故总体的个体数为解析:题型三直方图、茎叶图的应用.25()357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,444,451,454ABA某良种培育基地正在培育一种小麦新品种将其与原有的一个优良品种进行对照试验.两种小麦各种植了亩,所得亩产数据单位:千克如下:品例种:3:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,43012440445BABABA品种:绘出品种、产量的茎叶图,并根据茎叶图比较品种、的平均产量和稳定性;设从品种中亩产量不低于千克的试验品种中随机抽取两种进行下一年的对比试验,求亩产量千克被抽中的频率.1AB品种、的亩产量茎解析:叶图如下:()“445?440443,444443,445444,445451,45410443,445444,445445,451(445,454)2ABABAAAA通过茎叶图可以看出:①品种的亩产平均数比品种高;②品种的亩产标准差或方差比品种的大,故品种的亩产稳定性较差.设亩产量千克被抽中为事件,从品种中亩产量不低于千克的试验品种中随机抽取两种的所有基本事件有,,,,,共种,事件所含的基本事件有,,,24.5410PA,共种,故“”“”茎叶图中叶表示的数字的末位数,由已知数据绘制茎叶图时应同茎的条件下,叶按大小排列,茎叶图的优势在于直观清晰地反映数据的分布情况,便于比较,没有信息损失,可以随时添加新评析:的数据.()1110,12020231203某班同学《统计》单元测试成绩单位:分的频率分布条形图如图所示.若成绩在内的共有人,求全班同学