高中数学北师大版必修3第1章《统计》ppt复习课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计第一章本章归纳总结第一章第一章本章归纳总结成才之路·高中新课程·学习指导·北师大版·数学·必修3有部分课件由于控制文件大小,内容不完整,请联系购买完整版专题探究3知识结构1知识梳理2即时巩固4知识结构知识梳理1.随机抽样统计分析的基本过程是:当总体容量很大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计.本章学习了三种比较典型和常用的抽样方法:简单随机抽样、分层抽样和系统抽样,它们的共同点:在抽样过程中每个个体被抽到的可能性(概率)相同,体现了抽样统计的客观性和公平性.(1)简单随机抽样:在需要分析的总体中,随机地抽取一部分个体,然后对抽取的对象进行调查,并且在抽取的过程中,要保证每个个体被抽到的概率相等.这样的抽样方法叫作简单随机抽样.简单随机抽样是抽样中一个最基本的方法,通常采用抽签法或随机数法.(2)分层抽样:将总体按其属性特征分成若干类型(有时称为层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(3)系统抽样:将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本,这种抽样方法叫作系统抽样,有时也称为等距抽样或机械抽样.2.用样本估计总体(1)统计图表①条形统计图、折线统计图、扇形统计图各自用途如下:条形统计图用于体现数据分布的频数及频率;扇形统计图用于体现部分在总体中所占比例;折线统计图用于体现数据的变化趋势.②画茎叶图的步骤:将数据分为“茎”“叶”两部分→共茎的叶按从小到大(或从大到小)的顺序同行列出.茎叶图只方便记录较少的样本数据,所有数据信息都可以从茎叶图中得到,方便记录与表示.③画频率分布直方图的步骤:求给定一组数据的极差→决定组距与组数→分组→列频率分布表→画频率分布直方图.频率分布直方图以面积的形式反映数据在各小组的频率的大小,能清楚反映数据分布的总体态势.④频率折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,即频率折线图.(2)数据特征①反映一组数据的“集中趋势”的数字特征:中位数、众位数、平均数.把一组数据按从小到大的顺序排列,处在最中间位置的一个数或最中间两个数的平均数就是该组数据的中位数.一组数据中出现次数最多的数据是该组数据的众数.一组数据x1,x2,…,xn的平均数x-=1n(x1+x2+…+xn).②反映一组数据的“离散程度”的数字特征:极差、方差、标准差.一组数据中最大的数与最小的数的差称为该组数据的极差.一组数据x1,x2,…,xn的平均数为x-,方差s2=1n(x1-x-)2+(x2-x-)2+…+(xn-x-)2.标准差s=1n[x1-x-2+x2-x-2+…+xn-x-2].(3)用样本估计总体的方法①用样本的频率分布估计总体的分布:通过样本数据得到频率分布表、频率分布直方图、频率折线图,对总体的频率分布作出估计.②用样本的数字特征估计总体的数字特征:用样本数据的平均数、标准差估计总体的平均数、标准差.从样本数据得到的分布、平均数和标准差并不是总体真正的分布、平均数和标准差,只是总体的一个估计,但这种估计是合理的.当样本量很大时,它们的确反映了总体的信息.3.变量的相关性对两个变量的样本数据进行相关性分析,画出散点图,若所有点都在一条直线附近波动,则这两个变量是线性相关的,此时由用最小二乘法求出的a,b的计算公式b=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2a=y--bx-,可得线性回归方程y=a+bx.得到的线性回归方程可用于对总体作出估计和预测,为决策提供依据.专题探究抽样方法的应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数法抽样时,对个体所编的号码位数要相等,当问题所给位数不等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.如:1,2,3,…,20可凑成01,02,03,…,20(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=Nn;如果总体容量N不能被样本容量n整除,先用简单随机抽样法剔除多余个体,抽样间隔k=[Nn].①当总体容量较小,样本容量较小时,制签简单,号签容易搅匀,可采用抽签法;②当总体容量较大,样本容量较小时,可用随机数表法;③当总体容量较大,样本容量也较大时,可用系统抽样法;④当总体中个体差异较显著时,可采用分层抽样法.[特别提醒]在选取抽样方法时,必须使总体中每个个体被抽到的机会是均等的,同学们要理解各种抽样方法的特征及适用范围,在解题时灵活选用.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.[解析](1)设登山组人数为x,游泳组中青年人、中年人、老年人各占比例分别为a、b、c,则有x·40%+3xb4x=47.5%,x·10%+3xc4x=10%,解得b=50%,c=10%,则a=40%,即游泳组中,青年人、中年人、老年人各占的比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为200×34×40%=60人;抽取的中年人数为200×34×50%=75人;抽取的老年人数为200×34×10%=15人.在下列问题中,各采用什么抽样方法抽取样本较为合适?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排,每排有40个座位(座位号为01~40),一次报告会坐满了听众,会后为了听取意见,留下了座位号为18的所有32名听众进行座谈;(3)实验中学有180名教工,其中有专职教师144名,管理人员12名,后勤服务人员24名,今从中抽取一个容量为15的样本.[解析](1)因总体中的个体的数目较少,故采用简单随机抽样.(2)因总体中的个体的数目较多,又是“等距”抽取,故采用系统抽样.(3)因总体中的个体差异较大,故采用分层抽样.茎叶图是近年高考的热点.主要考查茎叶图的画法,以及对茎叶图的分析和应用.用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.茎叶图及应用某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分:8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两名运动员的水平.[解析](1)作出茎叶图如图.甲乙085213465423689766113389944051(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.在某电脑杂志的一篇文章中,每个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?[解析](1)茎叶图如图所示:电脑杂志报纸987755410123898777654432022234777861322335694116(2)电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明.表现统计数字大小和变动的各种图形总称为统计图.其中有条形统计图、扇形统计图、折线统计图、茎叶图等.在统计学中把利用统计图形表现统计资料的方法叫作统计图示法.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表现现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.统计图表某同学从一本英文杂志中截取了含有120个字母的一段小文章,欲研究六个字母的使用频率,我们不妨用1,2,3,4,5,6来代替这六个字母,发现它们出现的次数分别为18,19,21,22,20,20.(1)列出样本数据的统计表;(2)画出数据的条形统计图;(3)画出数据的折线统计图.[解析](1)统计表如下:字母123456次数181921222020(2)数据的条形统计图如图所示.(3)数据的折线统计图如图所示小明家2015年的四个季度的用电量如下:季度名称用电量(单位:千瓦时)第一季度250第二季度150第三季度400第四季度200其中各种电器用电量如下表:各种电器用电量(单位:千瓦时)空调250冰箱400照明100彩电150其他100根据以上三幅统计图回答:(1)从哪幅统计图可看出各个季度用电量变化情况?(2)从哪幅统计图可看出冰箱用电量超过总用电量的?(3)从哪幅统计图可以清楚地看出空调用电量?[解析](1)折线统计图;(2)扇形统计图;(3)条形统计图.频率分布表与频率分布直方图频率分布直方图的特点如下:(1)图中小长方形的面积=组距×频率组距=频率.(2)所有长方形的面积之和为1.(3)同一组数据若组距不同,得到直方图的形状也不一致.(4)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).某车站在春运期间为了改进服务,随机抽样调查了100名旅客从开始在购票窗口排队到购到车票所用的时间t(以下简称购票用时,单位:min),如下图是这次抽样的频率分布表和频率分布直方图,解答下列问题:分组频数频率一组[0,5)00二组[5,10)10三组[10,15)100.10四组[15,20)五组[20,25)300.30合计1001.00(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图.(3)旅客购票用时的平均数可能落在哪一小组?(4)若每增加一个购票窗口可使平均购票用时降低5min,要使平均购票用时不超过10min,那么你估计最少要增加几个窗口?[解析](1)样本容量为100.(2)由频率=频数样本容量可补全频率分布表和频率分布直方图(如图所示的阴影部分).分组频数频率一组[0,5)00二组[5,10)10(0.10)三组[10,15)100.10四组[15,20)(50)(0.50)五组[20,25)300.30合计1001.00(3)设旅客平均购票时间为smin,则有:0×0+5×10+10×10+15×50+20×30100≤s5×0+10×10+15×10+20×50+25×30100得15≤s20.∴旅客购票用时平均数可能落在第四小组.(4)设需增加x个窗口,则20-5x≤10,解得x≥2.所以估计最少要增加2个窗口.[规律总结]本题考查了同学们整理数据和分析数据的能力,补全频率分布表可从横向(利用频数与频率的关系)和纵向(各组频数之和等于样本容量,各组频率之和等于1)两个

1 / 83
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功