第29讲统计1.调查方式(1)普查:对对象进行的调全体查叫做全面调查(普查).(2)抽样调查:从被考察的全体对象中抽取部分进行考察的调查方式叫做抽样调查.(3)调查方式的选取:①调查的范围小,调查不具有破坏性,数据要求精确、全面时,选用全面调查;②所调查对象涉及面大、范围广,或受条件限制,或具有破坏性等时,一般采用抽样调查.2.总体、个体、样本及样本容量总体所要考察对象的数目称为总体个体组成总体的每一个考察对象称为个体样本从总体中抽取的一部分个体叫做总体的一个样本样本容量样本中个体的全体_叫做样本容量3.频数与频率频数:对总的数据按一定的组距将其分组,一般我们称落在不同小组中的数据个数为该组的频数.频率:每个小组中的频数与数据总数的比值为频率.频率反映了各组频数的大小在总数中所占的份量,频率之和等于1.4.几种常见的统计图条形统计图条形统计图就是用长方形的高来表示数据的图形折线统计图用几条线段连成的折线来表示数据的图形扇形统计图用一个圆代表总体,圆中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分在总体中所占总体大小,这样的统计图叫扇形统计图频数分布直方图能显示各组频数分布的情况,显示各组之间频数的差别5.数据的代表与波动(1)平均数、中位数、众数平均数一般地,如果有n个数x1,x2,x3,…,xn,那么平均数x=1n(x1+x2+x3+…+xn).如果在n个数据中,x1出现了f1次,x2出现了f2次,…,xk出现了fk次,那么x=x1f1+x2f2+…+xkfkn.(f1+f2+…+fk=n)中位数将一组数据按大小顺序排列,位于最中间的一个数据(当数据的个数是奇数时)或最中间两个数据的平均数当数据的个数是偶数时),叫做这组数据的中位数众数一组数据中出现次数最多的数据叫做这组数据的众数(2)方差设一组数据x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是(x1-x)2,(x2-x)2,…,(xn-x)2.那么我们用它的平均数即s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]来衡量一组数据的波动大小,并把它叫做这组数据的方差.方差越大,数据的波动越大,方差越小,数据的波动越小.考点1:调查方式及其数据的收集【例题1】(2019•山东省济宁市•3分)以下调查中,适宜全面调查的是()A.调查某批次汽车的抗撞击能力B.调查某班学生的身高情况C.调查春节联欢晚会的收视率D.调查济宁市居民日平均用水量【答案】B【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似解答.【解答】解:A.调查某批次汽车的抗撞击能力,适合抽样调查,故A选项错误;B.调查某班学生的身高情况,适合全面调查,故B选项正确;C.调查春节联欢晚会的收视率,适合抽样调查,故C选项错误;D.调查济宁市居民日平均用水量,适于抽样调查,故D选项错误.故选:B.归纳:1.一般来说,对于具有破坏性的、搜集整理及计算数据的工作量大、无法普查、普查的意义或价值不大时,应选择抽样调查;对于精确度要求高的调查,事关重大的调查往往选择普查.2.明确总体、个体、样本、样本容量的含义:①总体:我们把所要考察的对象的全体叫做总体;②个体:把组成总体的每一个考察对象叫做个体;③样本:从总体中取出的一部分个体叫做这个总体的一个样本;④样本容量:一个样本包括的个体数量叫做样本容量.考点2:数据的代表与波动【例题2(2018•四川凉州•3分)一组数据:3,2,1,2,2的众数,中位数,方差分别是()A.2,1,0.4B.2,2,0.4C.3,1,2D.2,1,0.2【答案】B【分析】找中位数要把数据按从小到大的顺序排列,位于最中间的一个数(或两个数的平均)数为中位数;众数是一组数据中出现次数最多的数据,注意众数可以不只一个.利用方差公式计算方差.【解答】解:从小到大排列此数据为:1,2,2,2,3;数据2出现了三次最多为众数,2处在第3位为中位数.平均数为(3+2+1+2+2)÷5=2,方差为[(3﹣2)2+3×(2﹣2)2+(1﹣2)2]=0.4,即中位数是2,众数是2,方差为0.4.故选:B.归纳:平均数、中位数、众数和方差的选择及意义1.均是用来刻画一组数据的平均水平,表示数据的集中趋势.2.平均数:(1)应用平均数时,所有数都参与运用,能充分地利用数据所提供的信息,但当一组数据中存在极大值或极小值时,平均数则不能准确的表示数据的集中情况;(2)求一组数据的平均数时要注意该组数据的平均数是算术平均数还是加权平均数,再选取适当的公式进行求解.3.中位数:(1)结合中位数的求解是按照大小顺序排列的特性,故中位数不会受到极大值或者极小值的影响,但这样使得所有信息不能充分利用;(2)求一组数据的中位数时首先要按照数据的大小顺序进行排列,再注意所求数据的总个数是奇数个还是偶数个.4.众数:(1)很多实际问题中,人们最关心、最重视的是出现次数最多的数即该组数据的众数;(2)一组数据中众数可能不止一个.当一组数据中存在多个数据均是出现次数最多且出现次数相同,则这几个数据均为众数.5.方差:要求比较两组或几组数据的稳定性,通过比较几组数据的方差的大小:方差越小,数据越稳定,数据的波动越小;方差越大,数据越不稳定,数据的波动越大.考点3:统计图的分析【例题3】(2018•江苏盐城•10分)“安全教育平台”是中国教育学会为方便学长和学生参与安全知识活动、接受安全提醒的一种应用软件.某校为了了解家长和学生参与“防溺水教育”的情况,在本校学生中随机抽取部分学生作调查,把收集的数据分为以下4类情形:.仅学生自己参与;.家长和学生一起参与;.仅家长自己参与;.家长和学生都未参与.请根据图中提供的信息,解答下列问题:(1)在这次抽样调查中,共调查了________名学生;(2)补全条形统计图,并在扇形统计图中计算类所对应扇形的圆心角的度数;(3)根据抽样调查结果,估计该校2000名学生中“家长和学生都未参与”的人数.【考点】扇形统计图,条形统计图【解析】【解答】解:(1)一共调查家长和学生:80÷20%=400(人)。【分析】(1)有A类学生的人数除以其所占的百分比即可得到;(2)由(1)求得的总人数,分别减去其他类的人数就是B类的人数;C类所占扇形的圆心角度数:由C类人数和总人数求出C类所占的百分比,而C类在扇形占的部分是就是这个百分比,用它乘以360°即可得答案;(3)用“家长和学生都未参与”在调查中的百分比看成占2000人的百分比计算即可。【答案】(1)400(2)解:解:B类家长和学生有:400-80-60-20=240(人),补全如图;C类所对应扇形的圆心角的度数:360°×=54°。(3)解:解:(人)。答:该校2000名学生中“家长和学生都未参与”有100人。归纳:统计图的分析中常见的设问有:1.计算调查的样本容量:①样本容量=各组频数之和;②样本容量=某组的频数该组的频率(所占的百分比).2.利用统计图中的数据进行相关计算:(1)补全统计图:①未知组频数=样本总量-其他组频数之和;②未知组频数=样本容量×该组频率;③未知组频率=1-其他组频率之和;④未知组频率=该组频数样本容量.(2)计算扇形圆心角度数:某组对应扇形圆心角的度数=该组所占的百分比(频率)×360°.考点4:统计的综合考查【例题4】某校260名学生参加植树活动,要求每人植4~7棵,活动结束后随机抽查了20名学生每人的植树量,并分为四种类型,A:4棵;B:5棵;C:6棵;D:7棵.将各类的人数绘制成扇形图(如图1)和条形图(如图2),经确认扇形图是正确的,而条形图尚有一处错误.回答下列问题:(1)写出条形图中存在的错误,并说明理由;(2)写出这20名学生每人植树量的众数、中位数;(3)在求这20名学生每人植树量的平均数时,小宇是这样分析的:第一步:求平均数的公式是x=x1+x2+…+xnn;第二步:在该问题中,n=4,x1=4,x2=5,x3=6,x4=7;第三步:x=4+5+6+74=5.5(棵).①小宇的分析是从哪一步开始出现错误的?②请你帮他计算出正确的平均数,并估计这260名学生共植树多少棵.【解析】:(1)D有错.理由:10%×20=2≠3(名).(2)众数为5,中位数为5.(3)①第二步.②x=4×4+5×8+6×6+7×220=5.3(棵),估计这260名学生共植树约5.3×260=1378(棵).一、选择题:1.(2019·贵州贵阳·3分)如图,下面是甲乙两位党员使用“学习强国APP”在一天中各项目学习时间的统计图,根据统计图对两人各自学习“文章”的时间占一天总学习时间的百分比作出的判断中,正确的是()A.甲比乙大B.甲比乙小C.甲和乙一样大D.甲和乙无法比较【答案】A【解答】解:由扇形统计图可知,乙党员学习文章时间的百分比是20%,由条形统计图求出甲党员学习文章的百分比是15÷(15+30+10+5)=25%,所以甲党员的百分比比乙党员的百分比大.故选:A.2.(2018•江苏扬州•3分)下列说法正确的是()A.一组数据2,2,3,4,这组数据的中位数是2B.了解一批灯泡的使用寿命的情况,适合抽样调查C.小明的三次数学成绩是126分,130分,136分,则小明这三次成绩的平均数是131分D.某日最高气温是7℃,最低气温是﹣2℃,则改日气温的极差是5℃【答案】B【解答】解:A、一组数据2,2,3,4,这组数据的中位数是2.5,故此选项错误;B、了解一批灯泡的使用寿命的情况,适合抽样调查,正确;C、小明的三次数学成绩是126分,130分,136分,则小明这三次成绩的平均数是130分,故此选项错误;D、某日最高气温是7℃,最低气温是﹣2℃,则改日气温的极差是7﹣(﹣2)=9℃,故此选项错误;故选:B.3.(2018·山东临沂·3分)如表是某公司员工月收入的资料.月收入/元45000180001000055005000340033001000人数111361111能够反映该公司全体员工月收入水平的统计量是()A.平均数和众数B.平均数和中位数C.中位数和众数D.平均数和方差【答案】C【解答】解:该公司员工月收入的众数为3300元,在25名员工中有13人这此数据之上,所以众数能够反映该公司全体员工月收入水平;因为公司共有员工1+1+1+3+6+1+11+1=25人,所以该公司员工月收入的中位数为5000元;由于在25名员工中在此数据及以上的有12人,所以中位数也能够反映该公司全体员工月收入水平;故选:C.4.(2019•浙江嘉兴•3分)2019年5月26日第5届中国国际大数据产业博览会召开.某市在五届数博会上的产业签约金额的折线统计图如图.下列说法正确的是()A.签约金额逐年增加B.与上年相比,2019年的签约金额的增长量最多C.签约金额的年增长速度最快的是2016年D.2018年的签约金额比2017年降低了22.98%【答案】C【解答】解:A.错误.签约金额2017,2018年是下降的.B.错误.与上年相比,2016年的签约金额的增长量最多.C.正确.D.错误.下降了:244.5-221.6244.5≈9.3%.故选:C.5.(2019湖南益阳4分)已知一组数据5,8,8,9,10,以下说法错误的是()A.平均数是8B.众数是8C.中位数是8D.方差是8【答案】D【解答】解:由平均数的公式得平均数=(5+8+8+9+10)÷5=8,方差=[(5﹣8)2+(8﹣8)2+(8﹣8)2+(9﹣8)2+(10﹣8)2]=2.8,将5个数按从小到大的顺序排列为:5,8,8,9,10,第3个数为8,即中位数为8,5个数中8出现了两次,次数最多,即众数为8,故选:D.二、填空题:6.(2018·重庆(A)·4分)春节期间,重庆某著名旅游景点成为热门景点,大量游客慕名前往,市旅游局统计了春节期间5天的游客数量,绘制了如图所示的折线统计图,则这五天游客数量的中位数为。O日期人数/万人25.424.923.421.922.4初一初二初三初四初五【答案】23.4万【