第七章 统计与概率61 第七章 统计与概率§7.1 统 计181考点清单考点一 数据的收集 1.数据的收集方式:普查和抽样调查.2.总体、个体、样本和样本容量总体是指所考察对象的全体,组成总体的每一个考察对象叫做个体,样本是指从总体中抽出的部分个体,样本中个体的数目叫做样本容量.考点二 数据的处理 1.中位数、众数中位数、众数都是描述一组数据平均水平的特征数.众数是一组数据中① 出现次数最多的数据 .中位数是将一组数据按大小顺序排列处于② 最中间 位置的一个数据(或最中间两个数据的平均数).2.平均数求平均数的方法:(1)基本方法:x=③ x1+x2+…+xnn ;(2)新数据法:x=x′+a;(3)加权平均数的计算公式:④ x=x1f1+x2f2+…+xkfkf1+f2+…+fk(f1+f2+…+fk=n) .3.极差:一组数据中的⑤ 最大数与最小数的差 叫做极差.4.方差:样本的⑥ 每个数据与平均数的差 的平方的平均数叫做样本方差.5.标准差:方差的算术平方根叫做标准差.6.求方差的方法设n个数据x1,x2,…,xn的平均数为x,则其方差s2=⑦ 1n[(x1-x)2+(x2-x)2+…+(xn-x)2] .7.样本方差与标准差是衡量一组数据波动性的量,其值越大,波动越大.考点三 统计图表 1.分析数据的统计图有:(1)扇形统计图;(2)条形统计图;(3)折线统计图;(4)频数分布直方图.2.频数是指⑧ 某个数据出现的次数 .3.频率是⑨ 频数与数据总个数之比 .4.画频数分布直方图的步骤:(1)求极差;(2)决定组数;(3)确定组距;(4)求出频数;(5)画频数分布直方图.182方法一 常见统计量的计算 常见的统计量有平均数、众数、中位数和方差. 例1 (2017菏泽,4,3分)某兴趣小组为了解我市气温变化情况,记录了今年1月份连续6天的最低气温(单位:℃):-7,-4,-2,1,-2,2,关于这组数据,下列结论不正确的是 ( )A.平均数是-2B.中位数是-2C.众数是-2D.方差是7解析 平均数是(-7)+(-4)+(-2)+1+(-2)+26=-2,方差是16×{[(-7)-(-2)]2+[(-4)-(-2)]2+[(-2)-(-2)]2+…+[2-(-2)2]}=16×(25+4+0+…+16)=9, 因为这组数据中-2出现了两次,次数最多,所以众数是-2.将这据数据从小到大排列为-7,-4,-2,-2,1,2,则中位数是-2+(-2)2=-2.答案 D 变式训练 (2018湖北荆门,8,3分)甲、乙两名同学分别进行6次射击训练,训练成绩(单位:环)如下表:第一次第二次第三次第四次第五次第六次甲9867810乙879788 对他们的训练成绩作如下分析,其中说法正确的是( )A.他们训练成绩的平均数相同B.他们训练成绩的中位数不同C.他们训练成绩的众数不同62 5年中考3年模拟D.他们训练成绩的方差不同答案 D解析 x甲=16×(9+8+6+7+8+10)=8,x乙=16×(8+7+9+7+8+8)=476,因为x甲>x乙,所以他们训练成绩的平均数不同,选项A错误.将每组数据排序后,第3个数和第4个数的平均数即是中位数,由此可知他们训练成绩的中位数相同,都是8,选项B错误.两组数据都是8出现的次数最多,因此他们训练成绩的众数相同,都是8,选项C错误.由排除法可知选项D正确,故选D. 例2 (2017德州,6,3分)某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:尺码3940414243平均每天销售数量/件1012201212 该店主决定本周进货时,增加一些41码的衬衫,影响该店主决策的统计量是( )A.平均数B.方差C.众数D.中位数解析 由于41码的衬衫销售的数量最多,因此该店主本周进货时,增加一些41码的衬衫,一组数据中出现次数最多的数即为这组数据的众数,所以影响该店主决策的统计量是众数.答案 C 变式训练 (2016内蒙古呼和浩特,20,7分)在一次男子马拉松长跑比赛中,随机抽得12名选手所用的时间(单位:分钟)得到如下样本数据:140 146 143 175 125 164 134 155 152 168 162 148(1)计算该样本数据的中位数和平均数;(2)如果一名选手的成绩是147分钟,请你依据该样本数据的中位数,推断他的成绩如何.解析 (1)将这组数据按从小到大的顺序排列如下:125,134,140,143,146,148,152,155,162,164,168,175.∵这组数据按从小到大的顺序排列后,处于最中间的两个数为148,152,∴该样本数据的中位数为148+1522=150(分钟).平均数为x=112×(125+134+140+143+146+148+152+155+162+164+168+175)=112×1812=151(分钟).(2)依据(1)中得到的样本数据的中位数可以估计,在这次马拉松比赛中,大约有一半选手的成绩快于150分钟,有一半选手的成绩慢于150分钟.这名选手的成绩为147分钟,快于中位数150分钟,可以断定他的成绩比一半以上选手的成绩好.方法二 理解统计图表的意义和作用 条形统计图、扇形统计图、折线统计图各有各的特点,它们从不同角度清楚、有效地描述数据.在解决由多种统计图共同组成的题目时,解题关键是结合各种统计图,将题目中用到的信息找出来,同时注意各种统计图的互补性.例3 (2018新疆乌鲁木齐,20,12分)某中学1000名学生参加了“环保知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取整数,满分为100分)作为样本进行统计,并制作了如下频数分布表和频数分布直方图(不完整且局部污损,其中“■”表示被污损的数据).成绩分组频数频率50≤x<6080.1660≤x<7012a70≤x<80■0.580≤x<9030.0690≤x≤100bc合计■1 请解答下列问题:(1)写出a,b,c的值;(2)请估计这1000名学生中有多少人的竞赛成绩不低于70分;(3)在选取的样本中,从竞赛成绩是80分以上(含80分)的同学中随机抽取两名同学参加环保知识宣传活动,求所抽取的2名同学来自同一组的概率.解析 (1)a=0.24,b=2,c=0.04.(2)在选取的样本中,竞赛成绩不低于70分的频率是0.5+0.06+0.04=0.6,根据样本估计总体的思想,有1000×0.6=600(人).∴这1000名学生中有600人的竞赛成绩不低于70分.(3)成绩是80分以上(含80分)的同学共有5人,其中成绩在80~90(含80,不含90)分的有3人,记为A1,A2,A3,成绩在90~100(含90和100)分的有2人,记为B1,B2,从成绩是80分以上(含80分)的同学中随机抽取两名同学,情形如树状图所示,共有20种情况:抽取的2名同学来自同一组的有A1,A2;A1,A3;A2,A1;A2,A3;A3,A1;A3,A2;B1,B2;B2,B1,共8种情况,∴抽取的两名同学来自同一组的概率P=820=25.思路分析 (1)由频数分布直方图与频数分布表即可得出;(2)根据(1)及频数分布表来求即可;(3)先找出成绩在80~90(含80,不含90)和90~100(含90和100)的同学人数,然后根据树状图得出所有可能的情况,最后求出概率. 变式训练 (2018青岛,18,6分)八年级(1)班研究性学习小组为研究全校同学课外阅读情况,在全校随机邀请了部分同学参与问卷调查,统计同学们一个月阅读课外书的数量,并绘制了以下统计图.请根据图中信息解决下列问题:(1)共有 名同学参与问卷调查;(2)补全条形统计图和扇形统计图;(3)全校共有学生1500人,请估计该校学生一个月阅读2本课外书的人数约为多少.解析 (1)100.(2)一个月阅读4本课外书的女生人数为100×15%-10=5,第七章 统计与概率63 一个月阅读2本课外书的学生人数所占百分比为20+18100×100%=38%,补全统计图如下:(3)该校学生一个月阅读2本课外书的人数约为1500×38%=570.思路分析 (1)根据一个月阅读1本(或3本)课外书的学生人数及所占百分比可求得参与问卷调查的总人数;(2)计算一个月阅读4本课外书的女生人数,补全条形统计图,计算一个月阅读2本课外书的学生人数所占百分比补全扇形统计图;(3)用样本中一个月阅读2本课外书的学生人数所占百分比来估计总体.方法规律 对于条形统计图和扇形统计图的综合运用的有关问题,关键是读懂统计图,从不同的统计图中得到必要的信息,从同一部分的频数和百分比入手,可求样本容量;利用样本去估算总体是统计中重要的数学思想.另外,双图题通常把两个统计图的公共部分作为解题的突破口.归纳拓展 统计图中相关量的计算方法如下:(1)条形统计图:一般涉及补图,也就是求未知组的频数,方法如下:①未知组频数=样本总量-已知组频数之和;②未知组频数=样本容量×该组所占样本百分比.(2)扇形统计图:一般涉及求未知组的百分比或其对应扇形圆心角的度数,方法如下:①未知组的百分比=1-已知组的百分比之和;②未知组的百分比=未知组频数样本容量×100%;③若求未知组在扇形统计图中对应圆心角的度数,则利用360°×其所占样本百分比求解.