统计与概率第1讲统计了解①总体、个体、样本、样本容量等概念;②频数、频率的概念.理解①中位数、众数的概念;②极差、方差、标准差的意义;③用扇形统计图,条形统计图以及折线统计图描述数据的异同.掌握①调查的两种方式:抽样调查和普查;②平均数、中位数、众数的计算方法,区别联系;③条形统计图、折线统计图和扇形统计图的特点及应用.熟练掌握①选择数据代表的方法;②计算数据的方差、标准差的方法;③计算平均数、加权平均数的公式;④调查方式的选择应用.一、数据的收集1.调查方式:(1)普查:为了一定目的而对考察对象进行的________调查,称为普查.(2)抽样调查:人们从总体中抽取__________进行调查,这种调查称为抽样调查.全面一部分个体2.总体、个体和样本:(1)总体:所要考察的对象的________叫做总体,组成总体的每一个________叫做个体.(2)从总体中抽取的一部分用于调查的________叫做总体的一个样本.(3)样本容量:样本中所包括的个体的________叫做样本容量.全体对象对象数目友情提示:(1)当总体中数目较少时,调查范围小时可用普查方式调查;当总体数目过于庞大不需要太过准确或调查具有破坏性时,可用抽样调查方式调查.(2)总体是“物”的全体而非“数”的全体,样本中个体的数目叫“样本容量”,它是一个正整数.二、数据的整理1.扇形统计图:能清楚地表示出各部分在总体中所占的________,但是不能清楚地表示出每个项目的具体数目以及事物的变化情况.2.条形统计图:能清楚地表示出每个项目的________,但是不能清楚地表示出各个部分在总体中所占的百分比以及事物的变化情况.3.折线统计图:能清楚地反映事物的________情况,但是不能清楚地表示出在总体中所占的百分比.4.频数分布直方图以及频数分布折线图:能清楚地表示出收集或调查得到的_________________.友情提示:各种统计图各有其优缺点,要根据实际需要选择一种整理描述数据百分比具体数目变化各组的频数及变化三、数据的代表1.平均数:一组数据的平均值.平均数能够反映一组数据的平均水平,n个数据x1,x2,…,xn的平均数为:x=________________________________;加权平均数:当所给的n个数据中,x1出现f1次,x2出现f2次,…,xk出现fk次,则x=_____________________________.(其中f1+f2+f3+…+fk=n)2.众数和中位数:一组数据中出现________的那个数据叫做这组数据的众数;n个数据按大小顺序排列,处于________位置的一个数据(或最中间两个数据的________)叫做这组数据的中位数.友情提示:平均数的计算用到所有的数据,在现实生活中较为常用,但它受极端值的影响;中位数是唯一的,仅与数据的排列位置有关,它不能充分利用所有数据;众数可能一个,也可能多个,它一定是这组数据中的数.次数最多中间平均数四、数据的波动1.极差:一组数据中________数据与________数据的差叫极差.2.方差:方差是各个数据与平均数之差的平方的________,即s2=________________________________.(其中,代表x1,x2,…,xn的平均数,s2表示方差)3.标准差:标准差s是方差s2的____________.最大最小平均数算术平方根友情提示:极差、方差、标准差是刻画数据离散程度的三个量.极差反映数据的波动范围,计算方便;方差、标准差反映事物的稳定性,方差、标准差越大,说明其稳定性越差;方差、标准差越小,说明其数据在平均水平上下波动不大,稳定性就越强.五、频数与频率1.频数表示每个对象出现的________.2.频率表示每个对象出现的次数与________的比值.(或百分比)友情提示:所有频数总和等于这组数据的总数;所有小组的频率之和等于1.次数总数1.(2010·重庆)下列调查中,适宜采用全面调查(普查)方式的是()A.对全国中学生心理健康现状的调查B.对市场上的冰淇淋质量的调查C.对某市市民实施低碳生活情况的调查D.对我国首架大型民用直升机各零部件的检查D2.(2010·益阳)某班体育委员记录了第一小组七位同学定点投篮(每人投10个)的情况,投进篮筐的个数为6,10,5,3,4,8,4,这组数据的中位数和极差分别是()A.4,7B.7,5C.5,7D.3,7C3.某校九年级学生总人数为500,其男女生所占比例如图8-1-1所示,则该校九年级男生人数为()A.48B.52C.240D.260D4.某鞋店销售一新款女鞋,试销期间对不同颜色的销售情况统计如下表:鞋店经理最关心的是哪种颜色鞋最畅销,则对鞋店经理最有意义的统计量是()A.平均数B.众数C.中位数D.方差颜色黑色棕色白色红色销售量(双)60501015B5.某市移动公司为了调查手机发送短信息的情况,在本区域的1000位用户中抽取了10位用户来统计他们某月份发送信息的条数,结果如下表所示:则本次调查中抽取的样本容量是________,中位数是________,众数是________.手机用户序号12345678910发送短信息条数857883798485868880851084.5856.小颖统计了某冷饮店五种冷饮产品的销售量,制作了频数分布直方图,如图8-1-2所示,则A冷饮销售量的频数与频率分别是________,________.131131/518收集数据的方式,即获得数据采取的方法一般为普查和抽样调查.很多考题结合生活中的实际问题,依据两种调查方式的特点,判断采用哪种方式进行调查.此类型问题近年出现频率较高,解题时一要彻底掌握两种方式的优缺点,二要考虑实际情况以选择既准确又快捷的调查方式.【例1】下列调查方式中适合的是()A.要了解一批节能灯的使用寿命,采用普查方式B.调查你所在班级同学的身高,采用抽样调查方式C.环保部门调查沱江某段水域的水质情况,采用抽样调查方式D.调查全市中学生每天的就寝时间,采用普查方式思路分析:普查适合于调查范围小(或个体较少),要求比较准确(人口普查)调查对象较稳定这样事件的调查;抽样调查适合于调查范围大,个体数目庞大,流动数据或带有破坏性等事件的调查,A项具有破坏性;B项调查对象较少;C项范围广;D项数目较大.答案:C平均数、中位数和众数作为数据的代表,是历年中考必考内容,重点是计算一组数据的平均数或加权平均数,找出一组数据的中位数或众数.难点是根据实际问题判断这三种数哪一个最能反映一组数据的平均水平.解答时,一定熟记平均数的计算公式,平均数、众数、中位数各自的意义,它们的优缺点.【例2】物理兴趣小组20位同学在实验操作中的得分情况如下表:问:(1)求这20位同学实验操作得分的众数、中位数;(2)这20位同学实验操作得分的平均分是多少?得分(分)10987人数(人)5843思路分析:(1)由众数的定义知,该组数据的众数是出现次数最多的数,8人得9分,9分出现次数最多;中位数将这20名同学的成绩按大小顺序排列后,第10、11名同学的平均成绩.(2)代入加权平均数计算公式x=1n(x1f1+x2f2+…+xkfk)(f1+f2+…+fk=n).解:(1)得9分的人数最多,共8人,故该组数据的众数为9分,将20名同学成绩按大小排列后第10、11名同学的成绩都是9分,故中位数为9分.所以这20名同学实验操作得分的平均分是8.75分.【例3】(2010·浙江)如图8-1-3所示是甲、乙两射击运动员的10次射击训练成绩(环数)的折线统计图,观察图形,甲、乙这10次射击成绩的方差s,s之间的大小关系是________.本考点主要考查计算一组数据的极差、方差或标准差,利用极差、方差以及标准差反映数据的波动大小从而确定哪组数据更稳定;由已知数据的平均数计算数据的方差,此类问题的解答,一要熟记方差公式,二是明确公式中各字母表示的意义.思路分析:求方差需利用公式s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]计算,这样根据图中反映的甲、乙两运动员的成绩求出平均成绩x甲、x乙,代入公式便算出s2甲和s2乙.本部分包括根据频数、频率的概念,由已知频数、总数计算相应频率,由频率和总数计算频数,由频数和频率计算总数;根据频数,频率分布表制作或补全频数分布直方图以及频率分布直方图;把一组数据适当分组后作频数(或频率)分布直方图.该考点是必考内容之一,题型选择、填空、解答都有,掌握好频数、频率的概念,明确样本估计总体的方法是解题的基础.【例4】(2010·潼南)根据市教委提出的学生每天体育锻炼不少于1小时的要求,为确保每天体育运动时间得到落实,某校对九年级学生每天参加体育锻炼的时间作了一次抽样调查,频数分布表其中部分结果记录如下:时间分组(小时)频数(人数)频率0≤t<0.5100.20.5≤t<10.41≤t<1.5100.21.5≤t<20.12≤t<2.55合计1请你将频数分布表和频数分布直方图(图8-1-4所示)补充完整.思路分析:观察频数分布表知,频数为10时的频率等于0.2,根据“=频率”可计算出总数(样本容量),再由计算出的总数代入公式分别计算出各组的频数或频率,再填入表格.在频数分布直方图中找出第二、四组对应的频数,补全直方图.答案:直方图如图8-1-5所示.时间分组(小时)频数(人数)频率0≤t<0.5100.20.5≤t<1200.41≤t<1.5100.21.5≤t<250.12≤t<2.550.1合计501常见统计图有扇形图、条形图、折线图,它们各有优缺点,分别重点反映了数据中某一部分所占的百分比,各部分具体数目,数据的变化趋势.考题主要涉及(1)根据实际问题选择其中的统计图描述数据;(2)统计图之间的相互转化;(3)综合其中两种统计图进行计算.要明确各种统计图的构成,图中各部分所表示的意义.【例5】光明中学七年级甲、乙、丙三个班中,每班的学生人数都为40名,某次数学考试的成绩统计如下:(每组分数含最小值,不含最大值)丙班数学成绩频数统计表请根据以上图(如图8-1-6)表提供的信息,确定80~90分这一组人数最多的是哪个班.分数50~6060~7070~8080~9090~100人数1415119思路分析:根据三种图表比较三个班80~90分的人数,就是利用各图表分别求出三个班在80~90分的人数.甲班为频数分布直方图,除80~90分组其它组的频数能直接读出,用总数减去其它各组频数即80~90分组的人数;乙班为扇形统计图,80~90分组的比例可由1-35%-10%-5%-20%计算得出,丙班直接由表格获得.解:甲班在80~90分的频数为40-2-5-12-8=13.乙班在80~90分的频数为:40×(1-35%-10%-5%-20%)=12.丙班由表格直接看出在80~90分的人数为11人,所以80~90分这一组人数最多的是甲班.本部分主要是些综合性解答题,包括统计中多方面的知识,综合考查对各种统计的特征量,统计量,统计图的应用,类型有:根据统计表或统计图计算数据的平均数、众数或中位数;利用已知图表信息求极差、方差从而确定数据稳定性;给出一组或几组数据,对其进行处理,再比较优劣;综合数据集中趋势,波动情况结合频数或频率分布直方图或折线图做出决策等问题.【例6】一方有难,八方支援.2010年4月14日青海玉树发生7.1级强烈地震,给玉树人民造成了巨大的损失.灾难发生后,实验中学举行了爱心捐款活动,全校同学纷纷拿出自己的零花钱,踊跃捐款支援灾区人民,小慧对捐款情况进行了抽样调查,抽取了40名同学的捐款数据,把数据进行分组、列频数分布表后,绘制了频数分布直方图,图中从左到右各长方形高度之比为3∶4∶5∶7∶1(如图8-1-7所示).(1)捐款20元这一组的频数是________;(2)