王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日1编号:WZS-20140401作者:田彩虹班级:姓名:学号:评价:课题统计与统计案例教学目标1系统抽样,分层抽样,简单随机抽样2频率分布直方图,线性回归方程,独立性检验3求概率,课型复习课时2基础知识1.随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.2.总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确.3.线性回归方程(1)对n个样本数据(x1,y1),(x2,y2),…,(xn,yn),其线性回归方程为y^=b^x+a^,其中b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x,x、y分别是{}xi、{}yi的平均数.(2)相关系数r>0,表明两个变量正相关;r<0,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系;|r|>0.75时,认为两变量有很强的线性相关关系.4.独立性检测的一般步骤(1)根据样本数据列出2×2列联表,假设两个变量无关系;(2)根据公式K2=nad-bc2a+bc+da+cb+d计算K2的值;(3)比较K2与临界值的大小关系作统计推断.一例题精析自我升华:王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日2例1(1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9C.10D.15(2)某学校高一、高二、高三三个年级共有学生3500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为()A.8B.11C.16D.10变式训练1(1)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为()A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有________.例2(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日3变式训练2(1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则()A.x甲x乙,m甲m乙B.x甲x乙,m甲m乙C.x甲x乙,m甲m乙D.x甲x乙,m甲m乙(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为________;平均分为________.例3(1)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:优秀非优秀总计A班14620B班71320总计211940附:参考公式及数据①卡方统计量:K2=nad-bc2a+bc+da+cb+d(其中n=a+b+c+d);②独立性检验的临界值表:王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日4P(K2≥k0)0.0500.010k03.8416.635则下列说法正确的是()A.有99%的把握认为环保知识测试成绩与专业有关B.有99%的把握认为环保知识测试成绩与专业无关C.有95%的把握认为环保知识测试成绩与专业有关D.有95%的把握认为环保知识测试成绩与专业无关变式训练3某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)二课堂练习1(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.142(2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日5A.588B.480C.450D.1203.(2013·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,84.(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确...的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg5.(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.6.某校共有学生2000名,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373xy男生377370zA.24B.18C.16D.12王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日6三作业1.(2012·山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差2.(2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为__________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.3.如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有()A.a1a2B.a2a1C.a1=a2D.a1,a2大小与m的值有关4.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日75.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.课后反思:王官营中学高三年级数学科导学案*高三年级数学组编制*审核:*日期:2014年4月1日8详解答案例1答案(1)C(2)A解析(1)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人.(2)若设高三学生数为x,则高一学生数为x2,高二学生数为x2+300,所以有x+x2+x2+300=3500,解得x=1600,故高一学生数为800,因此应抽取高一学生数为800100=8.变式训练1(1)答案B(2答案760解析设该校的女生为x人,男生为(1600-x)人,则按照分层抽样,各层的比例为2001600=18,所以女生抽取x8,男生抽取1600-x8,所以x8+10=1600-x8,解得x=760.例2解(1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10(人).变式训练2(1)答案B解析由茎叶图可知甲数据集中在10至20