艺术生辅导资料1概率与统计知识梳理1.简单随机抽样2.系统抽样(1)步骤:①先将总体的N个个体编号;②根据样本容量n,当Nn是整数时,取分段间隔k=Nn;③在第1段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.(2)适用范围:适用于总体中的个体数较多时.(3)系统抽样是等距离抽样.3.分层抽样4.三种抽样方法的比较类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成练习1将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,三个营区被抽中的人数依次为________.练习2某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为________.5.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.6.频率分布直方图利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.(1)作频率分布直方图的方法①先制作频率分布表,然后作直角坐标系.②把横轴分成若干段,每一线段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形.③每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.(2)频率分布直方图的特征①从频率分布直方图可以清楚地看出数据分布的总体趋势;②从频率分布直方图中得不出原始的数据内容,把数据表示为频率分布直方图后,原有的数据信息就丢失了;③直方图中各小长方形的面积之和为1.④直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.⑤直方图中每组样本的频数为频率×总体数.7.茎叶图8.样本的数字特征:众数、中位数、平均数、方差、标准差标准差与方差:s=1n[x1-x2+x2-x2+…+xn-x2],s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]练习3某中学为了了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.艺术生辅导资料2练习4如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为________.练习5样本中有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.9.回归直线方程(1)线性相关在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是线性相关,这条直线叫回归直线.若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.(2)回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.b=∑ni=1xi-xyi-y∑ni=1xi-x2=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a=y-bx.说明:回归直线必过样本中心(x,y),但是样本数据不一定在回归直线上,甚至可能所有的样本数据点都不在直线上.10.相关系数相关系数r=∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1yi-y2=∑ni=1xiyi-nxy∑ni=1x2i-nx2∑ni=1y2i-ny2;当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.11.独立性检验设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;2×2列联表:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d构造一个随机变量χ2=nad-bc2a+bc+da+cb+d.利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联;当χ22.706时,有90%的把握判定变量A,B有关联;当χ3.841时,有95%的把握判定变量A,B有关联;当χ6.635时,有99%的把握判定变量A,B有关联.例已知x,y取值如下表:x014568y1.31.85.66.17.49.3从所得的散点图分析可知:y与x线性相关,且y^=0.95x+a,则a=________.变式训练已知x与y之间的一组数据:x0123艺术生辅导资料3ym35.57已求得关于y与x的线性回归方程y^=2.1x+0.85,则m的值为________.例下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)变式训练(2015新课标Ⅰ文)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费ix和年销售量1,2,,8iyi数据作了初步处理,得到下面的散点图及一些统计量的值.年宣传费/千元年销售量/t620600580560540520500480565452504846444240383634xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)·(yi-y)i=18(wi-w)·(yi-y)46.65636.8289.81.61469108.8表中wi=xi,w=18i=18wi.(I)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(II)根据(I)的判断结果及表中数据,建立y关于x的回归方程;(III)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(II)的结果回答下列问题:(i)当年宣传费90x时,年销售量及年利润的预报值时多少?(ii)当年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=i=1nui-uvi-vi=1nui-u2,α^=v-β^u.例有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是________.①列联表中c的值为30,b的值为35②列联表中c的值为15,b的值为50③根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”变式训练通过随机询问110名大学生是否爱好某项运动,得到如下列联表:男女总计爱好402060不爱好203050总计6050110艺术生辅导资料4由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),得K2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是________.①有99%以上的把握认为“爱好该项运动与性别有关”②有99%以上的把握认为“爱好该项运动与性别无关”③在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”④在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”12.古典概型具有以下两个特征的随机试验的数学模型称为古典的概率模型,简称古典概型.(1)试验的所有可能结果只有有限个,每次试验只出现其中的一个结果.(2)每一个试验结果出现的可能性相等.13.古典概型的概率公式P(A)=事件A包含的可能结果数试验的所有可能结果数=mn.例(2015新课标Ⅰ文)如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为________.变式训练(2014·高考天津卷)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:一年级二年级三年级男同学ABC女同学XYZ现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.14.几何概型如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称几何概型.15.几何概型的概率公式P(A)=构成事件A的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积)例在区间[-2,3]上随机选取一个数X,则X≤1的概率为________.变式训练在区间[0,2]上随机地取一个数x,则事件“-1≤log12x+12≤1”发生的概率为________.例若将一个质点随机投入如图所示的长方形ABCD中,其中AB=2,BC=1,则质点落在以AB为直径的半圆内的概率是________.变式训练如图,矩形ABCD中,点A在x轴上,点B的坐标为(1,0),且点C与点D在函数f(x)=x+1,x≥0,-12x+1,x<0的图象上.若在矩形ABCD内随机取一点,则此点取自阴影部分的概率等于________.例在棱长为2的正方体ABCDA1B1C1D1中,点O为底面ABCD的中心,在正方体ABCDA1B1C1D1内随机取一点P,则点P到点O的距离大于1的概率为________.变式训练有一个底面圆的半径为1、高为2的圆柱,点O为这个圆柱底面圆的圆心,在这个圆柱内随机取一点P,则点P到点O的距离大于1的概率为________.课后练习1.[2016·全国卷Ⅰ]为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是()A.13B.12C.23D.56艺术生辅导资料52.[2017·全国卷Ⅰ]如图11,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是()图11A.14B.π8C.12D.π43.[2017·全国卷Ⅰ]为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.9