回扣6概率与统计1.分类加法计数原理完成一件事有两类不同方案,在第1类方案中有m种不同的方法,在第2类方案中有n种不同的方法,那么完成这件事共有N=m+n种不同的方法.2.分步乘法计数原理完成一件事需要两个步骤,做第1步有m种不同的方法,做第2步有n种不同的方法,那么完成这件事共有N=m×n种不同的方法.3.排列(1)排列的定义:从n个不同元素中取出m(m≤n)个元素,并按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列.(2)排列数的定义:从n个不同元素中取出m(m≤n)个元素的所有不同排列的个数,叫做从n个不同元素中取出m个元素的排列数,用符号Amn表示.(3)排列数公式:Amn=n(n-1)(n-2)…(n-m+1).(4)全排列:把n个不同元素全部取出的一个排列,叫做n个元素的一个全排列,Ann=n×(n-1)×(n-2)×…×3×2×1=n!.排列数公式写成阶乘的形式为Amn=n!n-m!,这里规定0!=1.4.组合(1)组合的定义:从n个不同元素中取出m(m≤n)个元素合成一组,叫做从n个不同元素中取出m个元素的一个组合.(2)组合数的定义:从n个不同元素中取出m(m≤n)个元素的所有不同组合的个数,叫做从n个不同元素中取出m个元素的组合数,用符号Cmn表示.(3)组合数的计算公式:Cmn=AmnAmm=n!m!n-m!=nn-1n-2…n-m+1m!,由于0!=1,所以C0n=1.(4)组合数的性质:①Cmn=Cn-mn;②Cmn+1=Cmn+Cm-1n.5.二项式定理(a+b)n=C0nan+C1nan-1b1+…+Cknan-kbk+…+Cnnbn(n∈N*).这个公式叫做二项式定理,右边的多项式叫做(a+b)n的二项展开式,其中各项的系数Ckn(k∈{0,1,2,…,n})叫做二项式系数.式中的Cknan-kbk叫做二项展开式的通项,用Tk+1表示,即通项为展开式的第k+1项:Tk+1=Cknan-kbk.6.二项式系数的性质(1)对称性:与首末两端“等距离”的两个二项式系数相等,即Cmn=Cn-mn.(2)增减性与最大值:二项式系数先增后减,中间一项或两项的二项式系数最大.二项式系数为Ckn,当kn+12时,Ckn随k的增加而增大;由对称性知,当kn+12时,Ckn随k的增加而减小.当n是偶数时,中间的一项2Cnn取得最大值;当n是奇数时,中间的两项12Cnn和12Cnn相等,且同时取得最大值.(3)各二项式系数的和(a+b)n的展开式的各个二项式系数的和等于2n,即C0n+C1n+C2n+…+Ckn+…+Cnn=2n.二项展开式中,偶数项的二项式系数的和等于奇数项的二项式系数的和,即C1n+C3n+C5n+…=C0n+C2n+C4n+…=2n-1.7.概率的计算公式(1)古典概型的概率计算公式P(A)=A包含的基本事件的个数基本事件的总数.(2)几何概型的概率计算公式P(A)=构成事件A的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.(3)互斥事件的概率计算公式P(A∪B)=P(A)+P(B).(4)对立事件的概率计算公式P(A)=1-P(A).(5)条件概率公式P(B|A)=PABPA.8.统计中四个数据特征(1)众数:①在样本数据中,出现次数最多的那个数据.②频率分布直方图中,众数是最高矩形的底边中点的横坐标.(2)中位数:在样本数据中,将数据按从小到大(或从大到小)的顺序排列,位于中间的那个数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x=1n(x1+x2+…+xn).(4)方差与标准差:反应样本数据的分散程度.方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].标准差:s=1n[x1-x2+x2-x2+…+xn-x2].9.离散型随机变量(1)离散型随机变量的分布列的两个性质①pi≥0(i=1,2,…,n);②p1+p2+…+pn=1.(2)均值公式E(X)=x1p1+x2p2+…+xipi+…+xnpn=i=1nxipi.(3)均值的性质①E(aX+b)=aE(X)+b;②若X~B(n,p),则E(X)=np;③若X服从两点分布,则E(X)=p.(4)方差公式D(X)=i=1n(xi-E(X))2pi,标准差为DX.(5)方差的性质①D(aX+b)=a2D(X);②若X~B(n,p),则D(X)=np(1-p);③若X服从两点分布,则D(X)=p(1-p).(6)独立事件同时发生的概率计算公式P(AB)=P(A)P(B).(7)独立重复试验的概率计算公式P(X=k)=Cknpk(1-p)n-k,k=0,1,2,…,n.10.线性回归模型(1)线性回归方程y^=b^x+a^一定过样本点的中心(x,y),其中b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.(2)相关系数r具有如下性质:①|r|≤1;②|r|越接近于1,x,y的线性相关程度越强;③|r|越接近于0,x,y的线性相关程度越弱.11.独立性检验利用随机变量K2=nad-bc2a+bc+da+cb+d(n=a+b+c+d)来判断“两个分类变量有关系”的方法称为独立性检验.如果K2的观测值k越大,说明“两个分类变量有关系”的可能性越大.12.正态分布如果随机变量X服从正态分布,则记为X~N(μ,σ2).满足正态分布的三个基本概率的值是①P(μ-σX≤μ+σ)≈0.6827;②P(μ-2σX≤μ+2σ)≈0.9545;③P(μ-3σX≤μ+3σ)≈0.9973.1.关于两个计数原理应用的注意事项分类加法计数原理和分步乘法计数原理,都是关于做一件事的不同方法的种数的问题,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以完成这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.2.排列、组合问题的求解方法与技巧(1)特殊元素或特殊位置优先安排.(2)合理分类与准确分步.(3)排列、组合混合问题先选后排.(4)相邻问题捆绑处理.(5)不相邻问题插空处理.(6)定序问题排除法处理.(7)正难则反,等价条件.3.二项式定理应用时的注意事项(1)注意区别“项的系数”与“二项式系数”,审题时要仔细.项的系数与a,b有关,可正可负,二项式系数只与n有关,恒为正.(2)赋值法求展开式中的系数和或部分系数和,常赋的值为0,±1.4.应用互斥事件的概率加法公式时,一定要先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.5.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.6.易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.7.要注意概率P(A|B)与P(AB)的区别(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).8.(1)易忘判定随机变量是否服从二项分布,盲目使用二项分布的均值和方差公式计算致误.(2)涉及求分布列时,要注意区分是二项分布还是超几何分布.