第9讲离散型随机变量的均值与方差、正态分布1.离散型随机变量的均值与方差若离散型随机变量X的分布列为Xx1x2…xi…xnPp1p2…pi…pn(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.(2)D(X)=∑ni=1(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根D(X)为随机变量X的标准差.2.均值与方差的性质(1)E(aX+b)=aE(X)+b(2)D(aX+b)=a2D(X)(a,b为常数).3.两点分布与二项分布的均值、方差XX服从两点分布X~B(n,p)E(X)p(p为成功概率)npD(X)p(1-p)np(1-p)4.正态曲线的特点(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值1σ2π;(4)曲线与x轴之间的面积为1;(5)当σ一定时,曲线随着μ的变化而沿x轴平移;(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.[做一做]1.(2015·杭州模拟)甲、乙两人参加某高校的自主招生考试,若甲、乙能通过面试的概率都为23,且甲、乙两人能否通过面试相互独立,则面试结束后通过人数ξ的数学期望E(ξ)的值为________.解析:由题意可知,ξ~B(2,23),所以E(ξ)=2×23=43.答案:432.(2014·高考浙江卷)随机变量ξ的取值为0,1,2.若P(ξ=0)=15,E(ξ)=1,则D(ξ)=________.解析:设P(ξ=1)=a,P(ξ=2)=b,则15+a+b=1,a+2b=1,解得a=35,b=15,所以D(ξ)=15+35×0+15×1=25.答案:251.辨明两个易误点(1)理解均值E(X)易失误,均值E(X)是一个实数,由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X值的取值平均状态.(2)注意E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)易错.2.正态分布的三个常用数据(1)P(μ-σ<X≤μ+σ)=0.6826;(2)P(μ-2σ<X≤μ+2σ)=0.9544;(3)P(μ-3σ<X≤μ+3σ)=0.9974.3.求离散型随机变量均值、方差的基本方法(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量ξ的均值、方差,求ξ的线性函数η=aξ+b的均值、方差和标准差,可直接用ξ的均值、方差的性质求解;(3)如能分析所给随机变量服从常用的分布(如两点分布、二项分布等),可直接利用它们的均值、方差公式求解.[做一做]3.两封信随机投入A,B,C三个空邮箱,则A邮箱的信件数X的数学期望E(X)=________.解析:两封信投入A,B,C三个空邮箱,投法种数是32=9,A中没有信的投法种数是2×2=4,概率为49,A中仅有一封信的投法种数是C12×2=4,概率为49,A中有两封信的投法种数是1,概率为19,故A邮箱的信件数X的数学期望是49×0+49×1+19×2=23.答案:234.已知ξ~N(0,σ2)且P(-2≤ξ≤0)=0.4,则P(ξ>2)=________.解析:因为P(0≤ξ≤2)=P(-2≤ξ≤0)=0.4,所以P(ξ>2)=12×(1-2×0.4)=0.1.答案:0.1考点一__离散型随机变量的均值与方差(高频考点)___离散型随机变量的均值与方差是高考命题的热点,多以解答题的形式呈现,多为中档题.高考对离散型随机变量的均值与方差的考查主要有以下三个命题角度:(1)已知离散型随机变量符合条件,求其均值与方差;(2)已知离散型随机变量的均值与方差,求参数值;(3)已知离散型随机变量满足两种方案,试作出判断.(2014·高考湖南卷)某企业有甲、乙两个研发小组,他们研发新产品成功的概率分别为23和35.现安排甲组研发新产品A,乙组研发新产品B.设甲、乙两组的研发相互独立.(1)求至少有一种新产品研发成功的概率;(2)若新产品A研发成功,预计企业可获利润120万元;若新产品B研发成功,预计企业可获利润100万元.求该企业可获利润的分布列和数学期望.[解]记E={甲组研发新产品成功},F={乙组研发新产品成功}.由题设知P(E)=23,P(E-)=13,P(F)=35,P(F-)=25,且事件E与F,E与F-,E-与F,E-与F-都相互独立.(1)记H={至少有一种新产品研发成功},则H-=E-F-,于是P(H-)=P(E-)P(F-)=13×25=215,故所求的概率为P(H)=1-P(H-)=1-215=1315.(2)设企业可获利润为X万元,则X的可能取值为0,100,120,220.因为P(X=0)=P(E-F-)=13×25=215,P(X=100)=P(E-F)=13×35=315,P(X=120)=P(EF-)=23×25=415,P(X=220)=P(EF)=23×35=615,故所求的分布列为X0100120220P215315415615数学期望为E(X)=0×215+100×315+120×415+220×615=300+480+132015=210015=140.[规律方法]求离散型随机变量ξ的均值与方差的方法:(1)理解ξ的意义,写出ξ可能取的全部值;(2)求ξ取每个值的概率;(3)写出ξ的分布列;(4)由均值的定义求E(ξ);(5)由方差的定义求D(ξ).1.(1)一个盒子里装有7张卡片,其中有红色卡片4张,编号分别为1,2,3,4;白色卡片3张,编号分别为2,3,4.从盒子中任取4张卡片(假设取到任何一张卡片的可能性相同).①求取出的4张卡片中,含有编号为3的卡片的概率;②在取出的4张卡片中,红色卡片编号的最大值设为X,求随机变量X的分布列和数学期望.(2)(2015·沈阳市教学质量监测)为向国际化大都市目标迈进,沈阳市今年新建三大类重点工程,它们分别是30项基础设施类工程、20项民生类工程和10项产业建设类工程.现有来沈阳的3名工人相互独立地从这60个项目中任选一个项目参与建设.①求这3人选择的项目所属类别互异的概率;②将此3人中选择的项目属于基础设施类工程或产业建设类工程的人数记为X,求X的分布列和数学期望.解:(1)①设“取出的4张卡片中,含有编号为3的卡片”为事件A,则P(A)=C12C35+C22C25C47=67.所以,取出的4张卡片中,含有编号为3的卡片的概率为67.②随机变量X的所有可能取值为1,2,3,4.P(X=1)=C33C47=135,P(X=2)=C34C47=435,P(X=3)=C35C47=27,P(X=4)=C36C47=47.所以随机变量X的分布列是X1234P1354352747随机变量X的数学期望E(X)=1×135+2×435+3×27+4×47=175.(2)记第i名工人选择的项目属于基础设施类、民生类、产业建设类分别为事件Ai、Bi、Ci,i=1,2,3.由题意知A1、A2、A3、B1、B2、B3、C1、C2、C3均相互独立.则P(Ai)=3060=12,P(Bi)=2060=13,P(Ci)=1060=16,i=1,2,3,①3人选择的项目所属类别互异的概率:P1=A33P(A1B2C3)=6×12×13×16=16.②任一名工人选择的项目属于基础设施类或产业建设类工程的概率:P2=30+1060=23,由X~B(3,23),得P(X=k)=Ck3(23)k(1-23)3-k(k=0,1,2,3),∴X的分布列为X0123P1272949827其数学期望为E(X)=3×23=2.考点二__均值与方差的实际应用________________(2014·高考湖北卷)计划在某水库建一座至多安装3台发电机的水电站.过去50年的水文资料显示,水库年入流量X(年入流量:一年内上游来水与库区降水之和.单位:亿立方米)都在40以上.其中,不足80的年份有10年,不低于80且不超过120的年份有35年,超过120的年份有5年.将年入流量在以上三段的频率作为相应段的概率,并假设各年的年入流量相互独立.(1)求未来4年中,至多有1年的年入流量超过120的概率;(2)水电站希望安装的发电机尽可能运行,但每年发电机最多可运行台数受年入流量X限制,并有如下关系:年入流量X发电机最多40<X<8080≤X≤120X>120可运行台数123若某台发电机运行,则该台年利润为5000万元;若某台发电机未运行,则该台年亏损800万元.欲使水电站年总利润的均值达到最大,应安装发电机多少台?[解](1)依题意,p1=P(40<X<80)=1050=0.2,p2=P(80≤X≤120)=3550=0.7,p3=P(X>120)=550=0.1.由二项分布,在未来4年中至多有1年的年入流量超过120的概率为p=C04(1-p3)4+C14(1-p3)3p3=9104+4×9103×110=0.9477.(2)记水电站年总利润为Y(单位:万元).①安装1台发电机的情形.由于水库年入流量总大于40,故一台发电机运行的概率为1,对应的年利润Y=5000,E(Y)=5000×1=5000.②安装2台发电机的情形.依题意,当40<X<80时,一台发电机运行,此时Y=5000-800=4200,因此P(Y=4200)=P(40<X<80)=p1=0.2;当X≥80时,两台发电机运行,此时Y=5000×2=10000,因此P(Y=10000)=P(X≥80)=p2+p3=0.8.由此得Y的分布列如下:Y420010000P0.20.8所以,E(Y)=4200×0.2+10000×0.8=8840.③安装3台发电机的情形.依题意,当40<X<80时,一台发电机运行,此时Y=5000-1600=3400,因此P(Y=3400)=P(40<X<80)=p1=0.2;当80≤X≤120时,两台发电机运行,此时Y=5000×2-800=9200,因此P(Y=9200)=P(80≤X≤120)=p2=0.7;当X>120时,三台发电机运行,此时Y=5000×3=15000,因此P(Y=15000)=P(X>120)=p3=0.1,由此得Y的分布列如下:Y3400920015000P0.20.70.1所以,E(Y)=3400×0.2+9200×0.7+15000×0.1=8620.综上,欲使水电站年总利润的均值达到最大,应安装发电机2台.[规律方法]均值与方差的实际应用(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用D(X)来描述X的分散程度.(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.2.(2015·山西省四校联考)学校设计了一个实验学科的考查方案:考生从6道备选题中一次随机抽取3道题,按照题目要求独立完成全部实验操作,并规定:在抽取的3道题中,至少正确完成其中2道题便可通过考查.已知6道备选题中考生甲有4道题能正确完成,2道题不能完成;考生乙每题正确完成的概率都为23,且每题正确完成与否互不影响.(1)求考生甲正确完成题目个数ξ的分布列和数学期望;(2)用统计学知识分析比较甲、乙两考生哪位实验操作能力强及哪位通过考查的可能性大?解:(1)由题意知ξ的可能取值为1,2,3,P(ξ=1)=C14C22C36=15,P(ξ=2)=C24C12C36=35,P(ξ=3)=C34C02C36=15,所以,考生甲正确完成题目数的分布列为:ξ123P153515所以E(ξ)=1×15+2×3