易错点16随机变量及其分布列易错点1.随机变量和分布列理解错误1.离散型随机变量一般地,如果随机试验的样本空间为Ω,而且对于Ω中的每一个样本点,变量X都对应有唯一确定的实数值,就称X为一个随机变量.其所有可能的取值都是可以一一列举的随机变量称为离散型随机变量.2.离散型随机变量的分布列一般地,若离散型随机变量X的取值范围是{x1,x2,…,xn},如果对任意k∈{1,2,…,n},概率P(X=xk)=pk都是已知的,则称X的概率分布是已知的,离散型随机变量X的概率分布可以用如下形式的表格表示,这个表格称为X的概率分布或分布列.Xx1x2…xk…xnPp1p2…pk…pn3.离散型随机变量的分布列的性质(1)pk≥0,k=1,2,…,n;(2)∑nk=1pk=p1+p2+…+pn=1.4.离散型随机变量的数学期望与方差、标准差一般地,如果离散型随机变量X的分布列如下表所示Xx1x2…xk…xnPp1p2…pk…pn(1)均值称E(X)=x1p1+x2p2+…+xnpn=∑ni=1xipi为离散型随机变量X的均值或数学期望(简称为期望).(2)方差D(X)=[x1-E(X)]2p1+[x2-E(X)]2p2+…+[xn-E(X)]2pn=∑ni=1[xi-E(X)]2pi,能够刻画X相对于均值的离散程度(或波动大小),这称为离散型随机变量X的方差.(3)标准差称D(X)称为离散型随机变量X的标准差,它也可以刻画一个离散型随机变量的离散程度(或波动大小).5.均值与方差的性质(1)E(aX+b)=aE(X)+b.(2)D(aX+b)=a2D(X)(a,b为常数).易错点2.常见分布列分辨不清1.n次独立试验与二项分布(1)n次独立重复试验在相同条件下重复n次伯努利试验时,人们总是约定这n次试验是相互独立的,此时这n次伯努利试验也常称为n次独立重复试验.(2)二项分布一般地,如果一次伯努利试验中,出现“成功”的概率为p,记q=1-p,且n次独立重复试验中出现“成功”的次数为X,则X的取值范围是{0,1,…,k,…,n},而且P(X=k)=Cknpkqn-k,k=0,1,…,n,因此X的分布列如下表所示X01…k…nPC0np0qnC1np1qn-1…Cknpkqn-k…Cnnpnq0注意到上述X的分布列第二行中的概率值都是二项展开式(q+p)n=C0np0qn+C1np1qn-1+…+Cknpkqn-k+…+Cnnpnq0中对应项的值,因此称X服从参数为n,p的二项分布,记作X~B(n,p).2.两点分布与二项分布的均值、方差(1)若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).(2)若X~B(n,p),则E(X)=np,D(X)=np(1-p).3.超几何分布一般地,若有总数为N件的甲、乙两类物品,其中甲类有M件(MN),从所有物品中随机取出n件(n≤N),则这n件中所含甲类物品数X是一个离散型随机变量,X能取不小于t且不大于s的所有自然数,其中s为M与n中的较小者,t在n不大于乙类物品件数(即n≤N-M)时取0,否则t取n减乙类物品件数之差(即t=n-(N-M)),而且P(X=k)=CkMCn-kN-MCnN,k=t,t+1,…,s,这里的X称为服从参数为N,n,M的超几何分布,记作X~H(N,n,M).4.正态分布(1)正态曲线φ(x)=1σ2πe-(x-μ)22σ2,φ(x)的解析式中含有μ和σ两个参数,其中:μ=E(X),即X的均值;σ=D(X),即X的标准差.φ(x)也常常记为φμ,σ(x).(2)正态曲线的一些性质①正态曲线关于x=μ对称(即μ决定正态曲线对称轴的位置),具有中间高、两边低的特点;②正态曲线与x轴所围成的图形面积为1;③σ决定正态曲线的“胖瘦”;σ越大,说明标准差越大,数据的集中程度越弱,所以曲线越“胖”;σ越小,说明标准差越小,数据的集中程度越强,所以曲线越“瘦”.(3)正态总体在三个特殊区间内取值的概率值P(μ-σ≤X≤μ+σ)≈68.3%;P(μ-2σ≤X≤μ+2σ)≈95.4%;P(μ-3σ≤X≤μ+3σ)≈99.7%.(4)正态分布的均值与方差若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.1.盒中有大小相同的5个红球和3个白球,从中随机摸出3个小球,记摸到白球的个数为X,则随机变量X的数学期望EX()A.118B.98C.78D.58【答案】B【详解】解:盒中有大小相同的5个红球和3个白球,从中随机摸出3个球,记摸到白球的个数为X,X的可能取值为0,1,2,3,所以353810(0)56CCPX,215338CC6(1)5C30PX,125338CC15(2)C56PX,3338C1(3)C56PX,X的分布列为:X0123P105630561556156103015190123565656568EX.故选:B.2.某地市在一次测试中,高三学生数学成绩服从正态分布280,N,已知60800.3P,若按成绩分层抽样的方式取100份试卷进行分析,则应从100分以下的试卷中应抽取()A.20份B.60份C.80份D.90份【答案】C【详解】因为2~80,N,所以,1000.5801000.560800.8PPP,因此,应从100分以下的试卷中应抽取1000.880份.故选:C.3.某种包装的大米质量ξ(单位:kg)服从正态分布2~10,N,根据检测结果可知9.9810.020.98P,某公司购买该种包装的大米3000袋.大米质量在10.02kg以上的袋数大约为()A.10B.20C.30D.40【答案】C【详解】因大米质量210,N,且9.9810.02()0.98P,则9.981()()0.10.0210120.02PP,所以大米质量在10.02kg以上的袋数大约为30000.0130.故选:C4.若随机事件A,B满足112(),(),()323PAPBPAB,则()PAB()A.16B.13C.12D.23【答案】B【详解】解:由题意知:2()()()3PABPAPBPAB,得1121()3236PAB,故1()161()32PABPABPB.故选:B.5.已知随机变量服从正态分布2,N,若函数()(2)fxPxx是偶函数,则实数()A.0B.12C.1D.2【答案】C【详解】因为函数()(2)fxPxx是偶函数,所以()()fxfx,即(2)(2)PxxPxx,所以212xx.故选:C1.已知随机变量X服从正态分布N(3.1),且(24)PX=0.6826,则p(X4)=()A.0.1588B.0.1587C.0.1586D.0.1585【答案】B【详解】试题分析:正态分布曲线关于对称,因为,故选B.2.设两个正态分布2111()(0)N,和2222()(0)N,的密度函数图像如图所示.则有A.1212,B.1212,C.1212,D.1212,【答案】A【详解】根据正态分布函数的性质:正态分布曲线是一条关于对称,在处取得最大值的连续钟形曲线;越大,曲线的最高点越底且弯曲较平缓;反过来,越小,曲线的最高点越高且弯曲较陡峭,选A.3.已知随机变量服从正态分布22,N,且40.8P,则02P()A.0.6B.0.4C.0.3D.0.2【答案】C【详解】解:因为40.8P,所以40.2P.由题意知图象(如图)的对称轴为直线2x,040.2PP,所以041040.6PPP.所以102040.32PP.故选:C.4.某物理量的测量结果服从正态分布210,N,下列结论中不正确的是()A.越小,该物理量在一次测量中在(9.9,10.1)的概率越大B.该物理量在一次测量中大于10的概率为0.5C.该物理量在一次测量中小于9.99与大于10.01的概率相等D.该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D【详解】对于A,2为数据的方差,所以越小,数据在10附近越集中,所以测量结果落在9.9,10.1内的概率越大,故A正确;对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;对于D,因为该物理量一次测量结果落在9.9,10.0的概率与落在10.2,10.3的概率不同,所以一次测量结果落在9.9,10.2的概率与落在10,10.3的概率不同,故D错误.故选:D.5.某一批花生种子,如果每1粒发芽的概率为45,那么播下4粒种子恰有2粒发芽的概率是A.16625B.96625C.192625D.256625【答案】B【详解】解:根据题意,播下4粒种子恰有2粒发芽即4次独立重复事件恰好发生2次,由n次独立重复事件恰好发生k次的概率的公式可得,2224441962()()55625PC故选B.一、单选题1.若1()9PAB,2()3PA,1()3PB,则事件A与B的关系是()A.事件A与B互斥B.事件A与B对立C.事件A与B相互独立D.事件A与B既互斥又相互独立【答案】C【详解】∵21()1()133PAPA,∴1()()()09PABPAPB,∴事件A与B相互独立、事件A与B不互斥,故不对立.故选:C2.已知随机变量服从正态分布20,N,若20.023P,则22P()A.0.977B.0.954C.0.5D.0.023【答案】B【详解】随机变量服从正态分布20,N,若20.023P,则依据正态曲线的性质有22122120.0230.954PP故选:B3.读取速度是衡量固态硬盘性能的一项重要指标,基于M.2PCle4.0NVMe协议的固态硬盘平均读取速度可达7000MB/S以上.某企业生产的该种固态硬盘读取速度(MB/S)服从正态分布2~7400,XN.若(74007600)0.3PX,则可估计该企业生产的1000个该种固态硬盘中读取速度低于7200MB/S的个数为()A.100B.200C.300D.400【答案】B【详解】由正态分布的对称性可知:(72007400)(74007600)0.3PXPX,所以120.3(7200)0.22PX,所以该企业生产的1000个该种固态硬盘中读取速度低于7200MB/S的个数为10000.2200.故选:B4.下列说法错误的是()A.相关系数r越大,两个变量的线性相关性越强B.若2~2,XN,且130.5PX,则30.25PXC.相关指数20.64R,表示解释变量对于预报变量变化的贡献率为64%D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高【答案】A【详解】对于A中,根据相关系数的定义知:相关系数r越大且1r,两个变量的线性相关性越强,所以A不正确;对于B中,若2~2,XN,且130.5PX,可得11330.252PXPX,所以B正确;对于C中,根据相关系数的概念,当相关指数20.64R,表示解释变量对于预报变量变化的贡献率为64%,所以C正确;对于D中,根据数据的残差的定义,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以D正确.故选:A.5.目前,国际上常用身体质量指数BM