1《数据模型与决策》复习(附参考答案)2018.9一、填空题(五题共15分)1.已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是①。解:N(167.48,0.609)考查知识点:已知总体服从正态分布,求样本均值的分布。2.某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为②。解:[1040,1936]考查知识点:区间估计的求法。正态总体均值的区间估计是[nsZX1,nsZX1]其中X是样本平均数,s是样本的标准差,n是样本数。详解:直接带公式得:区间估计是[nsZX1,nsZX1]=[100224021488,100224021488]=[1040,1936]3.从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是③。解p=0.4653考查知识点:离散概率计算方法。详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩P(B3)=P(B3B2)+P(B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P(B3))2=P(B3|B2)P(B2)+P(B3|G2)P(G2)=0.48×(1-0.55)+(1-0.55)×0.55=0.46534.调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。解p=0.5考查知识点:了解正态分布概率含义。5.结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是。(请在0.3、0.6和0.9中选一个)考查知识点:了解相关系数。本题答案:孩子与父母平均身高的相关性比较高,应该选0.96.简述模拟仿真的关键步骤。考查知识点:模拟仿真的思想二、单项选择题(五题共15分)1.下列事件中,属于小概率事件的随机事件是()A.抛一枚均匀的硬币2次,结果全是正面B.抛一枚均匀的硬币3次,结果全是正面C.抛一枚均匀的硬币4次,结果全是正面D.小王某天上班路上捡到10元钱解:D考查知识点:认识哪些事件是小概率事件?2.关于假设检验,下列说法正确的是()。A.P值0.05,拒绝原假设B.P值0.05,接受原假设C.P值0.05,拒绝原假设D.P值0.05,接受原假设解:A考查知识点:假设检验的思想3.天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预报其实是一个置信度为95%的区间。描述置信度与精确度的关系。34.不确定型决策方法。5.检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用()。A.U检验B.t检验C.2检验D.F检验解C考查知识点:分组数据检验方法。三、简答题(两题共40分)1.货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:表2货车的行驶时间与行驶距离的远近及运送货物的次数统计Y:小时7.34.89.55.27.26.27.46.67.66.3X1:100公里10.61.50.70.50.80.750.750.90.9X2:次数4242423442利用Excel,得到下列输出结果,回答后面的三个问题。回归统计MultipleR0.913RSquare0.833AdjustedRSquare0.785标准误差0.616观测值10方差分析dfSSMSFSigF回归分析213.2536.62617.4640.002残差72.6560.379总计915.9094Coefficients标准误差tStatP-valueLower95%Upper95%InterceptA0.8022.7620.0280.3184.110XVariable12.6880.7923.3950.0120.8164.560XVariable20.3770.1093.4490.0110.1190.635(1)从上述输出结果看,这个模型拟合效果如何?(2)上表中的截距A为多少?(3)写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。(4)倘若某次行驶距离为50公里,跑4次,估计花费多少时间?解:(1)从模型检验的F值为17.464对应的p值等于0.002小于5%看模型拟合效果很好,另外,R2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。(2)上表中的截距A=(0.318+4.11)/2=2.214.(3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:21377.0688.22.214yˆxx(4)将x1=0.5,x2=4次带入回归方程21377.0688.22.214yˆxx,得花费时间约为5.07小时。考查知识点:回归方法的操作、模型选择、估计和预测。2.(10分)Westdata公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:(1)给出Westdata公司决策问题的支付矩阵(收益表);高中底自营-1300-1300-12005外包-1800-1200-600(2)请您利用最大风险最大化方法(乐观法)、最大风险最小化方法(悲观法)和最小最大后悔值法给Westdata的决策者推荐方案。解:乐观法:高中底自营-1300-1300-1200外包-1800-1200-600决策:选择外包。悲观法:高中底自营-1300-1300-1200外包-1800-1200-600决策:选择自营。最小最大后悔值法:高中底自营0100600外包50000决策:选择外包。考查知识点:不同决策准则下的决策方法四、计算题(三题共30分)1.(10分)某开发商面临有两种选择,投资建设百货商场(T),放弃建设百货商场(Q)。但建设百货商场可能面临未来人流量太少(X),也可能面临未来人流量大(D)。利润矩阵见下表(单位:万元)。开发商现在犹豫是否需要进行市场调研。调研成本是5万元。咨询将产生两种结果,认为人流量大(Y)和人流量小(N)。相关概率如下所示:P(X)=0.4,P(D)=0.6,P(Y)=0.8,P(N)=0.2,P(X|Y)=0.1,P(D|Y)=0.9,P(X|N)=0.8,P(D|N)=0.2表3某市物流中心建设与未来经济形势关系分析未来人流量太小X未来人流量大D建设T-49510056放弃Q00(1)画出此问题的决策树;(2)确定最优决策。解(1)决策树如下:(2)最优决策是:先调研,若专家认为未来人流量大就投资,若专家认为未来人流量小就放弃,这样的决策平均收益将达到680万元。考查知识点:决策树的应用2.(10分)全国汽车租赁公司所面临的问题:全国汽车租赁公司必须为一年当中确切时间、确切租赁区域所拥有的汽车数量做出决定。以南卡罗莱纳、默特尔区域为例,管理层想知道应该在劳动节的那个周末提供多少量标准汽车?全国汽车租赁公司的情况比较适宜于使用单一周期库存模型,公司必须在周末之前对可用的标准汽车进行统计,在周末,顾客的需求会导致缺货或剩余记Q=可用的标准汽车数量,则当Q比顾客的需求大,汽车租赁公司的汽车有剩余,单位剩余的成本就是高7估需求的成本,假设该成本为每辆汽车80美元(这个数据可以由过去的市场调查获得),另一方面,则当Q小于顾客的需求,汽车租赁公司将会租出所有的汽车,并且产生缺货现象。每缺一辆汽车将产生200美元的低估成本,这个数字包含利润损失及顾客没能租到车而产生的对公司信誉降低的成本。现在的问题是:那个周末应该准备多少汽车呢?解:记Cu=200美元(低估需求的单位成本),Co=80美元(高估需求的单位成本)最佳的汽车数量Q*应该满足下述等式:Q*+1的期望损失=Q*的期望损失-----(1)Q*+1的期望损失=Co*P(需求≤Q*)----(2)Q*的期望损失=Cu*P(需求Q*)---------(3)P(需求≤Q*)+P(需求Q*)=1--------(4)由(1)--(4)可得:uouCCCQP)(需求*将Co=80美元、Cu=200美元带入上式得7143.080200200*)(需求QP现在可以利用汽车租赁需求的概率分布来确定Q*了,根据该公司近年来的汽车租赁数据的直方图判断,五一节那个周末的汽车需求分布,近似服从正态分布N(150,196),即均值为150辆,标准差是14辆,查一查标准正态分布表可知,当均值高于0.57个标准差时(考试时不能查表,这个数会告诉您),正态分布左侧的面积(概率)是0.7143,于是有:1581457.0150*Q.考查知识点:库存管理方法的实际应用3.(10分)某企业生产甲乙两种产品,已知生产一件甲产品需要电力6千瓦时、钢材12千克、工时8个、利润为7元;生产一件乙产品需要电力9千瓦时、钢材6千克、工时5个、利润为5元。该企业现有这三种资源的数量分别为720千瓦时、600千克、480个。请回答下列问题:(1)写出该线性规划问题的一般形式;(2)甲乙两种产品各生产多少时,才能获得最大利润?最大利润是多少?8(3)在利润最大时,该企业哪种资源过剩?(4)给出各个资源的影子价格(即资源出售价格)。利用Excel规划求解的相关输出如下单元格名字初值终值$C$2x=115$C$3y=170单元格名字单元格值公式状态型数值$C$56x+9y=720$C$5=720到达限制值0$C$612x+6y=600$C$6=600到达限制值0$C$78x+5y=470$C$7=480未到限制值10$C$2x=15$C$2=0未到限制值15$C$3y=70$C$3=0未到限制值70单元格名字终值拉格朗日乘数$C$56x+9y=7200.25$C$612x+6y=6000.458333333$C$78x+5y=4700解:设生产甲乙两种产品的数量分别为x,y,则(1)线性规划问题为:Max{7x+5y}s.t.0,4805yx86006127209yx6yxyx(2)由规划求解表可见,当x=15y=70时,利润达到最大,最大为455元。(3)在利润最大时,该企业工时过剩,过剩10个工时。(4)给出各个资源的影子价格就是输出表中的拉格朗日乘数,各个资源的影子价格分别是:电力为0.25元/千瓦、46元/吨、0元/个。在实际中的应用考查知识点:线性规划方法,在实际中的应用。