定型数据分析习题答案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

作业中的一些错误情况1:解题过程不完整,没有明确指出所检验的假设和检验统计量。2:算错检验统计量的值,或算错检验的p值。(P27Ex2)解法一:总体总共分3类,要检验顾客是否对这三种肉食的喜好程度相同,这是一个分布的拟合优度检验问题。(1)要检验的原假设为0H:顾客对这三种肉食的喜好程度相同,即要检验0H:顾客对这三种肉食的喜好程度的分布为313131羊肉牛肉猪肉,(2)取检验统计量310202)(iiiinpnpn,检验分布为)13(2;(3)题中200n,3,2,1,32000inpi,则检验统计量的值为(计算过程略)73.153200)320074(3200)320041(3200)320085(2222(4)计算P值为:05.0000384.0)73.15)2((2Pp值,故在水平05.0下拒绝0H,即调查数据不符合该均匀分布.解法二(采用似然比检验+p值形式)(1)要检验的原假设为0H:顾客对这三种肉食的喜好程度相同,即要检验0H:顾客对这三种肉食的喜好程度的分布为313131羊肉牛肉猪肉,(2)选取似然比检验统计量riiiiriiiinnpnnnpnG10102ln2ln2ln2,检验分布为)1(2r;(3)题中200n,3,2,1,32000inpi,则检验统计量的值为(计算过程略)88.16ln23102iiiinnpnG(4)计算P值为:05.000022.0)88.16)2((2Pp值,故在水平05.0下拒绝0H,即顾客对这三种肉食的喜好程度的分布不是均匀分布.注:若显著性水平取05.0,则临界值为99.5)2()13(295.0205.01。(P27Ex3)解法一:总体总共分10类,这是一个分布的拟合优度检验问题。(1)要检验的原假设为:学生对这十门课的选择没有倾向性,即要检验0H:学生选择这十门课的人数分布为1011010121011课程课程课程,(2)取检验统计量1010202)(iiiinpnpn,检验分布为)110(2;(3)题中800n,10,,1,80108000inpi,则检验统计量的值为(计算过程略)125.580)8091(80)8074(222(4)计算P值为:05.0823.0)125.5)9((2Pp值,故在水平05.0下不能拒绝0H,即认为学生对这十门课的选择没有倾向性.解法二(采用似然比检验+p值形式)(1)要检验的原假设为:学生对这十门课的选择没有倾向性,即要检验0H:学生选择这十门课的人数分布为1011010121011课程课程课程。(2)选取似然比检验统计量101010102ln2ln2ln2iiiiiiiinnpnnnpnG,检验分布为)110(2;(3)题中800n,10,,1,80108000inpi,则检验统计量的值为(计算过程略)017.5ln210102iiiinnpnG(4)计算P值为:05.0833.0)017.5)9((2Pp值,故在水平05.0下不能拒绝0H,即认为学生对这十门课的选择没有倾向性.注:若采用拒绝域法,临界值为92.16)9()110(295.0205.01。(P27Ex4)解法一:(采用卡方拟合优度检验法+拒绝域形式)(一)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设为0H:股票投资的盈亏分布为7.02.01.0亏持平盈,统计得到的频数分别为1697,1780,2129。(2)取检验统计量3122ˆ)ˆ(iiiipnpnn,拒绝域为)}13({212,(3)对显著性水平05.0,临界值为99.)2(295.05,(4)题中5606n,则检验统计量的值为99.596.35112.3924)2.39242129(2.1121)2.11211780(6.560)6.5601697(2222故在水平05.0下拒绝0H,即调查数据不符合该偏好分布.(二)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设仍为0H:股票投资的盈亏分布为7.02.01.0亏持平盈,统计得到的频数分别为151+122,240,517+240。(2)取检验统计量3122ˆ)ˆ(iiiipnpnn,拒绝域为)}13({212,(3)对显著性水平05.0,临界值为991.5)2(295.0,(4)题中5606n,则检验统计量的值为991.52.188889)889757(254)254240(127)127273(2222故在水平05.0下拒绝0H,即调查数据不符合该偏好分布.解法二:(采用似然比检验法+拒绝域形式)(一)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设为0H:股票投资的盈亏分布为7.02.01.0亏持平盈,统计得到的频数分别为1697,1780,2129。(2)选取似然比检验统计量3103102ln2ln2ln2iiiiiiiinnpnnnpnG,检验分布为)13(2,拒绝域为)}2({212G(3)对显著性水平05.0,临界值为991.5)2(295.0,(4)题中5606n,则检验统计量的值为991.59.280021292.3924ln212917802.1121ln178016976.560ln169722)(G故在水平05.0下拒绝0H,即调查数据不符合该偏好分布.(二)总体总共分3类,这是一个不含未知参数的分布检验问题。(1)要检验的原假设仍为0H:股票投资的盈亏分布为7.02.01.0亏持平盈,统计得到的频数分别为273,240,757。(2)选取似然比检验统计量3103102ln2ln2ln2iiiiiiiinnpnnnpnG,检验分布为)13(2,拒绝域为)}2({212G(3)对显著性水平05.0,临界值为991.5)2(295.0,(4)题中5606n,则检验统计量的值为991.53.147757889ln757240254ln240273127ln27322)(G故在水平05.0下拒绝0H,即调查数据不符合该偏好分布.注1:有同学混淆了两种解法(卡方拟合优度检验法与似然比检验法)的记号与称呼。注2:本题中两种方法得到的检验统计量的值相差很大。(P28Ex5)解法一:(卡方拟合优度检验)总体总共分3类,分布中有1个未知参数,这是一个含参数的分布检验问题。(1)要检验的原假设为0H:红、白、粉红色花的分布为pqqp222粉红白红,其中1qp。(2)先在0H为真时,似然函数为10,)1(2)1(2)2()(13210860222232313321ppppppqqppLnnnnnnnn取对数得)1ln(132)ln(1082ln60)(lnpppL求关于p的导数,并令之为0得对数似然方程为:0132)1(10801132108pppp解得p的极大似然估计值为209240108ˆp(3)算出0H的分布列中321,,ppp的极大似然估计值40081ˆˆ21pp;400121)2011()ˆ1(ˆ222pp;2009920112092)ˆ1(ˆ2ˆ3ppp。(4)取检验统计量3122ˆ)ˆ(iiiipnpnn,拒绝域为)}113({212,(5)对显著性水平05.0,临界值为3.84146)1(295.0,(6)题中120n,,4.5920099120ˆ,3.36400121120ˆ,3.2440081120ˆ321pnpnpn,则检验统计量的值为84.301224.04.59)4.5960(3.36)3.3636(3.24)3.2424(2222故在水平05.0下不能拒绝0H,即调查数据符合该偏好分布.注:有同学误认为检验的临界值为991.5)2(295.0。解法二:(采用似然比检验)(1)(2)(3)步骤同上。(4)算出无假定条件下诸ip的极大似然估计:2.012024~11nnp,3.012036~222nnp,5.012060~33nnp,(5)选取似然比检验统计量312~ˆln2ln2iiiippnG,拒绝域为)}1()113({21212G,(6)对显著性水平05.0,临界值为3.84146)1(295.0,(7)则检验统计量的值为01225.0)5.020099ln603.0400121ln362.040081ln24(2~ˆln2ln2312iiiippnG故在水平05.0下不能拒绝0H,即调查数据符合该偏好分布.注:p值05.091.0)01225.0)1((2P(P28Ex6)解法一:(卡方拟合优度检验)总体总共分4类,分布中有2个参数,这是一个含参数的分布拟合检验问题。(1)要检验的原假设为0H:人的血型分布为pqqrqprprABBAO222222”型“”型“”型“”型“,其中1rqp(2)先在0H为真时,算出似然函数5813224362748222)()2()2()()2()2(),,(4321pqqrqprprpqqrqprprrqpLnnnn在约束条件1rqp下,取rpq1,化似然函数为无约束二元函数:58132224362748))1(())1(()2(),(rpprpprprrpL取对数得))1(ln(58))1ln((132)2ln(436ln748),(ln222rpprpprprrpL注意到用微分法很难求出极大似然估计值的精确解,我们考虑近似计算。首先由“O”型和“B”型两类的矩估计算出参数向量),(rp的初始估计:2887.0ˆ6116.0ˆ7113.0506.0ˆ16116.0374.0ˆ132.0ˆ)ˆ1(374.0ˆ222prprrpr然后参照课本25页利用EXCEL算得),(rp的极大似然估计值611379.0ˆ288632.0ˆrp(3)算出诸rpp,,1的极大似然估计值0.373784611379.0ˆˆ221rp;0.436236611379.0288632.02288632.0ˆˆ2ˆˆ222rppp0.13226611379.0)288632.01(ˆ)ˆ1(ˆ22223rpp0.05772)611379.0288632.01(288632.02)ˆˆ1(ˆ2ˆ4rppp且在0H为真时,对数似然函数的最大值为-1162.1971)ˆ,ˆ(lnrpL。(4)取检验统计量4122ˆ)ˆ(iiiipnpnn,拒绝域为)}214({212,(5)对显著性水平05.0,临界值为3.84146)1(295.0,(6)题中1000n,72.5705772.01000ˆ,,784.373373784.01000ˆ41pnpn,则检验统计量的值为(计算过程略)84.3002121.072.57)72.5758(78.373)78.373374(222故在水平05.0下不能拒绝0

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功