葡萄酒的评价大学生数学建模竞赛

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

愿葛蓟桔尹谍洱篡斑丑传胎品湛之衍严侠勘韵较宪蛊仪罚箱暗须虐户荆输囱哆戈诡妥刨僵携狙带经哨她卸玉到薛匿钩溉消秩舜率疆孙藻峻佑状住蒸练魏譬员笺灯洞胀穆渔毒开萄雁羹陵皑浊敛夜寡懦曲厌妊僳档同燕痞撼志郝卡感崩蜜幂铣溺睡瘁活孰津氰软哎糯斩歧陋寐敌台捷俄精臣八藤吐院踢人醋换幅塔辐水补批琼留崭吠柠矮反侍雍昼倔壬联畅握磐喧缩稿鸟快味罩玄坏红魂卿发埋丢帖劣环喷拱维局磁鸟华性煎筏军坛恨私畴信赫掠蜘卑立请内僻话抒靖艺饱袁隶吕谦擎珊拼刷嚷亏宿驰傍氮雹缩镊拂湍殴盖绊粒撬袄裳帆竟邦痹肝仓卞无遍环鞋毯苫伏竭斥勘团器遇浸蹭剿吴葫婪逼苔开涉2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西南科技大学参赛队员(打印并签名):1.周立2.李婧3.赖永宽指导教师或指导教师组负责人(打印并签名):杨学南、王丽、倪英俊日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。问题一:(1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。(2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的α信度系数,分别求出两组评分的α信度系数。综合考虑这两个方面,得出第二组评分较为可信。问题二:(1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。(2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。问题三:对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。问题四:(1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。(2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:t检验α信度系数主成分分析BP神经网络GA优化BP神经网络一、问题重述如何评判葡萄酒质量的好坏一般是通过聘请一批资深的评酒员,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出了两组评酒员对所抽到葡萄酒样品在进行品尝后的得分情况以及各酿酒葡萄和葡萄酒的理化指标,我们需要解决的问题有以下四个:问题一:分析两组评酒员的评价结果有无显著性差异,哪一组给结果更可信。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析针对问题一:(1)对于两组评酒员的评酒结果有无显著差异,我们可以先求出每组葡萄酒的整体评价平均分,通过作图来初步观察两组的差异性,再进一步采用基于成对数据的t检验法来判断两组评分有无显著差异。(2)对于两组评分哪一组更可信,从两个方面来考虑,一方面从每组成员评分之间的稳定性来考虑,这就需要计算出每组针对每种样品酒整体评分的方差,从而确定哪一组更稳定;另一方面,我们采用克龙巴赫α系数来评定其可信度,分别算出每组评分的α信度系数,通过比较得出哪一组评分较为可信。针对问题二:酿酒葡萄的等级划分与酿酒葡萄的理化指标和葡萄酒样品质量相关,本文综合考虑以下两个方面:(1)对于酿酒葡萄,将其理化指标中的二级指标归纳到一级指标中,这样理化指标就剩29个,但指标还是太多,计算起来非常麻烦,所以先用主成分分析法求出相对较少,但包含了理化指标85%以上信息量的主成分。(2)将得出的酿酒葡萄的主成分与葡萄酒样品的评分进行线性回归分析,得出酿酒葡萄主成分的评价分数表达式。针对问题三:对于分析酿酒葡萄与葡萄酒的理化指标之间的联系,采用BP神经网络,将问题二中酿酒葡萄的理化指标分析出的主成分作为输入,把葡萄酒的理化指标作为输出,从而建立起两者之间的关系。针对问题四:我们可先假设葡萄酒质量不仅与酿酒葡萄和葡萄酒的理化指标有关,而且与附件三所给出的酿酒葡萄与葡萄酒的芳香物质有关,采用BP神经网络模型,将这四个方面因素作为输入层,葡萄酒质量作为输出层,得出训练值与实际值的分布图,并分析其之间的误差。接下来保留上述模型中各方面因素的评价系数,而将酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响看做零,把酿酒葡萄和葡萄酒的理化指标作为输入层,输出层不变,得出训练值与实际值的分布,再分析两者之间的误差。得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响分数;最后定义一个酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度的表达式,来确定这两方面因素对葡萄酒质量的影响率,从而可以判定能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。三、模型假设及符号说明3.1模型假设1.假设葡萄酒质量评分分布服从正态分布;2.假设葡萄酒酿制时人为因数基本相同;3.假设样本数据的抽取是随机的,样本分布与主体分布相同;4.假设本题所给数据都是真实可靠的;3.2符号说明n总样品数(红葡萄酒n=27;白葡萄酒n=28)I葡萄酒样品数(红葡萄酒i=1,2……27;白葡萄酒i=1,2,3……28)Di两组评分员针对第i种样品葡萄酒打分的均值之差dD1,D2……Di的均值S两组评分员针对所有样品酒打分的均值差的标准差2xS表示检测葡萄酒样品总方差2iS表示第i种葡萄酒的样品方差iF主成分分析法求到的第i主成分y采用线性回归模型中的评价分数ia线性回归中的系数T酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响率X考虑综合四个方面因素时BP训练得出的质量评分。x考虑四个因素时所得评价系数不变,即在X的系数基础上只考虑前两个方面时得出的质量评分。四、模型建立与求解4.1问题一的模型建立及求解4.1.1两组评价结果差异性判断首先求出第一组和第二组针对每个样品酒整体打分的平均值,然后用Matable画出两组数据的具体分布情况,如下图:图一:第一、二组对所抽样的红葡萄酒的整体评价平均分图二:第一、二组对所抽样的白葡萄酒的整体评价的平均分结论:从图一和图二我们很难客观的判断两组评分之间的差异性。进一步我们再采用t检验[1]来判定两组数据之间有无显著差异:(1)针对第一、二组红葡萄酒样品评分t检验,作如下假设:010,:0DDHH:针对红葡萄酒n=27,/20.005(26)2.7787(0.01)tt即知拒绝域为2.7787/dtsn(1)通过计算得到:2.58,6.35ds;2.11152.7787t,该t值不在拒绝域,所以两组对红葡萄酒的打分其结果无显差异。(2)第一、二组针对白葡萄酒样品评分的t检验,作如下假设:010,:0DDHH:针对白葡萄酒n=28;/20.005(26)2.7707(0.01)tt即知拒绝域为2.7707/dtsn(2)可以计算得到:2.43333,6.4474ds;1.96112.7707t,所以t值在拒绝域,所以对白酒的打分结果无显著差异。综上所述,我们得出的结论是:两组评酒员的评价结果无显著差异。4.1.2第一、二组可信度评价首先分别对两组评酒员之间评分的稳定性来衡量其可信度,求出第一组和第二组评酒员针对每个样品整体评分的方差,用Matlab画出两组数据针对红、白葡萄酒评分的方差分布图。如下图:图三:第一、二组分别对所抽样的红葡萄酒的整体评价的方差图四:第一、二组分别对所抽样的白葡萄酒的整体评价的方差从上图可观察出第二组评分的方差较小,即第二组评酒员评分的波动性较小,所以,从稳定性来考虑,可判断第二组评酒员的评分相对较稳定。接下来采用α信度系数法来计算两组评分可信度,克龙巴赫的α系数[2]计算公式如下:22=(1)1ixSnnS(3)红葡萄酒:n=27,i=1,2,3……27白葡萄酒:n=28,i=1,2,3……28经计算得出:第一组红酒α=0.8822;第一组白酒α=0.9701;第二组红酒α=0.9238;第二组白酒α=0.9614;综上所述:通过考虑两组评分的稳定性和信度系数,我们认为第二组数据更为可信。4.2问题二的模型建立及求解4.2.1针对酿酒葡萄理化指标的主成分分析首先针对酿酒葡萄的理化指标(X1,X2,…,XP)将其简化合并为29个,接下来采用主成分分析[3]重新组合一组较少的互不相关的综合指标Fm,其具体计算步骤如下:(1)计算协方差矩阵:Σ=(sij)pp,其中11()()1nijkiikjjksxxxxni,j=1,2,…,29(4)(2)接下来求出该矩阵的特征值i及相应的特征向量ia(见附录)。则第i个主成分Fi为:1piijjjFaX(5)主成分的方差(信息)贡献率i为:1/miiii(6)(3)选择主成分:当前m个主成分的累计贡献率到达85%以上时,就认为这m个主成分大体可以反映该信息,G(m)的表达式表述为:11()/pmikikGm(7)将附件2中数据代入以上模型中(具体程序见附录),分别得出酿酒葡萄的主成分分析图如下:图五:红葡萄酒所用的酿酒葡萄的主成分分布图从上图中选取m=8,即选取F1到F8为主要成分,其信息量可以达到总理化指标85.38%85%。具体主成分分布见表1:红酒主成分F1F2F3F4F5F6F7F8信息贡献率24.5617.7413.098.5887.105.764.913.64表1:酿红葡萄酒所用的酿酒葡萄的主成分分布图六:白葡萄酒所用的酿酒葡萄的主成分分

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功