2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1葡萄酒的评价模型摘要本文对葡萄酒的评价过程及其重要评价指标做了较为科学细致的研究。为客观公正的评价葡萄酒的质量并揭示酿酒葡萄与葡萄酒质量之间的关系,提供了一套客观完整的从原材料到产成品的评价体系。目前国内外对葡萄酒的评价主要依靠评酒员,鉴于不同评酒员的能力及偏好等对酒品评价的影响,我们在第一问中运用统计学中常用的方差分析法,找出了两组评酒员评价结果的置信区间。进而对两组评酒员的评价结果进行差异性、合理性分析,得出结论。第二问中对于对酿酒葡萄的分级,我们先利用国际通用的主要理化指标对葡萄进行分级,然后用主成分分析法得出酿酒葡萄的主要评价指标,进而用科学而又简便的人工神经网络分析法建立了一套BP神经网络对葡萄进行分级,并用部分数据进行验证,取得了较好的模拟效果。第三问中鉴于葡萄酒的酿造涉及复杂的生化反应以及物理量变化,我们先假定一酿造过程不变量,利用其进行指标数据相对无量纲化,然后考虑两个主要的生化反应,注意到反应物与生成物的多样性,再次利用神经网络对主要反应参与物之间建立转化关系。而对于其他指标,为简化模型,我们“就轻取重”,对主要成分进行数据分析,得出一般结论。考虑到第三问中的葡萄与酒之间理化指标的对应关系,在最后一问中,我们并未试图建立葡萄和酒的理化指标与酒的质量之间的定量关系(我们认为这将是一项细致繁琐且又费时的工作),而是在定性描述之后,着重利用TOPSIS模型论证用葡萄和酒的理化指标来评价酒的质量这一工作的合理性、可行性,并最终得到肯定结论。综合四个问题的解决方案,我们基本上理清了从葡萄到葡萄酒的一系列转化关系及指标对应关系。在模型建立过程中,我们常常用相关数据的一半建立模型,另一半来验证模型,以期得到最好的数学模型来解决问题。可以说在本文的基础之上,完全可以进行严谨而又细致的后续工作,得到更加准确的结论,甚至可以建立一套完整的标准评价体系,对葡萄酒进行数字化、指标化评价,以节省人力物力资源。当然我们的模型亦有较多不足之处,在模型改进中提出了改进方法。关键词:葡萄酒评价方差分析主成分分析人工神经网络TOPSIS模型21问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。但由于在葡萄酒面前,任何品尝员都只能代表个人无法言传的感觉,故对于同一种样酒,不同的人会有不同的评价。这就为葡萄酒质量的评判和优质酒所需原材料的选择增加了一定难度。通过建立数学模型,我们将解决以下几个问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2问题分析葡萄和葡萄酒的历史与人类的文明史几乎是同步成长的。无论是在古代文明中还是在现代生活中,葡萄酒都占有着重要的位置,她为我们的生活带来情趣。世界各国还由此产生了许多的习惯和传统。一杯葡萄酒的好坏取决于它的色、香、味等各因素的协调和平衡。专业的品酒师经过一定基础理论知识的学习和训练后,可以向测量仪器一样品评出一种葡萄酒的品级。但每个人的感觉敏锐度不同,因而评价会有一定差异。对于第一个问题,各个品酒师的感官分析和评价需要借助统计分析的方法进行。通过方差分析可以找到两组评酒员评价结果之间的置信区间,综合所有样酒的评价数据,从而理性分析出两组评酒员评价结果是否有显著性差异。由两组评价结果的方差可比较出评价结果更为可信的一组评酒员。对于第二问,先利用国际通用的主要理化指标对葡萄进行分级。而后,由于葡萄酒的理化指标涉及到其化学组成,物理评价指标,酸碱性等诸多因素,如果直接进行回归分析,各因素之间的相互影响将相当复杂。无法准确的得到其对酿酒葡萄等级的函数。因而我们采用主成分分析法对附录2中的数据进行主成分确定,进而确定出对酿酒葡萄质量影响较强的主要因素。由于芳香程度与芳香物质的关系十分复杂,我们通过简化假设简化问题。仅通过对芳香物质功能团分子量所占比重的计算,确定各类芳香化合物的香气程度[5]。我们根据决定优质葡萄的五大因素并加以改进,制定出酿酒葡萄的分级方法。之后综合处理数据确定出酿酒葡萄样品的等级。综合以上酿酒葡萄的理化指标和葡萄酒质量,我们运用人工BP神经网络对酿酒葡萄分级方法进行验证,将葡萄样品分为两组,一组用于确定权重,另外一组用于检验方案的准确性。通过检验的拟合图可以直观的看出葡萄等级是否切实可行。第三问中,要建立酿酒葡萄与葡萄酒理化指数之间的关系,就要考虑到酿酒葡萄在酵母菌作用下的发酵过程。由文献[16]中得知葡萄的发酵过程中还原糖和苹果酸会发生化学变化,分别生成酒精和乳酸,而葡萄浆果中成分如单宁、色素、芳香物质、矿物质以及果胶等会在发酵过程中得到保留但含量有所变化。发酵过程与酵母菌的活性有重要的关联,影响酵母菌活性的主要因素有发酵温度、pH值、单宁浓度、乙醇浓度等[10]。根据数据我们选取了几项对酵母菌发酵过程影响较大的因素:pH值、乙醇浓度、还原糖浓度、各类乙酯等来模拟发酵程度。运用人工神经网络对各项因素在发酵过程的变化3进行分析,以期得到较好的拟合。由于发酵前后酒精的溶解特性和葡萄酒中各成分的含量在不断的发生着变化,我们通过选取单宁作为不变量并将其他各理化指标的浓度与其相比得到相对统一的度量尺度下各成分的含量用以分析。同第二问中的验证方法,我们将数据分为两组,留一组用以检验模型。对于问题四,我们综合以上各问题中所用到的方法和得到的结论。利用第三问中得到的结论,可以将酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响归纳转化为葡萄的理化指标对葡萄酒质量的影响,又由问题2中的主成分分析得到影响程度最大的五项理化指标,从而使问题得到简化。进而,我们利用TOPSIS法(逼近理想解排序法)[17]定义出距离的测度表示理化指标与葡萄酒质量的相近程度。然后分别计算每种理化指标与葡萄酒质量的贴近程度,以此作为评价优劣的依据。一般来说贴近度越大,则表明该理化指标对葡萄酒的质量影响越大。3基本假设1.每个评酒员的评价均相对公平公正,不考虑评酒员个人特殊情况(如身体不适等)对评价结果的影响。评价结果可看做服从正态分布;2.两组评酒员品尝的同一种样酒品质完全一样,认为表一中的因素基本完全涵盖葡萄酒好坏的评价指标;3.酿酒葡萄的理化指标之间有较为复杂的相关性,芳香物质和葡萄酒质量可作为重要指标单独列出,不考虑归属不明确,影响较小的因素;4.芳香物质中,化合物功能团在整个分子中所占的比重越大,功能团对嗅感的影响越明显,即比重越大,香气越浓[5];5.假设单宁在葡萄发酵过程中质量不发生变化,即将其看作质量恒定量;6.假设葡萄酒理化指标和酿酒葡萄理化指标可近似看做线性关系。4符号说明iX:表示来自第一组葡萄酒评分总体的第i个样本;iY:表示来自第二组葡萄酒评分总体的第i个样本;A:表示酿酒葡萄各主要化学指标平均含量样本矩阵;iF:表示红葡萄理化指标的第i个主成分;'iF:表示白葡萄理化指标的第i个主成分;i:表示第i种芳香化合物的发香团分子所占比重;iL:表示第i个葡萄样品的等级;jiF:表示第i个样品第j个理化指标的标准化得分;iu:表示发酵过程中第i个理化指标的浓度;G:表示葡萄酒质量的评价矩阵;Z:表示评价矩阵数据的理想解;4Z:表示评价矩阵数据的负理想解;iC:表示某一样品指标与理想理化指标的相对接近度。5模型的建立与求解5.1模型一差异性评价模型通过分析表一中品酒员给分情况,我们发现:造成品酒员异质性差异的主要原因包含评价尺度的差异、评价位置的差异以及评价方向的差异。每个品酒员对不同酒样的品味不同,他们的评价结果徘徊在其固有的评价习惯之间;其次,有些评酒员的给分区间虽然相同,但评价的位置却存在很大的差异,有的都集中在某一分数左右,而有的则有明显的区分;再次,对于不同样品酒,一些品酒员认为是好的,而另一些则认为是差的。综上可知,每个品酒员都有自己的准确度和精确度。我们在对评价结果进行统计分析时,必须像校正仪器一样,对数据进行相应处理以降低误差。对此我们采用置信区间的方法求得一二两个组总体方差2221/的置信区间。设1,,,21nXXX与2,,,21nYYY分别为来自一二两组葡萄酒评分总体的样本。由假设知,两总体均服从正态分布,即X~),(211N,),(~222NY。由于每个人评价标准不同,可认为两随机向量),,,(121nXXX与),,,(221nYYY相互独立。设112121)(11niiXXnS,212222)(11niiYYnS分别为这两个样本的方差,其中X和Y分别为两个组的样本均值。由概率论知识[1]可知:)1,1(~//2122212221nnFSS并且分布F不依赖任何未知参数。取22212221//SS为枢轴量得1)1,1(//)1,1(212/22212221212/1nnFSSnnFP,即1)1,1(1)1,1(1212/122212221212/2221nnFSSnnFSSP,于是得到2221/的一个置信水平为1的置信区间为))1,1(1,)1,1(1(212/12221212/2221nnFSSnnFSS取ɑ为0.05即置信区间取0.95,根据所给数据,可通过spss软件计算得到第一组5和第二组评酒员对红白两种葡萄酒评酒结果的方差21S,22S,并用Matlab编程计算得到置信区间如下表:样品方差红葡萄酒白葡萄酒21S22S21S22SS192.9081.8892.2225.88S239.7916.22201.0749.07S345.8230.71365.12142.49S4108.0441.2944.7142.10S559.7321.12162.7122.72S6103.6162.6839.1742.18S732.9425.7392.77106.27S862.0113.66126.4426.28S944.0165.11183.6031.12S1030.4036.18212.6870.40S1170.7738.04177.1287.82S1279.6625.12115.79140.04S1344.9315.29170.7746.77S1436.0023.1