2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1葡萄酒的评价摘要随着人们生活水平的提高,越来越多的人热衷于葡萄酒,所以对葡萄酒的质量做出客观的评价非常重要。本文就从以下的四个方面探讨葡萄酒的质量问题。针对问题一,首先利用求平均数的方法得出每一酒样品的综合评价,建立综合评价模型:1010k11110ijijHa1010iji1j11b10KB接着使用综合评价数据通过相关样本检验中的Wilcoxon符号秩检验法和边际齐性检验法都得到两组品酒员的评分有显著性差异,比较综合评价数据方差的大小得到第二组品酒员的品分比较可信。本文还使用了通过分析每组品酒员对每个酒样品打分的方差波动情况,得到两个对比的方差波动图,依然可以得到两组品酒员的评分有显著性差异,第二组评酒员的评分更可信。针对问题二,根据第二组评酒员对酒样品的评分,从而对第二组酒样品进行聚类分析得到葡萄酒的6个分类,相应地把葡萄分成6类。对葡萄的理化指标进行聚类分析得到口感等四个因子。然后再针对每个类中的葡萄的四个因子给出浓度范围并把浓度方位数值化,从而得到评价任意葡萄的评价标准。针对问题三,使用了多元线性回归以及典型相关性模型两种方法验证了酿酒葡萄和葡萄酒的理化指标之间有较大的关系,且建立了七个多元线性回归模型,其一如下:=1.6840.2530.008Hhh总酚总酚花色苷.针对问题四,通过相关性分析得到葡萄的芳香物质和葡萄酒的芳香物质具有显著相关性。接着建立葡萄酒的质量和葡萄的理化指标、葡萄芳香物质之间的多元线性回归模型,模型如下:=72.477+0.386+0.265P1.307.11514.532YPPPP葡萄的质量葡萄总黄酮苹果酸固酸比多酚氧化酶活力果内质量果皮颜色-0.335P【关键字】相关样本检验;聚类分析;多元线性回归;典型相关分析2一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析对于问题一,要求对两组品酒员的评价结果进行显著性差异分析,并比较可信度。我们考虑两种方法进行比较。方法一,Wilcoxon符号秩检验法和边际齐性检验法。由于非参数检验方法不涉及有关总体分布的函数,且假设比参数检验方法少得多,因此我们选择非参数检验进行显著性差异分析。由于两组品酒员的评分是两个相关的样本。因此最终选用Wilcoxon符号秩检验法和边际齐性检验法。分别对红酒和白酒的评价结果进行显著性差异分析并计算两组评酒员对葡萄酒样品的评分的方差。方法二,为了确定两组评酒员的评价结果哪一组更可信,考虑用方差的波动情况来进行分析。两组评酒员评分的方差波动情况可以反映两组品酒员评分的稳定程度,方差越小,则评价结果越可信。对于问题二,根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。首先考虑用聚类分析法得到酿酒葡萄的分级,接着用变量聚类分析法对葡萄理化性指标进行分类,然后用感官指标来描述分类的理化指标。筛选出最影响感官指标的理化指标,并把这些理化指标划分区间,给每一个感官指标赋一个分数,得到了一个酿酒葡萄分级表,具体过程见流程图用样品点聚类分析法将第二组红葡萄酒分为六类将酿酒葡萄分为六个级别用变量聚类法对葡萄的理化性指标分类查阅资料把分类的理化指标用感官指标来描述筛选出影响感官指标的几个理化指标对筛选出的理化指标划分等级区间给每一个感官指标赋一个值得出酿酒葡萄的分级标准表对于问题三,分析酿酒葡萄与葡萄酒的理化指标之间的联系。方法一:分析酿酒葡萄与葡萄酒的理化指标之间的联系,考虑用多元线性回归模型。在筛选变量的时候,选择逐步回归法。通过spss软件算得回归系数,并得到回归模型。方法二:由于酿酒葡萄与葡萄酒的理化指标之间有着,用典型相关模型解决的是两组变量之间的相关关系的多元统计模型。3对于问题四,葡萄酒的每一个理化指标只与葡萄的几个少量的理化性指标有联系,不能包括所有的理化性指标,因此用葡萄酒的理化性指标来评价葡萄的质量是不够全面的。考虑到芳香物质对葡萄酒的影响,通过spss软件对葡萄芳香物质和葡萄酒的芳香物质的相关性进行分析。接着建立葡萄酒的质量和葡萄的理化指标、葡萄芳香物质之间的多元线性回归模型。三、模型假设1、评酒员对每一个葡萄酒样品的评分是相互独立的。2、评酒员对葡萄酒的每一个分类指标的评分是相互独立的。3、葡萄酒的质量只与葡萄有关4、好的葡萄一定能酿出好酒。四、符号说明ija:第i位评酒员对红葡萄酒的第j个分类指标的评分ijb:第i位评酒员对白葡萄酒的第j个分类指标的评分(1)kH:第一组品酒员对红葡萄酒样品k的综合评价(2)KH:第二组品酒员对红葡萄酒样品k的综合评价(1)KB:第一组品酒员对白葡萄酒样品k的综合评价(2)KB:第二组品酒员对白葡萄酒样品k的综合评价ix:酿酒葡萄样品的第i项理化指标jy:葡萄酒样品的第j项理化指标五、模型的建立与求解5.1显著性差异分析及可信度比较5.1.1非参数检验的模型在红葡萄酒品尝评分中,考虑两组品酒员对每一个酒样品的一个总体评价。由此,引入综合评价,表示每一组品酒员对每一个酒样品的总体评价。首先,求出每一位评酒员对酒样品k的评价,再对10位评酒员的评价求平均值,将求得的值作为这一组品酒员对酒样品k的综合评价。由此,建立综合评价模型:1010k11110ijijHa,1010iji1j11b10KB用kkH(1),H(2)分别表示第一、二组品酒员对红葡萄酒样品K的综合评价,用kkB(1),B(2)分别表示第一、二组品酒员对白葡萄酒样品K的综合评价。由所建立的4综合评价模型算出kkkkH(1),H(2),B(1),B(2)的值。计算的部分结果如表一,表中数据为两组品酒员组对前12个红酒样品的评价。酒样品123456789101112kH(1)62.780.380.468.673.372.271.572.381.574.270.153.9kH(2)68.17474.671.272.166.365.36678.268.861.668.3表一品酒员对红酒样品的评价分析两组评酒员的评价结果有无显著性差异,要对两组数据进行分析检验。数据的检验有参数检验和非参数检验。参数检验是对参数平均值、方差进行的统计检验。说明被检参数之间在统计上没有显著性差异,是同一总体的参数估计值。非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,它的假设前提也比参数检验要少得多,因此在解决这一问题时选择非参数检验。第一组对酒样品的评价是第一个总体,第二组对酒样品的评价是第二个总体。由于这两种方法都是对相同编号的酒样品进行测量,所以测量出来的样品数据自然配成对。如(62.7,68.1)就是第一对数据。每对数据均是同一编号的样品酒的,只是由不同的组别进行测量。这说明这两个数据间有联系,不是完全独立的,是两个相关的样本。因此我们对两组评酒员的评价结果进行显著性分析时,考虑用Wilcoxon符号秩检验法和边际齐性检验法。5.1.1.1Wilcoxon符号秩检验法Wilcoxon符号秩检验法是由威尔科克森(F·Wilcoxon)于1945年提出的。该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于T检验中的成对比较,但并不要求成对数据之差iD服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。步骤如下:第一步:对成对观测数据1122(,),(,),...,(,)nnxyxyxy,计算iiixy,1,2,...Din。按差iD的绝对值iD的大小排列(从小到大),排序中的序号称为相应差值iD的秩。第二步:令T=所有正差iD相应的秩的总和,T=所有负差秩和。构造统计量minT(T,T)第三步,作出判断。如果0H成立,则ixiy和iixy几乎是等可能的,从而TT,5所以统计量2nT,或者说T的值不会太小。反之,如果T的值偏小,则说明0H不成立。当样本数n较大时,为了方便计算T的分布的概率,将这转化为TZ其中(1)4nn(1)(21)24nnn此时Z近似服从正太分布。用spss软件用Wilcoxon符号秩检验法检验两组品酒员对红酒评价结果有无显著性差异,求得结果如图一。图一第一个表“Ranks”分别给出了观测数据,两组品酒员的评价结果配对后的各种秩的Case、平均秩、秩和。第二个表“TestStatistic”分别给出了WilcoxonSignedRankTest基于负秩计算的Z=-2.5474。概率值为Sig.=0.0110.05,因此,可以认定两组品酒员对红酒的评价结果有显著性差异。同理,用spss软件用Wilcoxon符号秩检验法检验两组品酒员对白酒评价结果有无显著性差异,求得结果如图二。6图二图二第一个表“Ranks”分别给出了观测数据,两组品酒员的评价结果配对后的各种秩的Case、平均秩、秩和。第二个表“TestStatistic”分别给出了WilcoxonSignedRankTest基于负秩计算的Z=-2.5474。概率值为Sig.=0.0110.05,因此,可以认定两组品酒员对白酒的评价结果有显著性差异。5.1.1.2边际齐性检验(Marginalhomogeneity)边际齐性检验(Marginalhomogeneity)是针对两个相关的有序离散变量而言的。它实际上是MoNemar检验方法到多项变量分布的推广。它是使用2分布来进行判断,特别适用于设计前后的对照研究,边际齐性检验适应于有序的多值离散变量。运用边际齐性检验,通过spss软件检验两组品酒员对红酒的评价结果进行显著性差异分析。图三由图三可得,概率值sig.=0.0230.05。因此,可以认定两组品酒员对红酒的评价结果有显著性差异。7同理,运用边际齐性检验,通过spss软件检验两组品酒员对白酒的评价结果进行显著性差异分析。图四由图四可得,概率值sig.=0.0170.05。因此,可以认定两组品酒员对白酒的评价结果有显著性差异。5.1.1.3两组评酒员评分可信度比较为了比较两组评酒员评分