承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西安理工大学参赛队员(打印并签名):1.郑晓东2.罗璐3.宫维静指导教师或指导教师组负责人(打印并签名):日期:2013年05月10日葡萄酒质量的综合评价分析摘要近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。对问题四,采用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小,并以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。关键词:t检验主成分分析曲线拟合灰色关联度分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1问题一本题给出了两组评酒员对同一批葡萄酒的评价分数,在本文,采用假设检验中的t检验建立评估两组数据差异性的模型,研究两组评论员的评价是否存在差异,判断能否接受它们存在显著性差异的假设。若接受,则继续第二步:可靠性分析,分别对两组数据求方差,方差小的说明波动小,既评酒员的评价较稳定,可靠性高。2.2问题二首先,我们利用问题一得到的结果,对可靠性高的一组数据进行处理,降低评论员之间的差异,提高葡萄酒样品最终得分的可靠度。按得分对葡萄酒进行分级。然后,用标准化处理后的酿酒葡萄的理化指标对葡萄进行主成分分析。最后,结合葡萄酒的分级对酿酒葡萄进行分级。2.3问题三首先,用处理酿酒葡萄的理化指标的方法对葡萄酒的理化指标做同样的处理,得到葡萄酒理化指标的主成分。然后,分别根据主成分获得红葡萄和红葡萄酒的的得分。通过曲线拟合,分别建立红葡萄得分和专家的评分之间的关系;红葡萄酒得分和专家评分之间的关系。最后,根据两种理化指标和专家的评分之间的关系,建立两种理化指标之间的关系。2.4问题四运用灰色关联度分析的方法,定量描述酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。三、问题假设1.同种葡萄酒在同一组评酒员的得分下成正态分布。2.一种葡萄对应酿制一种葡萄酒。3.葡萄的成分充分转化为葡萄酒里的成分,不存在意外的浪费和挥发。四、符号说明这里只列出主模型的全局参数,其他局部参数见具体模型。(1)iJ:第i个红葡萄酒样品(1)ija:第i个红葡萄酒样品的得分T1:第一组评酒员全体T2:第二组评酒员全体五、模型的建立与求解5.1模型一:基于t检验建立差异评估模型我们采用假设性检验验证是否能接受两组评酒员的评价结果存在显著性差异的假设。然后用方差分析两组评酒员评价数据的波动,认为较平稳的一组比较可靠。5.1.1、数据预处理我们在分析数据是发现了几个显著性的异常数据:第一组红酒数据——样品20——色调——评酒员4号数据缺失第一组白酒数据——样品3——持久性——评酒员7号怀疑多了一个7第一组白酒数据——样品8——口感分析——评酒员2号数据明显异常因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。5.1.2t检验模型的建立21,TT分别代表第一,第二组整体,分别对红葡萄酒iR(i=1,2,…,27)和白葡萄酒iW(i=1,2,…,27)进行感官评价,1T的评价结果通过组内的每一评酒员的评分的均值来表示。同样的,T2的评价结果通过组内的每一评酒员的评分的均值来表示。从而得到两组评论员分别对红葡萄酒的评价结果见表一:红葡萄酒样品1234567891011121314第一组评分62.780.380.468.673.372.271.572.381.574.270.153.974.673第二组评分68.17474.671.272.166.365.36678.268.861.668.368.872.6D-5.46.35.8-2.61.25.96.26.33.35.48.5-14.45.80.4红葡萄酒样品15161718192021222324252627第一组评分58.774.979.359.978.679.1577.177.285.67869.273.873第二组评分65.769.974.565.472.675.872.271.677.171.568.27271.5D-754.8-5.563.354.95.68.56.511.81.5表1红葡萄酒的评价结果表中对于同一酒样品的两个评价差异是由两个评酒员引起的,为鉴定他们的评价结果有无显著性差异,可对两组数据对同一样品的差值进行分析,既表中的D。以红葡萄酒为例:有27对相互独立的评价结果(X1,Y1)(X2,Y2)…(X27,Y27),D1=X1-Y1,D2=X2-Y2,…,D27=X27-Y27,由于Di(i=1,2,…,27)是由同一因素造成的,可认为它们服从同一分布。现假设Di~N(D,2D),i=1,2…,27,且D,2D未知,基于这一样本检验假设:0:,0:100DHH(1)分别记1227,,,DDD的样本均值和样本方差的观测值为d,2Ds。对1227,,,DDD进行单个均值的t检验,检验问题的拒绝域为(显著水平为):2(1)Ddttnsn.(2)当t的值不落在拒绝域内时,接受0H,既认为两组评价无显著性差异。否则,两组评价有显著性差异。对白葡萄酒的处理同红葡萄酒。2)模型的求解现以红葡萄酒为例求解,首先,作出同一酒样品(1)iJ(1,2,,27)i分别由两组品酒员1T、2T得到的评价结果之差,列于表一的第三行,根据建立的模型检验假设:01:0,:0DDHH.(3)取α=0.05,运用spss软件求解得到表二:表二t检验求解结果根据上表得到的Sig=0.0200.05,所以拒绝接受,即认为两组品酒员的评价结果有显著性差异。5.1.3可信度定量分析记第一组10位品酒员对红葡萄酒样品(1)iJ(1,2,,27)i的评分为(1)ija(1,2,,10)j10(1)(1)1110iijjaa,10(1)(1)2(1)2111()10iijijsaa(4)其中,(1)ia表示第一组品酒员对红葡萄酒样品(1)iJ的评分均值,(1)21is表示(1)iJ的评分方差;同样,第二组对红葡萄酒样品(1)iJ的评分均值和方差分别为10(1)(1)1110iijjcc,10(1)(1)2(1)2211()10iijijscc(5)从而对每一组品酒员得到一个评分方差向量(1)2(1)2(1)2(1)211112127(,,,)Ssss(1)2(1)2(1)2(1)222122227(,,,)Ssss同理可求得白葡萄酒的(2)21S,(2)22S。再对(1)21S和(1)22S中的元素分别求和得到总方差,对于同一批红葡萄酒用总方差来代表两组不同的评价水平。总方差小的稳定性好,评价结果是更可信的。运用excel软件可以求解得到(1)21S,(1)22S,(2)21S和(2)22S。得到(1)21S=1415.513,(1)22S=821.11,(2)21S=2986.77,(2)22S=1411.69。不管是红葡萄酒还是白葡萄酒,第一组的总方差总是远远大于第二组。说明第二组的评价结果更为可信。5.2模型二:对于问题二,是要基于酿酒葡萄的理化性质和葡萄酒的质量对酿酒葡萄进行分级,因此,对于模型二可分为三步进行,即:1)根据酿酒葡萄的理化指标对酿酒葡萄进行分级;2)根据评酒师的评分对葡萄酒的质量进行分级;3)综合两种因素,对酿酒葡萄进行分级。5.2.1根据酿酒葡萄的理化指标对酿酒葡萄进行分级根据附录给出的酿酒葡萄的理化指标,可以看出,有些理化指标含量很低,有些理化指标含量很高。所以对于此种情况,我们采用主成分分析法对附录中的理化指标进行处理,将理化指标分为几种主成分,然后根据主成分对酿酒葡萄进行打分,通过得分对酿酒葡萄进行分级。5.2.1.1对于不同的理化指标可能存在着不同的量纲,因此在进行主成分分析之前应对酿酒葡萄的理化指标进行标准化处理。处理方法如下:将原始数据标准化,即做如下数据变换:(6)其中,,j=1,2,…,p。标准化后的数据阵记为X*,其中每个列向量(标准化变量)的均值为0,标准差为1,数据无量纲。标准化后变量的协方差矩阵(CovarianceMatrix)Σ=(sij)pp,即原变量的相关系数矩阵(CorrelationMatrix)R=(rij)pp:i,j=1,2,…,p(7)此时n个样品在m个主成分上的得分应为:Fj=a1jX1*+a2jX2*+...+apjXp*j=1,2,…,m(8)*1,2,...,;1,2,...,ijjijjxxxinjps11njijixxn2211()1njijjisxxn**11122221111()()1111()()()()11nkiikjjnnkjjkiikijkikjijnnnnkktiitjjtiitjjttttxxxxxxxxsxxrnnxxxxxxxxnn5.2.1.2主成分分析法的步骤如下:步骤一:计算协方差矩阵计算样品数据的协方差矩阵:Σ=(sij)pp,其中i,j=1,2,…,p(9)步骤二:求出Σ的特征值及相应的特征向量求出协方差矩阵Σ的特征值12…p0及相应的正交化单位特征向量:则X的第i个主成分为Fi=ai'Xi=1,2,…,p。步骤三:选择主成分在已确定的全部p个主成分中合理选择m个来实现最终的评价分析。一般用方差贡献率(10)解释主成分Fi所反映的信息量的大小,m的确定以累计贡献率(11)达到足够大(一般在85%以上)为原则。步骤四:计算主成