葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质。目前,葡萄酒的营养价值得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。由于该题的数据量较大,我们主要采用EXCEL和SPSS软件对模型进行求解。针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。针对问题二,对附件二和附件三中的葡萄理化指标进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标(以下简称主要指标);再建立神经网络模型,根据葡萄酒品尝评分进行分层抽样,选取与之对应的红、白酿酒葡萄各6种,将其主要指标作为输入数据,对应葡萄酒的品尝评分作为输出数据建立具有一个隐含层的BP神经网络,对神经网络进行训练,使其准确智能的给出葡萄酒的评分,根据评分结果对酿酒葡萄进行分级。针对问题三,通过聚类分析和典型相关分析来确定酿酒葡萄与葡萄酒的理化指标之间的关系。再对简化后的两组样本进行典型相关分析,得到两种样本指标被对方解释的比例分别达到了100%和92.4%,较好的反映了酿酒葡萄与葡萄酒的理化指标之间的关系。针对问题四,我们用层次分析法,通过比较品酒员对葡萄酒的评分与根据酿酒葡萄和葡萄酒的理化指标得到的葡萄酒的质量这两者的吻合度,具体吻合度的大小可用图形和线性相关分析得到的检验指标大小同时判断定量给出。关键词:SPSST检验聚类分析法相关系数回归分析原理相关分析原理偏相关系数EXCEL判别分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题目给出的附件一共有三个,分别为某一年份一些葡萄酒的评价结果,该年份这些葡萄酒的和酿酒葡萄的成分数据。需解决的问题为以下四个:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1针对问题一,我们将它分成两个问题去解决1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS中利用T检验去判断。在这之前,我们对附录1中数据进行处理,利用excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。2、针对问题一中选择哪组结果更加可靠,我们利用SPSS求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,从而确定出第几组的结果更可靠。2.2针对问题二对附件二和附件三中的葡萄理化指标进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标(以下简称主要指标);再建立神经网络模型,根据葡萄酒品尝评分进行分层抽样,选取与之对应的红、白酿酒葡萄各6种,将其主要指标作为输入数据,对应葡萄酒的品尝评分作为输出数据建立具有一个隐含层的BP神经网络,对神经网络进行训练,使其准确智能的给出葡萄酒的评分,根据评分结果对酿酒葡萄进行分级。2.3针对问题三通过聚类分析和典型相关分析来确定酿酒葡萄与葡萄酒的理化指标之间的关系。为了能够在海量数据中找到两个样本之间的内在联系,我们先通过聚类分析对酿酒葡萄的理化指标进行分类如下表所示:(数字代表的含义见正文)糖类酚类持久度酸度酒精度微量元素色度果皮质地1、16、17、18、20、222、11、12、134、8、9、155、6、719、21314、2829、3023、24、26、27再对简化后的两组样本进行典型相关分析,得到两种样本指标被对方解释的比例分别达到了100%和92.4%,较好的反映了酿酒葡萄与葡萄酒的理化指标之间的关系。2.4针对问题四考虑到酿酒葡萄和葡萄酒的理化指标对葡萄酒的影响因素众多,关系复杂,我们用层次分析法,对于论证,基本思路是通过比较品酒员对葡萄酒的评分与根据酿酒葡萄和葡萄酒的理化指标得到的葡萄酒的质量这两者的吻合度,吻合度大,证明能用葡萄和葡萄酒的理化指标评价葡萄酒的质量,吻合度小,则不能,具体吻合度的大小可用图形和线性相关分析得到的检验指标大小同时判断定量给出。三、基本假设1、假设制作葡萄酒的工艺是一样且稳定的;2、假设两组评酒员是随机分配的且每位评酒员的系统误差较小;3、假设题目附件所给数据真实有效;4、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;5、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;6、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;7、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒;四、符号说明n——自由度iX:表示随机变量;2S:表示样本方差;ix:酿酒葡萄的主成分指标iy:葡萄酒的理化指标iu:酿酒葡萄的典型变量iv:葡萄酒的典型变量i:对应判断矩阵的最大特征值E:准则层判断矩阵ia:对应矩阵的特征向量ib:权重向量F:红葡萄酒判断矩阵G:白葡萄酒判断矩阵'R:红葡萄酒的方案层中各因素对准则层中葡萄酒理化指标的比重'W:白葡萄酒的方案层中各因素对准则层中葡萄酒理化指标的比重1RR:红葡萄酒样品在葡萄酒质量这一项上占的比重1WW:白葡萄酒样品在葡萄酒质量这一项上占的比重五、模型建立与求解5.1两组评酒员的评价结果有无显著性差异,选择哪一组更可靠5.1.1问题分析根据题目要求,我们需要根据两组评酒员对27种红葡萄酒和28种白葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。我们对两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否满足配对样品t检验的前提条件,由判断可知符合检验要求。接着,我们对数据进行多组配对样品的t检验,从而对两组评酒员评价结果的显著性差异进行检验。对于两组评价的可靠性的评价,我们选择信度分析的方法。运用α信度系数法,通过比较两组数据α值的大小来判定稳定性。5.1.2两组评酒员的评价结果有无显著性差异——配对样本的T检验2.1配对样本T检验的概念若实验设计是将条件、性质相同或相近的两个供试单元配成一对,并设有多个配对,然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实验叫做配对实验。它的特点是配成对子的两个试验单元的非处理条件尽量一致,不同对子的试验单元之间的非处理条件允许有差异,每一个对子就是试验处理的一个重复。SPSS配对样本的T检验主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法的有效性。配对样品t检验具有的前提条件为:(1)两样品必须配对;(2)两样品来源的总体应该满足正态性分布。2.2基本数学原理:成对样本的均值比较t检验,假设这两个样本之间的均值差异为零,用于检验的统计量为:t=)1(/])([)(1212nnnyxniniiiiiyxyx(式中,n-1为自由度,n为数据对数)2.建立检验假设:0:,0:10ddHH(其中d为均值差异)其假设的意义为,当差异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试验方法在发生作用或有效。2.3模型求解:(1)配对样品的t检验要求两对应样品的总体满足正态分布,则总体中的样品应该满足正态性或者近似正态性,样本的正态性检验如下:根据t检验的原理,对葡萄酒配对样品进行t检验之前我们要对样品进行正态性检验。配对样品的t检验要求两对应样品的总体满足正态分布,总体中的样品应该满足正态性或者近似正态性。因此,以白葡萄酒的澄清度的28组数据为例分析,利用SPSS软件绘制两样品的直方图和趋势图如图1所示:图一白葡萄酒澄清度两组数据直方图我们假设两组总体数据都服从正态分布,利用SPSS软件进行K-S正态性检验的具体结果见附录1。两组数据的近似相伴概率值P分别为0.629和0.223,大于我们一般的显著水平0.05则接受原来假设,即两组红葡萄酒的澄清度数据符合近似正态分布。同理可用SPSS软件对其他指标的正态性进行检验,得到结果符合实际猜想,都服从近似正态分布。(2)问题一中配对样品为红葡萄酒与白葡萄酒两个完全相同的酒样品在两组不同评酒员的检测下得到的两组数据,其中两组中各个指标的数据为各组10个评酒员对该指标打分的平均值。通过先求和后平均的算法作出各个样品的总指标,即平均分,如表1。并在SPSS中对两组红葡萄酒质量的平均值运行配对样本的T检验(检验水平α=0.05)表1:酒样品的平均分样品红1红2白1白2样品162.768.18277.9样品280.37474.275.8样品380.474.685.375.6样品468.671.279.476.9样品573.372.17181.5样品672.266.368.475.5样品771.565.377.574.2样品872.36671.472.3样品981.578.272.980.4样品1074.268.874.379.8样品1170.161.672.371.4样品1253.968.363.372.4样品1374.668.865.973.9样品147372.67277.1样品1558.765.772.478.4样品1674.969.97467.3样品1779.374.578.880.3样品1859.965.473.176.7样品1978.672.672.276.4样品2078.675.877.876.6样品2177.172.276.479.2样品2277.271.67179.4样品2385.677.175.977.4样品247871.573.376.1样品2569.268.277.179.5样品2673.87281.374.3样品277371.564.877样品2881.379.6将数据导入spss运行后,结果如下:成对样本检验tdfSig.(双侧)对1红1-红22.45826.021对2白1-白2-2.18427.038结论分析:本题中,红葡萄酒自由度n=27-1=26,056.226t2,即知拒绝域为|t|≥2.056,白葡萄酒自由度n=28-1=27,052.227t2,即知拒绝域为|t|≥2.052。由上表可知,两组品酒师对红、白葡萄酒的检验结果|t1|=2.458≥2.056,|t2|=2.184≥2.052,因为两个检验值均在拒绝域,所以两组品酒师的评价结果有显著差异。5.1.3评价结果的可信度分析3.1基本数学原理:本小问,我们采用信度分析中的α信度系数法。Cronbachα信度系数是目前最常用的信度系数,其公式为:其中,K为酒样品的总数,为第i种酒品得分的方差,为全部酒样品总得分的方差。从公式中可以看出,α系数评价的是品酒师各酒样得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。目前,普遍认为α信度系数的值一般在0和1之间,在此范围内,值越大,评价信度越好。3.2模型求解:对附表1中两组品酒师对每种酒