优秀论文《葡萄酒的评价》破解一.队号:第58组队员:刘春博电气13-9班吴章明机械13-4班戚亮生电气13-9班二.摘要阅读。1.模型的数学归类:该论文在问题一的处理中运用t检验法和标准差法,T检验法是在处理具有本含量较小,总体标准差未知的正态分布的问题。在问题二的处理中由于涉及多个因素和多个指标,且这些因素和指标具有模糊性,所以运用模糊综合评价法,数学上属于模糊评价模型;对于问题三由于不能确定变量之间的具体函数关系,并且需要对大量的数据进行分析,利用了多元线性回归模型和多元非线性回归模型,在自变量和因变量之间估计和预测其内在联系,模型在数学上属于回归分析模型;问题(4)中建立了BP神经网络模型,并使用均值滤波法分析不同指标的作用,该模型模拟人工神经网络来判断葡萄酒质量的影响因素。2.建模的思路或方法,模型的求解方法以及模型的分析:对于问题(1),作者先对缺失值进行了合理的求解补充,再利用t检验法和标准差对两组评酒员进行显著性误差分析,并对两组组内进行可靠性分析。对于问题(2),作者先对酿酒葡萄进行分级,对葡萄酒质量数据误差处理,将数据一致化,无量纲化合降维,最后利用均值法和模糊综合评价法将红.白葡萄酒进行分级。对于问题(3),作者先建立多元线性回归模型,对酿酒葡萄的理化指标和葡萄酒的理化指标进行估计预测,并对模型结果做了残差分析,发现了该模型的缺点,继而用多元非线性回归模型分析。对于问题(4),通过对BP神经网络模型的学习,对葡萄酒质量的影响进行判断,采用均值滤波法分析酿酒葡萄和葡萄酒质量影响的关系,最后对预测值和实际值进行比较,发现存在较大误差。模型的求解方法以及模型的分析:均值法模型:对所得数据按行取均值。针对各个理化指标,对所有酿酒葡萄按行取均值,得出每种酿酒葡萄各项指标的均值。模糊综合评价模型:对模糊关系矩阵取不同的权值,分别求出不同种类对应的酿酒葡萄数量。多元线性回归模型:回归分析是利用已知数据来寻找变量之间关系的一种统计分析方法,主要目的是了解输入变量与输出变量的数量关系。总体思路是先假设酿酒葡萄理化指标与葡萄酒理化指标呈线性关系,建立多元线性回归模型,然后进行模型检验,如果该模型预测结果良好,则可用于实际,若不合理,再考虑建立多元非线性回归模型对其进行优化。基于附件2无量纲化并降维后的数据,由线性回归模型可解得红葡萄酒与酿酒红葡萄理化指标之间的关系。残差分析:因为在实际问题中,数据可能不完全可靠。所以有必要对该多元线性回归模型进行残差分析。BP神经网络模型::具有偏差和至少一个S形隐藏层加上一个线性输出层的网络,能够逼近任何有理函数。针对本文实测目标,神经网络采用三层前馈网络,由输入层,隐藏层,输出层组成。输入层有15个神经元,每个神经元对应一个影响因素,其输入为因素的归一化结果值;输出层有一个神经元,其输出为酒质量的值。:具有偏差和至少一个S形隐藏层加上一个线性输出层的网络,能够逼近任何有理函数。针对本文实测目标,神经网络采用三层前馈网络,由输入层,隐藏层,输出层组成。输入层有15个神经元,每个神经元对应一个影响因素,其输入为因素的归一化结果值;输出层有一个神经元,其输出为酒质量的值。对于建立的基于BP神经网络的质量模型,利用matlab进行求解均值滤波法:均值滤波法进行权值与自变量(质量影响因素系数)的转换:求出同一变量的各个权值系数的平均值后取绝对值,作为相应因素对质量的最终影响程度系数。原因有以下两点:第一,同意因素不同权值的算术平均值可以表示其在整个网络中的整体权重值;第二,不同变量的权值最后都取绝对值保证了它们比较的基准相同,可以全部通过正向比较来区分不同权值的大小。3.主要结果或结论:通过问题(1)的分析,得到两组品酒员的结果存在显著性差异,第二组的评价结果更可靠。问题(2)最后将红.白葡萄酒分为了5个等级。问题(3)得到结论:只有利用多元非线性回归模型才能描述出酿酒葡萄和葡萄酒质量两类理化指标间的联系。问题(4)得到结论:用七种酿酒葡萄和葡萄酒的理化指标的预测值和实际值作比较,发现误差较大,确定不能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。三.问题的分析及准备:1.该论文的目的:通过建立模型,得到酿酒葡萄与葡萄酒质量之间直接的确定关系,以及葡萄酒和酿酒葡萄检测的理化指标在一定程度上反映葡萄酒和葡萄的质量,对评酒员所给出的分数进行合理处理和分析,从而科学的确定葡萄酒的质量。2.建立模型要具体解决以下四个问题:a.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?b.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。c.分析酿酒葡萄与葡萄酒的理化指标之间的联系。d.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒质量。3.建模的过程中收集到了:a.葡萄酒品尝评分表(含4个表格)b.葡萄和葡萄酒的理化指标(含2个表格)c.葡萄和葡萄酒的芳香物质(含4个表格)附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。.4.基本思路:首先,对两组评酒员的评价结果的显著性差异进行检验和分析,从而筛选可靠性较好,可信度较高的品酒数据;继而利用酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级;之后通过对所建模型的结果进行分析,建立正确的回归模型,准确描述酿酒葡萄的理化指标和葡萄酒的理化指标间的联系;最后依据理化指标,分析得到不同酿酒葡萄和葡萄酒的理化指标对葡萄酒质量产生的影响,最后根据评酒员给各类葡萄酒品尝后对其分类指标的打分确定葡萄酒质量。5.该论文所选择的模型:有模糊评价模型,回归分析模型,BP神经网络模型;用到的方法有t检验法,标准差法,均值滤波法。6.论文所用到的数据信息如下:见附件1-葡萄酒品尝评分表,附件2-各类指标总表,附件3-芳香物质。四.模型的假设模型的假设要排除一些次要因素以及人为不可控的外在复杂因素的影响,如果考虑过多的次要因素会使模型的难度加大,排除次要因素是为了避免为计算带来不必要的麻烦,抓住主要因素。从而使问题简化。并假设建模所计算结果的可靠性。增强模型的说服力。五.模型的建立运用了均值法模型和模糊综合评价法模型。均值法:两组评酒员对白葡萄酒个样本评分的平均值。再利用倒数发将数据一致化:'1jjxx利用极值差法对变量进行无量纲化。用因子分析法进行降维。利用SPSS软件得成分得分系数矩阵,得到隐形变量的值:F1=—0.046X1+0.081X2+……+0.046X30F8=0.078X1+0.150X2+……+0.087X30列出表格。对所得数据按行取均值。最后根据权重求出葡萄酒得分is=1wGi+2wAi它是从因素集到评语集的模糊关系矩阵。11188188rrRrr用模糊综合结果向量2iiBwR最终等级得分:2iiiSBwM最后根据等级得分向量利用Matlab画出条形图建立多元线性回归模型:'01122...iiininiyxxx其中i相互独立且2()0,()iiED.多元非线性回归模型:8091810371iiiiyxxxxx其中,取各种形式脚标时均为常数,的脚标遵循以对应因子的脚标打头的原则.采用BP神经网络模型进行定性分析第一层(输入层):将输入引入神经网络(1)(1),1,2,......,iiOutInxim第二层(隐藏层):(2)(1)(1)1(2)(2),1,2,......,()njijiijjInwOutjlOutfIn其中()fx是传递函数,这里采用的是正切S型激励函数()fx=tansig(x)第三层(输出层):(3)(3)kkkyOutIn=(2)1,1,2,......,jjkijwOutkn其中m,n,l分别代表输入层节点数输出层节点数,隐藏层神经元个数。根据本问题可以直接确定m=15,n=1.l则不能直接确定,采用经验公式,[1,10]lmnaa来确定初始值l=6六模型求解问题一1.缺失数据替换发现第一组评酒员4号对红葡萄酒样品20号色调一项数据评分缺失,利用缺失值前后数据的平均值进行补植,即为(4+6)/2=5,缺失数据为5。2.显著性差异分析分析两组之间的差异,每组内部的10个人可看为一个整体。将样本的各项单项分数相加,利用Excel得出每一组对每一个葡萄酒样本的评分的平均值。得出结果如下:两组对葡萄酒各样本评分的平均值样本编号1234567891011121314组一82.074.285.379.471.068.477.571.472.974.372.363.365.972.0组二77.975.875.676.981.575.574.272.380.479.871.472.473.977.1样本编号1516171819202122232425262728组一72.474.078.873.172.277.876.471.075.973.377.181.364.881.3组二78.467.380.376.776.476.679.279.477.476.179.574.377.079.6对样本进行t检验,首先对白葡萄酒的得分进行正太分布检验。此处应用分布拟合检验的思想,以及皮尔逊定理。求得第一组的皮尔逊统计量chisum=0.4135,第二组的chisum=0.3727,利用SPSS软件对白葡萄酒进行t检验。所得结果显示两组品酒员的评价结果都有显著性差异。3.可信度比较利用方差概念进行计算。表4评分方差表方差平均值第一组第二组白葡萄酒129.18356.01944红葡萄酒57.998333.7905由于第二组方差平均值较小,所以第二组更可信。问题二1.依据葡萄酒的质量对酿酒葡萄进行分级由于第二组评价更可信,所以对第二组数据进行分析。利用聚类分析法对白葡萄酒评分进行等级划分。所以得到白葡萄酒与红葡萄酒的四个等级,见表6。2.依据酿酒葡萄的理化指标对酿酒葡萄进行分级因为香气和口感所占权重大,只考虑定葡萄酒香气和口感的理化指标,不仅可以简化问题,还可以使正确性得以保证。对附件2和附件3中决定口感、香气的理化指标进行量纲化处理。口感与香气的权重比为22:15。品酒的权重为:酿酒白葡萄的口感指标×22+酿酒白葡萄的香气指标×15。可得具体分级标准见表7。3.均值法模型对酿酒葡萄进行分级3.1数据处理异常数据值的替换:异常数据值在第二问中对酿酒葡萄的理化指标有很重要的影响,会影响酿酒葡萄的分级,采用统计中常用的3σ原则。多次测量数据的平均,数据的一致化。利用倒数法。数据无量纲化。在实际的评价指标中,往往都存在着各自不同的单位和数量级,为了消除不同变量的量纲的影响,首先需要对变量进行无量纲化。因子分析:通过对原附件2的分析,可看出酿酒葡萄的理化指标由氨基酸,蛋白质,VC含量等指标构成。将标准化后的结果导入SPSS中进行因子分析和降维。3.2均值法模型对所得数据按行取均值。针对各个理化指标,对所有酿酒葡萄按行取均值,得出每种酿酒葡萄各项指标的均值为0.3138,0.3084,0.3666,0.2063,0.3023,0.2878,0.2222,0.3865,0.2877,0.2600,0.3014,0.2618,0.2252,0.3419,0.2679,0.2307,0.3398,0.2459,0.2514,0.2783,0.2790,0.2493,0.3836,0.2979。由第一问可知第二组对葡萄酒的评价结果更可信,所以利用第二组的评分进行以下计算。第二组对红酒每个样本评分的平均值为68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72,71.5。最后求得酿酒葡萄的分数:0.6155