2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):20122129所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:2012年9月9日赛区评阅编号(由赛区组委会评阅前进行编号):2011高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1A题葡萄酒的评价一,摘要第一问中,我们通过T-检验来判断两组评酒员的评价结果有无显著性差异,结果发现两组评酒员的评价结果无显著性差异;对红,白葡萄各自两组的可信度分析,我们引入稳定性指标X,即将每一组的十位品酒师对于同一样品所有指标所给的分求标准差并根据指标所占分数进行相应的加权求和。最后求出总平均稳定性指标,数值较小的可信度较高。结果发现红,白葡萄酒均是第二组品尝评分较合理。第二问中,首先对酿酒葡萄的一些特殊理化指标进行简化处理(如Ph值,芳香物质,果皮颜色),接着采用用无量纲化对所有数据进行处理。将指标分级后运用熵值法求出各个指标所占权重。使用topsis算法求出各评价对象与最优方案的接近程度并进行排序,将红葡萄酒酿酒葡萄分为7级,白葡萄酒酿酒葡萄分为5级。第三问,我们计算出葡萄酒与酿酒葡萄理化指标间的相关系数,得到相关系数矩阵(见附录),并对相关系数进行筛选分析,将筛选出来的项用线性拟合的方法进行显著性实验得到相应的R-square值。综合相关系数与R-square值得出酿酒葡萄与葡萄酒的理化指标之间的联系。第四问,我们将葡萄酒与对应酿酒葡萄的理化指标合成一个综合指标。这一综合指标可以反映出葡萄酒与对应酿酒葡萄的理化指标间的线性关系。将这一综合指标与附录一中对应葡萄酒的分数进行相关性分析,拟合出相关函数。在尝试多种函数拟合后,拟合结果并不理想,因此我们认为无法定量评价葡萄和葡萄酒的理化指标与葡萄酒的质量,只能大致猜测综合指标与葡萄酒的质量负相关。关键字:T-检验无量纲化topsis算法熵值法相关性分析综合指标2二,问题提出确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三,问题分析第一问:为了确定两组品酒师的评价结果有无显著性差异,我们采用T-检验法进行检验。首先计算出两组评审对各个葡萄酒的评审均分,对于每一个葡萄酒样品求出对应该组评审均分的平方和。引入一个统计量T。并与T值表中数据核对,从而确定两组品酒师的评价结果的差异是否显著。为了确定两组评价结果的可信度,我们引入一个稳定性指标X,即将每一组的十位品酒师对于同一样品所有指标所给的分求标准差并根据指标所占分数进行相应的加权求和。最后求出总平均稳定性指标,数值较小的可信度较高。第二问:首先对酿酒葡萄的一些特殊理化指标进行简化处理(如Ph值,芳香物质,果皮颜色),采用用无量纲化对所有数据进行处理。将所有指标分为两级,一级指标分酿酒葡萄的理化指标和葡萄酒质量两个指标,其中酿酒葡萄的理化指标又分30个子指标即二级指标。运用熵值法求出各个指标所占权重。使用topsis算法求出各评价对象与最优方案的接近程度并进行排序,从而完成对酿酒葡萄的分级。第三问:由于附件二中各项指标的单位不统一,因此我们先将其无量纲化(芳香物质单位统一无需无量纲化)。再求出任一个葡萄酒指标与其对应的任一个酿酒葡萄指标间的相关系数。相关系数的绝对值越接近于1,说明两指标间的线性关系越强,且大于0时二者成正相关,小于0时二者成负相关。从得到的相关系数矩阵中筛选出绝对值大于等于0.8和横纵指标相同或相似的项。将这些项所对应的葡萄酒与酿酒葡萄指标用线性拟合的方法进行显著性实验得到相应的R-square值。综合相关系数与R-square值得出这些指标的联系。第四问:由于葡萄酒与酿酒葡萄的理化指标很多,不方便直接找它们与葡萄酒质量的关系。因此我们建立综合指标。这一综合指标可以反映出筛选后每一个葡萄酒与酿酒葡萄理化指标间正相关与负相关关系。再将综合指标与问题二中葡萄酒的排名数进行相关性分析,得出葡萄和葡萄酒的理化指标与葡萄酒的质量间的关系。四,建模过程3第一问1,模型假设(1):假设各指标之间没有联系,独立分开(2):问题中给出的数据可靠(3):品酒师品酒时所处的外界环境相同,不会因外界环境而导致品酒师的评价水平(4):每位品酒师鉴赏水平波动不大,可视为恒定(5):每位品酒师在品同一类酒的时候除个人品酒水平外,其他条件相同(6):假设10位品酒师对某一指标所评的分数符合正态分布2,定义符号说明::T统计量T:khjia第k组序号为h的样品第j个品酒师对第i个指标的给分:khia第k组序号为h的样品中第i个指标10位品酒师给分的平均值:khiS第k组序号为h的样品第i个指标10位品酒师评分的标准差kib:第k组第i个指标所占权重:khx第k组序号为h的样品的稳定性指标k:p红第k组红葡萄酒的评分总平均稳定性指标k:P白第k组白葡萄酒的评分总平均稳定性指标k=(1or2)其中:第一个指标指澄清度,第二个指标指色调,第三个指标指香气纯正度,第四个指标指香气浓度,第五个指标指香气质量,第六个指标指口感纯正度,第七个指标指口感浓度,第八个指标指持久性,第九个指标指口感质量,第十个指标指平衡/整体评价。3,模型建立:(1),显著差异分析:首先假定两个总体平均数间没有显著差异。统计量T的计算公式122212121212().2.XXTXXnnnnnn查T值表,比较计算得到的T值与理论T值,推断发生概率(一般为95%)。(3),可信度分析:通过Excel得出第k组序号为h的样品第i个指标10位品酒师给分的平均值4101=10khjijkhiaa通过Excel得出第k组序号为h的样品第i个指标10位品酒师的标准差1021()10khjikhijkhiaaS算出第k组序号为h的样品的稳定性指标101khkhikiixSb求出第k组红,白葡萄酒的评分总平均稳定性指标271khhpx红k28k1khhpx白4,模型求解:对于红葡萄酒来说统计量T的值为0.443对于白葡萄酒来说统计量T的值为0.551查看T值表,并核对。结果发现两组评酒员的评价结果无显著性差异。红葡萄酒各组稳定性指标样品序号12345678910第一组该样品稳定性指标148.57103.63132.01157.28137.99126.92162.77146.24137.44131.99第二组该样品稳定性指标155.57106.55112.14115.53102.92108.88137.89141.93111.84118.82样品序号11121314151617181920第一组该样品稳定性指标153.02128.62144.59129.49148.00126.52162.74129.06128.7891.19第二组该样品稳定性指标123.49110.4997.79105.81112.1097.2886.60136.20129.07119.51样品序号21222324252627第一组该样品稳定性指标178.59124.97111.40147.36148.84108.69149.45第二组该样品稳定性指标112.08128.68121.28107.94115.08110.5182.49第一组总平均稳定性指标p红1136.90第二组总平均稳定性指标p红2115.13比较红葡萄酒的两组总平均稳定性指标,因为2pp红1红,所以第二组品酒师的评5价结果更可信白葡萄酒各组稳定性指标样品序号12345678910第一组该样品稳定性指标144.71190.69351.30129.43165.66182.83111.98212.46154.12201.45第二组该样品稳定性指标96.95118.65167.31106.04112.00100.51118.9187.34160.78145.86样品序号11121314151617181920第一组该样品稳定性指标184.85156.05186.57171.11179.59188.99180.97197.01137.92153.99第二组该样品稳定性指标146.03186.67120.0989.09124.40156.93127.96108.99109.07119.72样品序号2122232425262728第一组该样品稳定性指标194.12174.80130.27172.96112.87149.36173.98158.63第二组该样品稳定性指标128.55126.2084.45105.90148.99175.2499.53114.32第一组总平均稳定性指标P白1179.58第二组总平均稳定性指标P白2129.13同样,比较白葡萄酒的总平均稳定性指标,因为2PP白1白,所以第二组品酒师的评价结果可信度更高。第二问1,模型假设:假设酿酒葡萄的理化指标中的数据符合事实2,定义符号说明:ijh:代表对应的指标Z:无量纲化处理后的矩阵Z:平移以后的矩阵P:比重矩阵je:第j项指标熵值jd:第j项指标差异性系数6jw:第j项指标权重Z:最优方案Z:最劣方案iD:每个评价对象与Z的距离iD:每个评价对象与Z的距离iC:各评价对象与最优方案的接近程度3,模型建立:首先某些特殊指标进行处理。PH这一指标合理范围大致在3.4至3.6,所以我们对其进行等级划分,[2.8,3)和[4.0,4.2)为第一等级,计数值为1,[3,3.2)和[3.8,4)为第二等级计数值为2,[3.2,3.4)和[3.6,3.8)为第三等级计数值为3,[3.4,3.6)为第四等级计数值为4。我们把芳香物质量的总和作为一个指标。对于果皮颜色,在红葡萄中,我们将每组**()ab的平均值作为各组红葡萄果皮颜色的指标,同样,在白葡萄酒中,我们将每组**()ba的平均值作为各组白葡萄果皮颜色的指标。为了消除负值对后面topsis算法的影响,我们将每组**()5ba作为各组白葡萄果皮颜色的指标。1,指标属性趋同化处理与数据无量纲化a,可将低优指标和中性指标全转化为高优指标'ijh'1//[||]ijijijijhhhMMhM高优指标低优指标中性指标并适当调整(扩大或缩小一定比例)转换数据b,数据的无量纲化。由于各指标所代表的物理含义不同,因此存在着量纲上的差异。这种异量纲性是影响对事物整体评价的主要因素。因此我们用无量纲化来解决这一问题。我们采用以下公式对数据进行无量