byliao2013.1.23红外光谱分析化学计量学软件Unscrambler9.7PLS1红外光谱分析建模(帮助里自带例题消费者对果酱质量的偏爱性分析-tutor_b每一步超详细步骤,自己总结加翻译)PCA\PLS2\PLS1问题1:找到覆盆子果酱主要的感官质量特征问题2:找出主要感官质量特征和化学测量值的关系问题3:通过主要感官质量特征预测未知样的参数看重PCA解释方差图(theExplainedVariance:残余方差曲线),得分和权重PLS2解释方差图(theExplainedVariance:残余方差曲线):残余方差曲线,得分,权重,模型预测能力-PredictedvsMeasuredPLS1解释方差图(theExplainedVariance:残余方差曲线),模型预测能力-PredictedvsMeasured,模型系数RW-RegressionCoefficients,预测时:模型预测错误率RMSEP基本设置:1打开自带例子tutorialBLAB为化学变量;Absorban吸收性Soluble可溶解性Acidity酸性为设备变量(比色法测得),6个变量放在设备变量里preference变量是消费者偏爱性20个样品:12个用来建模,叫做校正集;其他8个为预测集。2插入类别变量Cultivar、HarvestTimeEdit-Insert-CategoryVariable同理,收获时间分类变量HarvestTime,变量名为蓝色。数据表中双击选择对应值如下图3样品、变量设置Modify-EditSet样品:变量:问题1:找到覆盆子果酱主要的感官质量特征解决方法1PCA建模因为只考虑X变量分析:1解释残余方差图选中右下方,Plot-VariancesandRMSEP得到解释方差图,3个主成分描述了92%的验证变量信息、97%的校正变量信息。2解释得分图:选中得分图,Edit-Options-SampleGrouping-EnableSampleGrouping,再按下图设置:得到:按照收获时间分类,分成了三类,以不同颜色标示。3解释权重矩阵选中权重矩阵,View-CorrelationLoadings显示REDNESSandCOLOUR在主成分1的最右边,离得很近,远离中心,非常接近100%解释方差椭圆(内椭圆为50%解释方差),得出颜色和发红性很相关,也意味着得分图右边的样品这两个变量的含量值很高。主成分2轴上,R.SMELLandR.FLAV在正上方,两者很相关,且与在正下方的FLAV呈负相关。在得分图上,越往上,有很高R.SMELLandR.FLAV。得分图和相关权重图显示C2H3andC1H3有很高的REDNESSandCOLOUR特性值;C1H2有很大的off-flavour特性。在得分图上的样品点的位置对应权重图上相对应位置上的特性变量值。主成分3描述的变量是sweetness,bitternessandchewingresistancePlot-Loadings,选择PC1vs.PC34解释影响图左下角是,位于图右上方的样品是outliers,应该被去除。本图中没有outliers.保存PCA模型为“TutorialBPCA”。问题2:找出主要感官质量特征和化学测量值的关系解决方法1建立PLS2模型因为考虑X和Y变量Task-Regression点击setup在PC5处预测误差达到最小值。但是第一个最小预测误差是在前两个主成分后的0.84,这是必须选择的主成分来避免过拟合。2找出outliers下方的warning:找出outliers。点击Window-WarningList点击outliers得出:1解释方差图选中左下方图,Plot-VariancesandRMSEP--看模型如何描述6个Y变量_查看解释方差explainedvariance.theExplainedVariance:残余方差曲线显示,两个主成分是最佳的。变量很好地被这两个主成分描述。85%thecolorvariation(variables1and2),80%的sweetness(6)可以被化学和测量变量解释。注意:只有23%的总Y变量被模型解释(用两个主成分)。total为蓝色。2解释得分图得分图Edit-OptionsPC1描述收获时间。收获时间1在最左边,收获时间在最右边,分的很开。得分图不显示培养变量Cultivar的信息。结合loading权重图可以得到更多的信息。3解释权重图选中权重图,Plot-LoadingWeights显示spectrophotometriccolormeasurements(L,A,andB)与colorintensityandredness是负相关的。Sweetness就像期望的一样与酸度Acidity负相关。但是R.Flavor与thePLS-factors弱相关(靠近原点、弱的PLS权重)问题1PCA模型分析结果是jamqualityvariedbothwithrespecttocolor,flavor,andsweetness(果酱质量主要以color,flavor,andsweetness)区分。现在的模型中显示,chemicalandinstrumental变量主要预测colorandsweetness,但是不能预测Y-variableFlavor。采用其他设备变量X,例如气相色谱数据,可以提高Y-variableFlavor的预测能力。1解释模型预测能力图模型预测能力选中右下角图,Plot-PredictedvsMeasured:variableRedness,modelwithtwoPCs最终四幅图:保存PLS2模型为“TutorialBInst-Sens”问题3:通过主要感官质量特征预测未知样的参数解决方法1建立PLS1预测模型Task-Regression2解释模型预测能力--残余方差图选中左下角图,点击Window-CopyTo-1预测方差在0.143时停止降低,因此选择两个主成分PC1、PC2.3解释预测和测量图PredictedvsMeasured选中右下角图,点击Plot-PredictedvsMeasured预测能力很好,虽然一些样品不是很好地被预测,但是总的相关系数很好0.9213,4解释模型系数BwandB模型系数告诉我们每一个感官变量对消费者的累计重要性,这些变量可以很好地预测Y变量Preference。Plot-RegressionCoefficients,选择Weightedcoefficients(BW),两个主成分双击图中显示屏位置,可以使画出的图是全屏Edit-Options-barsEdit-Mark-SignificantX-VariablesOnly统计分析上,Redness,ColorandSweetness对于预测Preference很重要。RaspberrySmell也很重要,但是是副作用对应偏爱。Thickness看起来很重要,因为有很大的副作用,但是该模型不能显示其重要性。保存模型为“TutorialBSens-Pref”5打开结果矩阵File-Import-UnscramblerResults-ImportdataintoNewdatatable6输出模型Results-Regression点击ExportFullASCII-MODexport包含了outliers探测等的所有结果,且可以被其他软件识别。7预测新变量Task-Predict预测存在一些不确定性的限制,模型不是太好,但是这个模型可以被用来预测新果酱样品的偏爱性,预测哪一个样品将会被消费者接受。保存预测结果为“TutorialBPredict1”。7RMSEP(预测均方根误差值)查找原始单元中的错误-RMSEP(预测均方根误差值)Results-Regression--TutorialBSens-PrefPlot-andRMSEP图中显示了所有主成分的偏爱性的预测均方根误差。前两个主成分的RMSEP是0.83,这意味着预测新样品误差在0.8左右,在可以接受的感官质量特征分析水平内,在所有测量中都有一定的不确定性。