基于多元回归的炉龄问题的实现-2.0

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

成员信息:姓名班级学号张队长队员&答辩人题目:基于多元回归的炉龄问题的实现日期:2019年12月30日摘要工业生产在生产出产品的同时,也生产出大量关于生产过程的信息。应充分利用这些信息并在此基础上寻求如何才能使生产得到进一步改善的方法。因为钢铁生产过程特别复杂,出现的因素特别多,各因素间又相互牵连[1]。因此找出某一时期影响某一实际问题的最主要原因,提供优化决策,不仅对生产技术管理有很大的参考价值,而且也有助于积累经验,还对机理性问题的研究具有启发和促进作用。现有某钢铁公司炼钢转炉的炉龄按30天炉/天炼钢规模,大约一个月就需等炉一次进行检修。为了减少消耗,厂家通过实际测定,得到33组数据。要求对炉龄进行预测和分析。本文针对此问题,进行分析并建立合适的数学模型,为解决炉龄问题提供方案。针对问题一,分析各个因素横向之间以及各个因素纵向内部数据之间的关系,采用灰度预测模型,将缺失的数据进行补全。针对问题二,通过主成分分析法找出与影响炉龄的主要因素,剔除对炉龄影响较小的因素。建立以多个影响因素为自变量和以炉龄为因变量的多元线性回归模型,并且建立了支持向量机的回归模型。针对问题三,对于多元线性回归模型,主要考虑其预测的残差来分析模型的可靠性,模型预测残差的分布越没有趋势,表示回归的结果越是可靠,所以多元线性回归模型对本问题有一定的适用性。对于支持向量机回归模型,将其与BP神经网络进行对比,发现其性能明显优于BP神经网络。针对问题四,分析找出对转炉寿命影响较大的因素为喷补料量、炼钢时间和渣中含铁量,并将设计延长炉龄方案时重点放在这三个因素。关键词:转炉炉龄灰度预测多元线性型回归支持向量机目录一、问题重述........................................................41.1问题背景........................................................41.2问题的提出......................................................4二、问题的分析......................................................4三、基本假设........................................................5四、符号说明........................................................5五、问题一的模型建立与求解..........................................55.1问题的分析......................................................55.2模型的建立与求解................................................6六、问题二的模型建立与求解..........................................96.1问题的分析......................................................96.2模型的建立与求解...............................................10七、问题三的求解...................................................197.1问题的分析.....................................................197.2问题的求解.....................................................19八、问题四的求解...................................................218.1问题的分析.....................................................218.2问题的求解.....................................................21九、参考文献.......................................................22一、问题重述1.1问题背景自1952和1953年氧气顶吹转炉炼钢在奥地利的钢铁股份公司林茨钢厂与砂冶公司多纳维茨钢厂先后建成投产。转炉炼钢以其生产率高、品种多、质量好、热效率高、原材料适应性好、消耗低、成本低、基建投资少、建设速度快等优点,被国内外钢铁冶炼行业广泛采用,成为现代炼钢的主要方法之一。转炉炉龄是炼钢车间的一项综合性技术经济指标。炉龄的离低直接影响转炉钢产及耐火材料消耗和成本等指标。因此,炉龄的提高对于技经指标的改善和炼钢成本的降低具有十分重要的意义[2]。1.2问题的提出某钢铁公司炼钢转炉的炉龄按30天炉/天炼钢规模,大约一个月就需等炉一次进行检修。为了减少消耗,厂家通过实际测定,得到下表所示的数据,其中𝑥1为喷补料量、𝑥2为吹炉时间、𝑥3为炼钢时间、𝑥4为钢水中含锰量、𝑥5为渣中含铁量、𝑥6为作业率、目标变量y为炉龄(炼钢炉次/炉)。要求完成如下四问:问题1:由于某种原因,造成个别数据缺失,试对这些缺失数据(表中用██表示)进行补全。问题2:试根据附表数据建立炉龄的预测模型。问题3:采用适当的指标和方法对第2问建立的模型,和第1问修正数据之后的改进模型进行可靠性分析,说明模型对实际问题的适用性。问题4:为钢铁公司提出延长炉龄的方案。二、问题的分析此问题属于多元回归问题。回归问题是建立因变量Y与自变量X之间关系的模型。我们需要利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化。根据因变量和自变量的个数分为:一元回归分析和多元回归分析。此问题属于多元回归。三、基本假设1.所得数据可靠准确,不包含人为误差。2.炉龄的影响因素只有喷补料量、吹炉时间、炼钢时间、钢水中含锰量、渣中含铁量、作业率六个因素。四、符号说明符号说明单位𝑥1喷补料量\𝑥2吹炉时间\𝑥3炼钢时间\𝑥4钢水中含锰量\𝑥5渣中含铁量\𝑥6作业率\y炉龄炼钢炉次/炉𝜆(𝑘)序列的级比\𝑏𝑗信息贡献率\𝑄残差平方和\𝐾(𝑥𝑖,𝑥𝑗)=𝜙(𝑥𝑖)𝜙(𝑥𝑗)核函数\表1:符号说明五、问题一的模型建立与求解5.1问题的分析问题一首先要求我们根据一项已知的数据,对个别数据缺失,试这些缺失数据(表中用██表示)进行补全。由附表可以看出,给出的数据是一些离散的,规律性不强的数据,此时我们采用灰色预测的方法对其进行补全。灰色系统理论认为,尽管客观表象复杂,但总是有整体功能的,因此必然蕴含某种内在规律。关键在于如何选择适当的方式去挖掘和利用它。灰色系统是通过对原始数据的整理来寻求其变化规律的,这是一种就数据寻求数据的现实规律的途径,即为灰色序列的生成。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。灰色预测的主要特点是模型使用的不是原始数据序列,而是生成的数据序列。其核心体系是灰色模型(GreyModel,简称GM),即对原始数据作累加生成(或其它方法生成)得到近似的指数规律再进行建模的方法。5.2模型的建立与求解5.2.1数据的检验与处理首先,为了保证建模方法的可行性,需要对已知数据列作必要的检验处理。设参考数据为𝑥(0)=(𝑥(0)(1),𝑥(0)(2),⋯,𝑥(0)(𝑛)),计算序列的级比:𝜆(𝑘)=𝑥(0)(𝑘−1)𝑥(0)(𝑘)𝑘=2,3,⋯,𝑛(5.1)如果所有的级比𝜆(𝑘)都落在可容覆盖𝛩=(𝑒−2𝑛+1,𝑒2𝑛+2)内,则序列𝑥(0)可以作为模型GM(1,1)的数据进行灰色预测。如果所有的级比𝜆(𝑘)都落在可容覆盖𝛩=(𝑒−2𝑛+1,𝑒2𝑛+2)内,则序列𝑥(0)可以作为模型GM(1,1)的数据进行灰色预测。否则,需要对序列𝑥(0)做必要的变换处理,使其落入可容覆盖内。即取适当的常数𝑐,作平移变换:𝑦(0)(𝑘)=𝑥(0)(𝑘)+𝑐,𝑘=1,2,⋯,𝑛(5.2)使序列𝑦(0)=(𝑦(0)(1),𝑦(0)(2),⋯,𝑦(0)(𝑛))的级比:𝜆𝑦(𝑘)=𝑦(0)(𝑘−1)𝑦(0)(𝑘)∈𝛩𝑘=2,3,⋯,𝑛(5.3)5.2.2.建立模型1.已知参考数据列𝑥(0)=(𝑥(0)(1),𝑥(0)(2),⋯,𝑥(0)(𝑛))(5.4)进行1次累加生成序列:𝑥(1)=(𝑥(1)(1),𝑥(1)(2),⋯,𝑥(1)(𝑛))=(𝑥(0)(1),𝑥(0)(1)+𝑥(0)(2),⋯,𝑥(0)(1)+⋯+𝑥(0)(𝑛))(5.5)其中𝑥(1)(𝑘)=∑𝑥(0)(𝑖)𝑘𝑖=1(𝑘=1,2,⋯,𝑛)。𝑥(1)的均值生成序列:𝑧(1)=(𝑧(1)(2),𝑧(1)(3),⋯,𝑧(1)(𝑛))(5.6)其中𝑧(1)(𝑘)=0.5𝑥(1)(𝑘)+0.5𝑥(1)(𝑘−1),𝑘=2,3,⋯𝑛。2.建立灰微分方程𝑥(0)(𝑘)+𝑎𝑧(1)(𝑘)=𝑏𝑘=2,3,⋯,𝑛(5.7)相应的白化微分方程为:𝑑𝑥(1)𝑑𝑡+𝑎𝑥(1)(𝑡)=𝑏(5.8)记𝑢=[𝑎,𝑏]𝑇,𝑌=[𝑥(0)(2),𝑥(0)(3),⋯,𝑥(0)(𝑛)]𝑇,𝐵=[−𝑧(1)(2)1−𝑧(1)(3)1⋮⋮−𝑧(1)(𝑛)1],则由最小二乘法,求得使𝐽(𝑢)=(𝑌−𝐵𝑢)𝑇(𝑌−𝐵𝑢)达到最小值的𝑢的估计值𝑢̂=[𝑎̂,𝑏̂]𝑇=(𝐵𝑇𝐵)−1𝐵𝑇𝑌于是求解方程(5-8)得:𝑥̂(1)(𝑘+1)=(𝑥(0)(1)−𝑏̂𝑎̂)𝑒−𝑎̂𝑘+𝑏̂𝑎̂𝑘=0,1,⋯,𝑛−1,⋯(5.9)5.2.3模型求解1.对于𝑥4(钢水中含锰量),先选取前19个数据对第20个数据进行的级比图1:残差𝜆(𝑘),发现不满足级比要求。多次测试后,选择:𝑥(0)=(50,44,46,46,48,45,42,40)此时级比满足要求。由此补全所缺失的值:502.对于𝑥6(作业率),先选取前19个数据对第27个数据进行的级比𝜆(𝑘),发现不满足级比要求。多次测试后,选择:𝑥(0)=(35,33.3,37.9,42.9)图2:残差此时级比、残差满足要求。由此补全所缺失的值:37.777.3.对于y(炉龄),先选取前25各数据对第27个数据进行的级比𝜆(𝑘),发现不满足级比要求。多次测试后,选择𝑥(0)=(832,1076,1376,914)此时级比满足要求。由此补全所缺失的值:1366.5。图3:残差补全后的数据如下:序号x1x2x3x4x5x6y200.215520.240.25016.841.71098280.243617.737.24516.237.771105300.19717.335.94613.857.41366.5表2:应补全的数据六、问题二的模型建立与求解6.1问题的分析问题二要求根据附表数据建立炉龄的预测模型。由表中数据可以看出,我们需要找出多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量。对此我们采用回归分析的方法。回归分析(RegressionAnalysis)是一种统计学上分析数据的方法,回归分析是建立因变量Y(或称依变量,反因变量)与自变量X(或称独变量,解释变量)之间关系的模型。在建立模型前,由于自变量过多,可先对自变量进行主成分分析。然后可

1 / 28
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功