某家庭耐用消费品产品服务数据的分析运用摘要厂方希望知道近期生产中的质量情况,但刚出厂的产品还没有全卖出去,已售出的产品使用几个月后的保修情况可能还没有数据反馈,因此数据显得滞后很多。当一个批次生产的产品的三年保修期都到时,我们对这批产品的质量情况有了最准确的信息,可惜时间是产品出厂的四、五年后,这些信息已无法指导过去的生产,对现在的生产也没有什么作用。为了解决厂方对于用少量数据预测未来较长时间的产品故障情况的要求,我们首先对问题以及数据进行了分析。通过我们的分析,千件产品故障数主要受到使用时间、实际月份与生产批次的影响,并且产品的使用时间为主要影响,实际月份和生产批次会对使用时间的预测值进行修正。我们将已知的部分售出批次在售出后一年的内的每一月的累计的千件产品故障数整理为我们需要的数据与制表形式,再通过一系列数据处理,得到了用于求解我们模型的数据。之后我们利用MATLAB对每一因素进行建模,再将各个因素模型结合,建立了能够预测每一售出批次的产品的任意使用月数的千件产品故障数的模型,并用C语言写出能够通过输入希望预测的生产批次和使用时间就可得到千件产品故障数预测值的程序。最后对我们的模型进行了验证与评估,验证了我们模型的合理性。关键字:千件产品故障数MATLABCurvesFitting回归方程DevC++某家庭耐用消费品产品服务数据的分析运用摘要厂方希望知道近期生产中的质量情况,但刚出厂的产品还没有全卖出去,已售出的产品使用几个月后的保修情况可能还没有数据反馈,因此数据显得滞后很多。当一个批次生产的产品的三年保修期都到时,我们对这批产品的质量情况有了最准确的信息,可惜时间是产品出厂的四、五年后,这些信息已无法指导过去的生产,对现在的生产也没有什么作用。为了解决厂方对于用少量数据预测未来较长时间的产品故障情况的要求,我们首先对问题以及数据进行了分析。通过我们的分析,千件产品故障数主要受到使用时间、实际月份与生产批次的影响,并且产品的使用时间为主要影响,实际月份和生产批次会对使用时间的预测值进行修正。我们将已知的部分售出批次在售出后一年的内的每一月的累计的千件产品故障数整理为我们需要的数据与制表形式,再通过一系列数据处理,得到了用于求解我们模型的数据。之后我们利用MATLAB对每一因素进行建模,再将各个因素模型结合,建立了能够预测每一售出批次的产品的任意使用月数的千件产品故障数的模型,并用C语言写出能够通过输入希望预测的生产批次和使用时间就可得到千件产品故障数预测值的程序。最后对我们的模型进行了验证与评估,验证了我们模型的合理性。关键字:千件产品故障数MATLABCurvesFitting回归方程DevC++一问题描述1.1引言产品质量是企业的生命线,售后服务是产品质量的观测点,如何用好售后服务的数据是现代企业管理的重要问题之一。现以某种家庭耐用消费品生产厂家为例考虑这个问题。假设该厂的保修期是三年,即在其产品售出后三年中对于非人为原因损坏的产品免费维修。在全国各地的维修站通过网络将保修记录送到统一的数据库里面,原始数据主要是这是哪个批次生产的产品(即生产月份)、售出时间、维修时间、损坏原因及程度、维修费用等等。通过这样的数据可以全面了解产品的质量情况,若从不同的需求角度出发科学整理数据库中的数据,可得到不同用途的信息,从而实现不同的管理目的。1.2提出问题整个产品的“千件产品故障数”是一个很重要的指标,常用于描述产品的质量。首先将产品按生产批次划分成若干个不同的集合,再对每个集合中迄今已售出的全部产品进行统计,由于每个集合中的产品是陆续售出的,因此它们的统计时间的起点即售出时间是不同的。相同使用时间长度内的产品的保修总次数乘以1000再除以迄今已售出的产品数量,即为千件产品故障数。厂方希望知道近期生产中的质量情况,但刚出厂的产品还没有全卖出去,已售出的产品使用几个月后的保修情况可能还没有数据反馈,因此数据显得滞后很多。当一个批次生产的产品的三年保修期都到时,我们对这批产品的质量情况有了最准确的信息,可惜时间是产品出厂的四、五年后,这些信息已无法指导过去的生产,对现在的生产也没有什么作用。在这种情况下,我们利用已知的部分售出批次在售出后一年的内的每一月的累计的千件产品故障数,建立能够预测每一售出批次的产品的任意使用月数的千件产品故障数的模型,并且将此模型应用于该厂的产品,为其售后服务以及产品生产监督提供改进建议。二符号说明符号意义F月千件产品故障数预测值T(t)使用时间影响M(m)实际月份影响N(n)生产批次影响TH月千件产品故障数S对应生产批次销售数量SS已统计数据时间内销售数量总和为SSR月实际产品故障数RA加权平均月实际产品故障数KRA当前使用月数下的一般千件产品故障次数THM实际月份下的月千件产品故障数RM实际月份实际产品故障数RMA加权平均实际月份实际产品故障数KRM当前实际月份下的一般千件产品故障数TF累计千件产品故障数预测值t使用天数m实际月份n生产批次三问题分析根据题目所给表格(表1)以及结合生活实际,我们初步认定产品在某月累计故障次数只与T(t)、M(m)、N(n)有关。其中M(m)为当月气候、社会环境(如节假日等)等因素的集合,所有因素共同产生一个固定结果,并且假设该影响每年相同。3.1数据处理在研究特定因素对与产品故障次数影响时,我们暂且忽略掉其他因素的影响,认为各个因素之间是互相独立的,并以一定权重共同影响最终的产品故障次数。为了便于我们对各个因素的研究,我们首先对表1中的数据进行处理,得到每一生产批次在每一使用月数的产品故障次数,并且为了方便在MATLAB中引用数据,我们颠倒了使用月数的顺序,得到表2月千件产品故障数的数据表。3.1.1在研究T(t)的影响时的数据处理在研究T(t)的影响时,我们忽略掉生产批次以及实际月份的影响,将同一使用时间下的所有生产批次的当前使用月数故障次数根据其销售量获得加权平均值,然后根据此值求得当前使用月数下的一般故障次数,利用该数据求得T(t)对产品故障次数的影响。具体处理过程如下:设表2中月千件产品故障数为TH,对应生产批次销售数量为S,已统计数据时间内销售数量总和为SS。月实际产品故障数加权平均月实际产品故障数当前使用月数下的一般千件产品故障次数3.1.2在研究M(m)的影响时的数据处理在研究M(m)的影响时,我们忽略掉产品使用时间以及生产批次的影响。我们先将表2的数据对应整理到每一实际月份下,再计算出每一实际月份实际产品故障数。之后我们将12、13年但同一月份的数据根据该年月下销售数量总和的进行加权平均处理,根据此值求得该月份下的一般千件产品故障数。具体处理过程如下:设对应到每一实际月份下的月千件产品故障数为THM,对应生产批次销售数量为S,所有下标中12表示2012年对应数据,13表示2013年对应数据。实际月份实际产品故障数加权平均实际月份实际产品故障数该当前实际月份下的一般千件产品故障数3.2T(t)对产品故障次数的影响由于要研究的是产品的T(t)对产品故障次数的影响,所以应该在研究这一因素时应该去掉还未售出时的数据,即使用月数为0的数据。之后利用上文所述方法求得每一使用月数下的一般千件产品故障次数KRA。经过数据处理,我们已经得到了除0月外每一使用月数下的一般千件产品故障次数,得到表3。表3除0月外每一使用月数下的一般千件产品故障数使用月数123456KRA0.4891878480.6125030920.5647123470.4594090980.5227141790.372367532使用月数789101112KRA0.3334448150.2524611770.1816982440.1316265970.1054427140.098316785我们认为T(t)对产品故障次数影响可反映至使用月数与当前使用月数下的一般千件产品故障数的关系,即可通过数据模拟出回归方程来初步确定T(t)的影响。3.3M(m)对产品故障次数的影响由于在研究M(m)对产品故障次数的影响时同样与产品未售出时无关,所以仍要去掉使用月数为0时的数据。利用上文所述方法求得每一实际月份下的一般千件产品故障次数KRM。经过数据处理,我们已经得到了每一实际月份下的一般千件产品故障次数,得到表4。表4每一实际月份下的一般千件产品故障次数实际月份123456KRM4.8278784317.4288012087.8997635919.0704688836.4092729395.21041854实际月份789101112KRM3.0576983822.2353646051.371436931.2161396011.2349447641.145021654我们认为M(m)对产品故障次数的影响可反映至实际月份与当前实际月份下的一般千件产品故障数的关系,即可通过数据模拟出回归方程来初步确定M(m)的影响。3.4N(n)对产品故障次数的影响由于生产批次的影响是可影响到产品售出前的故障次数的,所以在分析这一因素时不舍去使用月数为0的故障次数。所以我们直接分析原表格中的每一使用月数下的所有生产批次与产品故障次数的关系,做出每一使用月数的生产批次与产品故障次数的关系图,并且比较所有使用月数的生产批次与产品故障次数的关系图,分析得到N(n)对产品故障次数的影响。四模型建立与求解4.1基本假设在建立模型之前,我们首先有几个基本假设:①产品故障次数仅受产品使用月数、实际月份和生产批次影响。②影响产品故障次数的各个因素不互相干扰且独立作用。③在研究实际月份这一影响时认为产品故障只与此月有关,并且每年同一月影响相同。4.2模型的建立与求解设F表示模型中的月千件产品故障数预测值,结合我们的基本假设,我们可以构建出基本模型在我们的基本模型中,T(t)的影响为主要影响,M(m)与N(n)的影响为使T(t)的影响上下波动,即通过求得数据的拟合方程,再在数据范围内求出均值,每一个数据和均值作差再求与均值的比例即为该影响因素的对数据的影响。而我们若想获得如表1中的累计千件产品故障数预测值,则将使用月数为0至所需求得的月数的所有月千件产品故障数进行加和即可。4.2.1T(t)模型的建立与求解通过对数据的观察,我们发现月千件产品故障数随着使用月数的增加会递减,并趋近于0。通过对常识的分析,累计故障数最终会稳定在一个由各因素影响下的值。将每一使用月数下的一般千件产品故障数与使用月数代入MATLAB,得到一般千件产品故障数与使用月数的图像(图1)。图1根据我们的假设,T(t)只受使用时间t的影响,从图像形状来看,我们可以大致认为T(t)的函数为T(t)=a*exp(b(t))的形式。利用MATLAB中的CurvesFitting插件,我们可以求得回归方程根据CurvesFitting中对于拟合程度的评估(图2),R-square=0.9615,可以认为这条曲线拟合程度较好,可以接受。图24.2.2M(m)模型的建立与求解根据我们基本模型部分所述,M(m)的影响为修正T(t)的影响,所以我们M(m)的模型目的是利用已处理好的数据得到与真实数据最为拟合的曲线,再对这段曲线在[1,12]上积分再除以12得到均值,每一月的值与均值的差与均值的比例即是我们所想要的修正值。首先我们将每一实际月份的一般千件产品故障次数代入到MATLAB中,得到了每一实际月份下的一般千件产品故障次数与实际月份的图像(图3)。图3由于不作为在[1,12]外进行预测,所以我们只需要得到拟合程度最好的一个图像,并利用这个图像求得均值即可。利用MATLAB中的CurvesFitting,我们可求到回归方程根据CurvesFitting中对于拟合度的评估(图4),R-square=0.9857,可以认为这条曲线拟合程度是很好的。图4利用MATLAB的定积分求解,我们求得该曲线在[1,12]上的定积分为:ans=(2559*cos(799/1000))/3995-(2559*cos(2397/250))/3995+(418*cos(799/2000))/47-(418*cos