第1页/共9页一、实验项目:用matlab软件实现一般的回归分析二、实验目的和要求a.掌握回归模型的基本假设,明确回归分析的基本任务;b.学会回归分析的基本统计思想和原理;c.学会使用matlab软件解决统计分析问题;d.通过范例学习,熟练统计分析方法和建模的基本要素。三、实验内容操练一确定企业年设备能力与年劳动生产率的关系某市电子工业公司有14个所属企业,各企业的年设备能力与年劳动生产率统计数据如下表。试分析企业年设备能力与年劳动生产率的关系。若该公司计划新建一个设备能力为9.2千瓦/人的企业,估计劳动生产率将为多少?操练二测定某矿脉的金属含量一矿脉有13个相邻样本点,人为地设定一个原点,现测得各样本点与原点的距离x,与该样本点处某种金属含量y的一组数据如下:试建立合适的回归模型。(首先画散点图)三、实验结果及分析操练一1.代码:第2页/共9页functionf81x=[2.82.83.02.93.43.94.04.84.95.25.45.56.27.0];y=[6.76.97.27.38.48.89.19.810.610.711.111.812.112.4];plot(x,y,'+'),pausex1=[ones(size(x')),x'],pause[b,bcint,r,rint,stats]=regress(y',x1,0.05),pausercoplot(r,rint)functionf82x0=9.2y0=3.1003+1.4481*x02.图形、运算结果及分析2.533.544.555.566.57678910111213由数据的散点图可以看出,函数关系呈线性函数关系,因此用线性回归分析,运算结果如下:x1=1.00002.80001.00002.80001.00003.00001.00002.90001.00003.40001.00003.90001.00004.00001.00004.8000第3页/共9页1.00004.90001.00005.20001.00005.40001.00005.50001.00006.20001.00007.0000b=3.10031.4481bcint=2.25933.94141.26551.6308r=-0.4551-0.2551-0.24480.00010.37600.05190.2071-0.25140.40380.06930.17970.73490.0212-0.8374rint=-1.24690.3366-1.08470.5744-1.08880.5993-0.85300.8531-0.46821.2202-0.84270.9465-0.67971.0939-1.13370.6309-0.45191.2594-0.81760.9562-0.69311.05250.00331.4664-0.81240.8547-1.3523-0.3224stats=0.9613298.36310.00000.1687得到线性关系的系数为b=3.10031.4481则函数表达式为y=3.1003+1.4481*x第4页/共9页2468101214-1-0.500.511.5ResidualCaseOrderPlotResidualsCaseNumber上图为残差分析图,两条红线所在点表示异常点。将x0=9.2代入函数表达式y0=3.1003+1.4481*x0得到x0=9.2000y0=16.4228即当该公司计划新建一个设备能力为9.2千瓦/人的企业时,估计劳动生产率将为16.4228。操练一1.方法一:下用线性回归分析方法建立回归模型a.代码:functionf83x=[23457810111415151819];y=[106.42109.2109.58109.5110109.93110.49110.59110.6110.9110.76111111.2];plot(x,y,'+'),pausex1=[ones(size(x')),x'],pause[b,bcint,r,rint,stats]=regress(y',x1,0.05),pausercoplot(r,rint)b.图形、运算结果及分析第5页/共9页2468101214161820106107108109110111112由数据的散点图可以看出,函数关系呈线性函数关系,因此用线性回归分析,运算结果如下:x1=121314151718110111114115115118119b=108.25810.1742bcint=107.2794109.23670.08910.2593r=-2.18640.4194第6页/共9页0.62530.37110.52280.27860.49030.4162-0.09630.0295-0.1105-0.3930-0.3671rint=-2.5001-1.8727-1.14571.9846-0.94012.1906-1.26042.0026-1.12832.1739-1.41311.9704-1.18822.1688-1.27002.1023-1.77171.5790-1.62591.6849-1.76421.5433-1.92891.1429-1.86191.1276stats=0.648420.28660.00090.5965得到线性关系的系数为b=108.25810.1742则函数表达式为y=108.2581+0.1742*x第7页/共9页24681012-2.5-2-1.5-1-0.500.511.52ResidualCaseOrderPlotResidualsCaseNumber上图为残差分析图,两条红线所在点表示异常点。2.方法二:由方法一中的散点图观察可知,可以选择多项式拟合的回归分析方法,下用3次多项式进行回归分析,建立回归模型a.代码:functionf84x=[23457810111415151819];y=[106.42109.2109.58109.5110109.93110.49110.59110.6110.9110.76111111.2];[p,S]=polyfit(x,y,3);p[y1,delta]=polyconf(p,x,S);y1plot(x,y,'+',x,y1)b.图形、运算结果及分析第8页/共9页2468101214161820106107108109110111112p=0.0030-0.11121.3653105.0874y1=Columns1through6107.3972108.2634108.9609109.5075110.2199110.4213Columns7through12110.6042110.6214110.5904110.6121110.6121111.0237Column13111.3359得到函数关系式为:32087.1053653.11112.00030.0xxxy3.方法三:下用polytool工具箱对数据进行多项式拟合,建立回归模型,可以更方便的控制函数的次数,得到更精确的多项式函数,缺点是不能得出确切的函数关系式,但可以和方法二中的polyconf函数同时使用,求得所拟合函数的函数表达式。a.代码:functionf85x=[23457810111415151819];y=[106.42109.2109.58109.5110109.93110.49110.59110.6110.9110.76111111.2];polytool(x,y,7)b.图形、运算结果及分析第9页/共9页24681012141618102104106108110112114由图可以清晰地看到图形的置信区间。