研究生课程考核试卷科目:数理统计教师:姓名:学号:专业:类别:学术上课时间:2013年3月至2013年5月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)重庆大学研究生-1-巷道断面面积与平均维护费单价之间关系的线性回归分析摘要:矿井生产全部事件几乎都是概率型的,生产经验在实际生产中尤为重要。巷道维护费主要是支护材料费及维修工人工资费。其主要受井巷类别、巷道断面尺寸、开采深度等影响。本文仅以巷道断面尺寸为例,利用已知统计数据,进行统计分析,讨论巷道维护费与断面尺寸的关系,建立回归方程式,形成经验公式,作为设计时能利用的可靠指标。并以此案例综合已学课程《应用数理统计》相关知识,培养独立思考,提出假设,建立模型,运用统计分析方法和统计软件求解,对结果加以说明和解释的能力。一、问题提出,问题分析矿井在建设投入生产前,都要经过复杂繁琐的地质勘察、资料搜集和分析整理,从而为矿井初步设计提供必须的信息和准备。在初步设计中,一般提出至少三种可供选择的开拓方案,然后进行技术、经济比较选出较为合理的方案。在经济比较过程中,有一项经济费用指标即为维护费用,而实际的费用只有在矿井实际投产后维护过程中才可以获知。一般在设计过程中,参考以往的经验,根据巷道设计的断面尺寸提出合理的费用值进行计算。如何根据已知设计条件,结合生产经验中类似的条件,提出贴近实际的巷道维护费用,从而更为合理的筛选设计方案,尤为重要。(1)问题提出:根据以往的生产条件(即生产经验数据:以往矿井的巷道断面尺寸和对应的平均维护费单价(见表1)),建立合适的数学模型,现有某矿井设计生产条件(设计数据:如断面尺寸S),预测其巷道平均维护费单价,从而为方案比较提供可靠依据。(2)问题分析:在忽略其他条件的影响下,巷道断面面积与平均维护费单价之间可能存在某一种映射或函数关系,作出散点图,建立可能的数学模型i(;)YFX,通过已知数据(|)iiiiYyXx,解除未知参数i,即确定函数形式。代入给定变量(断面-2-面积S),求解因变量(维护费单价)的值。表达如下:(|)(;)(;)|iiiiYyXxxSiYFXyfxYyXx。二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据)1、已知生产经验数据:表1巷道维护费用统计表序号煤质硬度巷道断面面积(m2)平均维护费单价(元/m·a)1硬10.4362中7.8253中7.8324中7.8275硬12.4446软7.8297硬14.2538软12.4589中7.81810软5.213.811中6.613.812硬6.618.313中14.24914中10.434.4——表中数据摘自采矿工程专业教材:《矿山开采设计·第二篇》P145-146,表9-4;2、某矿井设计断面尺寸213.8mS。三、模型建立(1)提出假设条件,明确概念,引进参数假设条件:○1忽略井巷类型、巷道埋藏深度的影响,只考虑巷道断面尺寸与维护费单价的近似关系;○2煤的硬度对维护单价的影响看不出规律,且煤的硬度较小,影响作用远不及围岩的影响,因此不予考虑。参数设置:平均维护费单价——因变量Y,观测值y;巷道断面面积———自变量X,观测值x。(2)模型构建-3-首先根据数据点作散点图(见图1),观察变量X,Y之间呈何种函数关系,567891011121314151015202530354045505560巷道断面面积X(m2)平均维护费单价Y(元/m·a)X与Y的关系图图1关于变量X、Y的散点图根据图1,从点的分布规律看,XY基本呈线性关系,可按一元线性回归方程处理。可设:01ˆ()yfxx,则,012,~(0,).YxN(3)模型求解将观测值(,)(1,2,,)iixyin,代入模型中,01iiiyx由Gauss使用的最小二乘法,01201,1min()niiiyx进行求解,得:-4-112101()()ˆ,()ˆˆ.niiiniixxyyxxyx四、计算方法设计和计算机实现最小二乘法的计算,可以借助许多软件得以实现,本文利用matlab数学软件编写M-脚本文件进行计算:1、读取数据,绘制X、Y散点图:x=[10.47.87.87.812.47.814.212.47.85.26.66.614.210.4];y=[36253227442953581813.813.818.34934.4];scatter(x,y,50);2、计算相关统计量并输出直线图像:x_bar=mean(x);y_bar=mean(y);lxy=sum((x-x_bar).*y);lxx=sum((x-x_bar).*x);lyy=sum((y-y_bar).*y);beta1=lxy/lxxbeta0=y_bar-beta1*x_bar……x1=5:1:15;y1=beta0+beta1.*x1;h=plot(x1,y1,'r');……y_cal=beta0+beta1.*x;STsquare=sum((y-y_bar).^2)SRsquare=sum((y_cal-y_bar).^2)SEsquare=sum((y-y_cal).^2)五、主要的结论或发现在matlab窗口中,运行上述程序,得如下运行结果:beta1=4.5902beta0=-10.8466Equation=y=-10.85+4.59*xST_square=2.7002e+003SR_square=2.3640e+003SE_square=336.1672即,1ˆ=4.59;0ˆ=-10.85;解出一元线性回归方程:ˆ10.854.59yx。5总离差平方和:22()2700.2TiSyy;回归平方和:22ˆ()2364RiSyy;残差平方和:22ˆ()336.2EiiSyy。巷道断面面积与维护费单价存在这种简单的线性关系,由经验而成,若能较为准确的预测实际情况,则可方便用于实际设计生产中,用来初期评估方案的可行性。六、结果分析与检验1、检验:显然对任一组数据,都能给出二者间简单的线性回归方程,但变量间是否真的存在线性关系,回归曲线的偏离程度大小,能否表征实际生产情况,就需要对其进行检验。否则,回归直线就失去了实际意义。常用通过以下3种方法检验:1||越大,表征Y随X的变化的趋势越明显。于是问题的统计假设为:0111:0,:0HH1)F检验法拒绝域形式为:21ˆ{}c,即,210ˆ(|)PcH成立≤在0H成立下有22(1,2)/(2)RESFFnSn~有21ˆ(1,2)xxFncl程序运行得:H0:beta1=0;H1:beta1~=0ans=F检验:beta1^2=21.07c1=1.19,拒绝H0c=1.19,1ˆ落在拒绝域内,接受1H。62)t检验法11ˆ()(2)(2)xxEnlTtnS~拒绝域为1ˆ{||}c。程序运行得:t检验:|beta1|=4.59c2=1.09,拒绝H01ˆ落在拒绝域内,接受1H。3)r检验法采用样本相关系数:12211()()()()niiinniiiiYYXXrYYXX统计假设为:01::HYXHYX与线性无关,与线性相关拒绝域:0{||(2)}aKrrn运行程序得:H0:Y与X线性无关;H1:Y与X线性相关ans=r检验:|r|=0.94r_0.05=0.532,拒绝H0故相关性显著。2、预测:通过检验可以得知,平均维护费单价与巷道断面面积之间的线性关系显著,回归方程是成立的。可以作为经验公式应用,则,200010ˆˆˆ13.8m;10.854.5913.852.5/amxyx元对当巷道断面面积,其对应的平均维护费单价Y=52.5元/(m·a)。70y的置信度1的预测区间:010010ˆˆ((),())yxyx;其中,101012ˆ()()(2)xsxtn,2010()1()xxxxsxnl,22ˆ2ESn;取0.05a,计算得:(46.8,58.2);即有95%的把握巷道断面面积213.8mS,平均维护费单价在46.8元到58.2元之间。参考资料[1].杨虎、刘琼荪、钟波•数理统计[M]北京:高等教育出版社,2004。[2].矿山开采设计·上册[M][3].附录1、回归方程直线图:567891011121314151015202530354045505560巷道断面面积X(m2)平均维护费单价Y(元/m·a)X与Y的关系图y=0+1x图2X与Y线性回归方程直线图82、matlab中M-脚本文件计算程序:clear;clc;x=[10.47.87.87.812.47.814.212.47.85.26.66.614.210.4];y=[36253227442953581813.813.818.34934.4];%统计使用数据scatter(x,y,50);%作散点图,观察数据特点xlabel('巷道断面面积X(m^2)')ylabel('平均维护费单价Y(元/m·a)')title('X与Y的关系图')holdonformatshort;%设置数据运算格式x_bar=mean(x);y_bar=mean(y);%求样本数据平均数lxy=sum((x-x_bar).*y);lxx=sum((x-x_bar).*x);lyy=sum((y-y_bar).*y);beta1=lxy/lxx%回归方程系数beta0=y_bar-beta1*x_bar%回归方程常数项Equation=sprintf('y=%.2f+%.2f*x',beta0,beta1)%回归方程表达式x1=5:1:15;y1=beta0+beta1.*x1;h=plot(x1,y1,'r-');%作回归方程的直线图set(h,'Color','red','LineWidth',2)text(9,beta0+beta1*9,'\fontsize{16}\leftarrowy=\fontname{\bf}\beta_0+\beta_1x')%标注holdoffy_cal=beta0+beta1.*x;ST_square=sum((y-y_bar).^2)%总离差平方和SR_square=sum((y_cal-y_bar).^2)%回归平方和SE_square=sum((y-y_cal).^2)%残差平方和sigma2=SE_square/(size(x,2)-2);c1=sigma2*4.75/lxx;%F检验,分位数F_(1-alpha)(n-2)=4.75ifbeta1^2c1%F检验法的拒绝域disp('H0:beta1=0;H1:beta1~=0')sprintf('F检验:\nbeta1^2=%.2fc1=%.2f,拒绝H0',beta1^2,c1)end;c2=sqrt(sigma2/lxx)*2.179;%t检验,分位数t_(1-1/2*alpha)(n-2)=2.179ifabs(beta1)c2%t检验法的拒绝域%disp('H0:beta1=0;H1:beta1~=0')sprintf('t检验:\n|beta1|=%.2fc2=%.2f,拒绝H0',abs(beta1),c2)end;r=lxy/sqrt(lyy*lxx);%R=corrcoef(x,y)ifabs(beta1)0.532%r检验:r_alpha(n-2)=0.523disp('H0:Y与X线性无关;H1:Y与X线性相关')sprintf('r检验:\n|r|=%.2fr_0.05=0.532,拒绝H0',abs(r))end;