高级统计学-统计学课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

高级统计学哈尔滨工业大学管理学院葛虹高级统计学研究的对象多指标或多变量数据企业管理:产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率居民家庭消费:家庭收入、家庭人口、阶层、中高档消费品支出等等必备知识概率论与数理统计统计学——点估计——区间估计——假设检验研究内容简化数据结构箱式数据平面数据变换主成分分析PrincipleAnalysis因子分析FactorAnalysis按观测点分类或按变量分组分类比较是一切科学比较的基础和开端对观测点分类:银行发放贷款对各企业财务指标、信用状况进行分析对变量分组:股票市场是宏观经济的晴雨表经济指标与股票市场各种指标间的群组关系聚类分析判别分析ClusterAnalysisDiscriminantAnalysis回归分析RegressionAnalysis结构方程StructuralEquationModel变量间的依存关系+关系的强弱分析寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制内容提要回归分析1定性数据的建模2聚类分析3判别分析4主成分分析5因子分析6结构方程7教学内容结构回归分析OneTwoThree定性数据建模聚类分析判别分析主成分分析因子分析高级统计学结构方程预测回归分析定性数据建模分类聚类分析判别分析判别主成分分析因子分析结构方程关联性分析综合评价统计学方法的应用以及内容之间的逻辑关系应用范围教学内容参考书多元统计分析(何晓群编著)中国人民大学出版社应用统计(陆璇编著)清华大学出版社预备知识ONETWO随机向量及其分布随机向量的数字特征THREEFOUR随机向量的样本及其数字特征多元正态分布随机向量及其分布P维随机向量:联合分布函数:联合密度函数:),,,(21pXXX),,,(),,,(221121pppxXxXxXPxxxF12212121212121),,,(),,,()3(1),,,()2(0),,,()1(xxxpppppppdxdxdxxxxfxxxFdxdxdxxxxfxxxf随机向量的数字特征随机向量的数学期望随机向量的方差阵))(,),(),(()(21pXEXEXEE),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov())(()(212221212111ppppppXXXXXXXXXXXXXXXXXXEEED随机向量的相关系数阵11121212121,,,,,,XXXXXXXXXXXXppppR)()(),cov(,jijiXXXDXDXXji随机向量的样本及其数字特征P维随机向量的一个容量为n的样本:),,,(21pXXXpnnnppxxxxxxxxx212221212111,,,的样本1X的样本的样本2XpX样本均值pnnnppxxxxxxxxx212221212111,,,nipiniiniipxnxnxnXXX1121121111样本离差阵与样本方差阵nippiniippiniippinippiiniiniiinippiiniiiniiXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxS12122111122122211122111122111211)())(())(())(()())(())(())(()(SnV1样本离差阵样本方差阵样本相关系数阵1)()())(()()())(()()())((1)()())(()()())(()()())((122222221121122222221122211222211112222112211XxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxRippiippiippiippippiippiiiiiippiippiiiiii与的样本相关系数1XpX相关系数阵计算的SPSS实现多元正态分布定义1q维标准正态分布设独立同分布于,则称随机向量服从q维正态分布,记Y~密度函数:qYYY,,,21)1,0(N),,,(21qYYYY),(qqN)21exp()2(1)](21exp[)2(1),,,(222221221yyyyyyyyfqqqqY定义2p维一般正态分布设,B为实数矩阵,为维实数向量,则是维正态随机向量,记为:其中为非负定阵。),(qqNYqpp11qqppYBXp),(ppNXBBX定理1若服从,则(1),(2)密度函数:定理2与分别是和的无偏估计,即),(pNEXDX)()(21exp)2(1),;(1212xxxfpXSn11)(XE)11(SnE回归分析一元回归模型的建立1回归模型的诊断以及SPSS实现2回归模型的矩阵表示3多元回归模型的建立4多元回归模型的诊断以及SPSS实现5为什么要建立线性模型一般函数线性化…特殊函数线性化…简单易分析…相关性=线性性…线性模型一元回归的SPSS实现观察散点图GraphsScatter点击1点击2点击1点击2点击3点击4点击执行回归过程AnalyzeRegressionLinear点击1点击2点击3点击4点击5点击1点击2点击3点击1点击5点击2点击3点击4点击6点击点击2可选点击1ModelSummaryc,d.999b.998.9987.76600Model1RRSquareaAdjustedRSquareStd.ErroroftheEstimateForregressionthroughtheorigin(theno-interceptmodel),RSquaremeasurestheproportionofthevariabilityinthedependentvariableabouttheoriginexplainedbyregression.ThisCANNOTbecomparedtoRSquareformodelswhichincludeanintercept.a.Predictors:Heightofwifeb.DependentVariable:Heightofhusc.LinearRegressionthroughtheOrigind.ANOVAc,d991602.41991602.36716441.553.000a1869.6333160.311993472.0b32RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:Heightofwifea.Thistotalsumofsquaresisnotcorrectedfortheconstantbecausetheconstantiszeroforregressionthroughtheorigin.b.DependentVariable:Heightofhusc.LinearRegressionthroughtheOrigind.Coefficientsa,b1.061.008.999128.225.000HeightofwifeModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:Heightofhusa.LinearRegressionthroughtheOriginb.一元回归模型的建立观察由n个样本构成的散点图或计算样本相关系数,若呈现明显的相关性,建立数学模型~其中是未知参数,需要利用样本对它们进行估计.),(,),,(),,(2211nnyxyxyxxy10),0(2N210,,散点图(1)xyxy10ixiyi参数的最小二乘估计(1)模型1最小二乘解:10,),0(...,,,22110Ndiixyniiiniiniiixxyyxxxy021110)())((ˆˆˆ矩阵偏导数与样本矩阵表达nyyyY21nxxxX1112121n21AxxAxx2uxxu模型2最小二乘解:(1)为y关于x的回归方程(2)称为方程的回归系数()(3)称为残差,为残差向量(4)称为残差平方和),(),(22nnnnXNYNXYYXXX1)(ˆxy10ˆˆˆ)ˆ,ˆ(ˆ10iiiyyˆˆ)ˆ()ˆ(ˆˆYYYYSEYYˆˆˆˆXY参数的最小二乘估计(2)10,散点图(2)xyxy10ˆˆˆixiyiyˆiiiiixyyy10ˆˆˆˆ与的性质性质1~‾~~ˆESˆ))(,(122XXN0ˆ))(,(2220xxxNii))(1,(221xxNi1ˆ00c11c‾性质2~‾,且即的无偏估计是性质3与相互独立2ES22n2))2((nSEE2)2(ˆ2nSEESˆ性质4若,则~于是的置信区间是:iSiiˆˆ2ntiicSiˆˆi)%1())2(ˆ,)2(ˆ(ˆ2ˆ2iiStStnini的样本标准差iˆ一元回归模型的显著性决定系数法RSquare+Adjusted-RSquare回归方程的显著性检验方差分析=F-检验决定系数法总平方和分解决定系数222)ˆ()ˆ()(iiiiyyyyyyERTSSSTETRSSSSR12TESSnnRAdj2112总平方和回归平方和残差平方和df=n-1df=n-2df=1方差分析法(回归方程的显著性检验)零假设检验统计量0:10H含义?)2(nSSFER)2,1(nF~拒绝域(临界值法):)2,1(nF))2,1((nFFP)2,1(nFF→回归方程显著P值法:()(2)RESPFpSnRESS(n-2)P0.05→回归方程显著方差分析表(ANOVA)AnalysisofVarianceModeldfSSMSFresidualTotalregression12n1nRSESTSRS)2(nSE)2(nSSER回归系数的显著性检验(1)零假设检验统计量0:00H含义?0ˆ0ˆST2nt~拒绝域(临界值法))2(2nt)2(2nt)2(2ntT2))2((2ntTP2))2((2ntTP→常数项显著P值法0ˆ0ˆ()PTSp00ˆˆS00ˆˆSP

1 / 108
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功