统计考试复习大纲考试知识要点均值的比较检验方差分析与正交实验设计相关分析与回归分析聚类分析判别分析主成分分析与因子分析*五道大题,每题20分,共100分(其中包含简答题)注:P>α不能拒绝原假设;P<α拒绝原假设。一、均值的比较与检验1、课本P29思考与练习5(此题属于配对样本均值检验)Ho:μ1=μ2H1:μ1≠μ2【图表】PairedSamplesMean(均值)N(变量个数)Std.Deviation(标准差)Std.ErrorMean(估计标准误差)Pair1看前5.375081.59799.56497看后6.000081.85164.65465PairedSamplesTestPairedDifferencestdfSig.(2-tailed)【*结论看此处:P】MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1看前–看后-.62501.30247.46049-1.7139.4639-1.3577.217结论:在显著性水平α=0.05的情况下,P=0.217>α,所以,不能拒绝原假设Ho,广告对消费者无显著性影响。2、简答题:(1)配对样本均值检验的含义。答:【P29】红线划出的句子。(2)简述假设检验的主要步骤。答:1、提出假设。2、确定检验统计量。3、确定显著性水平α。4、计算检验统计量。5、作出推断。【P17】(3)简述显著性水平的含义。答:【P18】红线划出的句子。二、方差分析1、课本56页思考与练习6(此题属于多因子交互方差分析)(注:表格参考依据:P48,表3.14)【图表】Source(来源)TypeIIISumofSquares(平方和S)Df(自由度)MeanSquare(方差)FSig.(*显著性)【*结论看此处:P】CorrectedModel468.839(a)593.76822.875.000Intercept28078.561128078.5616849.822.000X1(因子X1)288.300【SA】(1)【r-1】(288.3)【Va=Sa/dfa】(288.3/4.099=70.331).000X2(因子X2)180.515【SB】2【S-1】90.257【Vb=Sb/dfb】22.018【Vb/Ve=Fb】.000X1*X2.024【S(AXB)】2【(r-1)(s-1)】0.024/2=0.012(0.012/4.099=0.003).997Error(误差e)98.380【Se】24【rs(m-1)】98.380/24=4.099Total(总和)28645.780【St】29【n-1】CorrectedTotal567.21929(r=2【因子时段下有两个水平】s=3【因子路段有三个水平】m=5【每一个路段下面有5个数据】N=30【30个行车时间】)结论:在显著性水平α=0.05的情况下,P(X1X2)=0.997>α,所以,不能拒绝原假设Ho,时段与路段交互作用无显著性影响。Px1=Px2=0<α,则拒绝原假设,及路段和时段有显著性影响。(注:单因子方差分析见P37表3.3;无交互作用的方差分析见P43表3.9)2、简答题:(1)方差分析的定义。【P55】(2)方差分析的核心。【P55】(3)方差分析的原理等。【P32】红线划出的句子。三、回归分析SPSS操作→Enter(变量强行进入)表中R越接近1,表明Se越小,回归方程拟合的更好。P109(6-58)1、例子:一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2002年的有关业务数据。试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义AVOVA(表格)【参考P99表6.3】VariablesEntered/Removed(b)ModelVariablesEnteredVariablesRemovedMethod1固定资产,累计应收,贷款项目,贷款余额(a).EnteraAllrequestedvariablesentered.bDependentVariable:不良贷款ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.893(a).798.7571.7788aPredictors:(Constant),固定资产,累计应收,贷款项目,贷款余额ANOVA(b)ModelSumofSquaresdfMeanSquareFSig.1Regression(回归)(Sr=St-Se=63.279)fr=ft-fr=4(Vr=Sr/Fr=4/63.279)(Vr/Ve).000(a)Residual(残差)63.279(Se)203.164=VeTotal312.650(St)24aPredictors:(Constant),固定资产,累计应收,贷款项目,贷款余额bDependentVariable:不良贷款结论:p=0.00<0.05,所以回归方程是显著的。Coefficientsa-1.022.782-1.306.206.040.010.8913.837.001.148.079.2601.879.075.015.083.034.175.863-.029.015-.325-1.937.067(Constant)贷款余额累计应收贷款项目固定资产Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:不良贷款a.注:回归系数表【参考P113表6.15】结论:P=0.01<0.05说明显著,货款余额对不良贷款有显著性影响。【写回归方程看上表格B这列】Y=-1.022+0.4X1+0.148X2+0.15X3-0.29X42、逐步回归方程分析VariablesEntered/Remove(逐步回归方程(stepwise),看最后一行,最后一个模型)ModelVariablesEnteredVariablesRemovedMethod1贷款余额.Stepwise(Criteria:Probability-of-F-to-enter=.050,Probability-of-F-to-remove=.100).2固定资产.Stepwise(Criteria:Probability-of-F-to-enter=.050,Probability-of-F-to-remove=.100).注:(逐步回归方程(stepwise),只看最后一行,那是最后一个模型)【有红色方框的那行】结论:在0.05显著性水平下,最终回归方程的表达式:y=-0.443+0.50X1-0.32X23、课本P139,第六大题(逐步回归分析)看Codfficients表格的“B”列的最后一行。Y=874+X1+X2……4、简答题(1)什么是回归分析?【P93】红线划出的句子。(2)在回归分析中,总的偏差平方和可以分为几部分?其含义分别是什么?答:【P109(6-56)】可分为回归平方和和残差平方和。含义:红线划出的句子。(3)偏差平方和分解在方差分析和回归分析中的应用有何不同?答:(P109)回归St=Sr+Se(SR和SE分别解释:红线划出的句子)偏差St=Sa+Se(SA和SE分别解释【P35】:红线划出的句子)(4)简述逐步回归的基本原理。答:【P115】红线划出的句子四、聚类分析1、例子(P1617.23):根据我国31个省市自治区2006年的6项主要经济指标数据,采用层次聚类法进行分类,并对结果进行分析。【分类是指出每类有什么特性结合原来的说一下】指出这里聚类所采用的样品间的距离及所采取的系统聚类的方法,并说明该系统聚类方法所采用的类间距离的含义或给出公式?。【依据:P143、144】CaseProcessingSummary(a,b)CasesValidMissingTotalNPercentNPercentNPercent31100.00.031100.0aSquaredEuclideanDistance(欧氏距离,样本间距离P143)bWardLinkage(离差平方和法P144)层次聚类的树状图2、简答题(1)系统聚类的思想、步骤【P142】(2)动态聚类的含义、思想【P142】(3)系统聚类与动态聚类的异同【P155】五、判别分析1、例子:P186思考与练习4CanonicalDiscriminantFunctionCoefficients(费希尔判别函数系数)【参见P184表格8.2】Function12销售价格-1.1641.076口味评分1.019.185信任度评1.356-.393(Constant)-10.613-1.772Unstandardizedcoefficients结论:费希尔判别函数系数公式(FISH判别函数):Y1=-10.613-1.164X1+1.019X2+1.356X3;Y2=-1.772+1.076X1+0.185X2-0.393X3ClassificationFunctionCoefficients(贝叶斯判别函数系数)【参见P184表格8.3】销售情况畅销平销滞销销售价格-11.689-10.707-2.194口味评分12.29713.3614.960信任度评16.76117.0866.447(Constant)-81.843-94.536-17.449Fisher'slineardiscriminantfunctions结论:贝叶斯判别函数系数公式(BAYES判别函数):畅销:Y1=-81.843-11.689X1+12.297X2+16.761X3;平销:Y2=-94.536-10.707X1+13.361X2+17.086X3滞销:Y3=-17.449-2.194X1+4.960X2+6.447X3列出公示后,分别把题目里的X1=23,X2=8,X3=5代入,并挑出MX{y1,y2,y3}ClassificationResultsb,c(误差判别结果)销售情况PredictedGroupMembershipTotal畅销平销滞销OriginalCount畅销3104平销1203滞销0033%畅销75.0(=3/4)25.0.0100.0平销33.366.7(=2/3).0100.0滞销.0.0100.0100.0Cross-validated(a)Count畅销2114平销1203滞销0033%畅销50.025.025.0100.0平销33.366.7.0100.0滞销.0.0100.0100.0看(Original—Count)栏误判概率畅销栏:3个是畅销,一个不是。所以畅销误判概率——1/4=25%平销栏:3个中,2个是平销,一个不是。所以畅销误判概率(回判)——1/3=33.3%总判别(回判)——20%(=2/10)(10看表里的TOTAL总数4+3+3=10)(畅销里误判了一个平销,平销里误判了一个畅销,加起来等于两个【看(Original—Count)栏】2、简单题:(1)判别分析的基本思想【P171】(2)判别分析与聚类分析的联系与区别【P171】六、主成分分析与因子分析1、例子:根据我国31个省市自治区2006年的6项主要经济指标进行因子分析。(P161)变量共同度(参考P221表格10.4)注:变量共同度反应了原始公因子与原始变量方差的比例,公因子方差越大,越接近1,说明提取的公因子对每一个原始变量解释的比例都比较高,则因子分析的效果越好。【看表格里的(Extraction)】(1)本例中,提取了几个公因子?答:2个(2)请写出前两个特征值及其对应公因子的贡献率。并说明方差贡献率的含义:TOTAL:特征值=方差贡献%ofVariance:方