扁平尖峰分布;,3s*n组数*X-分组峰态系数正值,右偏分布越大偏斜越大,,该组的中值;s*n组数*X-SK分组s*2-n1-nX-nSK未分组偏态系数04.%99/%95/%68个标准差3/2/1经验法则:.03,越大,离散系数越大Xs小)离散系数(衡量差异大-离散程度标准差/数值型数据:方差顺序数据:四分位差总频数(众数频数)f-1V分类数据:异众比率离散程度02.x几何平均X加权平均数.01443333smrniiiiiiiMKSKMMXVGWXWPS:0.3Px=0.30.31919xPn双侧:H0A无显著差异,同/2比较左单侧:希望数值越大越好H0A右单侧:希望数值越小越好H0A;同比较P值检验方法,求出Z,若x>μ,计算P(ZZ值)值双侧:P/2拒绝原假设单侧P拒绝原假设运用置信区上下限比较nZ2(边际误差)(单侧为)n总体标准差抽样标准误差若0-x,则拒绝H若未知,用s代替,使用t分布遇小数点向前进一)()1(定估计比例时样本量的确.22(边际误差):定一个估计时样本量的确.211-n自由度s)1n(s)1n(总体方差.13)1(总量)的区间估计(样本样本比率.12)1(方差未知,小样本,总体正态)2(置信区间为。。即,该样本平均或:未知/大样本且方差已知)1(计一个总体均值的区间估.1122222222222/12222/2222EPPZnnZEEZnnPPZPPnSntXnSZX,则不拒绝1-n1-n1总体方差的检验:.33)1(:总体比例检验统计量321自由度,/:未知小样本,,/已知小样本,,/或:大样本一个参数的假设检验.3122/222/1222SnnPZnnSXtnXZnSXZ212/212/12/1222122212/2221222111221d2d222222121212222121222121221212122212121221212121222211221221221212221212212121n,n1n,ns/s/s/s两个总体方差比.13)1()1(:两个总体比例之差.12ns)1(d小样本2nsd大样本1的总平均数为每一组对应样本之差d本)的估计,两个总体之差(匹配样).5(1s1sssvss)v(,未知,正态,,小样本)4(ss)2(,未知,正态,,小样本)3(2s1s1s11s)2(,未知正态,,小样本)2(ss可以互换/未知/已知,),30,(大样本)1(:独立样本)的区间估计(两个总体均值之差.11FFFFnppnppZppntZnnnnnnnntXXnnnnnntXXnnnnnnnnnntXXnnZXXSnnpp21212/212/1222121221122211121021212121222121212121212122121212221212121222112221222212221则可判定,n,nn,n若总体方差的相似性:.33)1()1(d)0(多设为d、样本比例11)1(、:两个总体比率之差32)比较1n(t同,nsˆ匹配样本:计算)4(值自由度同左,ssX小样本,)3()2(自由度,11X小样本,)2(,XZ大样本)1(两个参数的假设检验.31边际误差)1()1(p5.0;21定估计比例时样本量的确.22nn:量的确定两个估计均值差时样本21FFFSSFnnpnpnpnppnppppZBnnppppZAVnnXtnnnnSXtnnXEEpppZnppnnEZp连列分析连列表:条件频数/行百分数/列百分数/总百分数期望值:行百分数x条件总值方差分析:检验各个总体的均值是否相等,判断分类自变量对数值因变量的影响1-c,1-rmin*n相关系数.5nc列联相关系数.4越大,相关程度越大,cdab排列:dbcadcbabc-adn相关系数.3比较df同)总数列总和行总和(依赖关系)独立性检验(是否存在.2,拒绝原假设df比较,若df同)1-)(列数1-(行数自由度:两数之间相关程度.1期望值频数)观察值频数(222222022222020VCTRTfffffffffeeeeee1.单因素方差分析关系是比较每两组数据间的,拒绝,有显著差异-X,k-n自由度为11最小显著差异.3占总的自变量对因变量的影响,关系量强度.2,拒绝若,统计量.1k-nSSE组内均方_;1-kSSA组间均方MSA1-n自由度;的误差)的平方的总和x:(每一个观测值与k-n自由度的总和)的平方)的误差x均值:(每组内频数与组平1-k自由度和的误差)的平方))总x((各组间平均值与*(组内频数:组的个数k总数,n个值,:其中第个条件;:第总平均数x一个条件组的平均数;x,组内误差,,组间误差总平方和(总误差)jiji222LSDLSDXnnMSEtLSDRSSESSARFFMSEMSAFMSESSTSSESSAjjiiSSESSASST2.双因素方差分析A.独立双因素22ij的影响占总的这两个自变量对因变量,关系量强度.2,拒绝,即差异显著若))1k)(1r(,1-r(~列因素显著性))1k)(1r(,1-k(~行因素显著性.1同理、,1)1k)(1r(;随机误差平方和)1-r(df,列因素误差和),1-k(df,行因素误差和1-kr:df,自由度总平方和(总误差)为总平均数x;x,每行平均i,因素k行数;x,每列平均值j,因素r列数RSSTSSCSSRRFFFMSEMSCFFMSEMSRFMSEMSCKSSRMSRSSESSCSSRSSTdfSSESSCSSRSSTCRB.交互作用双因素K,个行因素;m,行因素数值的行数R,个列因素;n,观察值总数误差来源平方和自由度均方F值行因素SSRK-1MSRMSR/MSE列因素SSCR-1MSCMSC/MSE交互左右SSRC(K-1)(R-1)MSRC/MSE误差SSEKR(M-1)总和SSTN-1y预测yˆ,yˆ-y标准化残差yˆ-ye残差.56xxxxn1**)1(yy时,得到的置信区间估计,取值y.55n1,t回归系数1-k-n自由度;自由度2-n,1~线性关系线性关系显著性检验.54估计标准误差:越大拟合越好,拟合优度.53强度的线性关系r拒绝,即存在,,t若)2-n(~r-12-nrt2右偏分布r较大,负值,左偏r较大,正值,总体相关系数1的显著性检验,r,无关0负线性相关;,0,正线性相关;0度,两个关系间的关系强r相关系数.52,:和截距估计的回归方程的斜率:程估计的简单线性回归方一元线性回归模型.5100ei002i20200022ˆˆ2222122eeIIeeiiiiiSZSntXXXSSSABSSEKSSRFMSEMSRFMSESSSTSSRRttxbyAnxxnyxyxBBxAy),拒绝,即存在1-k-n(若均数,各个自变量之间相关系多重共线性判定.64)1-k-n(~St回归系数:)1,(~)1/(/显著性检验:线性关系.63估计标准误差:k,自变量数量n样本数量1k111修正的多重判定::多重判定系数拟合优度.62:之间的关系,,:多元回归方程:多元线性回归模型.6122iii22222110ttknkFknSSEKSSRFMSESnnRRSSTSSRRSSESSRSSTSSESSRSSTxxxyeapp71.时间序列平稳序列非平稳序列(趋势T/季节性S/周期性C/随机性I)平均增长率=环比增长率的几何平均值-1季节性顺序.75修正指数曲线指数曲线线性趋势趋势型预测.74-F指数平滑:个值作为一期的平均数选择F移动平均:Yt1F简单平均法平稳序列的预测.73和求平均每一个误差平方后的总均方误差和求平均全部误差取绝对值后总平均绝对误差所有预测误差的平均数平均误差,预测值个观测值i第预测方法评估.72ttt1t1tti1tiiFYFKMSEMADMEFY回归分析的一些数据P1:MR:相关系数;RS判定系数,ARS调整的判定系数;标准误差s,观测值nP2:df自由度;总平方和SS;均方MS;线性关系F(Ps:回归R,残差E,总计T)P3,:INTER,截距;XV,斜率;t-stat回归系数P值检验,P,不拒绝;,拒绝