统计学知识总结1、统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。2、统计数据分类数据、顺序数据、数值型数据3、总体总体是包含所研究的全部个体(数据)的集合。4、样本样本是从总体中抽取的一部分元素的集合5、样本量样本量构成样本的元素的数目6、参数参数是用来描述总体特征的概括性数字度量7、统计量统计量是用来描述样本特征的概括性数字特征8、变量说明现象某种特征的概念○1分类变量:说明事物类别的一个名称○2顺序变量:说明事物有序类别的一个名称○3数值型变量:说明事物数字特征的一个名称9、概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中的每个单位都有一定的机会被选入样本10、抽样误差抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。11、抽样框抽样框是有关总体单位的名录12、控制回答误差搞好问卷设计,调查过程的质量控制(ps:未能找到正确的方法,希望大家自己找寻)13、数据的预处理○1数据审核○2数据筛选○3数据排序○4数据透视表14、频数频数是落在某一特定类别或组里的数据个数15、比例比例是一个样本(或总体)中各个部分的数据与全部数据之比16、比率比率是样本(或总体)各不同类别数值之间的比值17、条形图与直方图的区别:○1条形图使用条形的长度表示各类别频数的多少,宽度是固定的;直方图是用面积表示各类别频数的多少,矩形的高表示每一组的频数或频率,宽度则表示各组的组距,因此其高度和宽度都有意义○2分组数据具有连续性,直方图的各举行通常是连续排列,条形图是分开排列,○3条形图用于展示数据,直方图用于展示数学值型数据最小值下四分位数中位数上四分位数最大值18、箱线图19、众数众数是一组数据中出现次数最多的变量值,用M0表示20、中位数中位数是一组数据排序后处于中间位置上的变量值21、四分位数四分位数是数据排序后处于25%和75%位置上的数22、平均数平均数是一组数据相加后除以数据个数得到的结果○1简单平均数○2加权平均数○3几何平均数:G=23、异众比率异众比率是指非众数组的频数占总频数的比例24、离散系数离散系数是一组数据的标准差与平均数之比25、抽样分布(定义)在总体X的分布类型已知时,若对任意自然数n,都能导出统计量T=T(X1,X2,…Xn)的分布的数学表达式,这种分布称为精确地抽样分布26、总体分布总体中各元素的观测值所形成的相对频数分布是总体分布27、样本分布从总体中抽取一个容量为n的样本,由这n个观测值形成的相对频数分布,称为样本分布28、抽样分布在重复选取样本量为n的样本时,由该样本统计量的所有可能取值形成的相对频数分布,称为抽样分布29、相关关系变量之间存在的不确定的数量关系,称为相关关系30、相关系数相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若为总体的,称为总体相关系数;若为样本的,则称为样本相关系数,记为另附重要公式:统计学重要公式D22221.XX2.N3.Q4.1(2)S1ULiiXnIQRQQXNXn样本平均数:总体平均数:四分位差:方差:()总体方差:样本方差:225.12SS6.100%100%100%CVSCVX标准差:()总体标准差:()样本标准差:变异系数标准差总体:平均数样本:22121111117.(),8.(,)19.,,,iiiiiiXYXYXYXYXYXXYYninniXXiiiinniinniiXYiiiiiiYYiXXXZZZSXXYYCovXYSnSLrSSLLXLXXXnXYLXXYYXYnLY标准分数分数或样本协方差皮尔逊相关系数22121111,,ninniiiinniiiiYYYnXYXYnn2210.X11.X12.S113.!121,!!12,!,!!!iiiiiiiimnmmnnmnmnnWXWFXFFXXnnPnnnnmmnnPnCmmnmCC加权平均数分组数据样本平均数分组数据样本方差排列组合公式nii114.()1()15.P(AB)P(A)P(B)-P(AB)P(AB)P(AB)16.P(A|B),P(B|A)()()17.P(AB)()P(A|B)()P(B|A)18.P(AB)()()19.P(B)()P(B|A)20.iPAPAPBPAPBPAPAPBPA事件补的概率加法公式条件概率乘法公式独立事件全概率公式贝叶iiinjj1()P(B|A)()P(B|A)P(A|B)P(B)()P(B|A)iijPAPAPA斯公式22221.()()22.()()23.(),0,1,2,...,,124.(),()(1)25.()!!27.()xxnxnxxxnxrNrEXxpxVarXxpxpxCpqxnqpEXnpVarXnppeepxxxCCpxC离散型随机变量的数学期望离散型随机变量的方差二项分布的概率函数二项分布的数学期望和方差泊松分布超几何分布222,0128.()229.nNxxrfxexZ正态概率密度函数标准正态分布变换30.X:(),131.:(),(1)1(1)XXPPEXNnNnnPEppNnppNnppn的数学期望和标准差有限总体时无限总体时比例的数学期望和标准差有限总体时无限总体时2222222232.:33.(1):,(2):,(3),,,(4),,34.:XXZnSXZnXZnSXtnZn估计时的抽样误差总体均值的区间估计大样本且方差已知大样本且方差未知总体正态小样本方差已知总体正态小样本方差未知估计时所需的样本容量2222000(1)35.(1)36.37.::,/:/38.:,1/39.:(1)ppPpZnZpppnXZnXZSnXtdfnSnppZppn总体比率的区间估计的区间估计时所需的样本容量大样本总体均值的检验统计量方差已知方差未知小样本总体均值的检验统计量总体比率检验统计量122222011212121222121240.:,41.,::(),XXZZnZZXXXXEXXnn总体均值的单侧检验中所需样本容量用代替即为双侧检验的公式独立样本时两个总体均值之差的点估计量的期望值与标准差12121212121212121222212121212222222121212121212242.:(1)(,30),,:(2),,11,()(3),XXXXXXXXXXXXnnXXZSSSnnXXZSXXnnnnXXtS两个总体均值之差的区间估计大样本已知的点估计量为大样本未知时的标准差小样本正态12121222121212122121212121211221112143.X(1)Z,X(2),11(3)44.:(1)(1)(1)pddppXnnXtSnndtSnppppEpppppppppppnnn两个总体均值之差的假设检验统计量大样本小样本相关样本两个比率之差的点估计量的期望值与标准差1212222112212(1)(1)(1):pppppnppppSnn的点估计量12121212111122221221212112212121245.:,(1),,(1)5,46.::11:(1)ppppppppnpnpnpnpppZSppppZnpnppnnppSppnn两个总体比率之差的区间估计大样本时两个总体比率之差的检验统计量总体比率合并估计时的点估计量22222/2(1/2)2222122221221147.:148.:49.:50.:,151.::kiiiiijijijijjijnSnSnSSFSfedfkeRTCTijenfee一个总体方差的区间估计一个总体方差的检验统计量两个总体方差的检验统计量拟合优度检验统计量独立假设条件下列联表的期望频数第行之和第列之和样本容量独立性检验统计量,11idfRC1221111212152.:,:,1:,1:,1:():,:1jjjnijijjnijjijjnkijkjittjjtkjjtjtkjjjKXXnXXSnXXnnnSSTRMSTRkSSTRnXXSSEMSEnkSSEnSk检验个均值的相等性第j个处理的样本均值第j个处理的样本方差总样本均值处理均方处理平方和误差均方误差平方和个均值相等检211i::::XLSD:t11jnkijtjijijMSTRFMSESSTXXSSTSSTRSSEXFisherMSEnn验统计量总平方和平方和分解多重比较方法的检验统计量2112.12.12254.::,1,:,1,:,1,:,11::,1,:katijtttjikbjtbjaritrietbreijtijtibSSXXdfnSSaXXdfkSSkXXdfaSSSSSSSSdfkaXSSXdfakakXSS随机化区组设计总平方和处理平方和区组平方和误差平方和求平方和的另一种方法总平方和处理平方和2222,1,:,1,:,11jijbijijrretbreXdfkaakXXSSdfakakSSSSSSSSdfka区组平方和误差平方和21112.12.12..1155.::,1:,1,:,1,:,11:,abrijktttijkaitAibjtBjabijijtABijeSSTXXdfnASSAbrXXdfaBSSBarXXdfbSSABrXXXXdfabSSESSTSSASSBSSABdfa析因试验总平方和因子平方和因子平方和交互作用平方和误差平方和(1)brababr01010121220157.::::min:,iiiiiiiyxEyxybbxyyxyxynbxxnbybx简单线性回归模型简单线性回归方程估计的简单线性回归方程最小二乘法估计的回归方程的斜率和截距222222222222221122::::()::():iiiiiiiiiiiiiixySSTSSRSSESSEyyySSTyyynXSSRyybXnXYXYnXXnSSRRrSSTrbbrSM平方和分解误差平方和总平方和回归平方和判定系数决定系数样本相关系数的符号判定系数的符号均方误差的估计量2:2