高级数理统计分析章立军课程目的•复习有关统计学的基础知识和工具•了解资本市场有关的数据库情况•将统计学的基础工具应用于会计学,尤其是资本市场财务数据的分析基本统计量及其在EXCEL中的实现•1.均值AVERAGE(B6:B47)•2.标准差/方差STDEV(B6:B47)/VAR(B6:B47)•E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差D(X)•σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差STDEV(B6:B47)•3.中位数MEDIAN(B6:B47)•4.分位数(25%,75%)QUARTILE(B6:B47,1)1:代表25%,2:中位数;3:75%;4:最大值;0:代表最小值基本统计量及其在EXCEL中的实现•5.众数(出现频率最高的数)MODE(B6:B47),返回出现次数最多的第一个数字•6.峰度和偏度–峰度:KURT(B6:B47);–偏度SKEW(B6:B47)基本数据库介绍•CSMAR数据库:国泰安数据库–股票市场数据库–上市公司数据库•财务年报•公司治理•股东研究•红利分配等–基金市场数据库–债券市场数据库–经济研究数据库–专题数据库。。。。•WINDS数据库:万德数据库证券市场背景知识介绍•主要网站–中国证监会–上海证券交易所–深圳证券交易所–巨潮咨讯网农、林、牧、渔业行业分类•A农、林、牧、渔业•A01农业•A0101种植业•A0199其他农业•A03林业•A05畜牧业•A0501牲畜饲养放牧业•A0505家禽饲养业•A0599其他畜牧业•A07渔业•A0701海洋渔业•A0705淡水渔业•A09农、林、牧、渔服务业•A0901农业服务业•A0905林业服务业•A0915畜牧兽医服务业•A0920渔业服务业•A0999其他农、林、牧、渔服务业房地产业行业分类•J房地产业•J01房地产开发与经营业J05房地产管理业•J09房地产中介服务业•J0901房地产经纪业•J0920房地产评估业•J0930房地产咨询业J0999其他房地产中介服务业制造业分类•C0食品、饮料•C01食品加工业•C03食品制造业•C05饮料制造业•C1纺织、服装、皮毛•C2木材、家具•C3造纸、印刷•C4石油、化学、塑胶、塑料•C5电子•C6金属、非金属•C7机械、设备、仪表•C8医药、生物制品基本统计方法介绍——两个数据列的均值的比较•前提:首先要判断数据是独立组还是成对组•一、两个独立组的比较(数据来源不同,如不同行业的公司的盈利能力、偿债比例的比较等)•1.比较什么:看两组数据的均值是否相等;H0:原假设:A=B;H1:备择假设:A≠B•2.如何比较:两组样本的T检验(TTEST)•3.如何看结果:看显著性水平(一般设为1%,5%,10%),当p值小于预先设定T检验的显著性水平,则结果为统计显著的,拒绝原假设,即两组的均值显著地不同;否则两组均值无显著的差异。基本统计方法介绍——两个数据列的均值的比较•4.做两样本T检验的三个前提:–A.观察独立–B.每组观测值是来自正态总体分布的样本;–C.两个独立组的方差相等•因此,在作T检验之前,要做两个检验,第一,观察值的正态分布检验;第二;方差是否相等的检验(F检验,原假设H0:方差相等)•5.如果不服从正态分布,也就用用非参数检验:Wilcoxon秩和检验(前提是只需要独立观察),Ztest基本统计方法介绍——两个成对组数据列的均值的比较•成对组举例–同一个公司股权分置改革前后盈利能力的比较,股改前后高管薪酬的业绩敏感度比较,病人治疗前后的某一指标如心跳、血压等的比较•1.比较什么:差值的均值差是否为0;H0:原假设:D=0;H1:备择假设:D=≠0•2.如何比较:成对差值的T检验(TTEST)•3.如何看结果:看显著性水平(一般设为1%,5%,10%),当p值小于预先设定T检验的显著性水平,则结果为统计显著的,拒绝原假设,即平均差值与0的差异不显著。基本统计方法介绍——两个成对组数据列的均值的比较•4.三个前提:–A.观察独立–B.每组观测值是来自正态总体分布的样本;–C.两个独立组的方差相等•5.如果方差不同,即用非参数检验:Wilcoxon符号秩检验(需要每对观察与其它对观察独立;差值来源正态总体)。相关分析•1.利用函数计算相关系数•2.用相关系数宏计算相关系数一、利用函数计算相关系数•在Excel中,提供了两个计算两个变量之间相关系数的方法,CORREL函数和PERSON函数,这两个函数是等价的,这里我们介绍用CORREL函数计算相关系数。•第一步:单击任一个空白单元格,单击“插入”菜单,选择“函数”,打开“插入函数”对话框,在“选择类别”中选择“统计”;在“选择函数”中选择“CORREL”,单击确定后,出现CORREL对话框。•第二步:在array1中输入B3:B10,在array2中输入C3:C10,即可在对话框下方显示出计算结果为0.77723。二、用相关系数宏计算相关系数•第一步:单击“工具”菜单,选择“数据分析”•项,在“数据分析”项中选择“相关系数”,弹出“相关系数”对话框。第二步:在“输入区域”输入$B$2:$C$10,“分组方式”选择逐列,选择“标志位于第一行”,在“输出区域”中输入$I$3,单击“确定”。统计方法在会计中的运用-以A+H股公司2006年股利分析为例•境内外股利支付是否存在差异(对于成对样本的均值比较)•方差分析–对于不同的实际控制人,境内股利支付是否存在差异(单因素方差分析)–实际控制人+行业这两个因素是否会影响境内股利支付(无重复双变量方差分析•回归分析–股利支付的影响因素分析(盈利能力、行业是否为垄断行业、短期偿债能力、长期偿债能力等)2006年A+H股股利支付部分情况中央政府控制的企业地方政府控制的企业0.080.020.580.250.280.20.30.0840.0620.40.110.190.120.130.040.20.20.220.049200.080.130.0160.040.140.10.040.040.23075不同实际控制人是否对境内发放股利有差异-单因素分析SUMMARY组观测数求和平均方差列1152.327950.15520.02181列2142.0040.143140.01189方差分析差异源SSdfMSFP-valueFcrit组间0.0010510.001050.061760.805624.21001组内0.45997270.01704总计0.4610328实际控制人与行业两个因素对境内股利支付的影响(双变量方差分析)中央政府控制的企业地方政府控制的企业B0.110.2C810.080.084C670.580.4C610.040.2C050.20.22C730.580C650.280.13C730.0620.1C610.230750.02C650.04920.58D010.0160.0558实际控制人类型行业实际控制人+行业双因素分析方差分析差异源SSdfMSFP-valueFcrit行0.34742100.034740.927140.546442.97824行业之间差异列0.0025810.002580.06880.798424.9646实际控制人差异误差0.37473100.03747总计0.7247321