第二章-统计表和统计图

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章单变量统计描述分析第一节分布、统计表和统计图王荣分布指的是一个概念或变量,它的各个情况出现的次数或频次,又称频次分布。分布形式一般为:(X1,n1)(X2,n2)(X3,n3)......(Xn,nn)如:家庭结构的分布:(核心家庭,105)(直系家庭,72)(联合家庭,11)(其他,25)n不同名称也不同:频次分布、百分比分布,概率分布。注意变量取值的完备性和互斥性。统计表和统计图统计表一般格式表2-12002、2006年六运调查点人均消费支出构成统计表(山西省,2007,7)1.91100.04030.0100.02107.0总支出1.4828.21144.436.7773.2文化生活服务2.124.5172.03.881.0交通通讯1.476.2250.28.1170.0用品及其他13.019.0765.72.858.9住房1.655.8233.56.7140.9燃料1.895.6226.95.7120.0衣着1.6230.71237.636.2763.1食品占总支出百分比(%)钱数(元)占总支出百分比(%)钱数(元)2006年比2002年增长倍数2006年2002年消费构成资料来源:《中国统计年鉴》,中国统计出版社,2006。统计表和统计图几点说明:“—”表示数据不存在,“......”表示数据缺失。统计表中小数点对齐。一般要有合计一栏。频率合计时有时可能不是100%,考虑四舍五入。0——1000,1000——2000上组界不包括在内的约定。统计表和统计图变量层次:定类变量定序变量定距变量定比变量注意:社会统计学中一般将定距、定比变量都当做定距变量处理。层次运算符定类定序定距定比=≠√√√√<>√√√+-√√×÷√统计表——定类变量定类变量家庭结构百分比(%)核心家庭49.3直系家庭33.8联合家庭5.2其他11.7总和百分数100.0(统计总数)(2130)表2-2家庭结构的百分比统计表(xx地,1985,6)统计表——定类变量有关意愿、原因等社会调查中,可供选择的答案类别数目,有时与变量的数目不相等。例1:问卷中“你认为人生最大的乐趣是什么”(1)事业上有成就(2)美满的婚姻(3)经历丰富统计表——定类变量人生乐趣频次百分比事业上有成就婚姻美满经历丰富事业上有成就且婚姻美满事业上有成就且经历丰富婚姻美满且经历丰富统计总数表2-3人生最大乐趣统计表统计表——定类变量例2你在购房中,主要考虑哪些因素?A价格适中B上班近C交通方便D购物方便请从中选择三项:第一项:第二项:第三项:统计表——定类变量变量1(第一项):ABCD变量2(第二项):ABCD变量3(第三项):ABCD价格适中上班近交通方便购物方便第一项2060--20第二项40301020第三项------100累积人次609010140表2-4100个人购房因素统计表Xa=60/300=0.2Xb=90/300=0.3Xc=10/300=0.03Xd=140/300=0.47统计表——定类变量Xa=(5×20+3×40)/100=2.2Xb=(5×60+3×30)/100=3.9Xc=(3×10)/100=0.3Xd=(5×20+3×20+1×100)/100=2.6Xb>Xd>Xa>XcA价格适中B上班近C交通方便D购物方便第一项(5分)2060--20第二项(3分)40301020第三项(1分)------100累积人次609010140表2-4100个人购房因素统计表统计表——定序变量定序变量统计表制作内容、方法同定类变量。值得注意的是,定序变量的取值有大小、高低之分,因此在制作时应该保留其变化趋势。统计表——定序变量例如某电影厂为了解群众对武打片是否爱看,将喜爱程度分为五等:非常爱看、爱看、一般不爱看、反感。喜爱程度频次百分比非常爱看717.9爱看923.1一般1025.6不爱看1025.6反感37.7总数3999.9表2.7xx单位对武打片的反映统计统计表——定距变量定距变量:连续型变量和离散型变量。离散型变量制表方法同定序变量。但是,当如果变量值的变化幅度过大,一一列举,势必形成很长的分类,且每类分类中的频次又变得很少,这时需要采用组距式统计表。工厂规模(人数)频次1—5(0.5—5.5)6—1011—2021—3030—35统计表——定距变量对于连续型变量,无法使每一个取值对应一个确定的频次或百分比。解决方法是将变量值分为若干个区间和组。例如结婚年龄。在实际中要考虑如下问题:组数、等距分组与非等距分组、分点精度。标明组界真实组界1—20.5—2.53—42.5—4.55—64.5—6.57—86.5—8.5统计表——定距变量统计表——定距变量统计表——定距变量统计表——定距变量统计表——定距变量组号真实组界值中心值频次统计频次相对频次1129.35~132.35130.8520.0172132.35~135.35133.8520.0173135.35~138.35136.8580.0684138.35~141.35139.85200.1705141.35~144.35142.85260.2206144.35~147.35145.85250.2127147.35~150.35148.85200.1708150.35~153.35151.8590.0769153.35~156.35153.8530.02510156.35~159.35155.8520.01711159.35~161.35157.8510.008总和—1181.000表2-2118例13岁女孩身高资料统计表统计图根据变量层次可选择不同的统计图定类变量:圆瓣图、条形图定序变量:条形图定距变量:直方图、折线图统计图—圆瓣图图2-1家庭结构分布图核心家庭49%直系家庭34%联合家庭5%其他12%核心家庭直系家庭联合家庭其他统计图—圆瓣图图2-1家庭结构分布图核心家庭49%直系家庭34%联合家庭5%其他12%核心家庭直系家庭联合家庭其他统计图—圆瓣图图2-1家庭结构分布图核心家庭49%直系家庭34%联合家庭5%其他12%核心家庭直系家庭联合家庭其他统计图—圆瓣图图2-1家庭结构分布图核心家庭49%直系家庭34%联合家庭5%其他12%核心家庭直系家庭联合家庭其他统计图—条形图条形图:主要用于表示离散型数据资料。可分为:简单条形图、分组条形图(复式)、分段条形图,误差线条形图,分段条形图。核心家庭直系家庭联合家庭其他0102030405060百分比%单式条形图0102030405060甲乙丙丁等级人数图2-1某年级操行评定结果条形图基线尺度线图形复式条形图图2-2某年级操行评定结果条形图05101520253035甲乙丙丁等级人数男女例:图2-3三项影响较大的SARS信息对不同文化程度民众的影响00.511.522.533.544.5世卫组织对来本地旅游的警告卫生部、本市的新闻发布会所在单位和住宅区有无患者初中高中大专本科误差条形图020406080100ABCD营养素体重(g)图2-27四种营养素喂养小白鼠三周后所增体重(克)0102030405060老中青人员分类阳性率(%)强阳性率%其它%图2-26老、中、青三代的结核菌素阳性率与强阳性率(%)分段条形图统计图—条形图绘制条图注意事项纵轴的刻度必须从“0”开始,否则会改变各对比组间的比例关系。横轴各直条一般按统计指标由大到小排列,也可按事物本身的自然顺序排列。各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条的宽度相等或为直条宽度的一半。图形区域中条形顶端和下端尽量少用数据标签。调节过长条形方法。一种方法是调整图尺,改变刻度或采用断裂;另一种是折叠。统计图—直方图横轴:数据分组纵轴:频次、频率或者频次密度、频率密度。等距分组数据:矩形的高度可以直接表示频数(或频率)。非等距分组数据需要用频次(或频率)密度表示,这时矩形的面积表示各组的频数(或频率)。统计图—直方图图3-5某车间工人日加工零件数的直方图02468101214105110115120125130135140按零件数分组(个)∥频数(人)统计图—直方图统计图—直方图05101520253.20~3.50~3.80~4.10~4.40~4.70~5.00~5.30~5.60~5.90~6.20红细胞计数值(1012/L)频数(人数)组织图2015105060636669727578818487909699统计图—直方图非等距直方图条形图和直方图有什么区别?条形图与直方图的区别(1)描述的数据不同。离散型数据;连续性数据。(2)表示数据多少的方式不同。长短或高低表示数据的多少和大小;用面积表示。注意:等距分组数据仍可用矩形高度直接表示频数(3)坐标轴上标尺分点意义不同。分类轴;刻度值。(4)间隔有间隔,但无意义;无任何间隙。0102030405060甲乙丙丁等级人数统计图—折线图折线图:把直方图顶部的中点(组中值)用直线段连接起来就是折线图。多用于连续性资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形。图3-6某车间工人日加工零件数的折线图02468101214105(个)频数110115120125130135140日加工零件数(个)051015202530%统计图—直方图例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。010203040506070一二三四五六初一初二初三年级百分比视觉记忆听觉记忆图2-5有意义的材料再现率比较线形图累计图和累计表统计图和统计表告诉我们某一变量值(或某一组)所对应的频次是多少。有时我们需要了解小于某一变量值或者大于某一变量值的总共频次是多少,这时要用到累计图和累计表。累计图和累计表表2-5家庭子女数频次分布与累计频次分布家庭子女数频次cf↑cf↓02210+2=12132+3=57+3=10235+3=84+3=7328+2=102+2=44110+1=111+1=25111+1=121累计图和累计表02468101214个数向上累计直方图013245累计图和累计表02468101214个数013245向上累计折线图累计图和累计表00.20.40.60.811.2频率向下累计频率直方图013245累计图和累计表00.20.40.60.811.2频率013245向下累计频率折线图累计图和累计表累计图和累计表的应用,在于通过它比较个体在总体中的位置。例如,甲、乙两同学在不同班级,他们都是考了80分,谁在班里的成绩更好呢?累计图和累计表例如:洛伦茨曲线。描述收入分配中平均程度的一种方法,用基尼系数衡量。累计图和累计表例如:洛伦茨曲线。描述收入分配中平均程度的一种方法,用基尼系数G衡量。累计图和累计表联合国有关组织规定:低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。常见的几种分布图常见的频数分布曲线有正态分布、偏态分布、J形分布、U形分布等。正态分布MeU形分布MeMeMe偏态分布正偏(右偏)负偏(左偏)J形分布正J形负J形欣赏几种有意思的图茎叶图雷达图箱图第二章统计量表茎叶图对于未分组的数据,可用茎叶图显示其分布特征,由“茎、叶”两部分构成,图形由数字组成,茎在左,叶在右,用小数点(直线)把茎叶隔开。茎叶图将每一观测值分解为茎值和叶值(用直线隔开)•垂直线左边的数字称为“茎”,确定组别•垂直线右边的数字“叶”,确定频数(计数)Xi2144677302841创设情境,建立模型大学生阿Q毕业后想找一份月薪在1700以上的工作,一天他看见三毛公司门口的招聘广告,上面写着:现因业务需要招员工一名,有意者欢迎前来应聘。于是阿Q走了进去……阿Q应聘我们好几人工资都是1100元.职员D职员C我的工资是1200元,在公司中算中等收入.?阿Q我公司员工的

1 / 137
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功