第2章 统计数据的搜集与整理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学2-1第二章统计数据的搜集与整理►主要内容统计数据的计量与类型统计数据的搜集统计数据的整理统计数据的显示►重点统计数据的计量类型统计数据的整理与显示统计学2-2统计数据的计量与类型►统计数据的计量定类尺度定序尺度定距尺度定比尺度►数据类型按计量尺度划分按数据的搜集方法划分按数据的时间关系划分统计学2-3统计数据的计量►定类尺度(分类尺度、列明尺度等)是对事物最基本的侧度,是其他计量尺度的基础。对研究客体进行平行分类或分组。定序尺度►定序尺度(序数尺度、顺为尺度等)比定类尺度精确一些。不仅可以将事物分出不同的类别,还可以确定类别间的等级差别和序列差别。►定矩尺度(间隔尺度、区间尺度等)能测度事物的类别或次序之间的数量标志。计量结果表现为数值,可以进行加减计算。没有绝对零点。►定比尺度(比率尺度)不仅能够侧度类别间的大小和多少,还具有绝对的零点。计量结果可以进行加减、乘除运算。统计学2-4四种计量尺度定类尺度定序尺度定距尺度定比尺度数据的计量尺度统计学2-5列名尺度(Nominalscale)1.也称名义尺度或分类尺度2.计量层次最低3.对事物进行平行的分类4.各类别可以指定数字代码表示5.使用时必须符合类别穷尽和互斥的要求6.数据表现为“类别”7.具有=或的数学特性统计学2-6顺序尺度(Ordinalscale)1.也称定序尺度2.对事物分类的同时给出各类别的顺序3.比定类尺度精确4.未测量出类别之间的准确差值5.数据表现为“类别”,但有序6.具有或的数学特性统计学2-7间隔尺度(Intervalscale)1.也称间隔尺度2.对事物的准确测度►比定序尺度精确►数据表现为“数值”►没有绝对零点►具有+或-的数学特性统计学2-8比率尺度(Ratioscale)1.也称比率尺度2.对事物的准确测度►与定距尺度处于同一层次►数据表现为“数值”►有绝对零点►具有或的数学特性统计学2-9四种计量尺度的比较四种计量尺度的比较定类尺度定序尺度定距尺度定比尺度分类(=,≠)排序(,)间距(+,-)比值(×,÷)√√√√√√√√√√计量尺度数学特性“√”表示该尺度所具有的特性统计学2-10数据的类型►按照计量尺度划分定性数据(品质数据)定量数据(数量数据和数值型数据)►按数据的搜集方法划分观测数据:通过调查和观测得到的数据。一般社会经济现象统计数据的获得方式。实验数据:在实验中控制实验对象而搜集到的数据。一般自然科学领域统计数据的获得方式。►按照数据的时间关系划分截面数据:同一时间,不同空间的数据。时间数据:同一空间,不同时间上的数据。统计学2-11统计数据的搜集统计数据的搜集就是根据统计研究目的的要求,采用一定的组织形式与科学的方法,采集与研究问题有关的各类信息资料的过程。►直接获取资料►间接获取资料统计学2-12直接来源——统计调查►统计调查方案的设计为使统计调查得以顺利进行,在组织调查之前,必须首先设计一个周密、可行的调查方案。►统计调查方法现场观察法、报告法、问卷法、访谈法、实验采集法等。►统计调查的组织方式统计报表专门调查统计学2-13抽样调查方案►确定调查目的(为什么调查)►确定调查对象和调查单位有许多性质相同的调查单位组成的现象总体。调查单位:所要研究的个体。►确定调查项目:调查中所要调查单位的特征。►设计调查表与问卷设计►选择调查方法►确定调查时间和调查期限►制定调查的组织实施计划统计学2-14统计调查方法►现场观察法带有明确的目的到现场,直接观察获得数据信息。优点:准确;缺点:成本大►报告法(通讯法)被调查者根据要求上报,现行的统计报告制度采用。►问卷法运用统一的问卷向被调查者收集资料。优点:省时、省钱、省力,便于定量分析与处理,不;避免主观偏见,较少误差,具有很好的匿名性。缺点:回收率和资料的质量难以保证。统计学2-15统计调查方法►访谈法有目的、有计划、有方向地运用口头交谈方式向被调查者了解问题的一种搜集资料的方法。优点:回答率高、适应性强、内容机动性大、过程可控性强。缺点:成本高、匿名性差,结果受访谈人员的素质、能力及现场表现直接相关。►实验采集法通过实验对比获得统计资料。优点:应用范围广、结果正确、直接缺点:成本高、研究时间长。统计学2-16统计调查的组织方式►统计报表依据国家统计局或国家各行政管理的规定,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、指标、时间和程序自下而上地逐级提供基本统计资料的调查方式。►专门调查普查抽样调查重点调查►重点单位是指在全体中虽然数目不多,所占比不大,但调查标志值却占较大比重。典型调查►有意识地选择有典型意义或具有代表性的单位。统计学2-17统计报表►是我国定期搜集基本统计资料的一种重要形式。►特点来源于基层单位的原始记录项目稳定,有利于资料积累和动态比较►种类国家、部门和地方统计报表全面统计报表和非全面统计报表定期报表和年报基层表表和综合报表电讯报表和书面报表统计学2-18普查(census)1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄总体统计学2-19抽样调查(samplingsurvey)1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。总体随机样本2.具有经济性、时效性强、适应面广、准确性高等特点。统计学2-20间接取得的数据Internethttp//统计部门和政府部门公布的有关资料,如各类统计年鉴2.各类经济信息中心、信息咨询机构、专业调查机构等提供的数据3.各类专业期刊、报纸、书籍所提供的资料4.各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料5.从互联网或图书馆查阅到的相关资料统计学2-21提供统计数据的部分国内政府网站中国政府及相关机构网址数据内容国家统计局统计年鉴、统计月报等国务院发展研究中心信息网宏观经济、财经、货币金融等中国经济信息网国家统计局授权的数据中心中国决策信息网三农信息、论坛及相关网站统计学2-22提供统计数据的国际部分政府网站美国政府机构网址数据内容人口普查局货币供应、信誉、汇率等预算编制办公室财政收入、支出、债券等商务部商业、工业等统计学2-23统计数据的整理►统计数据整理的意义和步骤►数据的录入与预处理►统计分组►分配数列►次数分配直方图►洛伦茨曲线统计学2-24统计数据的整理和步骤►定义根据统计研究的目的,对所搜集到的资料进行科学的分工,使之系统化、条理化的工作过程。►意义决定统计研究任务能否完成影响统计研究工作的质量►步骤设计、制定整理方案审核原始数据分组、汇总,计算指标表现、显示汇总结果保存资料、系统积累统计学2-25数据的录入与预处理►知名统计软件SAS:StatisticsAnalysissystem国际上的标准软件系统,专业统计软件中的巨无霸。以编成为主,操作界面不够友好,入门困难。GAS:GNUAssemble自由软件汇编程序编译器。一般用于Unix/Linux系统。SPSS:StatisticalProductandService——统计产品与服务解决方案”软件。最初软件全称为SolutionsStatisticalPackagefortheSocialSciences——社会科学统计软件包。是世界上最早的统计分析软件,最突出的特点就是操作界面极为友好,操作方便。►本书重点应用统计工具SPSS:重要实验内容EXCEL:自学掌握统计学2-26数据的录入与预处理►一般数据文件的建立与数据录入(SPSS)定义变量标签变量的测量尺度►多选题的录入技巧多重二分法多重分类法►数据的审核与筛选(P17)►数据的预处理排序分组合并连续变量可视化分段统计学2-27统计分组►概念根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。►分组方法基本原则:穷尽互斥关键问题:选择分组标志和确定组限►分组体系简单分组与平行分组体系复合分组与复合分组体系统计学2-28分配数列►分配数列概念:在统计分组的基础上,将总提案组归类整理,并按一定顺序排列,形成总体各单位在各组建的分布。►分配数列种类:品质数列和变量数列►变量数列种类:单项数列与组距数列统计学2-29组距分组(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组~~~~~统计学2-30组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的2.确定组距:组距(classwidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即►一般:遵循下述公式,但应具体分析组距=(最大值—最小值)÷组数3.统计出各组的频数并整理成频数分布表统计学2-31组距分组(几个概念)►1.下限(lowlimit):一个组的最小值►2.上限(upperlimit):一个组的最大值►3.组距(classwidth):上限与下限之差►4.组中值(classmidpoint):下限与上限之间的中点值下限值+上限值2组中值=统计学2-32次数分配表的编制(例题分析)例:某企业30名工人完成劳动定额资料如右表所示,要求:对上述数据编制合理的组距式变量数列序号完成定额序号完成定额序号完成定额12345678910988195849386911021001031112131415161718192010510010410810710810610911211421222324252627282930109117125115120119118116129113统计学2-33次数分配表(P22表2-5)1、计算数据总体范围,排序(21页)max=129;min=81变异全距=max-min=129-81=482、确定组距和组限常规分组:优、良、中、及格、不及格共5组组距=全距/组数=48/5=9.6,取组距=103、确定组限最小组下限低于最小值(81),最大组上限高于最大值(130)根据习惯和性质,100应为某一组组限确定下限为70,上限为130统计学2-34累计频数与累计频率►向上累计由变量值小的组向变量值大的组累计频数或频率。反映小于上限的各组频数或频率和。►向下累计由变量值大的组向变量值小的组累计频数或频率。反映大于下限的各组频数或频率和。►上例累计频数和频率完成情况频数频率向上累计向下累计频数频率频数频率80-9090-100100-110110-120120-13034128310.013.340.026.710.03719273010.023.363.390.0100.0302723113100.090.0760.736.710.0合计30100.0统计学2-35次数分布的主要类型►钟形分布分布特征:两头大中间小,形如钟形最常见的分布类型►U形分布中间小两头大,形如英文字母U死亡率、失业人口年龄分布►J形分布一边大,一般小分为正反两种类型同增减为正J分布,

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功