调查数据分析概念《调查数据分析》张海波主编,中国统计出版社出版。自学考试以及调查分析师考试指定教材《调查数据分析》张海波主编,中国统计出版社出版。自学考试以及调查分析师考试指定教材目录第一章调查数据分析的基本问题第二章调查数据的整理第三章调查数据的描述分析第四章调查数据的推断分析第五章调查数据的相关分析第六章调查数据的回归分析第七章调查数据的多元统计分析第八章调查数据的预测分析第九章调查数据的理论分析第十章调查分析报告调查数据分析第一章调查数据分析的基本问题(一)调查数据分析的意义1,调查数据分析调查数据分析是根据研究的目的和要求,运用科学的方法和手段,对调查数据进行定性和定量分析,揭示现象的本质和规律,为决策和管理提供咨询服务的过程.2,调查数据分析是调查研究过程中的一个十分重要的环节.调查数据分析具有自身的内在规律和特点,主要表现在以下几个方面:数据分析过程要定性分析和定量分析相结合;数据的定量分析以统计分析主要表现在以下几个方面方法为主;数据分析不能孤立于被调查研究的现象独立地进行;数据分析过程是一次认识上的质的飞跃.3,调查数据分析在整个调查研究过程中占有十分重要的地位,其重要性重要性主要表现在以下几个方面:重要性数据分析是调查研究不可缺少的重要环节;数据分析是充分发挥调查研究作用的重要保证;数据分析在检验调查研究其他环节的工作质量中有着特殊的作用;通过数据分析还可以促进调查数据分析方法的研究.(二)调查数据分析的原则与方法1,调查数据分析作为调查研究的一个重要阶段,有其自身的规律和要求.在进行调查数据分析时,应该遵循的原则主要有:遵循的原则①.科学性原则.科学性原则是指在数据分析中,应该根据调查数据的属性和特点,调查数据的来源渠道,调查研究的任务和目的,选择科学合理的分析方法进行分析②.客观性原则.客观性原则是指在数据分析中,必须遵守实事求是原则,充分了解研究对象的各种实际情况,尊重调查数据事实,保证分析结果的公正与客观③.目的性原则.目的性原则是指数据分析必须围绕调查研究的任务和目的来进行,其分析的结果必须能够满足调查研究的需要;④.系统性原则.系统性原则是指数据分析要将所的现象进行分解,然后对各种复杂的联系进行分析和综合.2,调查数据的分析方法有多种,但从方法论的角度来看,有定性分析方法和定量分析方法两大类.定性分析方法是人们根据事实,运用经验和判断能力,逻辑思维方法,哲学方法和相关专业理论,对定性分析方法现象进行判断,归纳,推理和概括,得出对事物的本质和规律性的认识的方法体系.具体包括归纳分析法,演绎分析法,比较分析法,因果分析法,结构与功能分析方法等.定量分析方法是对调查数据进行数学和统计处理分析的方法体系的总称.定量分析方法调查数据分析中所运用的定量分析方法主要是统计分析方法.统计分析方法分为描述统计分析方法和推断统计分析方法.描述统计分析方法是指对调查数据进行综合整理和计算综合指标等加工处理,用来描述总体特征的统计方法;推断统计分析方法是指根据调查的样本数据去推断总体数量特征的方法.3,在调查数据分析过程中,应该正确地选择分析方法.调查数据分析方法的选择,主要是定量分析方法的选择,而定量分析方法主要是统计分析方法.选择统计分析方法选择统计分析方法,主要是依据研究假设,调查方式,变选择统计分析方法量多少,数据类型来确定.(三)调查数据分析的程序和要求1,调查数据的分析过程包括分析计划的制订,原始数据的整理,分析方法的选择,数据的定量分析,,调查数据的分析过程数据的定性分析,调查报告的撰写等环节.2调查数据分析2,调查数据的分析不是一项简单的工作,也不是一项孤立的工作,要作好这项工作,必须具备一定的条件:1.对调查数据质量的要求.包括真实性要求,准确性要求和完整性要求;2.对分析方案的完备性要求,即要求在数据分析开始之前,必须充分考虑各方面因素,制订出详细,可行的分析方案;3.对分析人员素质的要求.要求分析人员具有系统的统计学功底,具有熟练的计算机操作能力,具有广泛的专业理论知识,具有较高的认识水平,具有良好的表达能力.3调查数据分析第二章调查数据的整理(一)数据整理的概念与作用1,数据整理,就是根据调查研究的目的与任务,对搜集到的各种数据,采用科学的方法,进行审核汇总,数据整理与初步加工,使之条理化,系统化,并以图表的方式显示数据特征,以符合数据分析需要的工作过程.2,其作用作用有:①数据整理能全面检查数据的质量,保证了数据的有用性;②数据整理是数据分析的作用基础;③数据整理是积累及保存资料的客观要求.3,数据整理应遵循以下原则数据整理应遵循以下原则:①真实性原则.即一方面要认真审核原始数据的真实性,又应注意在数据整理应遵循以下原则整理的各个环节,合理地选择整理方法和技术,保障原始数据的真实性不受损害;②准确性原则;③科学性原则;④目的性原则.4,数据整理的一般步骤是数据整理的一般步骤是:①数据的审核;②数据的编码;③数据的分组;④数据的汇总;⑤数据数据整理的一般步骤是的显示.(二)编码编码,是将问卷的问题及答案转化为计算机可以识别的数字或符号.1,通过编码,方便录入,适宜电脑进行处理.有事前编码与事后编码.事前编码事前编码是指在设计问卷时事前编码就给予每一个变量和可能答案分配代码,适用于封闭性问卷.事后编码事后编码是在数据收集完成以后正式整理开事后编码始之初,对调查问题的可能答案所进行的编码.对开放型问题,只能采取事后编码的方式.2,常用的几种编码方法有:,常用的几种编码方法有①顺序编码法:是用一个标准对数据进行分类,并按一定的顺序用连续数字或字母进行编码的方式;②分组编码法:是根据调查数据的属性特点和处理要求,将具有一定位数的代码单元分成若干组(或区间),每一个组的数字均代表一定的意义;③信息组码编码法:是把调查数据区分不同的组,给每一个组以一定组码来进行编码的方法;④表义式文字编码法:是用数字符号等表明编码对象属性,并依此方式对调查数据进行编码的方法.3,编码是一项细致的工作,为方便使用,需要编制统一的编码手册.编码手册包括四个主要项目编码手册包括四个主要项目,编码手册包括四个主要项目即问题顺序号,每个项目的预留代码位置,项目名称和内容说明.4,编码时应注意以下问题编码时应注意以下问题:①编码符号绝大多数情况下都必须用数字,个别时也可以采用英文字母;编码时应注意以下问题②可以对某些数字赋予特殊的意义,便于整理资料时识别;③编码位数应根据具体情况予以确定.5,编码完成以后,就可进行数据录入.数据的录入数据的录入是指将问卷或调查表或登录卡上的编码数字读到数据的录入磁盘,磁带中,或通过键盘直接输入到计算机的工作过程.有手工录入和光电录入两种方式.6,对收集到的数据是否真实可靠,还应进行审核.一般从准确性,完整性两方面进行.审核准确性是关键,主要是检查数据是否存在差错,有无异常值.检查的方法有逻辑检查与计算检查.审核数据的完整性是检查应调查的个体是否存在遗漏,所要求调查的项目是否齐全,有无缺项等.对不符合调查要求的数据,则应进行筛选.筛选有两方面的内容,一是对不符合要求或确认有错误的数据予以剔除,保留可靠性的数据.二是过滤,将符合某种特定条件的数据选取出来,而不符合条件的数据予以剔除.7,为合理安排数据,应首先对数据进行排序.排序是按一定顺序排列数据,便于观察数据的分布范围及特征.能为重新归类或分组等作准备,方便数据检索.对分类数据,一般按其英文字母或汉语拼音字母进行升序排列,也可按首个汉字的笔画数目由少到多的顺序排列.对数值型数据,可采用递增与递减两种方式排列.递增排序是由小到大排列,递减排序是由大到小排列.4调查数据分析8,分组是将原始数据按照某种标准划分为不同组别,以满足研究的需要.对数值型数据由各组的表示方法不同分为单变量值分组和组距分组.单变量值分组中的每一组用一个变量值来表示.组距分组中每一组用一定变动范围的两个变量值表示.有等距组距分组和异距组距分组.组距分组的基本步骤是:①通过排序的数据观察其极大值与极小值,找出变动的总范围;②确定组数.一组数据分成多少组是分组中首K=1+lgNlg2;③确定各组组距.组距与组数成反比;先需要确定的.通常可根据下列公式计算出建议组数④确定组限的表示方法,编制成频数分布表.9,频数频数是指落入各类或组中数据的个数,当我们把各组及相应频数按顺序全部加以排列,并用表格频数的形式表现出来,就是频数分布.它可以显示数据的分布状况,用于研究事物的内部结构.将各组频数逐级累加得到的频数,称为累积频数累积频数.累积频数10,为更好地表现数据特点.需要展示数据.其中图形表现,就是一种有效方法.常用的统计图有下列几种:①条形图,直方图.条形图和直方图大都是用来表现频数分布的.但两者常用的统计图有下列几种适用的数据类型不同.条形图是使用等宽条形的长短或高度来表示数据的多少的图形.直方图是用一定宽度与长度所围成的矩形面积来表示数据大小的图形.矩形的宽度与高度均有意义.此外,还可根据累积频数或累积频率,绘制累积频数及累积频率分布图.②饼型图,环形图.饼型图及环型图是来描述各种比例的图形.饼型图是用圆内扇形的面积表示数值大小的图形.以圆为整体,形象的说明各部分在总体中所占的份额.环形图是用圆内各环中每一段的面积来表示数值的大小的图形.能够同时显示多个总体的内部结构.③茎叶图,箱线图.对未经分组的数值型数据,适合用茎叶图,箱线图来显示.茎叶图是由茎和叶两部分组成,茎代表分组,表示高位数值;叶代表频数,列示个位数值.箱线图是用一组数据的五个特征值来描述该组数据的分布状况.既可显示单组数据,也可显示多组数据.其五个特征值分别是一组数据的最小值,最大值,中位数,下四分位数,上四分位数.④线图.线图,是反映时间序列数据的图形,即在平面坐标上标注各数据点并连接成折线,表现数量变化规律及特点的统计图.其横轴上列示时间的先后次序,纵轴上列示变量值.⑤雷达图.雷达图,反映多个变量多个观察样本数据的图形.在一个平面上绘有多个数轴,每个轴上显示一个变量的取值,每个样本的各观察值分别在各轴上标出.11,统计表统计表是表现调查数据的另一个重要形式.是指将一系列说明现象特性的经加工整理后的调查数统计表据,按一定次序和格式排列形成的专用表格.其作用不仅能有效表现数据,更有利于资料的贮存保管,还是积累资料的有效手段.为下一步分析提供基础,为进一步挖掘数据提供便利.统计表由两端不封口的纵横交错的直线围成各区域.从外形看,由总标题,行标题,列标题和具体数值及表外附加组成.从内容看,统计表分为主词与宾词两部分.主词是指统计表要说明的主体,也即研究的对象,通常是各个总体单位的名称或总体经分类(分组)形成的各个组.宾词是统计表要说明研究对象的某些方面状况,事实.根据主词是否分组及分组的状况,可将统计表分为简单表,分组表,复合分组表.为更好地表现调查数据,就需要精心设计统计表,设计时须注意以下几点:①合理安排表的内容,设计统计表,计时须注意以下几点设计统计表简明扼要,集中醒目,根据表的内容决定行标题与列标题的摆放位置,确定合适的长宽比例.②采用适当的排列顺序,置于顶端的总标题要确切,明确表明统计表要反映的内容,时间与空间范围.各项标题也要5调查数据分析简单明了.③表的上下两条横线要用粗线标出,中间各行一般不画线,有特殊要求需标横线的则用细线.使观看效果清楚醒目.④当统计表的栏次较多时,一般会进行编号.⑤统计表中的数字应填写清楚,排列有序,并采用统一的精确度,按位置对齐.第三章调查数据的描述分析本章讲述的是如何用指标的形式来认识调查数据数量特征的理论和方法.内容包括相对指标,平均指标和变异程度指标的设计思想,计算方法及运用原则.调查数据分析中常用的相对指标,有无名数和名数两种表现形式,按功能不同,相对指标分为:结构相对指标,比例相对指标,比较相对指标,动态相对指标及计划完成程度相对指标.学习时应注意掌握各种相对指标的计算方法.在计算相对指标时首先应注意分子与分母的可比性,同时还应注意各类指标的应用条件.在运用相对指