资料的整理与分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11资料的整理和分析12资料整理的定义资料整理主要是指对文字资料和对数字资料的整理。它是根据调查研究的目的,运用科学的方法,对调查所获得的资料进行审查、检验,分类、汇总等初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。对原始资料进行审核、分组、汇总、描述和归纳,使之条理化和便于统计分析和推断。13资料整理的意义资料整理是资料研究的重要基础,是提高调查资料质量和使用价值的必要步骤,是保存资料的客观要求。14资料整理的原则真实性合格性准确性完整性系统性统一性简明性新颖性15资料整理的分类根据信息资料的性质、内容或特征进行分类。要按一定的标准将所研究课题的有关信息资料分成不同的组或类。从资料来源来分,可以分为网上资料、书本资料、观察体验资料;从表现形式上分,可以分为文字资料、图像资料、录音资料等。从资料的性质来考虑,资料还可以分为定量资料(主要是各种数据)与定性资料(主要是文字材料)。16文字资料的整理在社会调查研究中,定性资料基本上都是文字资料,因此一般也把文字资料整理称作定性资料整理。由于文字资料在来源上存在差异,所以其整理方法也略不同。通常情况下可划分为审查、分类和汇编三个基本步骤。17文字资料的整理一:审查有些研究,需要收集的资料比较多,面对这成堆的资料,首要的任务就是要在初步阅读(当然需要做简单的分析)的基础之上做适当的筛选。筛选的主要目的在于“去伪存真”,“由表及里”,即只保留对本课题研究有参考价值的资料而删去其余。文字资料的审查,主要解决其真实性、准确性和适用性问题。18最后,要做到不真实的予以淘汰,不准确的予以核实准确,不全面的补全找齐。通常,对于“理胜资料”要求它有:可靠性,正确性,权威性;对于事实资料要求它有:真实性,典型性,浓缩性。19文字资料的整理二:分类文字资料的分类,就是将资料分门别类,使得繁杂的资料条理化、系统化,为找出规律性的联系提供依据。定义110比如对某一课题资料,可以按历史线索分类;可以按不同的观点分类;可以按研究的问题的性质分类;还可以按子课题分类,等等。分类的方法111文字资料的整理三:汇编文字资料的汇编,主要是指根据调查研究的实际要求,对分类完成之后的资料进行汇总、编辑,使之成为能反映调查对象客观情况的系统、完整的材料。汇编的定义112首先:根据研究目的要求和研究对象客观情况,确定合理的逻辑结构,对资料进行初次加工。如:给各种资料加上标题,重要的部分标上各种符号,对各种资料按照一定的逻辑结构编上序号等。汇编的步骤113其次:要求汇编好的资料要井井有条、层次分明,能系统完整地反映研究对象的全貌。第三:用简短明了的文字说明研究对象的客观情况,并注明资料来源和出处。114数据资料的整理数据资料是调查研究中定量分析的依据,因此数据资料的整理也叫定量资料的整理。115数据资料的整理一:一般程序在资料的整理阶段,为了便于得出正确的调查结论,需要对数据资料作进一步的处理,其一般程序包括:数字资料检验、分组、汇总和制作统计表或统计图几个阶段。116检验,主要是对数字资料的完整性和正确性进行检验,以确保更加准确的研究结果。一般程序1分组就是把调查的数据按照一定的标志划分为不同的组成部分。一般程序2117汇总就是根据调查研究目的把分组后的数据汇集到有关表格中,并进行计算和加总,集中、系统地反映调查对象总体的数量特征。数据的汇总可分为手工汇总和机械汇总。经过了汇总的数字资料,一般要通过表格或图形表现出来,最常见的方式就是统计表和统计图。一般程序3一般程序4118统计表统计资料的基本表现形式,也是最常见的形式。使得数据具有条理性、清晰易懂、便于比较和分析。形式:标题、纵列标题、横列标题、表体类型:简单表(一组横标目和一组列标目)复合表(多组横标目和一组列标目、一组横标目和多组列标目、多组横标目和多组列标目)119利用点、线、面、体形象、直观地表示统计资料的基本特征和变化趋势。统计图120一、条形图利用平行柱型的长短表示数的大小。适用于分类资料和离散性数量资料的频率分布121二、直方图利用距形面积表示各组中数据出现的频数。适用于连续性资料的频率分布122123三、饼图利用扇形面积表示不同类别的频率,可采用不同的色彩。适用于类别不多的分类资料的频率分布。124125126四、线形图利用曲线表示数据的动态变化趋势。不同的指标可以分别用不同的形式来表示,以示区别127128统计表与统计图统计表:信息量大、精确的数值。不仅反映资料的特征和趋势,还可以提供更详细的信息。统计图:形象、生动、直观主要反映资料的主要特征和趋势经常需要统计表结合统计图来说明问题;根据研究目的灵活应用;统计表应用更多、更常见。129即运用科学的分析方法对所占有的信息资料进行分析,研究特定课题的现象、过程及内外各种联系,找出规律性的东西,构成理论框架。资料分析的定义130对资料的分析,从方法论角度,一般可分为定性分析和定量分析,而且通常在实际分析过程中,要把这两种方法结合起来,交互使用。定性分析与定量分析相互补充,相得益彰,处在统一的连续体之中,定性分析为定量分析提供基础,定量分析的结果要通过定性分析来解释和理解。资料分析的方法131对资料的质的规定性做(整体的)分析,除了要运用一些哲学的观点和方法如辩证唯物主义和历史唯物主义、分析哲学、现象学、解释学等外,主要使用诸如比较、归纳、演绎、分析、综合等逻辑方法;同时还要求对分析结果的信度、效度和客观度等可靠性指标进行检验和评价。文字资料的分析:定性分析方法132定量分析的适用情况第一种情况:如果收集到的资料已经是一些数据,我们只需根据条件和需要选用适当的统计分析方法进行处理和分析便可;133第二种情况:对收集到的定性资料做进一步的定量分析。比如要研究某一学科的结构问题,我们可能收集了这一学科及相关学科的许多版本的教材(包括现在的和过去的),显然首先需要进行比较,如何比较?可能就需要数量化处理,定量分析;还比如要对学生在某一门学科学习中的错误进行分析,收集到各种事实的文字材料之后,定量分析可能也是十分重要的。134定量分析的方法一⑴描述统计,主要用于特征分析,即通过一些概括性量数来反映数据的全貌和特征。135①描述数据集中趋势的量数,如算术平均数,几何平均数,中位数,众数;描述统计方法的分类用来描述数据分布特征的概括性量数主要有:②反映数据间彼此差异的程度的量数,如全距,平均差,方差,标准差;136WACS-RC解释一、FIQ分等理论分布估计范围二、VIQPIQ差异15三、分测验IQ水平平均分100标准差15与常模比较分测验水平:平均分10标准差3与自己比较一个标准差3分强项弱项137③反映原始数据在所处分布中地位的量数,如百分位分数,百分等级分数,标准分数,T分数等;138正态分布标准分系统139④当事物之间存在联系但又不能直接做出因果关系的解释时,可用一些合理的指标对相关事物的观测值进行相关分析,其相关程度用相关系数表示,如有积差相关,等级相关,质量相关(点二列相关、双二列相关);等等。140⑵推论统计,即在无法直接估计总体参数的情况下,只能采用抽样方式对样本进行研究,并由样本统计量对事物的总体做出统计的推论和估计。它包括两个方面内容:①总体参数估计,即根据样本的数字特征推断总体的相应的数字特征,它又有点估计和区间估计之分;②假设检验。在许多研究中(比如比较两种教学方法、两种教材的优劣),首先需要提出一个假设(比如:谁比谁在什么状态下要好或者差或其他),这一假设合理或者正确与否,需要抽取样本用其统计量进行检验。通常根据总体是否从正态分布,将其分为参数检验和非参数检验,前者如Z检验,t检验,X2检验,方差分析等;后者有中数检验,符号检验,符号秩次检验,U检验,秩次方差分析等。定量分析的方法二141⑶多元统计。由于影响教育教学现象的因素不是单-的,而是多方面的、多层次的、多特征的,因而要分析这些因素之间的各种关系需要用多元统计方法。多元分析的基本方法主要有:①回归分析。对于两个具有不确定关系的变量,上述的相关系数可以对其两变量是否相关做出定性描述,对其相关程度做出总的定量描述,但是如何通过自变量的值去估计和预测因变量的发展变化,相关分析无能为力,这时需要用回归分析。它一般分为一元线性回归和多元线性回归两种;②因素分析(和主成分分析)。当描述事物性质的变量比较多时,常常需要从中提取较少的几个主要的一般因素(或称共同因素)(并依据一定的方式对所获得的一般因素作、做出较为合理的解释),这时就需要使用因素分析法;③聚类分析(也称分类分析或数值分类。即凭借变量指标的定量分析对变量实施分类(如果类别已经清楚,只需归类;如果事先并不清楚类别,这时就是寻求一种规则进行新的恰当的分类),使同类的变量比较均质,而不同类的变量差异比较大;还有其它方法,如图分析和模糊综合评判等等。定量分析的方法三142在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:1.算术平均数2.中位数(M)3.众数(Mo)4.几何平均数(Mg)5.调和平均数(H)X集中趋势的度量143意义:作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。例如:不同国家、地区、种族之间身高、体重等的比较;不同品种的家畜、家禽之间生产性能的比较144主要内容:一、算术平均数二、中位数、众数、几何平均数和调和平均数三、5种平均数的关系和评价145算术平均数一、定义一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。最常用的一种集中趋势度量指标。样本的平均数记为总体平均数记为x146xnnnxxixxx211:第i个观察值或变数n:观察值或变数的个数∑:求和符号(sigma)xi计算公式:147一、直接法:例2.1:5头猪的体重分别为70、72、80、83、88kg,问5头猪的算术平均数是多少?)(6.78888380727051kgx从计算结果看5头猪都距78.6(kg)不远,所以平均数是数量资料的代表值。上述计算方法称为直接法,适用于样本小,即资料内包含变数个数不多,一般在30个变数以下未经分组的资料。148二、加权法1.分类资料:每个类别在某个指标上取相同的值。2.计数资料和连续性资料:频率分布表加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。149fxfiiixxi=变数值fi=变数值xi出现的频数计算公式:定义:n个非负数的乘积开n次方的根称为几何平均数,用G表示。ninnXXXXG21为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。nnXXXGGlglglglg)(lglg21111几何平均数151从公式可以知道:几何平均数就是首先将原数据转换为对数;然后求对数值的算数平均数;最后再取反对数还原。几何平均数用于以百分率、比例表示的数据资料,如增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。152加权法:分类资料或计数和连续性资料总观测值个数个体的取值(组中值)组类第类(组)中的频数第类别数:...)(:::3212121fffniXifkXXXGiinfkffkiiXfnGlg1lg1对数形式例2.4P15153定义:各观察值倒数的平均数的倒数inXnxxxnH11111121适用于极端右偏态,例33页调和平均数iiiXffH1简单调和平均数加权调和平均数154从公式可以知道:调和几何平均数就是首先将原数据转换为倒数;然后求倒数值的算数平均数;最后再取倒数还原。调和平均数主要用于速度类资料,或者数据中有个别极端大的值的情况。155定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。中位

1 / 58
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功