第二章统计图表1

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章统计图表一、数据收集二、数据的初步整理三、次数分布表四、次数分布图五、其他类型的统计图表第一节数据收集如何进行数据收集(一)确定为什么要收集数据,也就是说弄明白收集数据是为了说明或是解决什么问题举例:菏泽学院2013级学生每周上网的时间(二)确定是用普查还是抽样调查的方式收集数据(三)如果确定是通过抽样调查,那么就需要设计如何来抽样(四)用“好”的测试工具对样本进行测试,获得数据(测量课)(五)录入数据(操作课上讲)(一)抽样调查研究的特点和作用1、节省人力及费用2、节省时间,提高调查研究的时效性3、保证研究结果的准确性(二)试着评价下面抽样的方法想了解菏泽学院大学生对于甲型H1N1流感的认识,9月8日9:00开始,头50名走进文科楼的大学生组成的样本想了解某校大学生最喜欢的电影演员是谁,有人在该校园bbs上发起一个投票活动,想表达意见的学生都可以上网投票。截止9月8日零时,所有在网上投票的学生组成的样本它们都是有偏抽样(三)几种重要的随机抽样方法1、简单随机抽样包括抽签法和随机数字法抽签法是把总体中的每一个体都编上号码,并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本随机数字法是由一些任意的数字毫无规律地排列而成的数字表。使用随机数字表进行抽样时,先给总体编号,然后从表中任意一个数字开始一次往下数,并把最后几位数字小于总体编号数字的选出,按研究要求组成一个样本。附表192、等距抽样又叫系统抽样,在实施时,将已编好号码的个体排成顺序,然后每隔若干个抽取一个。如果总体具有某一种周期性变化,则等距抽样的代表性远不如简单随机抽样3、分层随机抽样按照总体已有的某些特征,将总体分成几个不同的部分,再分别在每一部分中随机抽样。原则是:各层内的变异要小,层与层之间的变异越大越好关于抽样调查的一点说明•样本不能完全准确地反映总体的情况–样本量越大,样本准确性就越高–有一些统计方法上的处理来控制这种不准确性小结:知识的实际运用•相信某项抽样调查数据之前该了解的事项–谁做的调查?–总体是什么?–样本是怎样选取的?–样本量有多大?–回应率是多少?–具体的提问方式是怎样?第二节数据的初步整理一、数据排序二、统计分组三、绘制统计表或统计图一、数据排序(一)定义:数据排序就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。主要是对连续数据进行排序,为统计分组进行准备。(二)地位:是整理数据最简单的方法二、统计分组(一)定义又叫统计分类,根据被研究对象的特征,将所得数据划分到各个组别中去。(二)步骤1、分组前的准备对观测数据进行核对和校验,如果有充分的理由证明数据需要剔除(3个标准差原则),则剔除,但是切记随心所欲的剔除不符合自己主观假设的数据2、分组的标志性质类别,即根据事物的属性不同将被观测的事物划分。如根据年龄、性别、出生地等等数量类别数据按照数值大小分组三、统计表与统计图(一)教育与心理研究中使用的统计表是三线表,即顶线、底线和栏目线(二)统计图统计图一般采用直角坐标系,通常横坐标表示事物的组别或自变量X,纵坐标表示事物出现的次数或因变量某公司关于其部门主管的尽职情况,对80名员工进行了调查,结果显示,认为非常不尽职的有9人,不尽职的有30人,不置可否的有10人,尽职的有25人,非常尽职的有6人。请将该调查结果用三线表表示出来请将该调查结果用统计图表示出来员工对主管尽职情况的评定人数非常不尽职9不尽职30不置可否10尽职25非常尽职6表180名员工对部门主管尽职程度调查结果三线表的组成要素:表号、名称、顶线、表线、底线、分类标目、数字、表注图180名员工对部门主管尽职程度评价统计图统计图的组成要素:图号、图题(图的名称)、图目、图尺、图形第三节次数分布表计数数据:简单次数分布表连续数据:分组次数分布表相对次数分布表累加次数分布表双列次数分布表不等距次数分布表一、简单次数分布表(一)定义根据每一个分数值在一列数据中出现的次数或总计数据资料编制成的统计表(二)数据类型:计数数据员工对主管尽职情况的评定人数非常不尽职9不尽职30不置可否10尽职25非常尽职6表180名员工对部门主管尽职程度调查结果二、分组次数分布表定义:当数据量很大时,应该把所有的数据先划分为若干分组区间,然后将数据按数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了次数分布表数据类型:连续数据,只能手动编制(一)编制步骤(二)优缺点(一)编制步骤1、求全距最大值减去最小值2、决定组距与组数组距=全距/组数分组数目多,则组距小,计算精确,但这要求数据量大,否则会出现有的组距内无次数分布的现象如果分组少,组距就大,计算简单,但利用分布表的数据进行计算时误差较大组数3、列出分组区间又叫组限,最高组区间应包含最大的数据,最低组区间应包含最小的数据组限包括表述组限和精确组限(又称实际组限)例表述组限为10-19,20-29,30-39,40-49其对应的精确组限是[9.5-19.5),[19.5-29.5),[29.5-39.5),[39.5-49.5)在呈现表格时,各分组区间使用表述组限,而且通常只用整数写下限值,然后在右侧画一横线所以上述例子可写为画线登记次数(类似于正字计数法)计算次数,并进行核对后,取消画线登记次数一栏,重新制表。表第一列为分组区间,第二列为组中值,第三列为次数组中值=(精确组上限+下限)/2练习:利用52页第4题的数据绘制分组次数表(二)分组次数分布表的优缺点1、优点:可将一堆杂乱无序的数据排列成序可以发现各个数据的出现次数是多少,数据的大体分布状况2、缺点:原始数据不见了,只见到各分组区间及各组的次数,根据这样的统计表计算得到的平均值,会与用原始数据计算的值有一定的差异。这个误差称为归组效应。分组数目越少,误差越大三、相对次数分布表相对次数即用次数除以总个数(称其为频率)或次数除以总个数后再乘以100%(称其为百分次数)四、累加次数分布表(一)累加次数即把各组的次数由下而上(称为向上累加次数),或由上而下(称为向下累加次数)累加在一起,最后一组的累加次数应等于数据的总次数(二)作用:便于了解某一分组区间上限以下的数据总数或下限以上的数据总数五、双列次数分布表(一)定义:又称为相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布(二)编制步骤1、按照分组次数分布表的编制方法,分别列出各变量的分组区间,将一列变量的分组区间竖列,另一变量横列。竖列的小数端在下,大数端在上,横列的小数端在左而大数端在右2、登记时每次同一对变量同时登记在相应的格内六、不等距次数分布表如果等距分组不能确切的反映实际情况时,可采取不等距分组如工资级别,年龄分组思考:什么情况下用不等距次数分布表当数据的分布跨度不均等时,比如某公司的收入情况是:普通职员2000左右,主管3000元左右,经理4000元左右,董事长2万元左右第四节次数分布图•一、数据类型:连续型数据•二、次数分布图类型(一)直方图(二)次数多边形图(三)累加次数分布图(一)直方图•1、定义:以矩形的面积表示连续型随机变量次数分布的图形。•2、特点:横轴为各分组区间的表述下限,刻度从任何合适的数字开始,与数据的分布范围和组距有关。纵轴表示数据的频数,从零开始。3、绘制步骤:以组距为底边,以前后组的表述下限为底边二端点,以次数为高画矩形,各直条矩形之间没有间隔4、特殊属性:每个矩形面积表示每组次数分布,如果将总面积定为1,那么直方图中每一部分矩形的面积就是该矩形表示的次数与总次数的比值5、优点:更生动直观,可以观察出各组次数多少,分布是否对称,是峻峭还是低平6、另一种形式:组织图,即不画矩形,使直方图包围的面积呈封闭的图形(二)次数多边形图1、定义:表示连续性随机变量次数分布的线性图2、特点:(1)横坐标是各分组区间的组中值,纵坐标是数据的频数,连接各点,成为折线(2)为使计算面积与直方图相等,将折线两端画至前一组及后一组的组中值点,这样便连接成一个多边形了3、优点(1)轮廓显示的更好(2)可用于多个同质的次数分布的比较如果各次数分布的总次数不等,那么需要将次数用相对次数表示,并且组距相同(因为同质,所以这一点可以保证),即可以在同一个图中,表示两个或两个以上不同总数的次数分布,如此绘制的图叫相对次数分布图(三)累加次数分布图1、累加直方图2、累加曲线1、累加直方图绘制要求:横坐标为分组区间的表述下限,纵坐标是累加次数,其余步骤同绘制直方图的要求一样。优点:可以清楚地看出某精确上限以下的累加次数2、累加曲线(1)绘制要求:画法同次数多边形图基本相同,但是横坐标为每个分组区间的表述下限,纵坐标是各分组的累加次数,连接所有的累加次数即可画成累加曲线。等同于将累加直方图的各组矩形的右顶点连接绘制而成(2)特点:累加曲线的形式总是上升的,没有下降的情况(3)累加曲线的形状包括正偏态、负偏态、正态次数分布表:次数分布图:简单次数分布表分组次数分布表直方图、次数多边图相对次数分布表累加次数分布表累加次数分布双列次数分布表图(累加直方图、累加曲线)不等距次数分布表第五节其他类型的统计图表•一、次数分布表之外的统计表•(一)简单表•(二)分组表•(三)复合表(一)简单表只列出名称、地点时序或统计指标名称的统计表(二)分组表只有一个分类标志的统计表(三)复合表统计分组的标志有两个或两个以上的表。二、次数分布图之外的统计图(一)条形图(间断性变量)(二)圆形图(间断性变量)(三)线形图(连续性变量)(四)散点图(连续性变量)(一)条形图1、数据类型:离散型数据(计数数据)2、条形图中一个轴是分类轴,表示类别,描述计数数据,另一个轴是数量轴,表示大小多少,描述计量数据3类别:简单条形图、分组条形图、分段条形图4绘图注意事项(1)尺度必须从零点开始,要等距分点(2)条宽与间隔的比例要适当,宽度与数量大小无关,但过宽或过窄会影响美观(3)在分组和分段这种复式条形图中,互相比较的长条拼在一起,不留空隙6条形图与直方图的比较(1)描述的数据类型不同。条形图用来描述称名数据或计数数据,而直方图主要用来描述分组的连续型数据(2)表示数据多少的方式不同。条形图用直条的长短来表示数据的多少和大小,而直方图用面积表示数据的多少和大小。(3)坐标轴上的标尺分点意义不同。条形图的一个坐标轴是分类轴,而直方图的一个坐标轴是另一个刻度值(4)图形直观形状不同。条形图之间有间隔,直条与直条之间的间隔大小没有任何关系,不表示任何意义,直方图各个直方块之间紧密相接,没有间隙(二)圆形图1、数据类型:间断性资料2、作用:显示各部分在整体中所占比重大小,以及各部分之间的比较3、绘图注意事项(1)基线确定后,各部分按照顺时针方向由大而小排列(2)比较两种性质类似的资料时,二圆的直径应相同,图中各部分排列顺序要一致4、绘制圆形图的步骤•求出各组成部分所占的百分比•求出各部分的中心角度•以顺时针方向画出扇形•标出不同颜色及百分比总数量某一成分数量360总数量某一成分数量(三)线形图1数据类型:连续性数据2作用:表示两个变量之间的函数关系,或描述某现象在时间上的发展趋势,或一种现象随另一种现象变化的情形3地位:线形图是教育与心理学实验报告中最常用的图示结果的方法4类型(1)折线图:直方图中每个条形顶部的中点连接而成(2)曲线图:折线分布修匀后比较平滑的线形图绘图注意事项(1)横轴表示时间或自变量,纵轴表示频数或因变量(2)纵轴从零点开始(3)线条要粗于坐标纸格线(四)散点图定义:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性。作用:以圆点分布的形态表示两种现象间相关程度比较:条形图、圆形图:两个类别变量线形图:一个类别变量与一个连续变量散点图:两个连续变量的相关随堂练习

1 / 67
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功