Ch2统计数据与统计调查统计学原理§2.1统计现象与统计数据(new)§2.2统计数据的来源(new)§2.3统计调查方案设计§2.4统计数据的误差(new)介绍如何把一个研究对象,抽象成一个数据集。以及通过何种方法去获得所需要的数据。Ch2主要内容•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)•§2.2统计数据的来源(new)•§2.3统计调查方案设计•§2.4统计数据的误差(new)Ch2学习目的1,掌握统计数据与统计调查的关系2,掌握统计数据的来源与种类3,掌握统计调查的形式与种类4,掌握总体与总体单位、标志与指标、文字数据与数字数据等基本概念•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)•§2.2统计数据的来源(new)•§2.3统计调查方案设计•§2.4统计数据的误差(new)§2.1统计现象与统计数据(new)§2.2统计数据的来源(new)§2.3统计调查方案设计§2.4统计数据的误差(new)Ch2统计数据与统计调查统计学原理§2.1统计现象与统计数据§2.1.1统计总体与总体单位§2.1.2统计数据及其种类§2.1.3数据的计量与类型§2.1.4统计标志与统计指标§2.1.5静态数据与动态数据•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)•§2.2统计数据的来源(new)•§2.3统计调查方案设计•§2.4统计数据的误差(new)返回■统计研究的对象是客观现象,而统计研究的基础却是客观现象的数据。在客观现象向数据转换的过程中,存在着以什么样的方式、以多大的范围转换的问题。通常,把研究现象的全部,叫做现象的总体;由现象总体获得的数据全部,称为数据总体。统计上,数据总体和现象总体,常常不加区别,通称统计总体。而由现象获取数据的依据,则是标志和指标。标志和指标,是统计数据的两大来源。§2.1.1统计总体与总体单位•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)图2-1统计现象与统计数据的关系数据数字数据现象文字数据标志指标■统计总体就是由客观存在的、具有某些共同性质的许多个别单位构成的整体,一般简称总体。它是社会经济调查研究的对象,同时也是统计资料所属的主体。■总体单位就是构成总体的各个单位,简称单位,在统计调查时又称为调查数据。■总体与总体单位,都与调查研究目的有关。调查研究的目的,决定着总体单位和总体范围。一个具体的总体单位和总体,常常表现为一些具体的数据和数据集,比如总体单位Xi;i=1,2,3,…,n.统计总体{X1,X2,X3,…,Xn}={Xi;i=1,2,3,…,n.}.(2.1.1)如果n=N,N为有限的数值,则{Xi;i=1,2,3,…,n.}为有限总体;如果n→∞,则{Xi;i=1,2,3,…,n.}为无限总体。§2.1.1统计总体与总体单位•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)【例2-1】研究目的:了解整个社会的收入分配演变情况。于是,社会各个家庭在不同时期的人均收入数据,就是研究总体;每一个具体家庭的人均收入数据,则为总体单位。设社会的家庭数为n,调查得到这些数据总体为1999年{X1,X2,X3,…,Xn}={265(¥/人),378(¥/人),176(¥/人),…,1180(¥/人)}。2000年{X1,X2,X3,…,Xn}={276(¥/人),368(¥/人),206(¥/人),…,1070(¥/人)}。分析整理1999年和2000年的收入总体数据,便可以得到整个社会的收入分配演变情况。§2.1.1统计总体与总体单位•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)返回一、统计数据的形式■统计数据,就是研究总体量的具体取值。统计总体、总体单位是统计数据的源泉。总体单位是构成统计数据的基本单位,一个总体单位,通常可对应着一个统计数据;而统计总体,则表现为一个统计数据集。如{Xi;i=1,2,3,…,n.}={X1,X2,X3,…,Xn}.■数据的种类和形式多种多样。■一般地,从数据的表现形式上,数据可分为品质数据和数字数据两种。品质数据就是文字数据。如果从数据的来源分类,数据又可分为标志数据和指标数据两种。如果从数据变化与时间的关系上分类,则数据分为静态数据和动态数据两种。§2.1.2统计数据及其种类•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)二、统计数据的种类§2.1.2统计数据的种类数据种类数字数据定序数据定类数据定距数据定比数据品质数据文字类别文字类别绝对数平均数、相对数图2-2统计数据的种类及其表示数据种类动态数据数字数据文字数据静态数据数据种类指标数据数字标志数据品质标志数据质量指标数据数量指标数据标志数据文字类别数字绝对数平均数、相对数文字数据数字数据•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)三、品质数据与数字数据■品质数据,就是表示现象属性特征的数据。通常用文字来表示。其中:品质数据,又可分为定类品质数据和定序品质数据。品质数据,通常用于定性。■数字数据,就是表示现象数量特征的数据。数字数据,多用数字来代表数据。数字数据可分为定距数字数据和定比数字数据。定距数据,通常用绝对数表示;定比数据,则用平均数或者相对数表示。数字数据,通常用于定量。■品质数据和数字数据,是数据的两种表现形式。§2.1.2统计数据的种类•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)【例2-2】由n个人群构成的总体{X1,X2,X3,…,Xn},其性别总体为{X1,X2,X3,…,Xn}={男性,男性,女性,…,男性},其身高总体为{X1,X2,X3,…,Xn}={165(cm),178(cm),176(cm),…,180(cm)}。显然,性别总体的每一个数据单位,均是用文字表示,因此,性别总体为品质数据总体;而身高总体的每一个数据单位,均是用数字表示,因此,身高总体为数字数据总体。另外,身高数据的单位为“cm”,“cm”是一个绝对数单位。因此,身高总体为定距数字总体。§2.1.2统计数据的种类•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)返回一,计量尺度和计量方式一个具体的数据现象,具体用什么样的形式表现,与现象总体的计量尺度和计量方式有关。现象总体的计量尺度和计量方式,一般有4种。■定类尺度:→定类数据■定序尺度:→定序数据■定距尺度:→定距数据■定比尺度:→定比数据§2.1.3数据的计量与类型•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)二,定类尺度与定类数据■定类尺度:计量层次最低;对事物进行平均分类;各类别可用指定代码表示;使用时必须符合类别穷尽和互斥的原则;数据表现为“类别”;数据与数据之间,具有或者的数学特性。用定类尺度计量出来的数据,显然是定类数据。【例1-5】由n个人群构成的性别数据总体{X1,X2,X3,…,Xn}={男性,男性,女性,…,男性}。显然,性别总体的每一个数据单位,为男性或者女性。男性或者女性之间,不存在大小顺序关系,只存在或者的关系,因此,性别尺度,就是一个定类尺度;性别数据总体,就是一个定类数据总体。定类数据总体,都是用文字来表示的。§2.1.3数据的计量与类型•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)三,定序尺度与定序数据■定序尺度:对事物分类的同时可给出各类的顺序;比定类尺度精确;未测量出类别之间的准确差值;数据表现为“类别”,数据与数据之间有序;具有>或者<的数学特性。用定序尺度计量出来的数据,则为定序数据。【例1-6】由n个人群构成的总体{X1,X2,X3,…,Xn},其考试成绩数据总体,按等级记为{X1,X2,X3,…,Xn}={良好,及格,中等,…,优秀}。显然,成绩总体的每一个数据之间,不仅存在类别关系,同时还存在大小顺序关系,即“不及格<及格<中等<良好<优秀”的等级关系。因此,等级尺度,就是一个定序尺度;等级成绩总体,就是一个定序数据总体。定序数据总体,都是用文字来表示的。§2.1.3数据的计量与类型•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)四,定距尺度与定距数据■定距尺度:对事物的准确测度;比定序尺度精确;数据表现为“数字”;数据与数据之间,具有+或者-的数学特性。用定距尺度计量出来的数据,是定距数据。【例1-7】由n个人群构成的总体{X1,X2,X3,…,Xn},其身高数据总体,按国际度量衡单位“cm”标记为{X1,X2,X3,…,Xn}={165(cm),178(cm),176(cm),…,180(cm)}。因为,身高总体的每一个数据,均是用数字表示的,而且,数据的度量衡单位“cm”,是一个绝对数单位,因此,数据与数据之间,存在绝对的正负差距关系。所以,度量衡单位“cm”尺度,就是一个定距尺度;身高数据总体,就是一个定距数据总体。§2.1.3数据的计量与类型•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)五,定比尺度与定比数据■定比尺度:对事物的准确测度;与定序尺度处于同一层次;数据表现为“数字”;数据与数据之间,具有×或者÷的数学特性。用定比尺度计量出来的数据,当然是定比数据。【例1-8】由n个家庭构成的总体{X1,X2,X3,…,Xn},其人均收入数据总体,按度量衡单位“¥/人”标记为{X1,X2,X3,…,Xn}={265(¥/人),378(¥/人),176(¥/人),…,1180(¥/人)}。因为,人均收入总体的每一个数据,均是用数字表示的,而且,数据的度量衡单位“¥/人”是一个平均数单位,数据与数据之间,存在相对的对比关系。所以,度量衡单位“¥/人”尺度,就是一个定比尺度;人均收入数据总体,就是一个定比数据总体。【例2-6】由n个日期构成的证券指数总体{X1,X2,X3,…,Xn},按度量衡单位“%”标记为{X1,X2,X3,…,Xn}={1265(%),1378(%),1276(%),…,1170(%)}。因为,证券指数总体的每一个数据,均是用数字表示的,而且,数据的度量衡单位“%”是一个相对数单位,因此,数据与数据之间,亦存在相对的对比关系。所以,度量衡单位“%”尺度,就是一个定比尺度;证券指数数据总体,就是一个定比数据总体。§2.1.3数据的计量与类型•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)六,4种尺度的作用比较■表2—1数据四种尺度及其作用§2.1.3数据的计量与类型数学特性尺度定类尺度定序尺度定距尺度定比尺度分类,或者√√√√排序,>或者<√√√间距,+或者-√√比值,×或者÷√•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)返回一、标志及其特征■所谓标志,就是总体各单位的特征或属性。这种特征或属性,一般表现为一个概念,或者概念及标志表现。■比如,对于统计总体{X1,X2,X3,…,Xn}={Xi;i=1,2,3,…,n.},其总体单位的共同特征或属性为X,显然,X就为这个总体的标志。■标志,可与计量尺度划等号。■标志的具体表现通常也叫标志值。在空白调查表中,没有具体标志表现的标志名称,也是标志,习惯上称为调查项目。§2.1.4统计标志与统计指标•Ch2统计数据与统计调查•§2.1统计现象与统计数据(new)一、标志及其特征【例2-6】由n个人群构成的总体{X1,X2,X3,…,Xn},其性别数据总体为{X1,X2,X3,…,Xn}={男性,男性,女性,…,男性},其身高数据总体为{X1,X2,X3,…,Xn}={165cm,178cm,176cm,…,180cm}。可以看到,在性别总体的n个数据中,不论其数据是“男性”还是“女性”,但其中的每一个数据,均与“性别”有关,因此,“性别”就是这n个数据的共同属性特征,“性别”就是性别数据的标志。同理,数据集{165cm,178cm,176cm,…,180cm}的每一个数据,均与“身高”有关,因此,“身高”