江西财经大学统计学第一章数据与统计学-.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

STAT第一章数据与统计学第一章数据与统计学STAT本章重点1.数据类型2.统计学基本概念3.统计学研究方法本章难点1.统计学基本概念第一章数据与统计学STAT第一节数据的定义、测量尺度和类型一、数据及信息、知识的定义数据是关于变量的观测值。是数字化的信息记录。信息是把数据置于特定背景下,对数据的解释和注释,赋予数据的具体意义。在信息化时代,通常把存储在计算机或硬盘中的各类信息也称为数据,即泛数据。第一章数据与统计学STAT知识是人类识别万物实体和性质,以及是与不是的信息集合。是人类认识自然、改造自然过程中实践经验的总结。45;某某人今年是45岁;某某地区的平均年龄是45岁二、数据的测量尺度对事物进行分类的依据:定类尺度;定序尺度;定距尺度;定比尺度。四类尺度的区别:1.定类、定序尺度没有确定的计量单位;定距、定比尺度有确定的计量单位;2.定类、定序变量不能进行数学计算;定距、定比变量的值均以数字表示,能进行数学计算。第一章数据与统计学STAT3.定距尺度没有绝对意义上的零点;定比尺度有绝对意义上的零点。4.定距尺度只能加减运算;定比尺度能加减乘除运算。三、数据的类型1.按测量尺度不同分:定性数据(定类数据、定序数据)和定量数据(定距数据、定比数据)(1)定类数据:是对事物进行分类的结果,表现为类别。只能用文字或数字代码来表现。例:性别(男,女)(2)定序数据:是对事物按一定顺序进行分类的结果,表现为有顺序的类别。只能用文字或数字代码来表现。第一章数据与统计学STAT如学生成绩表示为优、良、中、及格、不及格;消费者对其产品的满意度表示为很满意,…,很不满意。(3)定距数据:是一种不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间的数量差距的数据。一般只适合加减运算。没有绝对意义上的零点!如,两学生的成绩分别为85分和55分,前者良好后者不及格,前者高于后者,前者高后者30分;摄氏温度;企业利润。(4)定比数据:是一种不仅能体现事物之间的数量差距,还能通过对比运算来体现相对程度的数据。加减乘除皆可。有绝对意义上的零点!第一章数据与统计学STAT2.按表现形式不同分:绝对数、相对数、平均数。3.按来源不同分:观测数据和实验数据。观测数据:在自然的未被控制的条件下观测到的数据。实验数据:在人工干预和操作情况下收集的数据。4.按加工程度不同分:原始数据和次级数据。5.按时间和空间状态不同分:序列数据和截面数据。截面数据:在同一时刻或几乎同一时点所收集的数据。序列数据:在若干时期内所收集到的数据。注意:定量数据又分为离散数据和连续数据。第一章数据与统计学STAT第二节一些基本概念※一、总体、个体与样本(一)总体1.定义:客观存在的①在同一性质基础②上结合起来的许多个别事物③的整体④。或:包含所研究的全部个体(数据)的集合。2.总体的特征(1)大量性:总体的个体必须是大量的(足够多)。统计的目的是反映大量现象的规律和特点。(2)同质性:总体的个体在性质上须相同,因为统计研究第一章数据与统计学STAT的目的是反映总体的特性。例如,将机械零件与书本放在一起,就不会得出整个总体的任何结论。→统计的基础(3)差异性统计的前提。3.总体的分类(1)按包含的个体数目可分:有限总体与无限总体。(2)按个体的时空状态分:空间总体(个体处于同一时间的不同空间),如人口普查时的全国总人口。时间总体(个体处于同一空间的不同时间),如某商店一年的销售情况。4.总体范围的确定有时容易,如一批灯管的寿命;有时难,如一种新饮料的消费对象。依据研究目的来定义第一章数据与统计学STAT(二)个体(总体单位)→构成总体的个别事物(三)样本1.定义从总体中抽取出来进行观测并据以推断总体的一部分个体。样本中包含的个体数目称为样本容量,用n表示,n30,大样本,反之,小样本。样本容量n与总体容量N的比,n/N称为抽样比。注意样本概念的重要性!总体样本第一章数据与统计学STAT2.样本的类型(1)代表性样本■若样本单位频数与总体的单位频数成正比,则这种样本称之为代表性样本。样本单位频数是某种特征的样本单位占总样本单位数的比例。总体的单位频数是某种特征的个体占总体的比例。(2)有偏样本在人为因素影响下抽取的样本称为有偏样本,是产生抽样偏差的来源。(3)随机样本按随机原则抽取的样本。第一章数据与统计学STAT(4)分层样本(类型样本)先将总体按某一标志分成若干组,再从各组中随机抽样。(5)整群样本按群抽样的样本。(6)系统抽样样本按系统抽样方法抽取的样本。思考:调查北京市民对交通规则的观点,总体、个体、样本各是什么?注意社会经济统计与数理统计表述的不同!第一章数据与统计学STAT二、标志与指标(一)标志:反映总体中个体特征的名称。不是具体数字。(A人)性别民族身高年龄(B厂)产值职工人数男汉1.75211000万元50人标志值:标志在各个个体上的取值。具体表现为数值或文字。种类:■按其结果的表示方式不同分:品质标志→反映属性特征数量标志→反映数量特征■按其在每个个体上的表现结果是否相同分:不变标志和可变标志第一章数据与统计学STAT(二)指标:反映总体数量特征的名称。[例]2004年①A县②所属500家工业企业产值③为100亿④元⑤,职工人数为56万人。指标的构成要素■内核指标名称;指标数值;■外延时间限制;空间限制;计量单位;计算方法。第一章数据与统计学STAT2.指标的分类■按所反映的数据特点不同分:数量指标和质量指标数量指标总体总规模、总水平。表现形式:绝对数,有名数。[例]2004年A地区所属500家工业企业年产值为100亿元,职工人数为56万人。质量指标现象间数量联系。表现形式:相对数或平均数;无名数或复名数人分人分总人数总成绩某班平均成绩/8010800人亿人万公里人口数铁路长度人均铁路长度/53.51319.7cm第一章数据与统计学STAT■按所反映的数据表现形式不同分:总量指标(绝对数指标)、相对指标、平均指标■按所反映的数据计量单位不同分:实物指标与价值指标■按所反映的数据时间状态不同分:时期指标与时点指标3.指标与标志的关系联系:标志值是计算指标值的依据,两者同属变量范畴。数量指标值=总体各单位某方面数量标志值。某班统计学总成绩=该班每一同学统计学成绩。第一章数据与统计学STAT区别:★反映的对象不同。标志个体(总体单位),指标总体。★反映的方式不同。标志品质特征、数量特征;指标数量特征。下列标志中属于品质标志的有()A.学历;B.籍贯;C.成绩;D.身高;E.职称;F.性别下列指标中属于质量指标的有()A.总产量;B.亩产量;C.播种面积;D.价格;E.单位产品原材料消耗第一章数据与统计学STAT三、变异与变量(一)变异:个体不断转换状态的现象。大量存在→统计的前提mAmAmA16.1618.1620.1610021岁岁岁儿童身高年龄广西男北京男四川男和尚贯籍别性10021BBB第一章数据与统计学STAT言行变异说金钱是罪恶,都在捞;说美女是祸水,都想要;说高处不胜寒,都在爬;说烟酒伤身体,都不戒;说天堂最美好,都不去!(二)变量:说明现象某种特征的概念(或可变的标志与指标)。特点:从一次观察到下一次观察会呈现出差别或变化。[例]2011年A地区25个县的GDP为120亿元,人口数为800万人。1.离散变量(取值是间断的)和连续变量(取值是连续的)。2.定性变量和定量变量。3.自变量和因变量解释变量和被解释变量4.确定变量和随机变量(一节车厢座位数和乘客数)第一章数据与统计学STAT四、参数和统计量推断统计中的概念(一)参数:用来描述总体特征的指标。是研究者想要了解的总体的某种特征值。是未知的常数。(二)统计量:用来描述样本特征的指标。样本的随机性决定了统计量是随机变量。NXNNPNX221)(1)(ˆ221nxxsnnPnxx第一章数据与统计学STAT第三节统计学的研究方法一、大量观察法→对事物的全部或足够数量进行观察的方法试验者掷硬币试验次数出现正面次数出现正面频率蒲丰皮尔逊皮尔逊4040120002400020486019120120.50690.50160.50051936年美国的选举情况RooseveltLandon样本容量《文学摘要》盖洛普选举结果43%57%56%44%62%38%240万人5万人——《文》:通过电话簿或俱乐部会员册搜集地址发出问卷第一章数据与统计学STAT二、综合分析法(统计分组法和综合指标法)→从数量方面对现象总体的规模及其特征的概括说明。综合汇总说明规模;分析分组说明特征领导素养地区GDP(亿元)比重%人均GDP(元)人口出生率‰总计东部中部西部6779539270189799596100.057.928.014.1556978894396344916.9811.5714.9219.79第一章数据与统计学STAT三、归纳推断法1.演绎推断:一般(总体)个别(个体)。甲班同学身高1.85米,A是甲班的A的身高1.85米。前提正确结论正确;前提范围结论范围。2.归纳推断:个别(个体)一般(总体)。甲班的A同学身高1.85米,B同学身高1.85米甲班同学的身高均低于1.85米。前提正确结论未必正确;前提范围结论范围。总体指标的推断、统计模型参数的估计、时间序列的外推预测都存在误差和置信度的问题。第一章数据与统计学STAT★预测与推断:参数估计、假设检验、相关与回归等。★推断与臆测的区别:误差程度的控制,概率保证的推算。★统计学与数学的思维区别:统计学→以归纳为主要思维方式;数学→以演绎为主要思维方式。四、统计模型法1.对相关现象之间数量变动关系进行定量研究。如回归分析2.统计模型三要素:变量、数学方程、模型参数第一章数据与统计学STAT课堂练习1.按测量尺度分,下列数据是哪一类型数据?(1)性别:男,女(2)体重:123,140.2等(3)汽车速度:78,64,45等(4)温度:78,64,85等(5)兄弟姐妹个数:2,5,6(6)成绩:A,B,C等(7)企业经营收入:100万(8)企业利润:10万第一章数据与统计学STAT2.下列变量中,何为连续变量?A.身高B.体重C.年龄D.毕业生人数E.学分F.设备台数G.设备利用率答:A、B、GC?3.若对全国工业企业生产设备的使用状况进行普查,则统计总体为()A.全国企业的所有生产设备B.全国工业企业每台生产设备C.全国工业企业每台设备D.全国工业企业所有生产设备答:D第一章数据与统计学STAT4.某学生某门课考试成绩为80分,则“成绩”是()A.品质标志B.数量标志C.标志值5.某学生某门课考试成绩为80分,则“80”分是()A.品质标志B.数量标志C.标志值6.全国人口普查时,()A.全国人口数是统计总体B.每个人是总体单位C.全部男性人口数是统计指标D.人口的性别是总体的标志E.人的年龄是变量答:B、C、E7.下列名称何为品质标志?A.职业B.成绩(等级制)C.健康状况D.女性E.姓名答:A、B、C

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功