主编余勍应用统计学(StatisticsApplication)2014第1章统计概述第2章数据的图表展示第3章数据的概括性度量第8章时间序列第9章指数第10章数据分析应用第4章概率和概率分布第5章抽样与参数估计第6章假设检验第7章相关与回归分析1.统计及其应用领域2.数据的类型3.数据来源4.统计中的基本概念不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天身体超重30%会使寿命减少1300天第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推上课坐在前面的学生平均考试分数比坐在后面的学生高漂亮的女性有损男性的智力。男性在看到漂亮女性时智力会下降,这就是为什么大学里的女孩子比男孩子学习好的原因收集、处理、分析、解释数据并从数据中得出结论的科学1.收集数据:取得数据2.处理数据:图表展示3.分析数据:利用统计方法分析数据4.数据解释:结果的说明5.得到结论:从数据分析中得出客观结论统计方法描述统计推断统计参数估计假设检验1.内容搜集数据整理数据展示数据2.目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=1051.内容参数估计假设检验2.目的对总体特征作出推断样本总体反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据统计学探索现象数量规律性的过程1.下列不属于描述统计问题的是()A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据2.下列叙述中,属于推断统计的是()A.用饼图描述某企业职工的学历构成B.利用36个橘子的平均重量估计果园橘子的平均质量C.计算出某城市1月份的平均汽油价格D.绘制出反映大学生统计学成绩的条形图【例1.1】用统计识别作者1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议。通过对不同单词的频数进行统计分析,得出JamesMadison最有可能是这12篇论文的作者。现在,对于这些存在争议的论文,认为JamesMadison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确的。市场调查股价指数贸易条件指数人口普查GDP增长率恩格尔系数基尼系数天气预报中的降雨概率企业生产中的质量控制统计学企业发展战略质量管理财务分析人力资源管理市场研究…大约在一个世纪以前,政治家本杰明曾有一个著名的论断:“世界上有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家AndrewLang说,一些人使用统计“就像喝醉酒的人使用街灯柱—支撑的功能多于照明”统计滥用(第二第三章详细阐述)不好的样本过小的样本误导性图表局部描述故意曲解统计数据的分类按计量尺度分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据1.分类数据(categoricaldata)(=,≠)•性别:男、女•姓氏:陈、林、李等2.顺序数据(rankdata)(=,≠,﹥,﹤)•大一、大二、大三、大四•非常满意、满意、一般、不满意、非常不满意3.数值型数据(metricdata)(+,-,×,÷)1.身高、体重、收入2.面积……1.观测数据(observationaldata)•高速公路车流量•出勤率•实验数据(experimentaldata)•袁隆平杂优水稻•煮饭时水放多少1.截面数据(cross-sectionaldata)•在相同或近似相同的时间点上收集的数据•描述现象在某一时刻的变化情况•时间序列数据(timeseriesdata)•在不同时间上收集到的数据•描述现象随时间变化的情况指出下面的数据哪一个属于顺序数据()A.5个人的年龄分别是25,22,34,41,33B.性别:男,女C.上市公司所属的行业:金融、房地产、医药、机械D.员工对企业某项改革的态度:赞成、中立、反对通过调查或观测而收集到的数据称为()A.观测数据B.实验数据C.时间序列数据D.截面数据一项民意调查的目的是想确定年轻人愿意与父母讨论的话题。调查结果表明:45%的年轻人愿意与父母讨论家庭财务状况;38%的年轻人愿意与父母讨论有关教育的话题;15%的年轻人愿意与父母讨论讨论爱情问题。该调查所收集的数据是()A.分类数据B.顺序数据C.数值型数据D.实验数据1.3.1间接来源1.3.2直接来源二手数据统计部门和政府部门公布的有关资料,如各类统计年鉴二手数据各类经济信息中心、信息咨询机构、专业调查机构等提供的数据二手数据各类专业期刊、报纸、书籍所提供的资料二手数据各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料二手数据从互联网或图书馆查阅到的相关资料1.收集容易,采集成本低2.作用广泛分析所要研究的问题提供研究问题的背景帮助研究者更好地定义问题检验和回答某些疑问和假设寻找研究问题的思路和途径3.收集二手资料在研究中应优先考虑1.数据是谁收集的?可信度评估2.为什么目的而收集的?3.数据是怎样收集的?4.什么时候收集的?•调查数据通过调查方法获得的数据通常是对社会现象而言通常取自有限总体•实验数据通过实验方法得到的数据通常是对自然现象而言也被广泛运用到社会科学中如心理学、教育学、社会学经济学、管理学等统计调查方式普查抽样调查统计报表人口普查农业普查经济普查概率抽样非概率抽样随机抽样分层抽样机械抽样整群抽样1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体随机样本随机原则:指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有被抽中的可能特点经济性:节省人力、物力、财力和时间时效性:可用较短的时间搜集到所需资料适应性:适用于各领域,各种问题的调查准确性:受人为干扰的可能性较小,调查资料的准确性较高能解决全面调查无法或难以解决的问题可以补充和订正全面调查的结果应用于生产过程上产品质量的检查和控制应用1.为特定目的专门组织的非经常性全面调查2.通常是周期性的3.我国进行的普查主要有人口普查,每10年进行一次,末尾数字为“0”的年份进行农业普查,每10年进行一次,每逢“6”的年份进行经济普查,每5年进行一次,每逢“3”和“8”的年份进行按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据有各种各样的类型经济数据造价20150215东方时空湖南衡山县统计造假5.8亿产值谎报44亿一个退休人员对寄居在家中的一窝燕子很感兴趣,他每天观察并记录燕子飞进飞出的时间,以及它们喂养小燕子的习惯。这种收集数据的方法称为()A.普查B.观察C.实验D.询问在下列叙述中,不正确的是()A.可以从公开发表的资料中获取数据B.民意调查在社会问题研究中广泛应用C.在医疗实验中,参加实验的个人被分成两组:控制组和实验组D.从调查中获取的数据通常比实验中获得的数据更可靠1.4.1总体和样本1.4.2参数和统计量1.4.3变量1.总体(population)所研究的全部个体(数据)的集合,其中的每一个个体也称为元素分为有限总体和无限总体2.样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量(samplesize)总体与参数1.总体(population)是指所研究的全部个体(数据)的集合对总体特征的一些概括性数字度量称为参数(Parameter)总体平均数()总体方差(2)总体比例()手机电池的使用寿命?样本(sample)是从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量(samplesize)用来描述样本特征的概括性数字度量称为统计量(Statistics)样本平均数(x)样本方差(s2)样本比例(p)平均数方差比例参数2统计量xs2p总体样本1.说明现象某种特征的概念(每次观察都有变化)如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据2.变量可以分为分类变量(categoricalvariable):说明事物类别的名称,如“您贵姓啊?”•顺序变量(rankvariable):说明事物有序类别的名称,如“您教育程度如何啊?”•数值型变量(metricvariable):说明事物数字特征的名称,如“您一个月工资多少啊?”典型的统计软件SASSPSSMINITABSTATISTICAExcel1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是(),样本是(),参数是(),统计量是()A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的总收入2、某一大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们每月平均生活费支出是500元。该研究人员感兴趣的总体是(),参数是(),统计量是()•A该大学的所有学生•B该大学所有本科生的月平均生活费支出•C该大学所有本科生的月生活费支出•D所调查的200名学生的月平均生活费支出3、最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”,这一结论属于()A对样本的描述B对样本的推断C对总体的描述D对总体的推断4、根据统计方法的构成,可将统计学分为()A.描述统计学和推断统计学B.描述统计学和应用统计学B.理论统计学和推断统计学D.理论统计学和应用统计学统计学的含义及分类统计数据的类型统计数据的来源统计数据的收集方法有哪些总体与样本的关系与区别变量与统计量的区别变量的类型