统计学基础课件(第一章)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

12017年9月2第一章统计和数据1.1统计及其应用领域1.2统计数据及其类型1.3统计中的基本概念1.1统计及其应用领域什么是统计从不同的角度理解可以有三种含义:1.统计工作——对社会经济现象的数量方面进行搜集、整理、分析研究所做的工作。如:“你是不是搞统计的?”2.统计资料——指反映社会经济现象的数量方面的数字及文字资料。如:“据统计”。3.统计学——系统论述统计工作原理和方法的科学。如:“我正在学统计”。341.1统计及其应用领域一、什么是统计学1.数据收集:取得数据2.数据处理:图表展示数据3.数据分析:分析数据4.数据解释:结果的说明统计学是收集、处理、分析、解释数据并从中得出结论的科学什么是统计学?1.收集数据CollectingData例:问卷调查Survey2.表示数据PresentingData例:图表Charts&Tables3.描述数据CharacterizingData例:平均值Average为什么?数据分析DataAnalysis做出决策Decision-Making?1984-1994T/MakerCo.统计学分类67描述统计示例89描述统计示例我国高等学校历年毕业生人数(万人)14.731.639.353.257.661.461.460.457.163.780.583.982.98384.7694.98133.7187.7239.133841349555961063155.316.5103.6301002003004005006007001978198519871989199119931995199719992001200320052007200910推断统计示例11饲养场规定,肉鸡平均体重超过3千克时方可屠宰,现随机抽取20只,测得平均体重为2.95千克,方差为0.2千克,请问,该批鸡是否达到屠宰标准?12某产品广告投入和销售额数据(单位:万元)广告1.03.23.25.55.97.17.39.210.812.1销售额9.431.833.252.453.556.056.959.260.163.51.这两个变量之间是否有关系?2.如果有关系,它们的关系是否显著?3.二者是什么关系?是否可以用数学模型来描述?推断统计示例13二、统计学的应用领域统计学经济学管理学医学工程学社会学食品科学统计学的应用领域14文学也用到统计学1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论红楼梦作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。15三、统计的误用与滥用问:统计资料表明,大多数汽车事故发生在中等速度的行驶中,极少数的事故是发生在大于150公里/小时的行驶速度上。这是否就意味着高速行驶比较安全?16答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是发生在中等速度的行驶中问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州死于肺结核的人多。这是否就意味着亚利桑那州的气候容易生肺病?答:正好相反。亚利桑那的气候对生肺病的人有好处,所以肺病患者纷纷前来,自然就使这个州死于肺结核的平均数升高了。171.2统计数据及其类型181920产品质量分为一等品;二等品;三等品。评价分数为优;良;差。劳动效率分为高;中;低。1.2数据的类型分类数据(categoricaldata)人口按性别分为男;女。职业分为国家机关、党群组织工作人员、企事业单位管理人员;各类专业、技术人员;办事人员和有关人员;商业与服务业人员;农林牧渔业生产人员;生产人员,运输人员和有关人员;军队;不便分类的其他劳动者8类。顺序数据(rankdata)人的身高分为168cm;175cm;183cm。销售利润为30万元;50万元;80万元。年薪为20万元;35万元;50万元。数值型数据(metricdata)分类标准:计量尺度21对课本第6页的解释2223在实验中控制实验对象而收集到的数据。1.2数据的类型观测数据(observationaldata)在没有对事物人为控制的条件下而得到的数据。实验数据(experimentaldata)分类标准:收集方法24第三产业对国民经济的拉动作用,1990年为0.6,1995年为2.9,2000年为2.9,2005年为4.2,2006年为4.9,2007年为5.1。1.2数据的类型截面数据(cross-sectionaldata)2009年中国GDP达到33.53万亿元,城镇居民人均可支配收入17175元,农村居民人均纯收入5153元。时间序列数据(timeseriesdata)分类标准:时间状况25对课本第7页的解释262728§1.3统计中的基本概念一、总体和样本二、参数和统计量三、变量29一、总体和样本1.总体(population)总体是所研究的全部元素的集合,其中的每一个元素称为个体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的30研究食品3学生的学习情况总体全班所有的学生个体每一个学生广州市的工业生产情况所有的工业企业每一个工业企业广州的工业生产设备情况每一台工业生产设备所有的工业生产设备总体总体个体个体312.样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本量32总体个体样本个体个体个体总体和样本3334练习35练习363738二、参数和统计量1.参数(parameter)用来描述总体特征的概括性数字度量参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示2.统计量(statistic)用来描述样本特征的概括性数字度量样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示3940总体参数一般是不知道的统计学抽样研究的目的就是:样本统计量总体参数41三、变量1.说明现象某种特征的概念如性别、民族、身高、体重、成绩、合格率等变量的具体表现称为变量值,女、苗族、1.68米、50公斤、优等即为变量值也称为数据2.变量可以分为分类变量:说明事物类别的一个名称顺序变量:说明事物有序类别的一个名称数值型变量:说明事物数字特征的一个名称离散变量:取有限个整数值连续变量:可以取无穷多个小数值42离散型变量人数20人、50人、82人、123人等连续型变量身高1.60米、1.61米、1.62米等例如变量值变量值43练习1.某大学有1000名男教师和500名女教师,为了了解教师的生活状况,从1000名男教师中随机抽取了100名,500名女教师中随机抽取了50名。(1)指出这一研究的总体、个体、样本;(2)指出这一研究的参数;(3)指出这一研究的统计量;(4)这一研究涉及的是截面数据还是时间序列数据。2.要调查某家电商场洗衣机的销售情况,试指出总体、个体是什么?并举出至少一个分类变量、顺序变量、数值型变量。

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功