统计学原理第一章统计与统计数据一、什么是统计二、什么是统计学三、统计规律四、统计学的应用领域第一节统计与统计学一、什么是统计统计包含三种含义:•统计数据的搜集活动统计工作:•统计工作的结果统计数据:•分析统计数据的方法和技术统计学:工作与工作成果的关系理论与实践的关系一、什么是统计请思考:下列资料中“统计”一词的含义是什么?(1)小王是学统计的(2)他已搞了几十年统计了(3)据统计,今年一季度物价指数出现负增长二、什么是统计学?1.数据搜集:取得数据2.数据分析:分析数据3.数据表述:图表展示数据4.数据解释:结果的说明收集、分析、表述和解释数据的科学统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题二、什么是统计学?观察法实验法筛选纠错找出分组表述描述法推断法描述统计(descriptivestatistics)1.内容◦搜集数据◦整理数据◦展示数据◦描述性分析2.目的◦描述数据特征◦找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105推断统计(inferentialstatistics)1.内容参数估计假设检验2.目的对总体特征作出推断样本总体三、统计规律(内在数量规律性)1.正常条件下新生婴儿的男女性别比为107:1002.投掷一枚均匀的硬币,出现正、反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/63.农作物的产量与施肥量之间存在相关关系四、统计的应用领域统计学经济学管理学医学工程学社会学…统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)统计的应用领域hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)一、统计数据及其类型二、数据的类型和分析方法第二节统计数据及其类型一、统计数据及其类型1.对现象进行计量的结果2.不是指单个的数字,而是由多个数据构成的数据集3.不仅仅是指数字,它可以是数字的,也可以是文字的统计数据的含义统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据一、统计数据及其类型统计数据的分类(按计量层次分)1.分类数据(categoricaldata)◦对事物进行分类的结果◦数据表现为类别,用文字来表述◦例如,人口按性别分为男、女两类2.顺序数据(rankdata)◦对事物类别顺序的测度◦数据表现为类别,用文字来表述◦例如,产品分为一等品、二等品、三等品、次品等3.数值型数据(metricdata)◦对事物的精确测度◦结果表现为具体的数值◦例如:身高为175cm、168cm、183cm统计数据的分类(按收集方法分)1.观测的数据(observationaldata)◦通过调查或观测而收集到的数据◦在没有对事物人为控制的条件下而得到的◦有关社会经济现象的统计数据几乎都是观测数据2.试验的数据(experimentaldata)◦在试验中控制试验对象而收集到的数据◦比如,对一种新药疗效的试验,对一种新的农作物品种的试验等◦自然科学领域的数据大多数都为试验数据统计数据的分类(按时间状况分)1.截面数据(cross-sectionaldata)◦在相同或近似相同的时间点上收集的数据◦描述现象在某一时刻的变化情况◦比如,2007年我国各地区的国内生产总值数据2.时序数据(timeseriesdata)◦在不同时间上收集到的数据◦描述现象随时间变化的情况◦比如,2002年至2007年国内生产总值数据一、总体和样本二、参数和统计量三、变量第三节统计中的基本概念一、总体和样本1.总体(population)◦所研究的全部元素的集合,其中的每一个元素称为个体◦分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限可数的无限总体所包括的元素是无限的,不可数的2.样本(sample)◦从总体中抽取的一部分元素的集合◦构成样本的元素的数目称为样本容量二、参数和统计量1.参数(parameter)◦研究者想要了解的总体的某种特征值◦所关心的参数主要有总体均值()、标准差()、总体比例()等◦总体参数通常用希腊字母表示2.统计量(statistic)◦根据样本数据计算出来的一个量◦所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等◦样本统计量通常用小写英文字母来表示平均数标准差比例参数统计量xsp总体样本三、变量1.说明现象某种特征的概念◦如商品销售额、受教育程度、产品的质量等级等◦变量的具体表现称为变量值,即数据2.变量可以分为◦分类变量(categoricalvariable):说明事物类别的一个名称◦顺序变量(rankvariable):说明事物有序类别的一个名称◦数值型变量(metricvariable):说明事物数字特征的一个名称离散变量:取有限个值连续变量:可以取无穷多个值