统计学第一章1.统计的含义、特点2.统计总体和总体单位3.标志与统计指标第二章调查对象和调查单位、报告单位统计调查的分类按收集资料的组织形式按调查对象包括的范围统计调查的组织方式•统计报表•普查•重点调查•典型调查•抽样调查第三章1.统计分组的作用划分现象的不同类型说明现象的内部结构揭示现象之间的依存关系第三章2.编制频数分布表的步骤:分组计算各组频数3.某行业管理局所属32家企业2007年的产品销售收入数据(单位:万元)1521241291161001039295105119114115871031181421171081051101071371201369888123115119138112146根据上面的数据进行适当分组,编制频数分布表。4.按组距方式分组:第一组55—65;第二组65—75;第三组75—85;第四组85以上,则数据()A.65在第一组B.75在第二组C.75在第三组D.85在第三组5.频数分布表中各组频率的总和应该()A.小于1B.等于1C.大于1D.不等于1不同统计图的适用用法•线图•散点图•饼图•条形图•直方图第四章总量指标和相对指标•总量指标的概念和分类•六种常用的相对指标–结构相对指标–比例相对指标–比较相对指标–强度相对指标–动态相对指标–计划完成程度相对指标平均指标和变异指标加权算术平均数调和平均数众数中位数方差离散系数异众比例均值-加权算术平均数设分组后的各组的标志值为:x1,x2,…,xk相应的频数为:f1,f2,…,fk则,加权算术平均数的计算公式为:kiikiiikkkffxffffxfxfxx11212211均值-调和平均数设分组后的各组的标志值为:x1,x2,…,xk各组相应的标志总量为:m1,m2,…,mk则,调和算术平均数的计算公式为:kiiikiikkkmxmmxmxmxmmmmH11221121众数、中位数众数:出现次数最多的变量值;中位数:数据排序后处于中间位置上的值;Me50%50%方差反映了各变量值与均值的平均差异;计算公式:nxxnii122)(kiikiiiffxx1122)(未分组数据:组距分组数据:6.在某个核算年度内,两个建筑施工单位采购同一种建筑材料的价格和批量情况如下表。试分别计算两个施工单位的平均采购价格。采购单价(元/吨)采购金额(万元)A单位B单位751501008012010010010010065130100150150100合计6505007.根据某城市50户家庭调查结果,将每户家庭按其每月旅游开支(单位:元)分组后,得到如下的频数分布资料:每月旅游开支(元)家庭户数200以下2200~3008300~40010400~50012500~6008600~7006700以上4合计50计算该城市平均每户家庭的旅游开支、方差。8.为研究少年儿童的成长发育情况,某研究所的一位调查人员在A城市抽取100名7岁—12岁的少年儿童作为样本,其平均身高为148CM,标准差为5CM;另一位调查人员则在B城市抽取了100名7岁—12岁的少年儿童作为样本,其平均身高为152CM,标准差为9CM。请问,哪个城市少年儿童的平均身高更具代表性?9.一条成品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?时间周一周二周三周四周五周六周日产量(件)385036703690372036103590370010.某班学生某一门课程的考试成绩如下:考分百分比(%)50~60460~701670~804080~903090~10010合计100请计算该班该门课程的平均成绩。第五章时间数列的水平分析和速度分析发展水平平均发展水平增长量(逐期增长量,累计增长量,平均增长量)发展速度(定基发展速度,环比发展速度,平均发展速度)增长速度(定基增长速度,环比增长速度,平均增长速度)增长1%的绝对值绝对数相对数平均数-1时间数列的构成要素TSCI第六章统计指数的概念和分类指数化因素和同度量因素加权综合指数、平均数指数——拉氏指数(数量)——帕氏指数(质量)指数体系与因素分析常用价格指数第七章抽样的组织方式•简单随机抽样•类型抽样•等距抽样•整群抽样•多阶段抽样抽样误差•抽样平均误差•抽样极限误差区分第七章单一总体均值的区间估计(方差已知或大样本)单一总体均值的区间估计(方差未知且小样本)单一总体比例的区间估计总体均值区间估计时样本容量的确定总体比例区间估计时样本容量的确定单一总体均值的区间估计(方差已知或大样本)方差已知或大样本1.假设:已知总体标准差;总体正态分布;如果不是正态,可被正态分布逼近(样本容量n30)2.置信区间:nZx.2/单一总体均值的区间估计(方差未知且小样本)方差未知且小样本1.假设:总体标准差未知;总体服从正态分布;样本容量n30;2.置信区间:nstxn.1,2/单一总体比例的区间估计1.假设:总体服从二项分布;可以用正态分布近似估计,即np5且n(1-p)5;3.置信区间:2.引理:)1,0(~)1(/)(000NnppppnppZp)1(.002/0样本容量的确定估计总体均值时:估计总体比例时:22/22znE2/221znE8.某高中随机抽查了10个高二的男学生,平均身高170厘米,标准差12厘米。(1)用矩估计法估计该高中高二男生的平均身高;(2)若该高中高二男生的身高服从正态分布,问该高中高二男生平均身高的所在范围(α=0.05)。9.某工业区有300家企业,用简单随机重复抽样的方法抽出50家作为样本,调查其年利润额,资料如下:年利润额(万元):1200130015001600企业数(家):5152010要求:(1)用矩估计法估计该工业区企业的平均年利润额及其方差;(2)以95%的可靠性估计该工业区企业的平均年利润额和利润总额的区间。10.某地区为了解该地区贫困家庭的生活情况,随机抽取200户家庭,其中20户在国家规定的生活贫困线以下,请问在95%的置信水平下,该地区有百分之多少的家庭在国家规定的生活贫困线以下?11.一项研究计划估计在一片森林中平均每年一棵树长高了多少,研究人员准备用95%的置信水平,并希望估计出的均值的误差不超过0.5cm。以前的研究显示样本的标准差为2cm。请问,这项研究的样本容量需要多大才能满足要求?12.在简单重复随机抽样时,当允许误差缩小一半,则n要()A.缩小4倍B.增大4倍C.增大2倍D.缩小2倍13.在其它条件不变的情况下()A.总体方差越大,所需的样本容量越少B.总体方差越大,所需的样本容量越多C.允许的误差越小,所需的样本容量越少D.允许的误差越大,所需的样本容量越多14.在抽样设计中,最好的方案是()A.抽样误差最小的方案B.抽样单位最小的方案C.调查费用最少的方案D.在一定误差要求下费用最小的方案单一总体均值的假设检验(方差已知或大样本)单一总体均值的假设检验(方差未知且小样本)单一总体比例的假设检验两个总体均值差的假设检验两个总体比例之差的假设检验总体均值的假设检验:(1)方差已知或大样本:(2)方差未知且小样本:总体比例的假设检验:(1)单一总体:nxZ/0nsxt/0nppppZ)1(/)(00015.已知在正常生产的情况下某种汽车零件的重量(克)服从正态分布,在某日生产的零件中抽取10件,测得重量如下:55.153.854.252.154.255.055.855.155.354如果标准差不变,该日生产的零件的平均重量是否有显著差异(取α=0.05)?)75.0,54(N16.正常人的脉搏平均为72次/分,现测得10例慢性四乙基铅中毒患者的脉搏(次/分)如下:54676878706667706569问四乙基铅中毒患者和正常人的脉搏有无显著差异?(假定中毒患者脉搏服从正态分布,α=0.05)17.某企业生产的某种型号电池,长期统计资料表明其平均寿命为1000(小时)。现从该厂生产的一批产品中,随机抽取20只,测得其平均寿命为960(小时)的样本标准差为90(小时)。根据这个数字能否断定新生产的这批电池为合格品?(α=0.05)18.一家制药公司声称,某地区大概有22%的儿童缺钙,一个研究组织对400名该地区的儿童进行了研究,发现其中有80名儿童缺钙。根据该研究组织的数据,能否认为这家制药公司的论断是正确的?(=0.05)第八章相关分析一元线性回归分析相关分析Pearson相关系数计算公式:22)(.)())((yyxxyyxxriiii相关系数的性质1.-1r1;2.如果r0,则两个变量负相关;如果r0,则两个变量正相关;如果r=0,则两个变量无线性关系;3.|r|0.95存在显著性相关;|r|0.8高度相关;0.5|r|0.8中度相关;0.3|r|0.5低度相关;|r|0.3关系极弱,认为不相关;相关系数的检验(1)提出假设:(2)计算检验的统计量:(3)确定显著性水平,并作出决策:若,拒绝原假设;若,不拒绝原假设。2)-(~122ntrnrt0:;0:10HH2/tt2/tt一元线性回归分析寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。xbybxxnyxxynb10221,)(19.产品产量与单位成本的相关系数是-0.85,销量与利润的相关系数是0.75,产量与利润的相关系数是0.80,因此()A.产量与利润的相关程度最高B.销量与利润的相关程度最高C.产量与单位成本的相关程度最高D.看不出哪对变量的相关程度高20.在一元线性回归方程中,若回归系数b=0,则表示()A.y对x的影响是显著的B.y对x的影响是不显著的C.x对y的影响是显著的D.x对y的影响是不显著的21.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需价格x(元)1068912需求量y(件)6072705855(1)计算价格与需求量之间的Pearson相关系数,并说明相关方向和程度;(2)拟合需求量与价格的一元线性回归方程。求解过程xy106011-39-3672-39981-27870-11749-795800-5250125539-864-24合计20228-6163,9yxxxiyyi2)(xxi2)(yyi))((yyxxii903.02282061)(.)())((22yyxxyyxxriiii相关系数的检验(1)提出假设:(2)计算检验的统计量:(3)取,查表得:由,拒绝原假设,即认为总体上价格与需求量之间相关关系显著。255.40.903-130.903-1222rnrt0:;0:10HH/2tt05.0182.33,2/t求解过程xyxyx210606001006724323687056064958522811255660144合计45315277442545.90905.363,05.3202542553154527745)(10221xbybxxnyxxynb随堂测验某企业职工人数和管理人员数资料如下:求该企业第一季度平均管理人员在全部职工人数中占的比重。工人数1月1日2月1日3月1日4月1日职工人数36200358003410034700管理人员数2000204020452049