统计学-期末总复习

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学第一章1.统计的含义、特点2.统计总体和总体单位3.标志与统计指标第二章调查对象和调查单位、报告单位统计调查的分类按收集资料的组织形式按调查对象包括的范围统计调查的组织方式•统计报表•普查•重点调查•典型调查•抽样调查第三章1.统计分组的作用划分现象的不同类型说明现象的内部结构揭示现象之间的依存关系第三章2.编制频数分布表的步骤:分组计算各组频数3.某行业管理局所属32家企业2007年的产品销售收入数据(单位:万元)1521241291161001039295105119114115871031181421171081051101071371201369888123115119138112146根据上面的数据进行适当分组,编制频数分布表。4.按组距方式分组:第一组55—65;第二组65—75;第三组75—85;第四组85以上,则数据()A.65在第一组B.75在第二组C.75在第三组D.85在第三组5.频数分布表中各组频率的总和应该()A.小于1B.等于1C.大于1D.不等于1不同统计图的适用用法•线图•散点图•饼图•条形图•直方图第四章总量指标和相对指标•总量指标的概念和分类•六种常用的相对指标–结构相对指标–比例相对指标–比较相对指标–强度相对指标–动态相对指标–计划完成程度相对指标平均指标和变异指标加权算术平均数调和平均数众数中位数方差离散系数异众比例均值-加权算术平均数设分组后的各组的标志值为:x1,x2,…,xk相应的频数为:f1,f2,…,fk则,加权算术平均数的计算公式为:kiikiiikkkffxffffxfxfxx11212211均值-调和平均数设分组后的各组的标志值为:x1,x2,…,xk各组相应的标志总量为:m1,m2,…,mk则,调和算术平均数的计算公式为:kiiikiikkkmxmmxmxmxmmmmH11221121众数、中位数众数:出现次数最多的变量值;中位数:数据排序后处于中间位置上的值;Me50%50%方差反映了各变量值与均值的平均差异;计算公式:nxxnii122)(kiikiiiffxx1122)(未分组数据:组距分组数据:6.在某个核算年度内,两个建筑施工单位采购同一种建筑材料的价格和批量情况如下表。试分别计算两个施工单位的平均采购价格。采购单价(元/吨)采购金额(万元)A单位B单位751501008012010010010010065130100150150100合计6505007.根据某城市50户家庭调查结果,将每户家庭按其每月旅游开支(单位:元)分组后,得到如下的频数分布资料:每月旅游开支(元)家庭户数200以下2200~3008300~40010400~50012500~6008600~7006700以上4合计50计算该城市平均每户家庭的旅游开支、方差。8.为研究少年儿童的成长发育情况,某研究所的一位调查人员在A城市抽取100名7岁—12岁的少年儿童作为样本,其平均身高为148CM,标准差为5CM;另一位调查人员则在B城市抽取了100名7岁—12岁的少年儿童作为样本,其平均身高为152CM,标准差为9CM。请问,哪个城市少年儿童的平均身高更具代表性?9.一条成品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?时间周一周二周三周四周五周六周日产量(件)385036703690372036103590370010.某班学生某一门课程的考试成绩如下:考分百分比(%)50~60460~701670~804080~903090~10010合计100请计算该班该门课程的平均成绩。第五章时间数列的水平分析和速度分析发展水平平均发展水平增长量(逐期增长量,累计增长量,平均增长量)发展速度(定基发展速度,环比发展速度,平均发展速度)增长速度(定基增长速度,环比增长速度,平均增长速度)增长1%的绝对值绝对数相对数平均数-1时间数列的构成要素TSCI第六章统计指数的概念和分类指数化因素和同度量因素加权综合指数、平均数指数——拉氏指数(数量)——帕氏指数(质量)指数体系与因素分析常用价格指数第七章抽样的组织方式•简单随机抽样•类型抽样•等距抽样•整群抽样•多阶段抽样抽样误差•抽样平均误差•抽样极限误差区分第七章单一总体均值的区间估计(方差已知或大样本)单一总体均值的区间估计(方差未知且小样本)单一总体比例的区间估计总体均值区间估计时样本容量的确定总体比例区间估计时样本容量的确定单一总体均值的区间估计(方差已知或大样本)方差已知或大样本1.假设:已知总体标准差;总体正态分布;如果不是正态,可被正态分布逼近(样本容量n30)2.置信区间:nZx.2/单一总体均值的区间估计(方差未知且小样本)方差未知且小样本1.假设:总体标准差未知;总体服从正态分布;样本容量n30;2.置信区间:nstxn.1,2/单一总体比例的区间估计1.假设:总体服从二项分布;可以用正态分布近似估计,即np5且n(1-p)5;3.置信区间:2.引理:)1,0(~)1(/)(000NnppppnppZp)1(.002/0样本容量的确定估计总体均值时:估计总体比例时:22/22znE2/221znE8.某高中随机抽查了10个高二的男学生,平均身高170厘米,标准差12厘米。(1)用矩估计法估计该高中高二男生的平均身高;(2)若该高中高二男生的身高服从正态分布,问该高中高二男生平均身高的所在范围(α=0.05)。9.某工业区有300家企业,用简单随机重复抽样的方法抽出50家作为样本,调查其年利润额,资料如下:年利润额(万元):1200130015001600企业数(家):5152010要求:(1)用矩估计法估计该工业区企业的平均年利润额及其方差;(2)以95%的可靠性估计该工业区企业的平均年利润额和利润总额的区间。10.某地区为了解该地区贫困家庭的生活情况,随机抽取200户家庭,其中20户在国家规定的生活贫困线以下,请问在95%的置信水平下,该地区有百分之多少的家庭在国家规定的生活贫困线以下?11.一项研究计划估计在一片森林中平均每年一棵树长高了多少,研究人员准备用95%的置信水平,并希望估计出的均值的误差不超过0.5cm。以前的研究显示样本的标准差为2cm。请问,这项研究的样本容量需要多大才能满足要求?12.在简单重复随机抽样时,当允许误差缩小一半,则n要()A.缩小4倍B.增大4倍C.增大2倍D.缩小2倍13.在其它条件不变的情况下()A.总体方差越大,所需的样本容量越少B.总体方差越大,所需的样本容量越多C.允许的误差越小,所需的样本容量越少D.允许的误差越大,所需的样本容量越多14.在抽样设计中,最好的方案是()A.抽样误差最小的方案B.抽样单位最小的方案C.调查费用最少的方案D.在一定误差要求下费用最小的方案单一总体均值的假设检验(方差已知或大样本)单一总体均值的假设检验(方差未知且小样本)单一总体比例的假设检验两个总体均值差的假设检验两个总体比例之差的假设检验总体均值的假设检验:(1)方差已知或大样本:(2)方差未知且小样本:总体比例的假设检验:(1)单一总体:nxZ/0nsxt/0nppppZ)1(/)(00015.已知在正常生产的情况下某种汽车零件的重量(克)服从正态分布,在某日生产的零件中抽取10件,测得重量如下:55.153.854.252.154.255.055.855.155.354如果标准差不变,该日生产的零件的平均重量是否有显著差异(取α=0.05)?)75.0,54(N16.正常人的脉搏平均为72次/分,现测得10例慢性四乙基铅中毒患者的脉搏(次/分)如下:54676878706667706569问四乙基铅中毒患者和正常人的脉搏有无显著差异?(假定中毒患者脉搏服从正态分布,α=0.05)17.某企业生产的某种型号电池,长期统计资料表明其平均寿命为1000(小时)。现从该厂生产的一批产品中,随机抽取20只,测得其平均寿命为960(小时)的样本标准差为90(小时)。根据这个数字能否断定新生产的这批电池为合格品?(α=0.05)18.一家制药公司声称,某地区大概有22%的儿童缺钙,一个研究组织对400名该地区的儿童进行了研究,发现其中有80名儿童缺钙。根据该研究组织的数据,能否认为这家制药公司的论断是正确的?(=0.05)第八章相关分析一元线性回归分析相关分析Pearson相关系数计算公式:22)(.)())((yyxxyyxxriiii相关系数的性质1.-1r1;2.如果r0,则两个变量负相关;如果r0,则两个变量正相关;如果r=0,则两个变量无线性关系;3.|r|0.95存在显著性相关;|r|0.8高度相关;0.5|r|0.8中度相关;0.3|r|0.5低度相关;|r|0.3关系极弱,认为不相关;相关系数的检验(1)提出假设:(2)计算检验的统计量:(3)确定显著性水平,并作出决策:若,拒绝原假设;若,不拒绝原假设。2)-(~122ntrnrt0:;0:10HH2/tt2/tt一元线性回归分析寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。xbybxxnyxxynb10221,)(19.产品产量与单位成本的相关系数是-0.85,销量与利润的相关系数是0.75,产量与利润的相关系数是0.80,因此()A.产量与利润的相关程度最高B.销量与利润的相关程度最高C.产量与单位成本的相关程度最高D.看不出哪对变量的相关程度高20.在一元线性回归方程中,若回归系数b=0,则表示()A.y对x的影响是显著的B.y对x的影响是不显著的C.x对y的影响是显著的D.x对y的影响是不显著的21.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需价格x(元)1068912需求量y(件)6072705855(1)计算价格与需求量之间的Pearson相关系数,并说明相关方向和程度;(2)拟合需求量与价格的一元线性回归方程。求解过程xy106011-39-3672-39981-27870-11749-795800-5250125539-864-24合计20228-6163,9yxxxiyyi2)(xxi2)(yyi))((yyxxii903.02282061)(.)())((22yyxxyyxxriiii相关系数的检验(1)提出假设:(2)计算检验的统计量:(3)取,查表得:由,拒绝原假设,即认为总体上价格与需求量之间相关关系显著。255.40.903-130.903-1222rnrt0:;0:10HH/2tt05.0182.33,2/t求解过程xyxyx210606001006724323687056064958522811255660144合计45315277442545.90905.363,05.3202542553154527745)(10221xbybxxnyxxynb随堂测验某企业职工人数和管理人员数资料如下:求该企业第一季度平均管理人员在全部职工人数中占的比重。工人数1月1日2月1日3月1日4月1日职工人数36200358003410034700管理人员数2000204020452049

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功