1一、主要术语描述统计....:研究数据收集、处理和描述的统计学分支。推断统计....:研究如何利用样本数据来推断总体特征的统计学分支。观测数据....:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。实验数据....:在实验中控制实验对象而收集到的数据。异众比率....:非众数组的频数占总频数的比率。四分位差....:也称为内距或四分间距,上四分位数与下四分位数之差.显著性水平.....:假设检验中发生第Ⅰ类错误的概率,记为。P-.值.:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。拟合优度检验......:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体是否服从某种分布。一般地,可以用于任何假设的概率分布。独立性检验.....:检验两个分类变量之间是否存在相关关系。多个总体比例差异检验..........:检验多个总体比例是否都相等。消费者物价指数.......:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。生产者价格指数.......:反映企业产品出厂价格变动趋势和变动程度的一种相对数。股票价格指数......:是反映某一股票市场上多种股票价格变动趋势的一种相对二.简答和计算P41—P42:2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。2.6你认为应当如何控制调查中的回答误差?回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。2.8如何设计调查方案?第一步:确定调查目的第二步:确定调查对象和调查单位第三步:确定调查项目和调查表第四步:调查表格和问卷的设计第五步:确定调查时间和调查方法等第六步:调查的计划实施2P77-P78:3.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1)指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3)绘制一张条形图,反映评价等级的分布。(4)绘制评价等级的帕累托图。解:(1)属于顺序数据。(2)频数分布表如下:服务质量等级评价的频数分布(3)评价等级的条形图如下:服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E1515合计1001003(4)评价等级的帕累托图如下:3.3某百货公司连续40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374426384442363737493942323635根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40100.0直方图如下:(见Excel练习题2.3)43.8鉴别图表优劣的准则有哪些?答:一张好的图表应当:1精心设计,有助于洞察问题的实质2使复杂的观点得到简明、确切、高效的阐述3能在最短的时间内、以最少的笔墨给读者提供最大量的信息4是多维的5表述数据的真实情况。3.9制作统计表应注意哪几个问题?(1)要合理安排统计表的结构,例如行标题、列标题、数字资料的位置,使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。(2)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应满足3W要求。即统计数据的时间(When)、地点(Where)及何种数据(What)。(3)表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。(4)最后在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料来源,以表示对他人劳动成果的尊重,备读者查阅使用。P111:4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:单位:CM成年组166169172177180170172174168173幼儿组68696870717372737475(1)答:应采用离散系数,因为它消除了不同组数据水平高低的影响。(2)离散系数公式%100xsvs成年组身高的离散系数:sv=024.01.1722.4幼儿组身高的离散系数:sv=035.03.715.2由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。4.12一种产品需要人工组装,为提高产量,企业准备对现有的组装方法进行改进,现有三种可供选择的组装方法。为确定哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):5(1)你准备采用什么方法来评价组装方法的优劣?答:应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。答:下表给出了用Excel计算一些主要描述统计量。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准差2.13标准差1.75标准差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值128从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:Av=013.06.16513.2,Bv=014.073.12875.1,Cv=022.053.12577.2方法A的离散程度最小。因此应选择方法A。P206:7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为10,8,12,15,6,13,5,11。求总体均值μ的95%的置信区间。解:已知:总体服从正态分布,但未知,n=8为小样本,=0.05,365.2)18(2/05.0t。根据样本数据计算得:x=10,s=3.46。总体均值的95%的置信区间为:nstx2=89.210846.3365.210,即方法A方法B方法C1641291251671301261681291261651301271701311261651301281641291271681271261641281271621281271631271251661281261671281161661251261651321256(7.11,12.89)。7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位;km)分别是:103148691211751015916132假定职工上班的距离服从正态分布,求职职工上班从家里到单位品均距离95﹪的置信区间。解:已知:总体服从正态分布,但未知,n=16为小样本,=0.05,131.2)116(2/05.0t根据样本数据计算得:x=9.375,s=4.113。从家里到单位平均距离的95%的置信区间为:nstx2=191.2375.914113.4131.2375.9,即(7.18,11.57)。P246:8.2一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时。试在显著性水平0.05下确定这批元件是否合格。解:700,:,700:10<HH0.02275P,Z-23660/700-680Z0.05<拒绝原假设。8.4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5。已知包重服从正态分布,试检验该日打包机工作是否正常(α=0.05)?解:100:H100,:H102122.1,978.99sx0.96212P),99(054.09/2122.1100978.99025.0tt<不能拒绝原假设。P269:9.2从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果:1n=28,2n=56,3n=48,4n=36,5n=327依据经验数据,各类别在总体中的比例分别为:解:P=0.007295拒绝原假设。9.3某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者,得到如下数据:阅读习惯大学以上大学和大专高中高中以下早上看中午看晚上看有空看612382113164022148119178613以0.05的显著水平检验读者的阅读习惯是否与文化程度有关。解:43210:H(即阅读习惯与文化程度无关),4320,,,:H不完全相等eeofff22)(=31.86P=0.000拒绝原假设,认为阅读习惯与文化程度无关。P424:13.1下表是1981-199年国家财政用于农业的支出额数据。要求:(1)绘制时间序列图描述其形态。不会做(2)计算年平均增长率。142002.0)2002.032(2002.0)2002.036(2003.0)2003.048(2002.0)2002.056(2001.0)2001.028(2222228解:年平均增长率为:(3)根据年平均增长率预测2000年的支出额。解:33.1232%)5.131(76.1085ˆ2000Y13.1加EXCEL中的六道题共7题;13.1某商业企业2005年下半年各月商品销售额资料如表所示。某商业企业2005年各月商品销售额单位:万元月份6789101112销售额520540600660760700820计算该企业2005年下半年平均每月的商品销售额。解:13.2某专业学生星期一至星期五出勤人数资料如表所示。某专业学生出勤资料星期星期一星期二星期三星期四星期五人数(人)160156162158154计算该专业学生平均每天出勤人数。解:nynyyyn21y6806820700760660600540nynyyyn21y1585154158162156160%55.131%55.113121.11076.10851180nnYYG913.3某企业2005年4月上旬职工出勤人数如表所示。某企业2005年4月上旬职工出勤人数日期1468日9职工出勤人数(人)250262258266272计算4月上旬职工人平均每日出勤人数为。13.4某企业2005年第四季度职工人数资料如表所示。某企业2005年第四季度职工人数资料日期9月30日10月31日11月30日12月31日月末职工人数(人)25