第三章数据分布特征的描述一、单项选择题1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间()A、XB、2XC、3XD、4X2、实际中应用最广泛的离散程度测度值是()A、极差和平均差B、平均差和四分位差C、方差和标准差D、异众比率和四分位差3、集中趋势的测度值中,最主要的是()A、众数B、中位数C、均值D、几何平均数4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的()A、均值为0B、均值为1B、均值为6C、均值为6.95、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用()A、简单算术均值B、简单调和算术均值C、加权算术均值D.、加权调和均值6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110、102,据此计算的结果是()A、均值=中位数=众数B、均值>中位数>众数C、众数>中位数>均值D、中位数>均值>中数7、几何均值主要适合于()A、具有等差关系的数列B、变量值为偶数的数列C、变量值的连乘积等于总比率或总速度的数列D、变量值之和等于总比率或总速度的数列8、加权算术均值不但受变量值大小的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不发生影响的是()A、变量值出现次数相等时B、变量值较小、次数较多时C、变量值较大、次数较少时D、变量值较大、次数较多时9、一组数据的均值为350,众数为200,则()A、中位数为275,数据呈右偏分布B、中位数为275,数据呈左偏分布C、中位数为300,数据呈左偏分布D、中位数为300,数据呈右偏分布10、一组数据的均值为5,中位数为3,则()A、数据呈右偏分布B、数据呈对称分布C、数据呈左偏分布D、数据呈正态分布11、经验表明,当数据分布近似于正态分布时,则变量值落在区间X的概率为()A、95%B、68%C、99.86%D、95.45%12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则()A、数据有极小值B、数具有极大值C、数据是对称分布D、数据是左偏分布E、数据右偏分布13、在单项式数列中,假定标志值所对应的权数都缩小1/10,则算术平均数()A、不变B、无法判断C、缩小1/100D、扩大10倍14、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数()A、增加一倍B、减少一倍C、不变D、无法判断15、各变量值与其算术平均数的离差之和()A、等于各变量值之和的平均数B、等于最大值C、等于零D、等于最小值16、各变量值与其算术平均数的离差平方之和()A、等于各变量值之和的平均数B、等于最大值C、等于零D、等于最小值二、多项选择题1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则()A、数据是左偏分布B、数据是右偏分布C、数据是对称分布D、数据存在极小值E、数据存在极大值2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则()A、数据是右偏分布B、数据是对称分布C、数据是左偏分布D、数据有极大值E、数据有极小值3、数据分布的两个重要特征是()A、正态分布B、集中趋势C、t分布D、2分布E、离散程度4、利用组距分组数据计算众数时,有一些基本假定,即()A、假定数据分布具有明显的离中趋势B、既定数据分布具有明显的集中趋势C、假定众数组的频数在该组内是正态分布D、假定众数组的频数在该组内是均匀分布E、假定众数组的频数在该组内是二项分布5、众数()A、是一组数据分布的最高峰点所对应的数值B、可以不存在C、也可以有多个D、是位置代表值E、不受数据中极端值的影响。6、极差()A、是描述数据离散程度的最简单测度值B、不易受极端值影响C、易受极端值影响D、不能反映出中间数据的分散状况E、不能准确描述出数据的分散程度7、一组数据为17、19、22、24、25、28、34、35、36、37、38。则()A、该组数据的中位数为28B、该组数据的第一个四分位数为22C、该组数据的众数为38D、该组数据无众数E、该组数据的第三个四分位数为368、下列标志变异指标中,与变量值计量单位相同的变异指标有()A、全距B、平均差C、标准差D、标准差系数E、平均差系数9、下列标志变异指标中,用无名数表示的有()A、全距B、平均差C、标准差D、标准差系数E、平均差系数10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断()A、甲单位标准差系数大B、乙单位标准差系数大C、甲单位平均数代表性大D、乙单位平均数代表性大E、无法判断两单位平均数代表性大11、已知100个零售企业的分组资料如下:销售利润率(%)企业数销售额(万元)10156040800200这100个企业的平均销售利润率正确计算公式是()A、406040%1560%10B、10%×60%+15%×40%C、10%80%+15%20%D、2%15%10E、200800200%15800%10三、填空题1、中位数将全部数据分为两部分,一部分数据_____________,另一部分数据则________________。2、根据未分组数据计算中位数时,若数据个数N为奇数时,则中位数Me=_____________;若数据个数为N为偶数时,则中位数Me=________________。3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算___________的平均;在实际应用中,几何平均数主要用于计算社会经济现象的___________________。4、均值的主要缺点是易受数据___________的影响,对于_________的数据,均值的代表性较差。5、均值的变形主要有_______________和_______________。前者主要用于__________________的数据,后者主要用于计算____________的平均数。6、方差是__________与其均值___________的平均数。7、极差也称_______,它是一组数据的___________和_________之差。8、众数是一组数据中____________的变量值,从分布的角度看,它是具有明显_______________的数值。四、判断题1、在均值加减3个标准差的范围内几乎包含了全部数据。()2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。()3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。()4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。()5、中位数与各数据的距离最长。()6、minMeN1iiX(最小)()7、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。()8、几何平均数的对数是各变量值对数的算术平均。()9、根据Mo、Me和X之间的关系,若已知Me=4.5,X=5,则可以推算出Mo=3.5。()10、对于具有偏态分布的数据,均值的代表性要好于中位数。()11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。()五、简答题1、权数的实质内容是什么?2、数据集中趋势的测度值与离中趋势的测度值各有哪些?3、试比较众数、中位数和均值三者的特点及应用场合。4、什么是离散系数?为何要计算离散系数?5、均值具有哪些重要的数学性质?6、离散特征数在统计分析中的作用?7、实际中几何平均数应用于哪些场合?六、计算分析题1、根据要求计算:(1)已知500X,V=0.3,求方差σ²。(2)已知5.5X∑X2=385,N=10,求离散系数V。(3)已知σ=20,60X,求各数据值对50的方差。(4)已知350X,V=0.4,求各数据值对400的标准差。(5)已知810X,657702X,N=10,求标准差和离散系数V。(6)已知:σ2=100,26002______X,求离散系数V(7)已知:样本方差S2n-1=16,∑(X-X)2=784,求样本容量n。2、某车间生产三批产品的废品率分别为1%、2%、1.5%,三批产品的产量占全部产量的比重分别为25%、35%、40%,试计算该车间三批产品的平均废品率。3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。要求:计算是非标志的平均数、方差、标准差及离散系数。4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:100150170210150120同期非星期一的产量整理后的资料如下表:日产量(吨)天数(天)100——150150——200200——250250以上81042合计24根据资料:(1)计算6个星期一产量的均值和中位数;(2)计算非星期一产量的均值、中位数、众数;(3)分别计算星期一和非星期一产量的标准差;(4)比较星期一和非星期一产量的离散程度哪一个大一些?(5)计算非星期一产量数据分布的偏态系数和峰度系数。6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:xxxx乙乙甲甲3;而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:DADA..2甲乙,求:通过计算判断上述情况在什么情况下可能会发生?7、从某地区抽取120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200—30019300—40030400—50042500—60018600以上11合计120要求:(1)计算120家企业利润的众数、中位数、和均值。(3)计算分布的偏态系数和峰度系数,并作简要分析说明。8、抽取10名成年人和10名幼儿进行身高(厘米)调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475要求:(1)若要比较成年组和幼儿组的身高差异,应采用什么样的指标测度值?为什么?(文字回答即可)(2)试通过计算,比较分析哪一组的身高差异大?9、甲、乙两个企业生产三种产品的有关资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业A1521003255B2030001500C3015001500试比较哪个企业的总平均成本高,并分析其原因。10、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下:日产量(件/人)甲单位工人数(人)乙单位总产量(件)241238245620合计1856试通过计算分析:(1)哪个单位工人的平均日产量水平高?(2)哪个单位工人的日产量水平均衡?11、已知某地区农民家庭按年人均收入分组的资料如表所示:按人均收入分组(元)家庭户数占总户数比重(%)100以下2.3100—20013.7200—30019.7300—40015.2400—50015.1500—60020.0600以上14.0合计100.0要求:(1)计算该地区平均每户家庭人均年收入的中位数、均值及标准差。(2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)12、在某城市抽取100户家庭所做的一项抽样调查结果如下:按月收入分组(元)家庭户数占总户数比重(%)300—40024400—50027500—60028600—70010700—8007800以上4你认为要分析