工商管理统计作业二(第三、四章)一、单项选择题1、下四分位数是处于数据(D)位置的值。A、50%B、40%C、80%D、25%2、在一组数据中,每个数据类型出现的次数称为(B)。A、参数B、频数C、众数D、组数3、数据161,161,162,163,163,164,165,165,165,166的中位数是(B)。A、163B、163.5C、164D、04、当一组数据的分布为左偏时,最好用(A)作为该组数据的概括性度量。A、众数B、均值C、最小值D、最大值5、在评价估计量的标准中,如果随着样本容量的增大,点估计量的值越来越接近总体参数,这是指估计量的(B)。A、准确性B、无偏性C、有效性D、一致性6、根据分组数据计算均值时,假定各组数据在该组内服从(C)。A、对称分布B、正态分布C、均匀分布D、U型分布7、在小样本的情况下,如果总体不服从正态分布,且总体方差未知,则经过标准化的样本均值服从(B)。A、Z分布B、t分布C、2分布D、F分布8、在其他条件不变的情况下,(D)。A、置信概率越大,所需的样本容量也就越小B、样本容量与总体方差成反比C、样本容量与边际方差的平方成正比D、样本容量与边际方差的平方成反比9、下列中,与样本容量成反比的是(D)。A、置信概率B、总体均值C、总体方差D、边际误差二、多项选择题1、下列中,不受极端值影响的统计量有(ABE)。A、众数B、中位数C、均值D、极差E、平均差2、评价估计量的标准主要有(ABC)。A、无偏性B、有效性C、一致性D、准确性E、关联性三、判断题1、当数据分布的偏斜程度较大时,中位数不宜作为该组数据的概括性度量。(×)2、如果数据分布右偏,则其众数最小,均值最大。(√)3、某商场有160名员工,如果大多数人的月销售额都比平均数高,意味着众数最大,平均数最小,这样的分布是左偏分布。(×)4、在大样本的情况下,即使总体不服从正态分布,样本均值的抽样分布也服从正态分布。(√)四、名词解释1、四分位数:将一组数从小到大排列,处在25%和75%位置上的数称为四分位数,其中25%位置上的称为下四分位数,75%位置上的称为上四分位数。2、尖峰分布和平峰分布:峰态是对数据分布平峰或尖峰程度的测度,峰态小于0时为平峰分布,峰态大于0时为尖峰分布。3、简单随机抽样:又叫纯随机抽样,它是从总体中随机抽取n个个体构成一个样本,使得每一个容量为n的样本都有同样的机会被抽中。4、系统抽样:也称为等距抽样或机械抽样,它是先将总体各单元按照某种顺序排列,并按照某种规则确定随机起点,然后,每隔一定的间隔抽取一个元素,直到抽取n个元素形成一个样本。五、简答题1、简述众数、中位数和均值的特点及其应用场合。众数、中位数和均值都是对一组数据的概括性度量,它们各有不同的特点和应用场合。众数是一组数据种出现次数最多的变量值,它主要是对各分类数据的概括性度量,其特点是部首极端值的影响,但它没有利用全部数据的信息,而且众数具有不唯一性。一组数据可能由众数也可能没有众数;可能有一个众数,也可能有多个众数。中位数是一组数据排序后处于中间位置上的变量值,它主要是用于对顺序数据的概括性度量。中位数特点是受手极端值的影响,但它也没有利用原始数据的全部信息。均值是一组数据的算术平均,它利用了全部数据的信息,是概括一组数据最常用的一个值。但均值的缺点是易受极端值的影响。当一组数具有极端值时,均值的代表性较差。就数值型数据而言,当一组数据为对称分布时,众数、中位数和均值相等,这是最好拥均值进行概括性度量;当一组数据的分布为偏态时,尤其当偏斜程度较大时,最好用中位数或众数进行概括性度量。2、什么是抽样分布?样本统计量的分布与总体分布的关系是什么?(1)所谓抽样分布就是样本统计量的分布。(2)样本均值的抽样分布与总体的分布有关,如果总体分布是正态分布,那么,无论样本容量的大小,样本均值都服从正态分布。其数学期望为总体的均值,方差为总体方差的。如果总体不服从正态分布,就要开样本容量的大小,当样本容量大于30时,根据中心极限定理,样本均值近似服从正态分布,其数学期望为总体的均值,方差为总体方差的。六、计算与案例分析题1、50位学员参加两门课程的考试,其成绩分布如下:考试成绩第一门课程的人数第二门课程的人数20--300330--400640--5001050--6001460--704970--8020580--9020290--10061合计5050利用Excel对原始数据进行描述统计,其结果如下:统计指标第一门课程第二门课程平均成绩79.8054.46标准误差1.172.09组中值82.0055.50众数84.0060.00标准差8.2914.75方差68.69217.48峰态系数-1.050.08偏态系数-0.170.26极差32.0065.00最小值63.0025.00最大值95.0090.00总和3990.002723.00离散系数0.100.27人数5050根据以上资料,你认为哪门课程考得好?为什么?第一门功课的平均成绩、组中值、众数都大于第二门功课的平均成绩、组中值、众数,说明第一门功课的平均水平较高。2、甲、乙两班各有10名同学参加一场智力测验,其成绩如下:甲班98898778957693929362乙班91879496919397889186用Excel对上述数据进行描述统计的结果如下表所示:统计量甲班乙班平均成绩86.391.4标准误差3.51.2中位数90.591众数9391标准差11.13.7样本方差123.113.6峰态系数1.3-1.0偏态系数-1.30.03极差3611最高成绩6286最低成绩9897总成绩863914人数1010根据以上资料,你认为哪个班的同学考得好些?为什么?乙班的同学比加班考得好,理由如下:3、某公司员工的工资情况如下表所示:月工资(元/人)员工人数(人)800—10001000—12001200—14001400—16001600—180051025105⑴众数、中位数和均值三个统计量中,你认为哪个统计量能概括该公司员工工资的情况?为什么?因为:该公司员工的工资表显示分布是右偏的,此时众数中位数平均数最大,我们用中位数来概括该公司员工的工资水平。⑵计算你认为能概括该公司员工工资情况的统计量。4、从某市的居民住户中随机抽取900户,其中720户拥有电视机。据此,你认为在95%的置信水平下,该城市居民的电视机普及率大概为多少?在同样的置信水平下,应该抽取多少居民户才能保证电视机普及率的估计误差不超过3%?