1一统计学原理形成性考核一(第一章和第二章)一、单项选择1.在某个或某些属性上的属性表现相同的诸多实体构成的集合称为(A)。A.同类实体B.异类实体C.总体D.同类集合2.不能自然地直接使用数字表示的属性称为(B)属性。A.数量属性B.质量属性C.水平属性D.特征属性3.属于总体边界清晰,个体不清晰的变量是(A)。A.一列车的煤炭B.滇金丝猴种群C.大兴安岭的树D.工业流水线的一批产品4.(A)是选择个体及采集个体属性值的途径。A.调查方法B.调查工具C.调查准则D.调查程序5.从某生产线上每隔25min抽取5min的产品进行检验,这种抽样方式属于(C)。A.简单随机抽样B.等距抽样C.整群抽样D.分层抽样6.抽样调查和重点调查都是非全面调查,两者的根本区别是(D)。A.灵活程度不同B.组织方式不同C.作用不同D.抽取样本的方式不同7.按随机原则进行的抽样称(D)A.问卷设计B.调查C.抽样设计D.随机抽样8.统计学将有许多个小实体构成的同类实体看做集合称为(A)A.总体B.个体C.总量D.变量9.据总体的形态,总体可以分为(B)A.时间总体和空间总体B.实在总体和想象总体C.时点总体和时期总体D.平面总体和线性总体10.统计工作过程由(A)两个步骤构成。A.统计设计和统计设施B.统计实施和调查设计C.现场调查和调查设计D.统计设计和调查设计二、多项选择1.按照信息科学和数据库理论,信息的构成要素主要包括(AB)。A.实体B.属性C.调查D.情况22.属性的基本类别包括(AB)。A.数量属性B.质量属性C.水平属性D.特征属性3.下列属于总体边界清晰,个体边界不清晰的是(ABC)A.一艘石油巨轮的石油B.一列车的煤炭C.公园一片草地D.大兴安岭的树4.现场调查方法包括的方式有(ABC)A.访问B.观察C.实验D.测量5.按照调查的范围,可将调查分为(AB)A.全面调查B。非全面调查C。概率调查D。非概率调查三、判断题1.文字是一种数据。(√)2.特性可以独立存在,不依赖于观察者的主观视角。(×)3.信息构成要素中的实体,只能是通过普通感官直接感知的内容。(×)4.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦缺少了组件,实体便不完整。(√)5.数量属性与质量属性是属性的基本分类,也是最重要的分类。(√)6.统计学中将由许多个小实体构成的同类实体看作集合,称之为总体,将构成总体的许多小实体看成集合的元素,特别地,如果小实体都不可再分,则称之为个体。(√)7.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终目标却是要获得总体数据所包含的信息。(√)8.统计数据的获取过程包括调查和汇总两个阶段(√)9.数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、图像并不包括在内。(√)10.如果在总体的每个层里独立进行抽样,则称为分层抽样。(√)四、简单题1、简述分类变量和数值变量的根本区别3答:由于属性可以分为数量属性和质量属性,因此,可以分为数量变量和分类变量。数量属性对应的是数值型变量,简称数值变量,与质量属性对应的是分类型变量,简称分类变量。数量变量是指可以自然地直接使用数值表示其变量值的变量。分类变量是指不可以自然地可直接使用数字表示其变量值。数值型变量是指值可以取一系列的数,这些值对于加法、减法、求平均值等操作是有意义的,而分类变量对于上述的操作是没有意义的。2.简述信息与数据的异同。举例说明有些信息不是数据。答:数据和信息是不可分割的两个术语,但它们又有一定的区别。首先是概念不同,信息是客观世界在人们头脑中的反映,是客观事物的表征。数据是信息的载体,是对客观存在实体的一种记载和描述。数据是对客观事物记录下来的可以鉴别的符号。这些符号不仅指数字,且包括回字符、字图形等;信息是经过加工后并对客观世界产生影响的数据。其次,数据只有经过加工处理后才能成为信息。例如,“0、1、2..”、“阴、雨、下降、气温””学生的档案记录、货物的运输情况”等都是数据,数据经过加工后就成为信息。3.分别指出下列描述中的实体与属性(1)汽车的颜色(2)家庭的人口数(3)国内生产总值最多的国家(4)人的身高(1)汽车的颜色汽车是实体颜色是属性(2)家庭的人口数家庭是实体人口数是属性(3)国内生产总值最多的国家国家是实体国内生产总值最多是属性(4)人的身高人是实体身高是属性4.统计调查的八要素有哪些?答:统计调查具有八个要素:调查主体、调查客体、调查内容(项目)、调查方法、调查工具、调查准则、调查程序、调查结果。45、简述抽样设计的内容和抽样的一般步骤。答:抽样设计的内容:(1)定义目标总体比(2)决定抽样框(3)抽样调查的组织形式和抽样方法的选择(4)精度的确定(5)确定样本量(6)经费核算抽样的一般步骤(1)界定总体(2)指定抽样框(3)实施抽样调查并推测总体(4)分割总体(5)决定样本规模(6)决定抽样方式(7)确定抽样的信度和效度5统计学原理形成性考核二(第三章和第四章)一、单项选择1.对一个变量而言,其(B)指的是全面调查获得的所有变量值(或组)与其对应频率的一揽子表示。A.分布B.总体分布C.样本分布D.频数2.(C)指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。A.分布B.总体分布C.样本分布D.联合总体分布3.以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是(A)。A.语示法B.表示法C.图示法D.函数法4.以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是(B)。A.语示法B.表示法C.图示法D.函数法5.以图形方式表达复杂变量的分布的表达方法是(C)。A.语示法B.表示法C.图示法D.函数法6.(B)既可以反映较少类数也可以反映较多类数的分类变量分布,甚至也能反映分组化的数值变量分布,居于优先选择地位。A.饼形图B.柱形图C.条形图D.直方图7.在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即占整个圆形面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。这样的图称为(A)。A.饼形图B.柱形图C.条形图D.直方图8.在所有总体分布特征中,最重要的分布特征是(D)。A.中位数B.众数C.标准差D.均值9.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是(D)。A.二者均为离散变量B.二者均为连续变量C.前者为连续变量,后者为离散变量D.前者为离散变量,后者为连续变量10.总量指标数值大小(A)6A.随总体范围扩大而增大B.随总体范围扩大而减小C.随总体范围缩小而增大D.与总体范围大小无关11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C)A.小于100%B.大于100%C.等于100%D.小于或大于100%12.众数是(C)。A.出现次数最少的次数B.出现次数最少的标志值C.出现次数最多的变量值D.出现次数最多的频数13.在一组数据中,每个数据类型出现的次数称为(B)。A.参数B.频数C.众数D.组数14.集中趋势最主要的测度值是(B)。A.几何平均数B.算术平均数C.众数D.中位数15.下列分布中,不属于离散随机变量分布的是(D)A.超几何分布B.伯努利分布C.几何分布D.正态分布二、多项选择1.分布的表达方法有(ABCD)。A.语示法B.表示法C.图示法D.函数法2.分布图的主要形式包括(ABCD)。A.饼形图B.柱形图C.条形图D.直方图3.均值的计算方式包括(AB)。A.算术平均数B.加权平均数C.中位数D.方差4.可以反映数值变量离散程度分布特征的是(BD)A.中数B.四分位差C.偏度D.标准差5.下列分布中,属于连续随机变量分布的是(BD)A.超几何分布B.指数分布C.几何分布D.正态分布三、计算分析题1.某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?序号123456789101112性别男男男女男男女男女女男男7职称工程师技术员技术员技术员技术员工程师工程师技术员技术员工程师技术员技术员解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/22.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)考虑逆事件A“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:于是83.已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀的概率。解:设A表示“合格”,B表示“优秀”。由于B=AB,于是4.某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。解:设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。脱靶的概率=1-0.9=0.1或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.195.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?解:设A=活到55岁,B=活到70岁。所求概率为:6.某企业2003年某月份按工人劳动生产率高低分组的有关资料如下:8.某班级25名学生的统计学考试成绩数据如下:89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80,79,81,70,87,60试计算:(1)该班统计学成绩的均值、中位数和四分位数;(2)该班统计学成绩的方差、标准差。(3)根据60分以下,60-70,70-80,80-90,90以上的分组标准,编制考试成绩的分布表53606769707375787980818282848686878889899193959598(1)答:2.812598959593918989888786868482828180797875737069676053x中位数Me=82中间第13个是82Ql=75QM=89(2)xx-平均数平方xx-平均数平方53-28.2795.24842.87.8460-21.2449.44864.823.0467-14.2201.64864.823.0469-12.2148.84875.833.6470-11.2125.44886.846.2473-8.267.24897.860.841075-6.238.44897.860.8478-3.210.24919.896.0479-2.24.849311.8139.2480-1.21.449513.8190.4481-0.20.049513.8190.44820.80.649816.8282.24820.80.64平均81.20方差29982998/25=119.9295.1092.119答:S2=119.92S=10.95(3)按成绩分组人数比重(%)60以下60-7070-8080-9090以上135115412204420合计2510011形成性考核三(第五章)一、单项选择(每题2分,共计40分)1.估计量的含义是指(A).A.用来估计总体参数的统计量的名