统计学课后习题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一章导论1.Q:什么是统计学?A:统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。2.Q:解释描述统计和推断统计。A:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。统计推断是研究如何利用样本数据来推断总体特征的统计方法。3.Q:统计数据可分为哪几种类型?不同类型的数据各有什么特点?A:①按计量尺度不同,可分为:分类数据(只能归类于某一类别的非数字型数据)、顺序数据(只能归类于某一有序类别的非数字型数据)、数值型数据(按数字尺度测量的观察值);②按统计数据的收集方法不同,可分为:观测数据(通过调查或观测而收集到的数据)、实验数据(在实验中控制实验对象而手机到的数据);③按被描述的现象和时间的关系,可分析:截面数据(在相同或近似相同的时间点上收集的数据)、时间序列数据(在不同时间上收集的数据,用于所描述的现象随时间变化的情况)。4.Q:解释分类数据、顺序数据和数值型数据的含义。A:见3。5.Q:举例说明总体、样本、参数、统计量、变量这几个概念。A:总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用于描述总体特征的概括性数字度量;统计量是用于描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。6.Q:变量可分为哪几类?A:分类变量(说明事物类别的一个名称);顺序变量(说明事物有序类别的一个名称);数值型变量(说明事物数字特征的一个名称)。7.Q:举例说明离散型变量和连续性变量。A:离散型变量:企业数、产品数量;连续型变量:年龄、温度、零件尺寸的误差。8.Q:请举例统计应用的几个例子。A:要了解一个地区的人口特征、对产品的质量进行检验等。9.Q:请举例统计应用的几个领域。A:政府部门、学术研究领域、日常生活、公司或企业的生产经营管理(企业发展战略、产品质量管理、市场研究、财务分析、经济预测、人力资源管理)。第二章数据的搜集大纲重点:1、调查的组织与实施;2、概率抽样和非概率抽样;1.Q:什么是二手资料?使用二手资料需要注意些什么?A:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据,即二手资料。二手资料具有搜集方便、数据采集快、采集成本低等优点,但也有很大的局限性,如资料的相关性不够,口径可能不一致,数据也许不准确,也许过时了等等2.Q:比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。A:(1)概率抽样也叫随机抽样,有3个特点:①抽样时按一定的概率以随机原则抽取样本②每个单位被抽中的概率是已知的或是可以计算出来的③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,即估计量不仅与样本单位的观测值有关,也与其入样概率有关;分为2类:等概率抽样和不等概率抽样;常用方式5个,如下:概率抽样方式优点缺点简单随机抽样简单、直观①总量很大时,构造抽样框较难;②单位分散;③没有利用辅助信息因而效率不高。分层抽样①样本结构和总体相近,有效提高估计的精度;②为组织调查提供方便;③即可对总体参数估计,也可对各层的目标量进行估计等。——整群抽样①只需整群的抽样框,简化了编制抽样框的工作量;②调查地点相对集中,节省费用,方便调查。同一群内样本类似因而估计精度较差,抽样误差较大系统抽样操作简单,有效提高估计精度对估计量方差的估计比较困难多阶段抽样类似整群抽样,①简化了编制抽样框的工作量;②调查地点相对集中,节省费用,方便调查;③再抽样使调查范围更广。——概率抽样可以依据调查结果,计算估计量误差,从而得到总体推断的可靠程度///也可以按照要求的精确度,计算必要的样本单位数目——(2)非概率抽样常用方式5个,如下:概率抽样方式优点缺点方便抽样容易实施,调查成本低样本单位的确定带有随意性,因此方便样本无法代表有明确会议的总体,推断无意义。判断抽样重点抽样抽样成本低,容易操作由于样本人为确定,没有依据随机原则,因而调查结果不能对总体进行估计。典型抽样代表抽样自愿样本反映某类群体的一般看法与抽样的随机性无关,样本是有偏的滚雪球抽样用于稀少群体/特定群体,容易找到那些属于特定群体的被调查者,调查成本较低。——配额抽样单一变量控制类似分层抽样,操作简单,样本结构与总体类似不是随机原则,可能出现偏斜交叉变量控制样本分布更均匀操作难度稍大(3)概率抽样与非概率抽样的比较比较特点适用条件概率抽样①抽样时按一定的概率以随机原则抽取样本;②每个单位被抽中的概率是已知的或是可以计算出来的;③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,即估计量不仅与样本单位的观测值有关,也与其入样概率有关。掌握研究对象总体的数量特征,得到总体参数的置信区间。非概率抽样操作简单、时效快、成本低,对于抽样中的统计学专业技术要求不是很高。适合探索性研究,调查的结果用于发现问题,为更深入的数量分析提供准备;也适合市场调查中的概念测试,如产品包装测试、广告测试等。3.Q:调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?A:观察式。4.Q:自填式、面访式、电话式各有什么长处和弱点?搜集数据的方式优点缺点自填式管理简单,成本小,范围大,调查者压力小回收率低,不适合结构复杂的问卷,周期长面访式提高回答率,问卷复杂程度可提高,时间可调调查成本较高,质量难控制电话式速度快,成本低没有电话就无法实施,时间不能太长,进度延缓造成交流困难5.Q:请举出(或设计)几个实验数据的例子。A:略。6.Q:你认为应当如何控制调查中的回答误差。A:数据的误差分为抽样误差和非抽样误差。抽样误差与样本量大小和总体的变异性有关;非抽样误差分为:抽样框误差、回答误差(理解误差——设计一份好的问卷调查、记忆误差——缩短调查所涉及的时间范围或以年度为调查期、有意识误差——说服、保密、避免敏感性问题)、无回答误差、调查员误差、测量误差。7.Q:怎样减少无回答?请通过一个例子,说明你所考虑到的减少误会大的具体措施。A:。无回答误差是随机的,增大n,调查数据的质量与调查员的责任心和耐心密切相关;无回答的系统性误差主要有两个解决途径:预防;分析无回答产生原因,采取补救措施。第三章数据的图表处理大纲重点:3、数据的预处理;4、定性数据;5、定量数据;1.Q:数据的预处理包括哪些内容?A:①数据审核:直接数据——完整性(条目数)、准确性(异常值);二手数据——适用性、时效性;②数据筛选;③数据排序;④数据透视表(列联表)。2.Q:分类数据和顺序数据的整理和图示方法各有哪些?A:⑴分类数据:①整理及描述:频数分布表,频数、比例、百分比、比率;②图示:条形图/柱形图、帕累托图(左侧频数、右侧累计百分比)、饼图(研究结构性问题)、环形图(两总体或样本分类相同且问题可比)。⑵顺序数据:①整理及描述:(向上/向下)累积频数、累积频率、累积百分比;②图示:累积频数分布、频率图;3.Q:数值型数据的分组方法有哪些?简述组距分组的步骤。A:⑴分组方法有:单变量分组(适合离散变量且值较少)、组距分组(连续变量或值较多)。⑵组距分组步骤为:①确定组数(5-15);②确定各组的组距;③根据分组整理成频数分布表。两原则:不重不漏、上组限不在内(区间左闭右开)。⑶图示:①分组数据——直方图、折线图、曲线图;②未分组数据——茎叶图、箱线图;③时间序列数据——线图;④多变量数据——散点图(两变量)、气泡图(三变量)、雷达图(多变量)。4.Q:条形图和直方图有何区别?A:前者用长度表视频数(率),宽度固定,各矩形分开排列,主要展示分类数据;后者用面积表示频数(率),宽度为组距,各矩形连续排列,主要展示数值型数据。5.Q:绘制线图应注意哪些问题?A:①时间一般绘在横轴,观测值绘在纵轴;②一般应绘制横轴略大于纵轴的长方形,其长度比例大致为10:7;③一般情况下,纵轴下端应从“0”开始,以便于比较;如果数据与“0”之间的间距过大,可以采取折断的符号将纵轴折断。6.Q:饼图和环形图有什么不同?A:前者只能显示一个样本或总体的比例数据;后者可以同时显示多个样本或总体的比例数据,有利于比较。7.Q:茎叶图与直方图相比有什么优点?它们的应用场合是什么?A:前者类似于横直直方图,既能展示数据分布状况,又保留了原始数据,适用于小批量数据;后者也能很好显示数据分布状况,但不能保留原始数据,适用于大批量数据。8.Q:鉴别图表优劣的准则有哪些?A:略。9.Q:制作统计表应注意哪几个问题?A:略。第四章数据的概括性度量重要知识点:1、描述统计量:2、众数、中位数、平均数的比较:①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大量的分类数据。②中位数:一组数据中间位置的代表值,不受极端值影响,只利用了一个数据,信息浪费严重,适用于偏斜度较大的顺序数据。③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。课后题答案:1.Q:一组数据的分布特征可以从哪几个方面进行测度?A:集中趋势、离散程度、分布的形状(偏态、峰态)。2.Q:怎样理解平均数在统计学中的地位?A:平均数在统计学中具有重要地位,它是进行统计分析和统计推断的基础。平均数是一组数据的中心所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。平均数也是应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。3.Q:简述四分位数的计算方法?A:首先对数据进行排序,然后通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。中间的四分位数就是中位数,25%和75%位置上的数值分别成为下四分位数和上四分位数。4.Q:对于比率数据的平均为什么采用几何平均?A:略。5.Q:简述众数、中位数和平均数的特点和应用场合?A:①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大量的分类数据。②中位数:一组数据中间位置的代表值,不受极端值影响,只利用了一个数据,信息浪费严重,适用于偏斜度较大的顺序数据。③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。6.Q:简述异众比率、四分位差、方差或标准差的适用场合。A:对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要是用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率、四分位差、极差和平均差等,但主要是用方差和标准差来测度其离散程度。7.Q:标准分数有哪些用途?A:测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。8.Q:为什么要计算离散系数?A:方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量本身水平高低的影响,另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。9.Q:测度数据分布形状的统计量有哪些?A:偏态系数SK(高度偏态分布|SK|1、中等偏态分布0.5-1;右偏SK0、左偏SK0)、峰态系数K(正态分布的K=0,尖峰分布K0,平峰分布K0)。第五章概率与概率分布大纲重点:概率论㈠、事件及关系和运算:随机事件、必然事件、不可能事件;㈡、事件的概率:古典定义(结果有限、可能性相同)、统计定义(大量重复试验)、主观概率主义;㈢、条件概率和全概率公式:条件概率:P(A|B)=P(AB)/P(B);全概率公式:P(A)=P(A|B1)*P(B1)+P(A|B2)*

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功