描述统计与推断统计-心理学统计与测量经典习题1第一章描述统计名词解释1.描述统计(吉林大学2002研)答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。2.相关系数(吉林大学2002研)答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。3.差异系数(浙大2003研)答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下:常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。4.二列相关(中科院2004研)答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。5.集中量数与差异量数(浙大2000研,苏州大学2002研)答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。6.中位数(南开大学2004研)答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md或Mdn来表示。7.品质相关(华东师大2002研)答:品质相关是指R×C表的两个因素之间的关联程度。两个因素只被划为了不同的品质类别,其数据一般都是计数的数据,而非测量的数据。品质相关可依二因素的性质及分类项目的不同,而有不同的名称和计算方法,较常见的有四分相关和Ф相关。8.标准分数(华南师大2004研)答:标准分数,又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。其计算公式为:简答题1.简述使用积差相关系数的条件。(首师大2004研)答:一般来说,用于计算积差相关系数的数据资料,需要满足下面几个条件:①要求成对的数据,即若干个体中每个个体都有两种不同的观测值。②两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布。③两个相关的变量是连续变量,也即两列数据都是测量数据。④两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。2.简述算术平均数的使用特点。(浙大2003研,苏州大学2002研)答:算术平均数的优点有反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。缺点有易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。从算术平均数的这些特点可以看出,如果一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,用算术平均数表示其集中趋势最佳。3.如果你不知道两个变量概念之间的关系,只知道两个变量的相关系数很高,请问你可能做出什么样的解释?(武汉大学2004研)答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。两个变量的相关系数很高,只能说明两变量间具有较高的共变关系,即一个变量的变化会引起另一个变量朝相同或相反方向发生变化。至于二者有无因果关系,或谁是因谁是果则无法确定。所以在解释时只能说两变量间存在较高的相关关系。4.一组大学生的智力水平和性别之间求相关,设男为1,女为2。如果两变量的相关为负,请问说明了什么情况?请举例说明。(武汉大学2004研)答:根据题意,如果两变量的相关为负,则说明大学生的智力水平与性别存在负相关,即男生智力水平低,女生智力水平高。举例提示:本题所求的相关是点二列相关,一列变量为等距变量(智力水平),另一列变量为名义变量(性别)。根据点列相关的数据特点,列出两组数据,运用相应公式计算即可。要注意的是,男生的智力水平平均分数应小于女生的。5.某省进行了一次小学五年级的数学统考。已知不同小学教学水平相差较大,但同一个小学的五年级的不同班级教学水平很相近。以学生的考试成绩为原始数据,问:①如何处理这些原始数据,使得数据处理的结果能够比较不同小学学生的数学学习潜能?答:提示:使用标准分数。由于要考察的是不同学生的数学学习潜能,而非已有的数学水平,所以应该以每个学校的五年级学生为总体,求每个学生的标准分数,然后比较不同学校学生间的标准分数。②如何处理这些原始数据,使得数据处理的结果能够反映一个学校的教学水平?(南开大学2004研)答:提示:一个学校的教学水平主要体现在学生的学习成绩上,而学生成绩的好坏有两个标准:一是平均水平的高低,二是整体水平的差异。一般来说,平均水平越高,同时整体水平差异越小,表明该学校的教学水平高,反之则低。而同时反映了这两个指标的只有差异系数(CV)。其公式为:6.举例说明相关程度很高的两个变量之间并不存在因果关系。(北师大2001研)答:变量之间的因果关系必须符合以下几个条件:①二者之间必须有可解释的相关关系;②二者必须有一定的时间先后顺序,也就是说“因”的变化在前,“果”的变化在后,二者顺序不能变;③二者不能是虚假关系(即一种关系被另一种关系被另一种关系取代后,原来的关系被证明不成立);④因果决定的方向不能改变。而变量之间的相关关系是一种共变关系,即一种变量发生变化,另一种变量也相应地朝相同或相反方向发生变化。但有高相关的两个变量之间并不一定存在因果关系,如一般情况下,数学成绩好的学生,物理成绩也会比较好,即两者存在很高的正相关。但是,数学成绩和物理成绩之间没有一定的时间先后顺序,而且无法确定二者谁决定了谁,即不能满足因果关系的②④两个条件,所以不是因果关系。7.度量离中趋势的差异量数有哪些?为什么要度量差异量数?(西北师大2002研)答:对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数。这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等。一组数据集中量数的代表性如何,可由表示差异情况的量数来说明。差异量数越小,则集中量数的代表性越大;若差异量数越大,则集中量数的代表性越小。如差异量数为零,则说明该组数据彼此相等,其值都与集中量数相同。集中量数是指量尺上的一点,是点值,而差异量数是量尺上的一段距离,只有将二者很好地结合,才能对一组数据的全貌进行清晰的描述。所以需要度量差异量数。8.用算术平均数度量集中趋势存在哪些缺点?试举例说明。(重大2004研)答:其缺点有:易受极端数据的影响;如果出现模糊不清的数据时,无法计算平均数,因为平均数的计算需要每个数据的加入。如:有两组物理成绩:第一组:25,37,32,60,100,99,96第二组:63,72,60,68,63,62,61尽管两组成绩的平均分相等都约为64,但由于极端数据的存在,64不能很好地代表第一组数据的平均水平,却较好地代表了第二组数据。计算题1.五位教师对甲乙丙三篇作文分别排定名次如下表;名次教师序号甲乙丙13122321331241325132请对上述数据进行相应的统计分析。(华东师大2003研)答题提示:题目目的是让考生对5位教师的一致性做出评价。该题是让5个被试(教师)对3篇作文进行等级评定,每个被试都根据自己的标准对三篇作文排出了一个等级顺序。所以应该计算肯德尔W系数。将题中原始数据代入公式即可。2.计算未分组数据:18,18,20,21,19,25,24,27,22,25,26的平均数、中数和标准差。(首师大2003研)答题提示:平均数与标准差的计算直接将原始数据代入相应公式即可。中位数的计算稍复杂一些。将数据从小到大进行排序,可知数组中虽有重复数据,但位于中间的数非重复数据,加之数据数为偶数,所以取第N/2和第N/2+1两个数的平均数作为中数即可。3.4名教师各自评阅相同的5篇作文,表2为每位教师给每篇作文的等级,试计算肯德尔W系数。(首师大2003研)表2教师对学生作文的评分作文评分者1234一二三四五35241352413415235142答题提示:将数据代入肯德尔W系数即可。4.把下列分数转换成标准分数。11.0,11.3,10.0,9.0,11.5,12.2,13.1,9.7,10.5(华南师大2003研)答题提示:先根据相应公式计算平均数和标准差,然后根据标准分数公式依次计算每个分数的标准分数。5.假定学生的成绩呈正态分布,某班五名学生的数学和物理成绩如下,求相关系数。(重大2004研)学生数学(X)物理(Y)1234580777370678582807470答题提示:两列数据均为测量数据,而且呈正态分布,因此应该求积差相关。将数据代入积差相关公式即可。第二章推断统计单选题1.什么情况下样本均值分布是正态分布?A总体分布是正态分布B样本容量在30以上CA和B同时满足DA或B之中任意一个条件满足(北京大学2000)参考答案D2.以下关于假设检验的命题,哪一个是正确的?A如果H0在=.05的单侧检验中被接受,那么H0在=.05的双侧检验中一定会被接受B如果t的观测值大于t的临界值,一定可以拒绝H0C如果H0在=.05的水平上被拒绝,那么H0在=.01的水平上一定会被拒绝D在某一次实验中,如果实验者甲用=.05的标准,实验者乙用=.01的标准。实验者甲犯II类错误的概率一定会大于实验者乙。(北京大学2000)参考答案D3.让64位大学生品尝AB两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表):A2.28%B4.01%C5.21%D39.06%(北京大学2000)参考答案C4.在多元回归的方法中,除哪种方法外,各预测源进入回归方程的次序是单纯由统计数据决定的:A逐步回归B层次回归C向前法D后退法(北京大学2000)参考答案B5.以下关于假设检验的命题哪一个是正确的A、实验者甲用=0.05的标准,实验者乙用=0.01的标准,甲犯II类错误的概率一定会大于乙:B、统计效力总不会比水平小C、扩大样本容量犯II类错误的概率增加D、两个总体间差异小,正确拒绝虚无假设的机会增加。(北京大学2002)参考答案D6.已知X和Y的相关系数r1是0.38,在0.05的水平上显著,A与B的相关系数r2是0.18,在0.05的水平上不显著A、r1与r2在0.05水平上差异显著B、r1与r2在统计上肯定有显著差异C、无法推知r1与r2在统计上差异是否显著D、r1与r2在统计上不存在显著差异(北京大学2002)参考答案C7.在回归方程中,假设其他因素保持不变,当X与Y相关趋近于0时,估计的标准误是怎样变化?A、不变B、提高C、降低D、也趋近于0(北京大学2002)参考答案C简答题1.非参数检验方法的特点有哪些?(浙江大学2005)参考答案:①一般不需要有严格的前提假设②非参数检验特别适用于顺序资料(等级变量)③很适用于小样本,且方法简单④最大的不足是未能充分利用资料的全部信息;⑤非参数方法目前还不能处理“交互作用”。2.在被试取样时,应该根据哪些因素确定样本的大小?(华南师大2005)参考答案①当进行平均数的估计时,当确定后,总体标准差和最大允许误差d是决定样本容量的两个因子②当进行平均数假设检验时,需要同时考虑显著性水平、统计检验力、总体标准差以及所假设的总体差异四个因子3.能否用两总体平均数差异z检验或t检验逐对检验多个总体平均数的差异显著性问题?为什么?(华南师大2005)参考答案:不能,因为同时比较的平均数越多,其中差异较大的一对所得的t值超过原定临界值t的概率就越大,这时错误的概率将明显增大,或者说原本达不到显著性水平的差异很容