心理学辅导课程pkurose心理学对应的工作•心理咨询•职业咨询–GCDF•心理测评–MBTI•市场调查•人力资源管理–招聘,培训课程安排•心理统计(10次)•实验心理学(20次)•普通心理学(10次)心理统计•《StatisticsfortheBehavioralSciences:AFirstCourseforStudentsofPsychologyandEducation》•《社会统计分析方法-SPSS软件应用》的多元回归,因素分析这两章实验心理学•《实验心理学》(北大版)•《实验心理学-掌握心理学的研究方法》(华东师范大学出版社)•《实验心理学-通过实例入门》•《心理学实验纲要》(北大版)•《心理实验方法》(吉林教育出版社)普通心理学•《心理学与生活》•《社会心理学》(侯玉波)•《人格心理学概要》•《心理学思想的流变》•《改变心理学的40项研究:探索心理学研究的历史》心理统计pkurosepsy2003@sina.com课程安排•课程的教材–Gravetter,F.J.,Wallnau,L.B.(2000).StatisticsfortheBehavioralSciences:AFirstCourseforStudentsofPsychologyandEducatio–《社会统计分析方法-SPSS软件应用》的多元回归,因素分析为什么要讲本课程•讲课的重要性•和以前我讲的一次课的区别•帮助大家从心理学整个学科以及心理学应用的角度来看心理统计,达到更好的理解•帮助大家掌握一个有用的工具本课程的用处•心理学的核心课程之一•学习–心理学的基础研究–心理学的应用研究•工作–市场调查–管理咨询–心理测量Chapter1统计初步什么是统计?•统计(Statistics)–指组织,总结和解释信息的一整套方法和规则。–人口普查,民意调查,班级学习情况,家庭每月支出情况总体和样本•总体(population)–特定研究所关注的所有个体的集合。–总体但指人,可以是动物、甚至可以是研究(例如元分析中将所有相关的研究作为总体)–总体可大可小•样本(sample)–从总体中选择出的个体的集合,应该能代表研究的总体。–样本不一定小于总体–统计总体(statisticspopulation)统计样本(statisticssample)•参数(parameter)–描述总体的数值。参数可以从一次测量中获得,或者从总体的一系列测量中推论得到。•统计量(statistic)–描述样本的数值。统计量可以从一次测量中获得,或者从样本的一系列测量中推论得到。•数据(Data)–测量或观察所得。描述统计和推论统计•描述统计(Descriptivestatistics)–总结,组织,和使数据简单化统计程序。•推论统计(Inferentialstatistics)–使我们能够通过对样本的研究将其结果推广于总体。–为什么需要推论统计•我们有时无法测量总体中的所有个体取样误差和随机取样•取样误差(Samplingerror)–样本统计量与相应的总体参数之间的差距。–样本的代表性•样本的大小•随机•随机取样(randomsampling)–从总体抽取样本的一种策略,要求总体中的每一个体被抽到的机会均等。用随机取样法得到的样本叫做随机样本.变量和常量•变量(variable)–是一种特征或条件,其本身是变化的或对不同的个体有不同的值。–智力、身高、员工满意度•常数(constant)–是一种特征或条件,其本身是不变的且对不同的个体的值也相同。–例如,数字:8相关法•相关法(correlationalmethod)–看两个变量是否有某种特定关系。–两个变量都需要测量–相关不表示因果–例如,学习上花的时间和学习成绩的关系的研究实验法•实验法(experimentalmethod)–操纵一个变量,观测另外一个变量的变化。用以建立两个变量间的因果关系。实验法用随机分组和控制其他变量恒定的方法,试图消除其他因素的影响或使之减为最小。•自变量(independentvariable)–被研究者操纵的变量.在行为科学研究中,自变量常常包括两个(或更多)的处理条件。•因变量(dependentvariable)–被观测的变量,其变化被用来评价处理的效果。•例子–网络教学和普通授课的效果的研究•控制组(controlgroup)–是自变量的一种处理方法,此组被试不接受任何实验处理.有时控制组被试接受一种中性处理或安慰剂。其目的是提供一个与实验组对照的基线水平。•实验组(experimentalgroup)–此组被试接受某种实验处理。•混淆变量(confoundingvariable)–未能控制的变量,与自变量有非预期的系统性关系。•例子–认知行为疗法的治疗效果研究。–药物效果研究。准实验法•准实验法(quasi-experimentalmethod)–考察已有的各组被试间的差别(如性别差异)或在不同时间所采集数据的差异(如,处理前和处理后).这里的分组变量称准自变量,每个被试的分数称因变量。假设、构念和操作定义•假设(hypothesis)–对实验结果的预测。在实验研究中,假设就是对操纵自变量会如何影响因变量的预测。•构念(Constructs)–指假设的概念,用于理论中,按其内部机制来组织观察。•操作定义(operationaldefinition)–用具体的操作或程序以及由此产生的测量指标来定义构念。因此,一个操作定义包含两个成分:1)它描述了度量一个构念的一系列操作或程序;2)它用度量的结果来定义构念。–智力的操作定义•例子:社会技巧和工作绩效的关系研究。四类量表•命名量表(nominalscale)–由一系列具不同名称的范畴所组成。命名量表的度量将观察所得标定并分类,但不会对观察所得作任何数量化的区分(无大小之分)。–性别、职业•顺序量表(ordinalscale)–由一系列按顺序排列的范畴所组成。顺序量表的度量将观察所得按其大小或数量排定秩次(rank)。–考研成绩的排名•等距量表(intervalscale)–由一系列按顺序排列的范畴所组成,且每两个邻近范畴之间的距离都是相等的。在等距量表中,加减运算反映数目的大小差距.但是,乘除运算没有任何意义。–没有绝对零点,可以加减,不可以乘除–温度•比例量表(ratioscale)–是具有绝对零点的等距量表.在比例量表中,乘除运算反映数量间的比例关系。–可以加减乘除–考研的分数变量的类型•离散型变量(discretevariable)由分离的,不可分割的范畴组成。在邻近范畴之间没有值存在。–参加本次课程的每周人数•连续型变量(continuousvariable)在任何两个观测值之间都存在无限多个可能值。连续型变量可以分割成无限多个组成部分。–身高、体重、温度统计中常用的符号•求和符号summation∑•N=群体大小(参数)•n=样本容量(统计量)Chapter2次数分布次数分布综述•描述统计的目的:简化和整理数据的表达。•次数分布表和次数分布图就是表达一组数据是如何在某一度量上分布的。•次数分布:是指一批数据在某一量度的每一个类目所出现的次数情况•组织此类数据的第一种方法是:建立次数分布表次数分布表•次数分布表的要素–变量的值?-填充x列–每个值出现多少次(发生次数)?-填充f列–观察的总数?将次数行求和,将得到∑f=N–变量的总值?最简单的方法就是求(X)和(f)的乘积列,然后将结果求和∑(Xf)次数分布表例子•例1:对于下面的次数分布表–此分布中共有几个分数(N=?)–对这些分数求和∑Xxf42342513例2•例2:某个班的26个学生在一次测验中的分数如下(10分为满分):–9,2,3,8,10,9,9,2,1,2,9,8,2,5,2,9,9,3,2,5,7,2,10,1,2,9–将这些分数作成一个次数分布表xfcfC%10226100%9724821771156014521240123210288122•比例(相对次数;Proportions).全组中有多大比例取值为X?p=f/N(N=观察的总数)•百分比(Percentages).全组中有多大比例取值为X?p*100分组次数分布表•常常以区间的形式出现,而不是某一特定值.例如学生成绩,(A=90-100,B=80-89,...).•编制分组次数分布表的步骤–求全距–定组数–定组距–写出区间上下限–统计每个区间的次数•建构这些区间有一系列的“惯常法则”(rulesofthumbs)–分组次数分布表应该有大约10个区间,目的是使这组数据易于直观感受和理解–组距应该是个比较简单的数字,如2,5,10,20–每个区间开始的分数应该是组距的倍数–所有区间的宽度应该相等次数分布图•次数分布的数据可以用图简明地概括•直方图(histogram):用一些垂直条画在每个分数之上–垂直条的高度代表次数–垂直条的宽度代表分数的精确区间.–只有数据是等距或等比量度时,才能用直方图•注意:对于一个连续变量,每个分数实际对应一段组距.分割这些组距的界限叫做精确界限(reallimits).分割两个邻近分数的精确界限位于两个分数的中间。•每个分数有两个精确界限,一个在组距的顶端,称为精确上限(upperreallimit),另一个在组距的底端,称为精确下限(lowerreallimit).•注意一个组距的精确上限也是高一个组距的精确下限。例3:•绘制一个直方图来表达例2的分布051012345678910Column1棒图(条形图;bargraph)•棒图(条形图;bargraph):用一些垂直条画在每个分数(或类别)之上–垂直条的宽度代表分数的精确区间–垂直条的高度代表次数–每个垂直条之间有一段空间–只有数据是命名或顺序量度时,才能用棒图例4,某年心理学系报考志愿统计0123456789第一志愿第二志愿调剂Column1线图入睡所需时间与训练次数的关系010203040506070800次2次4次8次训练次数入睡所需时间直方图,棒图,线图的使用•命名量表,顺序量表–棒图•等距量表,等比量表–直方图–线图(能够反应趋势)•例如儿童智力的发展次数分布的形状•用3个特征可以完整地描述一个分布:形状(shape),集中趋势(centraltendency),和变异性(variability).对称分布(symmetricaldistribution)•对称分布(symmetricaldistribution):可以画一条垂直线穿过分布的中央,使得分布的一边恰是另一边的镜象。偏态分布(skeweddistribution)•偏态分布(skeweddistribution)中,分数堆积在分布的一端,而另一端成为比较尖细的尾端(tail)•尾端向左:负偏态正偏态:尾端向右双峰分布例4(2003)例(2003)例(2003)20052005200520052005茎和叶图•茎和叶图(stemandleafdisplay)-将每一数字分解为左边部分(称为茎)和右边部分(称为叶).如果数字是两位数,左边的一位就是茎,右边的一位就是叶.•例7:考察下列茎和叶图百分位数•以上是描述观察的整体,而我们也可用次数分布来描述某一个别点在一个集合中的位置•一个分数的等级(rank)或百分位数等级(percentilerank):某一分布中分数在某一值之下或等于该值的个体所占的百分比.例8:此表是一次词汇测验的分数•cf=累积次数(cumulativefrequency)c%=累积百分比(cumulativepercentage)•95百分位数等级的所对应的测验分数是多少?•如果你在测验中得到4分,你的百分位数等级是多少?如何确定百分位数•注意:对于连续型数据,必须考虑其精确上限和精确下限•-对于分数4,其对应的累积百分比是95%.但注意:分数4意味着一个人得分在3.5和4.5之间.累积百分比表明组距的精确上限。因此,95的百分位数是与4.5相对应(而不是4.0).•找出分布中4分的精确上限和精确下限的累积次数.–对于分