心理学研究方法06抽样设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

抽样设计SamplingDesign目录1随机样本的概述2抽样设计的原则3分层随机抽样4整群抽样5有序抽样6样本规模的确定7有目的抽样8取样实例9练习一、随机样本概述1.随机样本的概念•随机样本也称概率样本,总体中的每个个体都有机会进入样本,即总体成员被选入样本的概率都不为零。•特点:随机样本是一个无偏样本。可以认为随机样本代表着它所属的总体。2.概念:随机选择和随机分布•随机选择和随机分布,它们都用于获得样本的代表性和消除可能的偏差,但是不完全同义。•当个体被随机选择为总体的代表时,就用到随机选择概念;•随机分布的概念通常用在实验中,总体中的成员被随机分配到不同的小组或不同的处理中,他们可以是、也可以不是直接从一个较大总体中选择出来参与实验的。随机选择的实例•一所大学内的研究机构从容量为6821名新生的总体中随机抽取了250人组成了一个随机样本,用来进行一项关于大学生生活态度的调查。这就是随机选择,250名样本成员就代表了6821名新生。•如果我们把调查结果推论到6821名新生中去,这是一种完全真实的、有统计依据的推论。//简单随机抽样的方法•使用随机数字表5398102015321119725005664•抽签或抓阄//随机分布的实例•一位心理学者为大学2年级学生开设的心理学课有90名学生注册。他用3种不同的材料进行一项学习实验。90名学生全部参加。每30名学生被随机分配在一个组接受一种处理。用随机分布的方式分配到不同处理中去的30名学生不是确定的。每个学生都有可能被分配到任何一组中去接受实验。//随机分布的实例•这90个学生代表什么总体?他们不是从一个较大容量的总体中随机选择出来的。他们参加实验的理由是他们报名选修了心理学课程。在这种情况下,心理学者有时候可能认为这90名学生可以代表整个大学生总体,有时候可能认为不能。如果这所大学的2年级学生与其他大学的2年级学生特别相似,此实验结果就可以推广到其他大学的2年级学生总体中去。但推论到整体青年人总体是不恰当的。这种推论是一种逻辑上的讨论。3.概念:抽样误差与抽样偏差•当随机样本被用来代表总体时,样本统计值与总体参数之间的差叫做抽样误差(samplingerror),它是一个变动量。•例如,从1675名5年级学生中随机抽取150名作为样本,如果样本的数学考试平均分是86.3,总体的平均分不一定是86.3,但大约是86.3。•随着样本容量的加大,因随机波动导致的变动量会减小,抽样误差也减小。/抽样误差与抽样偏差•抽样偏差(samplingbias)是由于选择样本的方式不恰当而造成的错误,它使样本对总体来说不具代表性。•例如,前述的1675名学生是来自5所小学,如果我们从每个小学选择一个高能力班,每班30人,这150名学生的数学考试平均分为98分,这个分数显然不能代表总体,因为发生了抽样偏差。•在问卷调查中,被调查者无应答也可能造成抽样偏差,尽管最初的样本是随机选择的。回答者对回答与不回答的选择造成了一个有偏差的样本。/抽样偏差的实例•1936年罗伯和克莱斯利曾进行一项民意测验,该测验结果预示阿尔夫·兰登将在总统竞选中获得比富兰克林·罗斯福多15%的选票。抽样是随机的,但样本却主要从电话簿和汽车登记册中选择的。这是一个抽样偏差的典型例子。同年,盖洛普根据选民的收入按比例取样并加权校正,预测罗斯福获胜。二、抽样设计的原则为什么研究人员放着简单随机抽样不用,而要进行复杂的抽样设计呢?主要原因有:•1总体容量太大;•2总体的组成是多样化的,简单随机难以兼顾;•3所研究的总体可能是非常特殊的人群,不可能进行简单随机取样;•4在实际抽样当中遇到的困难。•因此,研究者通常要在抽样前进行抽样设计。好的抽样设计的标准1目标明确2可测性3可行性4经济性1目标的明确性原则•目标明确性原则指对抽样方法进行设计时要以研究方案和研究目标为依据,将研究的问题作为出发点。•为了获取数据和进行预分析,应该在抽样之前进行必要的测量。•思考:要考察的总体是什么?要考察哪些变量?要考察变量的什么关系?要做什么推论?等等2可测性原则•抽样设计要为必要的分析提供数据。如果一个抽样设计具有可测性,那就可以对样本变量做出有效估计,使研究者以后能从样本数据有效地推断出总体特征。•从操作上来说,可测性就是从样本获得的数据是容易进行必要的描述和推论统计的。3可行性原则•可行性原则指应用某一抽样设计的实际活动在现实情境中是行得通的。为此,在进行抽样设计时应该考虑到可能遇到的问题和困难,以及解决这些问题和困难的方法。•思考:我能否找到我想找的那些人?当我找到他们时,他们会配合我的调查吗?他们能够回答我的问题吗?4经济性原则•研究活动应和可得资源相吻合。资源包括人员、财力、时间等。•数据的获得是以时间和金钱为代价的,所以抽样应避免造成浪费。三、分层随机抽样1抽样比率:样本容量与总体容量的比值,表示为n/N例如,从容量为2000的总体中抽取容量为300的样本,其抽样比率为300/2000,即0.15。对简单随机样本来说,抽样比率等于总体中每个成员被选入样本的概率。/三、分层随机抽样2分层随机抽样:有时候,要抽样的总体是不同质的,是由若干个子总体组成的。这时,我们可以把一个母总体分为两个或更多的子总体,或称作“层”,再从每层中抽样。这种抽样方法叫做分层随机抽样。三、分层随机抽样3层中样本大小的分配按比例分配法:若一个母总体N被分成K层子总体,各层总体的大小分别是N1,N2,……Nk,各层样本的容量分别为n1,n2,……nk,那么,n/N=n1/N1=n2/N2=……nk/Nk其中,N1+N2+……Nk=Nn1+n2+……nk=n抽样比率是n/N,nk=Nk*n/N三、分层随机抽样例题:一项关于大学设施充足度的调查,大学有7个学院,注册学生15823人,用分层随机法抽样,每个学院为一层,假设抽样比率为0.05,层层的总体各层的样本文理学院5461273商管学院185093社区服务学院2092105教育学院3508175工程学院2112106法学院31816药学院48224总计15823792韦氏量表编制中的取样过程•韦氏量表首版于1949年,1970年代初修订,采取分层随机取样原则,考虑到年龄、性别、种族、地理区域、家长职业、城乡六个分层变量。对这6个变量考虑得非常仔细严密。•样本共取6.5岁到16.5岁的2200名儿童为样本。每个年龄组各取男女儿童100名。儿童必须是正常的,凡在低智能机构中受教育的或有情绪障碍的一律不要。每个家庭只能有一个孩子被选中。修订韦氏量表时考虑的分层变量•地域:东北、北中部、西部、南部•种族:白种人、非白种人、黑人、印第安人、东方人(以1970年美国人口普查为基础)•父母职业:(1)从事专业技术的人员;(2)管理人员、政府公务员、业主、办事员、售货员;(3)手艺人、工头、领班;(4)操作人员、服务人员(包括私人管家)、农民及农场管理人员;(5)劳工、农场工人、农场领班。然后,根据美国18岁以下儿童生活在这5类职业家庭中的分布情况确定每类家庭的取样比例。•城乡:居住2500户居民以上的为城市,以下的为农村。•施测时间为1971年12月到1973年1月。•被试的受测年龄以他所在的年龄中间值的前后6个星期之内为限。如9.5岁组的被试在受测时必须在9岁4个月15天到9岁7个月15天之间。•由此建立的常模在美国具有相当好的代表性,可以应用到全国各地相似条件下的儿童智力测验工作中去。•与韦氏量表的严格取样程序相比,我们很多研究人员在实际工作中,不遵循分层次、按比例随机抽样原则,例如,从全市抽取15所学校,参加某项调查,有的研究者因缺乏经验,就按照好、中、差的标准把所有学校分成三个层次,然后各取三分之一。但是,好、中、差三种类型的学校在总体中确实是各占三分之一吗?四、整群抽样•当简单随机抽样不切实际或花费太高时,就可以考虑采用整群抽样法。•整群抽样是一种以群体为单位选择样本的方法。“群”就是两个或两个以上的人组成的群体•整群抽样与分层随机抽样的区别:–整群抽样的样本单位是“群”,而分层随机抽样的样本单位是个体。当一个群被选为样本时,群内的所有个体就全被包括在样本中。分层抽样中,每一层的成员能否进入样本是随机的。–划分层的依据不同:分层抽样中,层之间的异质性高,而层内尽可能同质。整群抽样中,群间异质性低,而群内异质性高因此,分层抽样适用于界质分明的总体,而整群抽样适用于界质不清的总体。整群抽样举例•某项调查要考察某市33所小学4年级学生的标准化数学测验成绩,对全体学生进行测验成本太高,选择一个简单随机样本并施测的工作太烦杂。因此决定整群抽样。33所小学共83个4年级班级每班平均有27.3个学生。预想样本规模约550人。决定从83个班中抽取20个班,最后参加测验的学生为561人。五、有序抽样(系统随机抽样)•当总体容量很大、并已得到按某种顺序(如汉语拼音、笔划等)整理好的名册时,即可采取有序抽样法。其优点是简便易行。具体做法是:当样本的第一个个体被随机选定后,其他个体就可按一定规律抽出。如果抽样比率为1/k,就从名册中抽出所有k序列的个体。如隔5抽1。•这种抽样可能因周期性问题的出现而导致一个偏差样本。/有序抽样造成的系统误差举例•以某市一个区为总体抽取5年级学生的一个样本,对其进行能力测试,以估计全区所有5年级学生的能力水平。研究者决定抽样比率为1/30,而且发现用各班学生的名册很方便,因为每班学生的人数大约都是30。研究人员向各学校索要了5年级各班学生的名册,但不是按姓氏笔划或拼音排列的名册,而是以最近一次考试成绩排列的名册。然后把所有学生顺次排列起来。如果样本的第一个个体选择第一个班的第三名,则意味着第33、63、93名学生被选入样本。这和第9、39、69、99名学生入选的结果差别将相当大。六、样本规模的确定•在调查研究中,确定样本大小的影响因素很多,除了研究成本,其他的因素常常很难确定,这就使样本容量的确定非常困难。•根据统计原理,样本越大,则统计误差越小。经验证明,10%的抽样比率对于一个2000以上的总体来说就足够了。如果总体达到20000以上,则抽样比率可以降低到2~4%。/0100200300400500600700100020003000400050001万2万5万10万样本数占35%23%16%13%11%6%3.2%0.68%0.14%总体比例不同的总体规模所需的样本容量总体规模100人以下100-1000人1000-5000人5000-1万人1万-10万人10万人以上样本占总体比重50%以上50%~20%30%~10%15%~3%5%~1%1%以下经验确定样本数的范围t2σ2n=Δ2n为样本容量,σ2为总体方差,t代表置信水平,Δ表示精确度为重复简单抽样的平均误差公式。它表明,抽样误差与总体方差及样本容量有关,总体方差越大,抽样误差越大;样本容量越大,抽样误差越小。确定样本容量的例题•已知某学校数学考试σ=8.625,若置信水平为95%,精确度为95%,若想抽样分析该试卷,样本容量应该多大?•由n=t2σ2/Δ2,•n=0.952×8.6252/0.952=74实验的样本容量•有的实验中,被试可能分为不同层次和组,一般来说,一项实验所包含的变量越多,所要求的被试数量就越多。如果组比较多,每组人数为8、10、15、30都是可以的,但是如果只有两个组,那么每组15个人的容量就太小。此时,每组40到50人比较合适。控制得比较好的实验,如学习实验室中的实验,每组15个左右被试、样本总量60左右可能是较充分的。实验的样本容量•一个2×2×3的多因素设计,包含的组有12个,每组10个被试可能算最小的样本容量,在这样的样本容量下,其结果可以勉强被接受,但如果每组增加到20、30人,其统计代表性就好得多。只要资源和条件允许,应尽量采用较大的样本。•但不应认为样本越大越好,因为这会造成工作量过大和数据浪费。对调查来说,收集大样本资料花的时间太长,会使统计结果失去及时性。•抽样方法的随机特征才是决定代表性的关键

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功