统计学抽样方案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

22006年海宁市公众科学素养调查抽样方案一、调查目的、范围及对象海宁地处中国长江三角洲南翼、浙江省北部,东距上海100公里,西离杭州60公里,南濒钱塘江,内陆面积近700平方公里,地势平坦,河流众多,水源丰富,是典型的江南水乡。海宁现辖8个镇,4个街道,总人口64万。海宁经济发达,市场繁荣,是我国首批沿海对外开放县(市)之一,连续三届跻身“全国综合实力百强县(市)”行列,县域社会经济发展综合评价全国第19位,是浙江省首批“小康县(市)”之一。海宁的目标是实现由小康向现代化的历史性跨越,到2010年建成经济文化强市。提高公众科学文化素质,是实施科教兴国战略和可持续发展战略,是建设经济文化强市的重要内容之一。为深入地了解海宁市公众科学素养的状况,为政府和相关机构以及科普研究提供详尽的数据,海宁市科协决定于2006年6月至11月开展海宁市公众科学素养抽样调查。本次调查的范围是海宁市包括:斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。本次调查对象是在海宁市境内居住半年以上,年龄在18~69岁的成年人(智力障碍者除外)。本次调查的内容主要是了解海宁市公众的科学素养水平、获得科技知识的渠道、对科技发展的态度等方面的基本情况。二、调查方案的设计从数据上看,海宁市各地区的经济、文化等各方面差异不是很大。但非农业与农村的差异还是明显的。本次调查采用分层抽样三阶段的方法,各阶段的抽样单位如下:第一阶段:海宁市所有镇及街道均入选为抽样单位;第二阶段:以社区或村委会为二级抽样单位;第三阶段:以家庭住户并在每户中确定1人为最终单位;(一)调查样本量的确定样本量的定量分析:纯净样本量是指去掉不合格或未回答的调查对象以后的剩余量,由于调查的结果主要是估计各种比例数据以及比例数据的之间的比较,所以在决定调查样本量时采用估计简单随机抽样的总体比例时的样本量为基础,一般用公式Nup(1p)d2来计算,其中N为纯净样本量,u为一定置信度下所对应的临界值,p为样本比例,d2为误差率。类似调查中,大多数取95%的置信度(即仍有5%的不确定性或5%的误差),本调查也采用95%的置信度,此时u=1.96,由于p值较难估计,可采用保守策略,取p0.5,上述公式转化为up(1p)1.9620.50.5n01067表1:各地区非农业与农业的样本量N1.9620.50.5d22006年海宁市公众科学素养调查研究报告。一般误差率(最大允许绝对误差)d取值为3%或更小。样本量的确定:在95%的置信度下按抽样绝对误差不超过3%的要求进行计算,由于我们可能要计算各种比较的大小,所以没办法精确地估计p的大小,采用保守策略,取p0.5计,即所应抽取样本量为:d20.032根据经验,一般分层抽样的设计效应为1.8,故抽取总样本数为1920.6个(人),为了便于计算和分组,设定本次的样本量为1920个(人)。(二)抽样方法考虑本项目所调查的地点仅为海宁市,所调查区域相对集中,并且海宁市所属的镇和街道只有12个分别为斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。抽样方法采取分层的三阶段与人口成比例的PPS概率抽样,即分层、多阶段概率与规模成比例系统抽样法。首先将海宁市按非农村人口和农村人口分为两个层,分层标准主要为居民性质(按海宁市科协所提供资料)。分层后,分别采用三级子抽样,即小层→社区或村→家庭户→人。(三)分层全市的镇和街道为一级抽样单元,共有12个基本单位。对第一阶段的抽样,全市各地区农村居民与非农村居民的科学水平差异较大,并且考虑到海宁市的具体情况,所以,将海宁市按非农村和农村分为两个层进行抽样。农业与非农业人口的比例的确定海宁市的非农业人口(即由海宁市科协提供的农村社区人口和城镇社区社区人口之和)与农业人口(即海宁市科协提供的农村人口)的比例为23.39:76.61。依据按比例抽样的原则,同时也兼顾可操作性,确定抽样时农业人口与非农业人口的样本数分别为:1464个(人)和456个(人)。现根据海宁市各镇或街道农业与非农业人口比例,确定非农业与农业的样本量比例如下:2地区合计非农业人口农业人口非农业人口占总人口比例非农业样本量农业样本量总人口6457731510524947210.234561464斜桥镇615743963576110.0612168许村镇1038383915999230.0412300长安镇7733817111602270.2248180周王庙镇479102831450790.0612132盐官镇486485193434550.1112132丁桥镇449151295436200.0312120表2:各地区抽取的社区或村个数2006年海宁市公众科学素养调查抽样方案(四)多阶抽样步骤:1.初级抽样单位的抽选全市的12个镇、街道均为初级抽样单位。2.二级抽样单位的抽选在各的街道、镇抽取若干个社区或村委会,由已经取得的社区和村的人口资料编号排序(随机进行,没有规定的先后次序)。然后用产生随机数的方法抽取社区或村。(可见表2,表3)。4.三级抽样单位的抽选将以上抽中的社区或村委会中所含居民户数编号排序。仍随机抽样法,从每个社区或村委会中抽取24或12户居民(具体样本的分配见下表3),将从社区中抽取的样本为非农业人口的代表,从村中抽到的样本为农业人口的代表。再用二维随机数表决定具体18-69岁(智力障碍者除外)的居民。三、第二阶段抽样——街道和镇对社区和村的抽样根据上述的抽样原则,确定抽取社区和村的个数如下:利用海宁市科协提供的资料,按人口总数的PPS抽样,经发生随机数产生下面的样本社区和村。3地区合计抽取社区个数抽取村个数非农业样本量农业样本量总人口645773381224561464斜桥镇615741712168许村镇10383811312300长安镇773382848180周王庙镇479101612132盐官镇486481612132丁桥镇449151512120袁花镇529511612144黄湾镇2309903072硖石街道652557215636海洲街道546955213236海昌街道38136234860马桥街道2741404084袁花镇529513969489820.0712144黄湾镇230990230990.00072硖石街道6525551669135860.7915636海洲街道5469544491102040.8113236海昌街道3813615921222150.424860马桥街道27414694267200.03084表3:各地区抽中的社区和村注1:在备注中社区或村只抽取12人,其余的均选取24人。2006年海宁市公众科学素养调查研究报告4合计抽取社区抽取村备注样本量斜桥镇斜桥社区金石村、祝东村、庆云村、永合村、仲乐村、新农村、三联村斜桥社区180许村镇联合社区孙桥村、永福村、团结村、双联村、李家村、联盟村、茗山村港东村、海王村、花园村、景树村、前进村、胜利村联合社区、联盟村312长安镇辛江社区、怡院社区盐仓村、褚石村、天明村、新民村、肖王村、东升村、辛江村、陆泽村东升村228周王庙镇周王庙社区荆山村、胡斗村、陈桥村、双涧村、上林村、长春村周王庙社区、荆山村144盐官镇春熙社区桃园村、群益村、丰士村、万寿村、祝会村、城北村春熙社区、祝会村144丁桥镇第一社区利群村、新仓村、群海村、万新村、芦湾村第一社区132袁花镇河东街社区镇东村、夹山村、龙联村、谈桥村、梨园村、东风村河东街社区156黄湾镇黄山村、黄湾村、大临村72硖石街道长田社区、高丰社区、群利社区、由拳社区、海青桥社区、西山社区、沙泗浜社区联和村、南漾村西山社区、南漾村192海洲街道新庄社区、东长社区、海洲社区、文苑社区、联塘社区、百合社区伊桥村、双凤村百合社区、双凤村168海昌街道金利社区、东郊社区利民村、金星村、利峰村金星村108马桥街道正阳村、利众村、柏士村、马桥村柏士村84表4:某社区住户情况(2)用计算器产生12个随机数。用计算器产生的随机数乘以所在村委会的总户数,表5:样本社区中12个家庭的抽样2006年海宁市公众科学素养调查抽样方案四、第三阶段抽样——社区或村对家庭户的抽样社区或村对家庭户的抽样是利用计算器产生随机数后进行简单随机抽样。例如:在抽中某个社区有40户,具体资料如下表所示:取整后所得的数即为被抽中的家庭的相应的编号。如表4。5序号住户名称随机数码序号住户名称随机数码1C01*22C212C02*22C223C0323C23*4C0424C245C0525C256C0626C267C07*27C278C0828C289C09*29C29*10C1030C30*11C11*33C3312C1232C3213C13*33C3314C14*34C3415C1535C35*16C16*36C3617C1737C3718C1838C3819C1939C3920C2040C40随机数随机数*总的户数抽中的家庭编号0.40216.08C160.34713.88C130.0461.84C010.75430.16C300.58423.36C230.89335.72C350.0672.68C020.249.6C090.1877.48C070.72729.08C290.28011.2C11表6:二维随机数表●表中最后一行与事先指定的一列交叉的数字即为调查对象的序号。如表所示调查对象2006年海宁市公众科学素养调查研究报告0.36014.4C14村中住户的抽取方法与社区中住户的抽取相同。五、家庭户内被调查对象的确定为了在调查中,使家庭中每个合格的调查对象均有同样的机会被抽选,本调查采用以下二维随机数表法。二维随机数表的使用方法:事先在第一行中随机圈定一列(每个样本街道、乡镇内1~12中每个数字被圈定的问卷数目完全相同)。将户内所有符合调查条件的成员(包括半年以上的暂住人口,如保姆、亲戚)按先男后女、同性别按年龄从大到小的顺序排列。为men3。附表一:入户接触表附表二:二维随机数附表三:问卷编号6序号姓名性别年龄1234567891011121Men1男681111111111112Men2男452112121212213Men3男203211322131234Women1女634132231432415Women2女435412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功