妇幼信息学实验抽样计算妇幼卫生系实验的要求掌握几种抽样的概念熟悉常用抽样方法的实施了解多阶段分层随机抽样方法实验目的学会抽样调查的实施步骤解决用什么方法抽(抽样方法)、抽多少(样本含量)、怎么抽(实施步骤)、如何分析(参数估计)等几个问题?基本概念复习基本调查方法:普查(全面调查)典型调查抽样调查总体与样本抽样基本抽样方法非概率抽样概率抽样PPS抽样基本抽样方法(一)非概率抽样偶遇抽样或自然抽样:街头随访,邮寄调查等判断式抽样:销售需求调查配额抽样:居民家庭情况调查滚雪球抽样:SARS流调,调查老年人的生活状况空间抽样:广告公司调查基本抽样方法(二)概率抽样单纯随机抽样系统抽样整群抽样分层抽样多阶段抽样概率抽样(一)单纯随机抽样:定义:又称简单随机抽样,简单任意抽样等,指从总体N个抽样单元中,每次抽取一个单元时,使每个单元都有相同的概率被抽中,连续抽取n次,组成简单随机样本样本。抽样方法:抽签法、随机数字法、随机数骰子法概率抽样(一)单纯随机抽样:优点:方法简单,易于操作,是其它抽样方法的基础缺点:要求总体同质性好,未充分利用总体的其他信息,大样本不使用实验题目1:从本班11位同学中抽取4名同学接受提问。实验题目1步骤题目:从本班11位同学中抽取4名同学接受提问。随机数字法(余数法)根据座位排列将11位同学编号1-11随机数字表中确定一点,选择的数字/20,余数为起始行数,同样确定起始列数(/50)以n(1或者2)为间隔依次选取4个随机数字选出的数字/11,余数为本次接受提问的同学编号列出编号,姓名,性别小实验:随便抽样和单纯随机抽样的区别请一同学随意说出10以内的数字(重复)10次,根据这10组数据,列出各数字出现的频率。概率抽样(二)系统抽样:定义:或称等距抽样、机械抽样。将总体的观察单位按照顺序排列或标志后,每隔一定的距离抽取一个单位作为样本。优点:更具代表性,方法简单,易操作,应用广泛缺点:周期性影响概率抽样(二)系统抽样:步骤:排序或者标记计算抽样距离确定起始位置抽取样本概率抽样(二)系统抽样:基本方法:随机起点法循环等距法中点起点法对称等距抽样概率抽样(三)整群抽样:定义:将总体各观察单位划分为若干群,随机抽取一部分群,对改该群内所有单位进行调查的方法。分群原则:尽量扩大群内变异特点:“扩大”了的总体,方法简单,易操作。抽样误差较大讨论:中山大学大学生心理状况调查概率抽样(四)分层抽样:定义:也叫类型抽样,指在抽样之前,先将总体划分称若干层次,然后在每个层中独立抽样。分层原则:尽量减小层内变异概率抽样(四)分层抽样:特点:获得总体参数估计的同时,也获得各层的参数估计更具代表性,提高精度实施,管理,数据收集整理分析方便提高抽样效率概率抽样(四)分层抽样:步骤:获得总体相关信息确定分层标准和层数确定各层样本含量各层独立抽样实验题目2——比较单纯随机抽样和分层抽样:假设某宿舍8名同学拥有书籍数量如下表,请使用分层随机抽样和单纯随机抽样方法抽取4名同学调查平均拥有书籍数量。学生新生1新生2新生3新生4老生5老生6老生7老生8书籍数量1513101228364037概率抽样(五)多阶段抽样:定义:根据实际情况将整个抽样程序分成若干个阶段,一个阶段一个阶段地进行抽样,以完成整个抽样过程,这种抽样就叫多阶抽样。特点:便于组织抽样;抽样方式灵活,有利于提高抽样的估计效率;便于组织实施;应用广泛。例:某乙肝疫苗纳入计划免疫基线调查抽样方案某乙肝疫苗纳入计划免疫基线调查抽样方案抽样步骤:确定分层抽样县抽取抽样县的排列抽样乡及行政村的抽取确定调查户及调查儿童抽样样本含量的估计估计样本含量的依据总体中个体的变异程度δ精度即相对误差ε置信程度(1-α)抽样样本含量的估计估算公式连续型变量资料:离散型变量资料:22224dSZn2222)1(4)1(dPPnZ实验题目3讨论以下抽样适用或属于哪种抽样1.电视台在广州火车站采访国庆旅游目的地2.健身器材使用情况调查3.中山大学本科生心理压力状况调查4.“双色球”福利彩票抽奖5.比较各种概率抽样方法各种概率抽样方法比较单纯随机抽样系统抽样整群抽样分层抽样优点简单直观,其它抽样基础,计算简便易理解,简便易行;易得到按照比率分配的样本;便于组织,节省经费,容易控制调查质量可独立分析层参数;灵活,信息利用好缺点大样本不使用,变异大时代表性差周期性影响大抽样误差大层变量选择适用范围总体不大的情况按抽样顺序个体随机分布情况群间差异小层间差异大抽样误差大较小最大小实验题目4:某县肺结核痰涂片实验室年底进行质量控制,需抽查痰涂片质量。已知共有登记本上痰涂片2743张(部分涂片交上级部门进行质控),涂片阳性率约为28%,阳性率错误不超过5%为合格。请设计如何抽样。实验题目4:确定抽样方法确定样本含量:制定抽样步骤:单纯随机抽样,系统抽样26644.26505.005.0/)21.01(21.04)1(4)1(2222dPPnZ抽样间距=2743/266=10.312循环等距法,起始点(人民币号后2位)13,确定3为起点实验题目51996—2000年中国与联合国儿童基金会妇幼卫生合作项目基础调查,0-4岁儿童死亡情况调查。