抽样调查第1章引言

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

教师:胡松华课程要求每次实验课需撰写实验报告,并统一提交,作为实验成绩利用本课程所学方法,选取一个实际问题,进行调查问卷分析,并撰写课程论文,计入平时成绩考核要求本课程以考核为主,总成绩包括:平时成绩占10%实验成绩占20%期末成绩占70%参考教材抽样论,许宝禄编著,北京大学出版社抽样调查,孙山泽编著,北京大学出版社抽样技术(第四版),金勇进等编著,中国人民大学出版社目录第一章引言第二章简单随机抽样第三章不等概抽样第四章分层抽样第五章多阶抽样第六章整群抽样与系统抽样第七章二相抽样§1.1大规模抽样调查§1.2有限总体抽样的样本分布§1.3概率抽样的几种基本的抽样方法抽样调查的意义与分类总体与样本抽样调查的操作流程抽样调查的概念广义上讲抽样调查即非全面调查狭义上讲指从构成总体的所有单元中按一定程序选择一部分单元,并根据这部分单元的特征估计或推断总体特征的调查Samplesurvey抽样调查的意义在一些场合,找到总体的所有单位客观上根本不可能在一些场合,能找到所有单元,但时间与费用代价太高在一些场合,能找到所有单元,代价也能承受,但在保证效果前提下可提高效率抽样调查的分类概率抽样调查非概率抽样调查按照一定概率从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法典型抽样便利抽样“自愿”抽样课堂练习一下列情况是否属于概率抽样?(1)从装有30只小鸡的箱子抓5只,不做任何挑选,随便抓满5只为止。(2)将箱中30只小鸡编上1~30号,从1~30中随机抽取5个数字,将对应小鸡抓出来。Jessen的实验(1978)求126个石头的平均重量样本量1251020典型抽样40.044.935.338.531.0随机抽样80.671.443.334.126.2Jessen的实验(1978)可以看出:(1)样本容量的增加对典型抽样的精度改进不大,而随机抽样的精度随样本量的增加有明显改善;典型调查的特点:取样很少,无法获得客观的误差评价;要以普查或概率调查为基础。(2)样本量很小时,依靠充足的先验信息获取的典型样本为佳,而样本量较大时,随机样本的估计更好。总体与样本总体与个体:所有调查客体的集合称为调查总体,构成总体的调查客体称为个体数理统计中总体一般为服从某种分布的无限总体,这里是有限总体。记号:U(N)={U1,U2,…,UN}指标量记号:{Y1,Y2,…,YN}总体与样本抽样框与抽样单元:其单元满足“与实际总体的每个单元之间存在确定的对应关系,凭借这种对应关系可以找到实际总体中特定的一个或一些单元”条件的实际总体的映射总体称为抽样框,构成映射总体的单元称为抽样单元。抽样框可认为是一个目录性清单。其形式可为:名单、手册、地图、数据库等。抽样框必须是有序的,其包含的抽样单元务必“不重不漏”。抽样单元不仅是“影子”,还指“实体”,又称样本单元或样本点,不一定是基本单元,可划分、分级。总体与样本抽样与样本:从总体全部单位中选择部分单元的活动称为抽样,而抽样的结果——从总体全部单元选出的部分单元,其全体称为样本总体,简称样本。记号:{y1,y2,…,yn}抽样比:f=n/N课堂练习二区分以下概念:(1)个体与样本(2)总体与抽样框(3)个体与抽样单元抽样调查的操作流程1、建立课题,明确调查目的2、调查的准备阶段3、现场工作阶段4、数据处理阶段5、写出报告结论总体及目标量的确定抽样框收集数据的方法抽样设计问卷设计数据的验收编辑估计、分析抽样的样本分布入样概率常见待估计总体特征对估计量的要求抽样的样本分布对于有限总体U(N)={U1,U2,…,UN},其指标量为{Y1,Y2,…,YN},从中抽取样本{y1,y2,…,yn},由于是概率抽样,每个可能样本有一个确定出现概率,称为由抽样设计形成的样本概率分布。在某种抽样设计下,由样本概率分布得到的样本统计量的期望方差称为基于设计的期望、方差。抽样的样本分布对有限总体U(N)={U1,U2,…,UN}作有放回抽样,每次随机抽出一个单元观测后放回再抽下一个单元,得样本{y1,y2,…,yn}对有限总体U(N)={U1,U2,…,UN}作无放回抽样,每次随机抽出一个单元观测后不放回再抽下一个单元,得样本{y1,y2,…,yn},不计每个单元出现顺序。样本总数:Nn每个样本出现概率:1/Nn样本总数:每个样本出现概率:nNCnNC1入样概率概念:一个总体单元出现在样本中的概率称为入样概率例:对有7个单元的总体{1,2,3,4,5,6,7}进行抽样,先分成两个子总体{1,2,3,4}和{5,6,7}再从每个子总体中随机抽取两个单元,共4个单元组成样本,求样本分布与各单元入样概率。每个样本出现概率为1/18;1,2,3,4入样概率为1/2;5,6,7入样概率为2/3。性质1:记一个可能样本为s,样本出现概率为p(s),则有ssp1)(对任一单元Yk,入样概率即为Yk的入样概率。kYssp)(性质2:入样概率定理1对总体{Y1,Y2,…,YN}抽取一个样本量为n的无重复样本(即同一单元不在样本中重复出现),对任一抽样设计,记Yk的入样概率为,记两个单元Yk,Yl同时入样的概率为,则有:kkl,)1(1nNkk.,)1()2(1lnlNlkkkl对固定的常见待估计总体特征,N121NkkYY、总体均值,4XYR、总体比值,P3、总体比例或总体中位数。如总体方差、其他,)(11,5122NkkYYNS,11NkkYYN或、总体总值常见待估计总体特征总体总值、均值、比例的统一关系:YNY则个个体不具有该特征,第个个体具有该特征,第记,0,1iiYkYYNPNkk11总体总值、比例都可以用均值来表示对估计量的要求偏量以样本统计量w估计总体的数字特征W,B(w)=E(w-W)=E(w)-W称为偏量。均方偏差MSE(meansquareerro)MSE(w)=E(w-W)2=var(w)+B2(w)对估计量的要求样本量n增大时,B(w)与MSE(w)同时变小,且应有即:B(w)的量级低于MSE(w).比较两种估计量的好坏,以MSE(w)为准,MSE(w)小者为佳。)1()()(owMSEwB优良抽样方案的衡量准则几种基本的抽样方法优良抽样方案的衡量准则目的性:可度量性:可行性:经济性:高要求——大样本,复杂设计;低要求——小样本,简单设计可给出估计值可能的误差范围设计方案能够得到忠实执行在经费与精度之间折衷几种基本的抽样方法简单随机抽样从一个单元数为N的总体逐个抽取单元且无放回,每次都在所有尚未进入样本的单元中等概率地抽取,直到n个单元抽完。Simplerandomsample(SRS)每个样本出现概率为nNC1特点:简单直观N很大时,受抽样框限制较难执行系统抽样先将总体中的抽样单元按某种顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。Systematicsample仅初始单元需随机抽取,实施简便特点:对抽样框要求不高估计精度较困难几种基本的抽样方法特别地,若在抽取初始单元后按照相等间距抽取其余单元,则称等距抽样。不等概抽样几种基本的抽样方法每个单元的入样概率不同,常以辅助信息为依据决定个体的入样概率。Non-equal-probabilitysample赋予适当的入样概率可以提高精度特点:需要辅助信息分层抽样先按照某种规则把总体划分为不同的层,然后在层内再进行抽样。各层的抽样独立进行;估计在各层内进行,再由各层估计量加权平均或求和得出总体估计。Stratifiedsample几种基本的抽样方法分层适当时可显著提高精度特点:抽样单元集中,利于调查实施分层需要辅助信息整群抽样抽样仅对初级抽样单元进行,对抽中的初级单元中调查其全部抽样单元,对没抽中初级单元不调查(群即初级抽样单元)。几种基本的抽样方法样本集中特点:Clustersample只需初级抽样框精度较差(一般比同样本量SRS差)多阶抽样是整群抽样的发展,抽得初级单元后,再从中抽取次级单元,直至达到基本单元。几种基本的抽样方法样本集中特点:Multi-stagesample编制抽样框较方便估计方差较复杂,阶段不宜过多多重(相)抽样对总体进行一次以上抽样。通常先以较小工作量获得一些可快速获得的信息(样本量较大),再在辅助信息基础上作一个样本量较小的调查。较小样本通常在前一大样本中取。几种基本的抽样方法可根据辅助信息选择合适的二次抽样方法,以提高估计精度。特点:Multiplesample几种基本的抽样方法要调查全校学生对某个问题的看法,采用各种抽样方法该如何实施?思考本章作业P11:4,5,6

1 / 39
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功