抽样调查教案-1绪论

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

njnu-liqicai1抽样调查李启才南京师范大学数学与计算机学院liqicai@njnu.edu.cn07级统计学目录第1章绪论……………(3)第2章简单随机抽样……………(18)第3章分层抽样……………(48)第4章不等概率抽样……………(76)第5章整群抽样……………(3)第6章系统抽样……………(3)第7章多阶抽样……………(3)第8章二重抽样……………(3)第10章复杂样本的方差估计……………(3)第11章调查中的非抽样误差……………(3)第12章案例及其它……………(3)11致谢:本讲义大量参考引用了文献1、2、3、4、5以及其它文献内容,在此一并致谢!njnu-liqicai2参考文献:1《抽样技术》金勇进蒋妍李序颖编著人大出版社(教材)2《抽样技术与应用》杜子芳编著清华大学出版社3《抽样调查》倪加勋广西师范大学出版社4《抽样调查》L.Kish[USA]倪加勋主译中国统计出版社5《抽样调查》樊鸿康高教出版社njnu-liqicai3第一章绪论§1.1统计与抽样调查引言:什么是统计?你觉得我们需要统计嘛?比如你想知道江苏省2008年人均年收入及其收入分布状况怎么办?像人口普查那样?你想要了解南师同学们每个月平均消费水平怎么办?一个个同学去询问?你想过下列问题嘛?当你买了一台电视时,被告知三年内可以免费保修。你想过厂家凭什么这样说吗?说多了,厂家会损失;说少了,会失去竞争,也是损失。到底这个保修期是怎样决定的呢?如何通过大众调查来得到性别、年龄、职业、收入等各种因素与公众对某项事物(比如商品或政策)的态度的关系呢?如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?“调查结果表明20%的观众喜欢某节目”“抽样调查结果的误差为±3%”“支持率的95%置信区间为(25%,30%)”“某学校排名第一”“消费价格指数为120%”“该药品疗效99%”“该国贫富差距大”“该型号电器的实用年限是20年”……你可以举出很多例子。实际上,上述诸多问题都是统计问题,统计学可以解决。所以你即将学习的数理(推断)统计很重要。一般来说,统计先从现实世界收集数据(抽样),然后根据数据作出判断。那么数据你怎么得到呢?像人口普查那样?当然你其实也可从报纸、电视、互联网、年鉴等方面看到各种数据并且从这些数据可以提取对自己有用的信息。这些间接得到的(并非自己收集的)数据都是二手数据。获得第一手数据要困难得多。某方便面企业每年至少花三四千万元来收集和分析数据,调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等。可见获得统计数据,并对它分析,提取需要的信息是非常重要的,你的预测决策都需要。你可以有很多方法去获取数据,而我们即将进行的抽样调查就是科学获得局部数据并对它进行分析的一种有效手段。njnu-liqicai4一、什么是抽样调查(Samplesurvey)调查(survey)是系统的信息搜集(或收集)与分析活动。它一般包括调查主体、调查客体、调查目标、调查目的、调查方案等要素。人类社会在发展过程中离不开对数据、资料、信息的统计调查和分析,比如人口普查、工业生产普查等等这些都是我们常见的。然而政府统计中的普查和定期报表只适于对基本国情(国势、国力等)等调查,而大量的社会现象都不可能作全面调查(一方面费时费力费财,是否值得?我们是否会“为了知道牛肉的滋味而吞噬掉整头牛”(萨缪尔森Samuelson)?另一方面某些现象根本无法作合理的普查,因为被调查对象可能不完全清晰),因此发展非全面调查非常必要,通过局部数据推断全局特征,这正是统计的一条主线。广义意义上的抽样调查就是非全面调查。非全面调查根据抽取方式不同,又可以分为非概率抽样和概率抽样。(一)非概率抽样非概率抽样没有严格的定义,也称非随机抽样,是一种不按照随机原则、总体中各单位被抽中概率事先未知或难以确定的抽样,样本的抽取主要根据人们的主观判断或简便性原则来进行。其致命的缺点是,难以计算和控制抽样误差,难以保证推断的准确性和可靠性。非概率抽样有很多形式:随意抽样、典型抽样、重点抽样、判断抽样、定额抽样和流动总体抽样等等。随意抽样:也称任意抽样,即抽样者随意地或任意地(通常遵循便利原则)从总体中抽取样本。如我们常见的街头拦访、商场在柜台分发的问卷调查等。这样的样本往往有偏,不能代表总体。比如调查18~40岁女性关于某品牌化妆品观点,则在柜台拦到的单元很可能属于更倾向于经常购买某类或某品牌的人群,她们的观点显然不能代表全体18~40岁的女性。典型抽样:只对总体中的典型(有代表性的)单元调查。如调查一个地方农村经济发展情况,根据调查者对当地情况的了解,选择有代表性的村调查;典型案件的调查等。重点调查:只对总体的重点单元调查。这些被选择的单元虽然数目不多,但它们的标志总量在总体总量中占据了绝大部分。如调查我国钢铁行业的现状,则只对宝钢、鞍钢、首钢等几家国有特大型企业调查,因为这几家产量占全国产量大半,把握了它们的情况就可以把握总体情况。典型调查和重点调查中如果抽样者对典型或重点把握比较准确,则会有较高精度,否则精度比价低。还有其它非概率抽样不一一赘述,本课程重点是在概率抽样上。(二)概率抽样概率抽样也称随机抽样,是遵循随机性的原则,使总体中的每个单位都有一个事先已知的、非零概率被抽中的抽样。从总体中抽取部分单元,采取科学的统计方法,以其所得到的结果对总体的数量特征作出具有一定精度和信度的估计与推断的一种非全面调查方法。总体各单元被抽中的概率可以通过样本设计来规定,通过某种随机化操作来实现。通常所说的、狭义上的抽样就是指概率抽样,狭义上的抽样调查就是指概率抽样调查。njnu-liqicai5常用的概率抽样方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。我们将在后面章节一一介绍。而抽样调查是遵循随机性的原则,采取科学的统计方法,从总体中抽取部分单元进行调查,以其所得到的结果对总体的数量特征作出具有一定精度和信度的估计与推断的一种非全面调查方法。因而在抽样调查中需要以较多的概率统计知识为基础。二、抽样调查的随性原则抽样调查的随机性原则是指在抽样过程中,样本单元的抽取不受任何主观因素及其它系统因素的影响,从而保证总体中的每一个单元都有一定的概率被抽中。随机性原则是抽样调查所必须遵循的基本原则。有人把随机性原则理解为任意性或随意性,还有人将随机性原则等同于客观性原则,认为只要排除了人的主观意识就满足了随机性原则,这些都是不正确定。事实上,随机性原则包含两个缺一不可得方面:抽样的客观性和样本的随机性。(比如网络上的随机调查,随意很大,就不满足这样的条件)抽样的客观性是指在整体抽样过程中,总体每个单元是否被抽中不取决于任何主观因素的影响。这就是说,每个样本单元的取得,既不取决于调查者的爱好和愿望,也不决定于被调查着的合作态度。即使调查者认为所抽取得某个调查单元,加入后会影响样本对总体的估计,也不能另取一个来代替被抽中的样本单元。因为这样就会破坏抽样的客观性,从而违背随机性原则,坚持抽样的客观性是坚持随机性原则的前提。抽样的随机性是指整个抽样过程中必须保证总体各个单元都有一定的被抽中的概率。只有这样才能保证样本结构类似总体结构,才能运用概率与数理统计知识进行合理推断。一个反面案例是:1936年美国《作家文摘》对总统选举的民意预测调查。该刊从电话簿和俱乐部成员中选取1000万样本进行调查,其中回收200万份,根据样本反映共和党候选人Landon(兰登,57%)大幅度领先民主党候选人Rossevlt(罗斯福,43%),于是该刊预测共和党候选人Landon将肯定胜出。然而选举结果却是民主党候选人Rossevlt(62%)以很大优势胜出(Landon,38%)。为什么《作家文摘》花费那么大精力收集那么多数据会产生那么大错误,最终导致该刊不久即“关门大吉”呢?原来《作家文摘》选取样本出了很大问题,完全没有遵循随机性原则。选取得1000万份样本明显排斥穷人,因为在当时,一般穷人很少拥有私人电话或属于哪个俱乐部。众所周知,经济地位很大程度上影响政治态度,穷人压倒性支持Rossevlt,而有钱人倾心Landon,《作家文摘》选取样本没有反映出这样的社会现实(总体结构),从而犯了致命错误。三、抽样调查的特点和作用(1)遵循随机性原则(2)可以科学合理推断总体(3)可以较好的控制误差(在一定信度下)当今,抽样方法的应用范围不断扩大,它的原理(包括抽样调查理论和抽样推断理论)已成为统计学中发展最快、最活跃的一个分支。它在社会经济和科学领域的应用愈加广泛。njnu-liqicai6节约成本时效性强提高调查数据的质量可以承担全面调查无法胜任的项目:(1)无限总体例如,气象调查、新工艺新设备新材料的功能调查等等(2)包括未来时间序列总体例如生产过程稳定性检查(3)破坏性的产品质量检验例如灯具寿命有些现象虽然属于有限总体,但是总体范围过大,如水库鱼苗数,森林蓄木量;有些现象根据研究的任务要求没有必要进行全面调查,如民意测验。当然,抽样技术也并非十全十美,首先是由于技术性强而不易理解和掌握,其次是抽样推断的结果有时也会产生差错,三是对于总体未被调查的部分很难提供有价值的信息,四是有些理论方法问题还没有得到完全解决。另外你得有思想准备:作为统计学类课程,它将面临大量实际问题和数据,很多时候计算量是巨大的,然而计算机的发展给你带来了很大的方便,所以应学会使用一些统计软件。(如SPSS)四、抽样调查的应用领域(一)人口调查1、人口调查是最早应用抽样技术的领域。2、我国抽样技术在人口调查中的应用主要有三个方面:一是用于普查中提前估计人口总数和检验普查的质量;二是用于两次普查年份之间(逢5年份)的1%的人口抽样调查;三是用于每年一次的经常性人口变动情况抽样调查。3、我国现行的人口变动情况抽样调查,采用在抽中的调查小区(调查群),按常住人口登记的原则以户为单位进行调查,全国约抽取120万人。抽样调查的主要指标是人口出生率、死亡率和失业率。调查的标准时间为当年10月31日0时,现场登记的时间为11月份。调查以全国为总体,以省级单位为次总体,采用分层、多级、概率比例的抽样方法。多数省级单位采用五级抽样方法,直辖市和少数省级单位采用四级抽样方法。(二)经济调查1、经济调查是应用抽样技术最为普遍、也最重要的领域。目前各国在产业、贸易、金融、居民收入与支出、消费等方面,基本上都通过抽样调查来获取信息。2、我国在经济调查方面应用抽样技术的主要有以下这些方面:农村居民生产、生活情况调查,农产量调查,城镇居民生活情况调查,工业调查,批发零售贸易与餐饮业调查,第三产业调查,企业景气调查,物价调查,固定资产投资调查等政府统计调查,以及不同主体的各种市场调查、专题经济调查。3、不同的调查,所应用的抽样技术也不一样。(三)社会调查1、抽样技术在社会调查中的应用主要是各种社会专题调查和民意调查。2、我国有关主管部门和研究机构曾先后组织开展了公众对物价改革的社会心理反映调查,深入的生育率调查,全国专业技术人员状况调查,妇女地位调查,中国儿童情况调查,公众对科学技术态度调查,以及老年人状况调查、青少年犯罪调查、全国群众安全感调查等。3、2004年11月的第四次全国群众安全感抽样调查,按照多阶段、分层、整群、概率比例抽样方法,在全国共抽取了997个县、市和市辖区的3631个乡、njnu-liqicai7镇、街道,共调查了102309个家庭,每个家庭随机抽取一名16岁以上的人员。4、我国这些年来,各种研究机构、民间团体也进行了大量民意调查。(四)其它调查抽样技术还在文化卫生调查、环境资源调查等方面得到广泛应用。例如,我国曾先后进行了全国使用语言文字情况调查,中国5岁以下儿童死亡率调查,国家卫生服务总调查,高血压流行病学调查,结核病流行病学调查,老年痴呆病调查,青少年肥胖症调查,儿童龋齿情况调查,粮食农药污染情况调查,耕地面积卫星遥感调查等专题抽样调查。有些国家还开展了森林资源、草地资源和珍惜动物资源等的

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功