统计学贾俊平第2章--数据的收集

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Allrightsreserved11第2章数据的搜集2.1数据的来源2.2调查数据3.3实验数据3.4数据的误差Allrightsreserved22.1数据来源Allrightsreserved3数据的来源PrimaryDataCollectionSecondaryDataCompilationObservationExperimentationSurveyPrintorElectronicAllrightsreserved4数据的间接来源二手数据(secondarydata):以前已经收集好的,与当前问题可能有关的信息资料缺乏可得性缺乏相关性缺乏充分性缺乏准确性Allrightsreserved5外部数据统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料互联网或图书馆查阅到的相关资料数据的间接来源Internethttp//统计年鉴、统计月报等中国统计网经济信息及各类网站年鉴、研究报告下载数据的间接来源CEIC全球数据库|CEICIMFDataMapper®IMFDataMapper®Allrightsreserved8数据的间接来源8中国收入分配研究院CHIP数据库内部数据业务资料,如与业务经营活动有关的各种单据、记录经营活动过程中的各种统计报表各种财务,会计核算和分析资料等云计算大数据……数据的间接来源Allrightsreserved10数据的间接来源思考:如何判断二手数据的准确性?是谁收集的信息?调研的目的是什么?收集的是什么信息?是什么时候收集的?是如何收集的?所得信息是否与其他信息一致?引用二手数据时应该注意什么问题?Allrightsreserved11数据的直接来源调查、观察与实验调查(survey):所谓调查是指透过访问员的当面访问,电话访问,或邮寄问卷的方式所搜集的数据。Allrightsreserved12数据的直接来源观察(observation):观察是由研究者对所研究的事物进行观察,以了解该事物的状况观察某十字路口旳各种车流况,可以由数字调查人员以计数器计数在不同日期,时段计数各型车辆经过该十字路口的数量。Allrightsreserved13数据的直接来源实验(experiment):实验是指在设定的条件或情形下,从事实际的试验以取得数据的方式。由于必须在特定的条件下进行,因此较见的实验有药厂在新药申请批准上市前所做的实验,以所得到的资料来检定该药的药效。Allrightsreserved142.2调查数据Allrightsreserved15数据的直接来源普查(Census)为某一特定目的面专门组织的一次性全面调查。目的:搜集某一时点上的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。Allrightsreserved16数据的直接来源特点:普查通常是一次性的或周期性的;普查一般需要规定统一的标准时点;普查数据的准确性、标准化程度均较高;普查的调查项目较少,适用范围较狭窄,调查资料缺乏深度。我国开展的主要普查Allrightsreserved17统计报表由政府部门组织,采用统一的表式、统一的指标、统一的报送时间和报送程序自上而下布置,自下而上报告以获取统计数据的一种调查方式。全面报表与非全面报表日报、旬报、月报、季报、年报国家、部门、地方联网直报数据的直接来源Allrightsreserved18思考:统计报表是中国特色吗?数据的直接来源Allrightsreserved19数据的直接来源2002年第5期Allrightsreserved21抽样调查样本:从总体中抽取的部分个体变量:测量样本或总体的特征统计推断:根据样本特征推断总体特征抽样调查Allrightsreserved22使用抽样调查的原因:样本可能以破坏或无法再使用得到可信赖的精确程度实用上原因节省时间节约花费抽样调查Allrightsreserved23搅拌均匀随机样本方便样本:潜在风险如何抽样因果考虑样本的代表性抽样调查Allrightsreserved24案例讨论ShereHite,AmericanSexology1987年出版的《女性与爱情:前进中的文化之旅》Allrightsreserved25Societyandmenneedtochangetoimprovelivesofwomen127-itemquestionnaireaboutmarriage&relationsbetweensexes4500USAwomen,14to85yearsAllrightsreserved2670%marriedfor5yearshavingaffairs...(usuallymorefor‘emotionalcloseness’thansex)76%didnotfeelguilty87%hadacloserfemalefriendthanhusband98%wanted“basicchanges”toloverelationshipsonly13%marriedfor2+yearswerestillinlove84%wereemotionallyunsatisfied95%reportedemotional&psychologicalharassmentfromtheirmen“HiteusesstatisticstobolsterheropinionthatAmericanwomenarejustifiablyfedupwithAmericanmen.”Allrightsreserved27抽样调查SamplingProceduresNon-ProbabilitySamplingProbabilitySampling-SimpleRandomSampling-SystematicSampling-StratifiedSampling-ClusterSampling-ConvenienceSampling-JudgmentalSampling-SnowballSampling-QuotaSamplingHere’sthedifference!ProbabilitySampling:Eachsubjecthasthenon-zeroprobabilityofgettingintothesample!Allrightsreserved28概率抽样——简单随机抽样(SRS)特点:总体中每一个样本点均有相同机率被抽中抽出某个样本后不影响另一个样本抽出的机率(独立性)经常先列样本名册后用计算机产生随机数或随机表抽选概率抽样Allrightsreserved29总体一些可能样本每一样本有相同被抽中的概率概率抽样Allrightsreserved30放回和不放回放回(重复)抽样无放回(不重复)抽样概率抽样Allrightsreserved31概率抽样——系统抽样(SYS)等距抽样将所有样本列册以序号排列,先随机抽取第一个样本,接着每隔K个样本抽取下一个样本间隔K的求法PopulationsizeSamplesize常用于电话抽样类似于简单随机抽样概率抽样Allrightsreserved32N=64n=8k=8FirstGroup概率抽样Allrightsreserved33概率抽样——分层抽样(STS)分层抽样将总体区分为数个strata层之间互斥且周延层内性质相近层与层之间差异明显从每一层中简单随机抽取若干样本作为该层的代表,再将所有层总结集合概率抽样Allrightsreserved34总体:大学生College概率抽样Allrightsreserved35EngineeringMathematicsHistoryHumanitiesCollege总体:大学生总体分层:各个系概率抽样Allrightsreserved36总体:大学生从每一层抽取:每个系随机抽取学生EngineeringMathematicsHistoryHumanitiesCollege总体分层:各个系概率抽样EngineeringMathematicsHistoryHumanitiesAllrightsreserved37概率抽样——整群抽样(CLS)将总体区分为多个群集clusters群集间互斥且周延群集与群集间差异小群集内类似总体随机抽取数个clusters将抽中的群集内每个样本均调查概率抽样Allrightsreserved38公司(Clusters)抽样概率抽样Allrightsreserved39概率抽样——多阶段抽样(MSS)第一阶段:分群——整群抽样第二阶段:分层——分层抽样第三阶段……概率抽样PPS抽样(ProbabilityProportionatetoSizeSampling)又称,按规模大小成比例的概率抽样Allrightsreserved40原始数据的搜集——调查法(续)Allrightsreserved41原始数据的搜集——调查法(续)Allrightsreserved42原始数据的搜集——调查法(续)Allrightsreserved43非概率抽样——便利抽样使用最经济的方式取得样本非概率抽样Allrightsreserved44举例:从卡车中取桔子TheconveniencesampleCaliforniaOranges非概率抽样Allrightsreserved45TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved46TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved47TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved48TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved49TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved50TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved51TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved52TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved53TheconveniencesampleCaliforniaOranges举例:从卡车中取桔子非概率抽样Allrightsreserved54TheconveniencesampleCaliforniaO

1 / 124
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功