9.1.3获取数据的途径讲课人:邢启强21、简单随机抽样的概念:2、简单随机抽样的特点:3、简单随机抽样的常用方法:③机会均等抽样.①总体个数有限;②逐个进行抽取;①抽签法;②随机数表法.设一个总体含有有限个个体,并记其个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.复习回顾讲课人:邢启强3一、分层抽样的定义。一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratifiedrandomsampling),每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.每一层抽取的样本数=×总样本量复习回顾讲课人:邢启强4第一步,计算样本容量与总体的个体数之比.第四步,将各层抽取的个体合在一起,就得到所取样本.第三步,用简单随机抽样在各层中抽取相应数量的个体.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.分层抽样的步骤:复习回顾讲课人:邢启强5分层随机抽样如何估计总体平均数MNxyMNMN在比例分配的分层随机中抽样中MNxyMNMNmnxymnmn11=MNiiiixymn复习回顾讲课人:邢启强61.分层抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。2.相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。3.分层随机抽样的结果并不是每一次都优于简单随机抽样。复习回顾讲课人:邢启强7方法类别共同特点抽样特征相互联系适应范围简单随机抽样分层抽样将总体分成几层,按比例分层抽取总体中的个体差异较小总体由差异明显的几部分组成从总体中逐个抽取用简单随机抽样对各层抽样抽样过程中每个个体被抽到的可能性相等讲课人:邢启强8学习新知1.通过调查获取数据:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.2.通过试验获取数据:通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.3.通过观察获取数据:通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.讲课人:邢启强9学习新知4.通过查询获得数据:我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据叫做二手数据.随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础。讲课人:邢启强10总结新知获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制实验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗数据”,去伪存真讲课人:邢启强111.判断正误(1)要了解一批节能灯的使用寿命,可以采用普查的方式.()(2)农科院获取小麦新品种的产量可以通过查询获取数据.()(3)普查获取的资料更加全面、系统,抽样调查更方便、快捷.()尝试练习××√讲课人:邢启强12典型例题【例1】(1)下列哪些数据一般是通过试验获取的()A.1988年济南市的降雨量B.2019年新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方(2)“中国天眼”为500米口径球面射电望远镜(FivehundredmetersApertureSphericalTelescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据DC讲课人:邢启强13选择获取数据的途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.方法总结讲课人:邢启强14例2.为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?典型例题[解](1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.讲课人:邢启强15在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.方法总结讲课人:邢启强16巩固练习1.利用统计报表和年鉴属于那中获取数据的途径?属于通过查询获取数据的途径.2.要了解一种新型灯管的寿命,能通过观察获取数据吗?不能,应通过试验获得数据.3.下面问题可以用普查的方式进行调查的是()A.检验一批钢材的抗拉强度B.检验海水中微生物的含量C.调查某小组10名成员的业余爱好D.检验一批汽车的使用寿命C讲课人:邢启强17巩固练习4.下列要研究的数据一般通过试验获取的是()A.某品牌电视机的市场占有率B.某电视连续剧在全国的收视率C.某校七年级一班的男女同学的比例D.某型号炮弹的射程D编号12345678910年收入1.21.31.82.04.61.70.92.11.01.65.小明从网上查询得到某贫困地区10户居民家庭年收入(单位:万元)如下所示:根据以上数据,我们认为有一个数据是不准确的,需要剔除,这个数据是.4.6讲课人:邢启强18巩固练习6.要得到某乡镇的贫困人口数据,应采取的方法是()A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据A7.一些期刊杂志社经常会请一些曾经高考落榜而在某方面的事业上取得成就的著名专家、学者,谈他们对高考落榜的看法,这些名人所讲的都是大同小异,不外乎“我也有过落榜的沮丧,但从长远看,它有益于我的人生”,“我是因祸得福,落榜使我走了另一条成功之路”等等.小明据此得出一条结论,上大学不如高考落榜,他的结论正确吗?[解]小明的结论是错误的,在众多的高考落榜生中,走出另外一条成功之路的是少数,小明通过研究一些期刊杂志社报道过的一些成功人士就得出结论是片面的,因为他的抽样不具有代表性.讲课人:邢启强19巩固练习8.为了了解我国电视机的销售情况,小张在某网站上下载了下图:(1)小张获取数据的途径是什么?(2)由图可知,电视机的销售总量在2012年达到最大值,你认为电视机销售总量出现下滑的主要原因是什么?[解](1)小张获取数据的途径是通过查询获得数据.(2)结合我国的经济发展水平可知,从2012年开始,电视机销售总量出现下滑的主要原因是市场的饱和.讲课人:邢启强20课堂小结1.获取数据的途径一般有四种:调查,试验,观察和查询.2.在应用以上四种方式获取数据时,要清楚数据的类型,选择适当的获取方式.