《买火柴》妈妈:“你要挑一挑,千万别买受潮的。”小明:“好的!”……一刻钟后小明:“妈妈!我回来了,买的火柴很好!”妈妈:“哦?”小明:“都没受潮,因为我每一根都试过了!”统计学是干什么的?•现代社会是信息化的社会,人们常常需要收集数据,根据所获得的数据提取有价值的信息,作出合理的决策。统计是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。1.总体和样本在统计学中,把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中所含个体的数目叫做总体容量.从总体中抽取一定数量的个体,我们称它为样本.其中个体的数目称为样本容量.精讲精析问题一:“为了解我校3500名学生的身体情况,最近组织学生体检,并抽样调查了高二(8)班54名学生的身体情况。”这个调查中,总体、个体、样本、样本容量各是什么?问题二:对于一个确定的总体,其样本是唯一的吗?统计的基本思想方法是什么?•统计的基本思想方法是用样本估计总体,即当总体数量很大或检测过程具有一定的破坏性时,不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。•如何进行合理的抽样呢?阅读一个著名的案例在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:候选人预测结果选举结果罗斯福4362兰顿5738思考你认为预期结果出错的原因是什么?原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。像本例中这样容易得到的样本称为方便样本。如果使用“方便样本”,那么得出与事实不符的结论的可能性就会大大增加。结论:在抽样时不能只图方便。如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个“方便样本”,“方便样本”的代表性差,基本这种方便样本得出的结论就会与事实相左。例如,为了了解一批计算器的寿命,我们能将它们逐一测试吗?很明显,这既不可能也没必要。实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况。进一步,从节约费用的角度考虑,在保证样本估计总体达到一定的精度的前提下,样本中包含的个体数越少越好。于是,如何设计抽样方法,使抽取的样本能够真正代表总体,就成为我们要关注的一个关键问题。否则,如果样本的代表性不好,那么对总体的判断就会出现错误。因此科学合理地采集样本才能作出客观的统计推断。那么,怎样从总体中抽取样本呢?如何表示样本数据?如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢?这些正是本章要解决的问题。数理统计所要解决的问题是如何根据样本来推断总体。首先必须清楚地知道要收集的数据是什么;其次,我们检验样本的目的是为了了解总体的情况;再次,我们要知道如何才能收集到高质量的样本数据。在抽样调查中要注意什么问题?在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解各题的得分情况呢?通常,在考生有这么多的情况下,我们只从中抽取部分考生(比如说1000名),统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。联系生活样本总体估计首要问题:样本一定能准确地反应总体吗?中央电视台需要在我市调查“春节联欢晚会”的收视率。(1)每个看电视的人都要被问到吗?(2)对我校学生的调查结果能否作为该节目的收视率?(3)你认为对不同社区、年龄层次、文化背景的人所做调查的结果会一样吗?答(1)中央电视台在调查时不可能问到每一个看电视的人。(2)对一所中学学生的调查结果不能作为该节目的收视率,因为只有中学生,缺乏代表性。(3)不同社区、年龄层次、文化背景的人所做调查的结果不一样,因为他们的兴趣、爱好等方面情况相距甚远。为了了解学生对学校伙食的满意程度,小红访问了50名女生;小聪访问了50名男生;小明访问了24名男生和24名女生,其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、小明三人的不同抽样方法那一种最好?为什么?答:小明的方法最好。小明抽得样本既有男生,又有女生,而均匀分布在各年级,这样的抽样较具有代表性,反映的情况具有普遍意义。1.我们常常根据样本得到结果来推测总体的结果。不同的抽样可能得到不同的结果。2.为了使结果更具准确性,抽样时,样本的容量要合理,样本的个体要有代表性。简单随机抽样的概念设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。注意以下四点:(1)总体的个体数有限;(2)逐个抽取;(3)不放回抽样;(4)是等概率抽样,概率均为n/N(每个个体机会均等,与先后顺序无关)C下列抽取样本的方式是属于简单随机抽样的是()①从无限多个个体中抽取100个个体作样本;②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)A.①B.②C.③D.以上都不对关于“随机抽样”随机抽样定义特征方法注意设···.如果···,且···,就称···.有限性、逐个性、不回性、等率性、公平性?随机抽样时,“每次抽取一个个体时,任一个体被抽取的概率相等”和“在整个抽样过程中个体被抽取的概率相等”不是一回事.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.第二步,将号签放在一个容器中,并搅拌均匀.(1)抽签法(抓阄法)怎样品尝味一锅汤的味道?抽样原则问题2:如何科学地抽取样本?使得样本能比较准确地反映总体搅拌均匀使得每个个体被抽取的机会均等为了了解咱们班64名同学的视力情况,从中抽取10名同学进行检查。如何抽取呢?请问:实例一开始抽签法64名同学从1到64编号制作1到64个号签将64个号签搅拌均匀随机从中抽出10个签对号码一致的学生检查结束又称“抓阄法”抽签法的一般步骤:总体个数N,样本容量n,每个个体被抽到的概率都是开始编号制签搅匀抽签取出个体结束Nn1.抽签法例:某单位对口支援西部开发,现从报名的18名志愿者中选取6人组成志愿小组到西藏工作3年,请用抽签法设计抽样方案。第一步:将18名志愿者编号,号码是01,02,…,18;第二步:将号码分别写在一张纸上,制成号签;第三步:将得到的号签放入一个容器中,并充分搅匀;第四步:从容器中逐个不放回地依次抽取6个号签,并记录上面的编号;第五步:所得的号码对应的志愿者就是支援小组的成员。(2)简单随机抽样的方法①抽签法先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.你认为抽签法有哪些优点和缺点?缺点:当总体个数较多时费时、费力,很难搅拌均匀,产生的样本代表性差的可能性很大.优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.用抽签法抽取样本时,编号的过程有时可以省略,但制签的过程就难以省去了,而且制签也比较麻烦。如何简化制签的过程呢?假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取10袋进行检验。请你设计一种抽样方案。你还愿意用抽签法么?再谈谈抽签法的优点和缺点?优点:简单易行.缺点:当总体个数较多时制签过程很麻烦,费时费力,而且很难搅拌均匀,实例二简单随机抽样法之二——随机数表法制作一个数表,其中的每个数都是用随机方法产生的,这样的表称为随机数表。只要按一定的规则到随机数表中选取号码就可以了。这种抽样方法叫做随机数表法。用随机数法抽取样本的步骤:①将总体中的所有个体编号(每个号码位数一致);②在随机数表中选定开始的数字(确定行数列数);③从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;④根据选定的号码抽取样本。2、用随机数表法进行抽取(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(3)用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的.(2)用随机数表进行抽样的步骤:(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。将总体中个体编号;选定开始的数字;获取样本号码。162277943949544354821737932378873520964384263491648442175331372455068877047447672176335025839212067663016378591695556719981050717512867358074439523879332112342978645607825242074438一、编号:001,002,…,800二、选数(起始数)三、取数四、抽取.随机数表教材105页例3:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时应如何操作?要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验。1、将800袋牛奶编号,000,001,…,7992、在随机数表(课本103页)中任选一数,例如第8行第7列,是7。3、从7开始往右读(方向随意),得到第一个三位数785编号799,将对应编号的牛奶取出;继续向右读,得到916编号799,舍弃;如此继续下去,直至抽出60袋牛奶。能从本例体会下,从000开始编号的好处吗?第一步,将800袋牛奶编号为000,001,002,…,799.第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7为起始数).随机数表法有哪些优点和缺点:缺点:当总体个数较多时,对个体的编号工作量太大,操作不方便,不快捷.优点:简单易行,当总体个数不多的时候对个体的编号容易,个体有均等的机会被抽中,从而能保证样本的代表性.1、为了解全校240名学生身高情况,从中抽取40名学生进行测量,下列正确的是()A.总体是240B、个体是每一个学生C、样本是40名学生D、样本容量是40D2、在简单随机抽样中,某一个个体被抽到的可能性()A、与第n次有关,第一次可能性最大B、与第n次有关,第一次可能性最小C、与第n次无关,每次可能性相等D、与第n次无关,与抽取的第n个样本有关C3.一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是_________B4、简单随机抽样中,最关键的一步是()A、编号B、搅拌均匀C、逐个抽取D、不放回抽样5、下列抽样的方式属于简单随机抽样的有______