第十章抽样调查与试验设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章调查与试验设计兽医统计学科研设计的质量直接影响着实验结果的准确性、可靠性、严密性和代表性,是实验数据的前提,决定着科学研究的成败。一个完整的科研设计包括专业设计和统计设计。二者相互结合,缺一不可。专业设计:指研究者对专业知识的把握能力,直接影响着实验的深度和水平。统计设计:指研究者对统计知识的正确应用,直接影响着科学实验的质量。统计设计的任务是从研究的部署、实施、直到研究结果的解释,进行系统的安排,要做到以最少的人力和物力来获得可靠的结论与信息。根据搜集资料的方法,可将科学研究分为两大类:•调查研究:研究者只是“被动”地观察客观实际情况,不对研究对象施加任何干预措施。----调查设计•实验研究:研究者给研究对象人为地施加干预因素,然后观察这种干预因素产生的效应。----实验设计第一节调查设计的基本含义及意义一、抽样调查的基本概念普查(masssurvey)抽样调查(samplingsurvey)调查是对所要研究的总体中的每个个体都作为调查对象,普查得到的结果真实全面。就是指从某一总体抽取若干个体组成样本,通过对样本的统计分析来对总体进行估计、推断。第一节调查设计的基本含义及意义进行抽样调查就面临着抽样的问题。抽样(sampling)指从总体中抽取样本的过程。无论是在调查研究中,还是在试验研究中,抽样问题都存在,其目的都是用样本来推测总体,用样本的统计量来估计总体参数。样本的好坏,即抽样的质量是调查的关键环节,因此我们必须重视抽样工作。第一节调查设计的基本含义及意义抽样必须遵循以下两个原则:1.样本必须来自于被研究的总体在被调查畜种的分布范围内进行抽样,所得的资料仅用来估测、推断该地区该畜种的基本情况,而不能作跨地区、跨畜种的估测和推断。2.样本必须具有很强的代表性在抽样前,—般要对总体有一个大致的、全面的了解,以便抽样时有针对性,以免由于代表性不强而得出错误的结论,产生误导作用。第一节调查设计的基本含义及意义二、抽样调查的意义(1)节省人力、财力和物力。(2)当所调查的总体是破坏性性状时,抽样调查就是唯一的调查办法。(3)当总体是无限的或是抽象的,我们无法对总体进行调查,因此此时抽样调查就是唯一的调查方法。(4)由于抽样调查的样本含量比总体要小得多,因此对样本进行调查研究,可以获得更高的质量和更好的效果。第二节抽样方案的制订在进行抽样调查前,为了确保调查任务的顺利完成、调查结果的真实可靠,我们必须先制订一个切实可行的抽样方案。万事,预则立,不预则废第二节抽样方案的制订制订一个合理的抽样调查方案必须从以下几个方面进行考虑。1、抽样调查的目的在制订抽样方案前,首先应弄清抽样调查的目的及要解决的问题。2、抽样调查的对象在明确抽样调查的目的后,要划定一个调查总体的范围作为调查研究的对象。抽样单位的大小应根据抽样调查的具体目的、研究的对象、问题的性质以及可支配的经费等来确定。第二节抽样方案的制订3、抽样调查的指标对调查总体的了解要通过一些具体指标的量化、统计和分析来实现。例如在进行传染病的流行病学调查时,需要统计发病动物数、死亡动物数和预防接种动物数等,然后计算感染率、发病率、患病率、死亡率和淘汰率等指标。抽样调查指标的确定一定要具体、合理、容易度量。第二节抽样方案的制订4、抽样调查的方法抽样调查方法的选择应根据具体调查的目的、研究的对象和问题的性质,结合各种抽样方法的特点,并考虑抽样费用、工作难易和估计值的精确度等综合因素作出决定。另外,抽样调查方法的选择还要考虑到人力、物力、时间及其他因素,确保抽样调查工作如期按质完成。第二节抽样方案的制订5、抽样调查的规模样本含量与调查结果的精确度密切相关,样本含量越大,抽样误差越小,结果的精确度越高,统计推断的可靠性越高,但随着样本含量的增加,调查研究的成本也会迅速增加,势必将造成人力、财力、物力的耗费和时间的浪费。样本含量与置信度也有关,置信度要求较低时样本含量可适当小些,否则样本应适当大些。第二节抽样方案的制订6、抽样调查的表格为了确保抽样调查的规范进行、原始数据的真实可靠,在抽样调查前,要根据调查内容、调查的指标编制各种表格,以便调查时记录各种原始数据。7、抽样调查的组织抽样调查的组织主要包括抽样调查工作的领导、时间与进度、人员分工、经费核算、统计分析等。第三节抽样调查的方法一、随机抽样随机抽样(randomsampling),又称简单抽样(simplesampling)根据随机的原则,从一个总体中抽得若干个个体进行观测。在随机抽样中每个个体都有同等的机会或相等的概率被抽中。第三节抽样调查的方法随机抽样的特点是:不会产生系统抽样误差,统计分析简单,但不能利用任何事先所了解的总体分布特征的信息。随机抽样适用于个体变异小、群体比较均匀的总体,它是最简单也是最常用的一种抽样调查方法。第三节抽样调查的方法二、整群抽样整群抽样(clustersampling)将总体分成若干个单位群(畜群),直接抽取单位群,然后对每一抽得的单位群作全面的调查。第三节抽样调查的方法与随机抽样法相比较,整群抽样法可以提供更为精确的总体估计值,如每一单位群内的个体数相等时,整群抽样可以无偏地估计总体平均值、百分率及群体的变异情况。整群抽样的特点是:组织调查比较方便,但抽取群数过少易产生偏性。整群抽样适用于群间差异较小的总体。第三节抽样调查的方法关于整群抽样的几种情况★如果抽取的单位群是家系或是有血缘关系的亲属,则可以对遗传性疾病、血型、某些基因型作更详细的调查和分析。由于具有血缘关系的个体间可具有概率较大的相同基因型或蛋白型,因而试验结果会更有说服力。★当以地区为单位群进行抽样调查时,应注意被抽取地区的代表性,因而在作整群抽样时应作预初调查,在掌握了全面、初步的情况后再抽取具有代表性的地区作为被调查的单位群,以保证结果的正确性和无偏性。第三节抽样调查的方法关于整群抽样的几种情况★就抽样单位数而言,整群抽样法抽取的单位数要比随机抽样法少得多,但被调查个体数或投入试验的个体数则应当是相等的。★当整群抽样所得到的每一单位群很大,因而无法对抽样单位群进行全面调查或研究时,可以在抽得的单位群内再进行一次抽样,对抽得的样本进行调查研究;在抽得的样本单位群内进行再抽样,成为二次抽样。必要的时候还可以进行三次、四次抽样。第三节抽样调查的方法三、分层抽样分层抽样(stratifiedsampling)就是将研究的总体分成若干个不同的层次,然后根据需要对每个层次进行完全随机抽样,再整合到一起构成样本。分层抽样的特点是:能有效地降低抽样误差,样本代表性好,各层次间也可进行分析比较。分层抽样适用于总体内个体差异较大的情况。第三节抽样调查的方法进行抽样时,可能会减小样本的精确性的原因:①由于偶然的原因,使得样本偏于总体的某一隅。例如个体编号问题②是当总体不是均质时,某一部分与其他部分有明显的不同,或总体本身就可分为若干不同的部分,如果我们对总体进行随机抽样,所得样本往往受各种因素影响而少有代表性,甚至某些部分不被抽到,即使抽得也会由于样本内各部分的比例与总体内各部分的比例不相同而使样本所得调查结果不能用来很好地说明问题而失去准确性。分层的原则:每一层区内所调查研究的性状,应尽可能地均匀同质,所抽样本的含量,应根据各层区的大小及总体内所占大致比例来设定,每一层区内的抽样则应是完全随机的。应根据总体分布的实际情况进行分层。层区可适当多一些,每一层区的抽样单位数最少不得低于2个,在具体的试验或调查中,还应结合当时当地的具体条件而决定分层的形式和层区数,当分层还牵涉到经费、人力时,则应以既恰到好处地分层、又能节省经费、人力为分层原则。第三节抽样调查的方法第三节抽样调查的方法四、顺序抽样顺序抽样(ordersampling),又叫等距抽样法,是将总体中全部抽样单位按某种规律(例如按和目标性状有关的或无关的某一标志的大小等)排列顺序,依次编号,再根据总体容量N和样本容量n确定一个抽样距m(N/n),先从中取出一个抽样单位(d称为随机起点),然后按抽样距m等距地抽取样本,i=0,1,2,…。Nxxxx,......,,,321mxxxx,......,,,321dimx顺序抽样法的特点是:抽样比较简单,事先不需作随机的准备工作。在有限总体内,顺序抽样可以使样本分布得更均匀、广泛,因而具有更好的代表性和较高的精确度。当总体内出现周期性交替且抽样顺序(即抽样距)与之相合或近似时,容易产生“共振”现象,即抽取的样本反而易失去代表性。顺序抽样法所得数据不能得出一个正确的抽样误差,即无法估计其置信区间。第三节抽样调查的方法第四节抽样规模的确定一、样本含量的确定原则样本含量的确定应遵循以下原则:(1)当总体有限且很大时,只要注意代表性,样本大小可占总体的1/1000~1/100;总体不是很大时,以5%为宜。第四节抽样规模的确定一、样本含量的确定原则(2)当调查性状为质量性状,所估计的往往是百分数、率或某一比例,样本含量一般要求大一些。家畜某传染病或寄生虫病的流行病学调查、散发性疾病调查(散发性疾病的分布往往呈泊松分布),遗传病调查(估测基因频率)等等,样本含量应大于500甚至上千才能较好地对总体进行估计。一、样本含量的确定原则(3)当调查性状为数量性状时,则样本含量可小一些,数量性状资料也有计算百分率的,但这一类百分率与前面所述质量性状的百分率(率或构成比)不是同一概念,因此,这一类资料的取样可少取一些。第四节抽样规模的确定一、样本含量的确定原则(4)当抽样调查不会对生产产生明显的不利影响时,可适当加大样本含量,甚至可对整群动物进行调查。(5)试验样本规模的确定是在满足试验准确性的前提下,尽量减少样本含量,使试验造成的损失达到最小。第四节抽样规模的确定二、样本含量的确定方法1.平均数抽样调查的样本含量确定方法nssx当样本含量还较小时,随着样本量的增大,标准误即抽样误差将迅速趋小;但当样本含量增大到一定程度后,抽样误差的缩减速度就很缓慢了,即此时再增大样本含量,一方面会迅速增大经费开支,另一方面对提高抽样的精确性已起不到多大的作用。第四节抽样规模的确定根据以往的研究或经验人为地定出一个样本平均值与总体平均值的离差,即允许误差L,同时选定一个大致的标准差s,LxnststLx222Lstn一般情况下,我们取95%的置信度,即α=0.05,则296.1t224Lsn第四节抽样规模的确定【例】某品种猪6月龄平均血红蛋白的含量为12g/100mL,标准差为1g/100mL,希望允许抽样误差在0.2g/100mL以内,确定α=0.05,求抽样调查所需的样本含量。这里,已知s=1,允许误差L=0.2,则所需样本含量为1002.01422n即在95%的置信度下,需至少调查100个个体才能较好地说明问题。第四节抽样规模的确定当所得的n值较小时,要用和n进行多次试求,直至得到一稳定的n值为止,一般试求l~2次即可完成;当所得n≤5时,说明所设L值太大,或s值太小,应适当调整L和s。t第四节抽样规模的确定【例】标准差为s=15.9,允许抽样误差为L=10,确定α=0.05,求抽样调查所需的样本含量。这里,已知s=15.9,L=10,α=0.05,根据公式,可得样本含量:10110.10109.15422n显然这一样本含量太小,故应重求n值。我们再将自由度df=10时的值直接代人公式t第四节抽样规模的确定1788.212,05.0t,则1604.213,05.0t,则12139.151604.2222n12129.151788.2222n此时样本含量已稳定在n=12,说明这次抽样调查的最佳样本含量约为12。第四节抽样规模的确定281.210,05.0t,则13109.15281.2222n2.百分率抽样调查的样本含量确定方法百分率数据与平均值数据的算法基本一样。百分率的标准误为nppsp)1(允许误差npptstLp)1(故当置信度为95%时的样本含量为:2)1(4Lppn第四节

1 / 70
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功