田间试验15抽样调查

晓雨真
1 ℃
2017-08-01

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第十五章抽样调查第一节抽样调查方案第二节常用抽样方法的统计分析第三节样本容量的估计第一节抽样调查方案一、抽样单位二、抽样方法三、样本容量四、确定抽样方案的一些因素一、抽样单位抽样分数(samplingfraction)：指一个样本所包含的抽样单位数占其总体单位数的成数。田间抽样调查的抽样单位(sampleunit)是随调查研究目的、作物种类、病虫害种类、生育时期、播种方法等因素而不同的，可以是一种自然的单位，也可以是若干个自然单位归并成的单位，还可以用人为确定的大小、范围或数量作为一个抽样单位。常用的抽样单位举例如下：（1）面积如0.5平方米或每平方米内的产量、株数、害虫头数等。（2）长度如1～2行若干长度内的产量、株数，若干长度内植株上的害虫头数等。（3）株穴如棉花连续10株的结铃数，水稻连续20穴的苗数、分蘖数、结实粒数等。（4）器官如稻、麦千粒重，大豆百粒重，每100个棉铃中红铃虫头数，每张叶片的病斑数等。（5）时间如单位时间内见到的虫子头数，每天开始开花的株数等。（6）器械如一捕虫网的虫数，一只诱蛾灯下的虫数，每一个显微镜视野内的细菌数、孢子数、花粉发芽粒数等。（7）容量或重量如每升或每公斤种子内的混杂种子数，每升或每公斤种子内的害虫头数等。（8）其他如一个田块、一个农场等概念性的单位。二、抽样方法基本的抽样方法(samplingmethod)有以下三类：1．顺序抽样(systematicsampling)也称机械抽样或系统抽样，按照某种既定的顺序抽取一定数量的抽样单位组成样本。2．典型抽样(typicalsampling)也称代表性抽样，按调查研究目的从总体内有意识地选取一定数量有代表性的抽样单位，至少要求所选取的单位能代表总体的大多数。3．随机抽样(randomsampling)也称等概率抽样，在抽取抽样单位时，总体内各单位应均有同等机会被抽取。常用的顺序抽样方式三、样本容量样本容量(或样本含量samplesize)：指样本所包括的抽样单位数。样本容量的大小与所获抽样调查结果的准确度和精确度密切有关。四、确定抽样方案的一些因素设计抽样方案时须考虑以下几方面：(1)所要求的准确度与精确度，要求高时样本容量应大。(2)是否需估计置信限或作统计推论，一般随机抽样有合理的试验误差估计，可以做统计推论。而其他抽样方法往往缺乏合理的误差估计，统计分析有局限性。(3)与人力、物力、时间等条件相适应，抽样单位大、样本容量大、进行总体编号等都是较费事的，必须权衡需要与可能，在保证一定精确性的情况下，尽量减低消耗。(4)注意到调查研究对象的特点。第二节常用抽样方法的统计分析一、简单顺序抽样及简单典型抽样法二、简单随机抽样法三、分层随机抽样法四、整群抽样法五、分级随机抽样法六、双重随机抽样法七、序贯抽样法一、简单顺序抽样及简单典型抽样法简单顺序抽样(simplesystematicsampling)：通常只计算平均数作为总体的估计值。计算平均数的公式为：nyy/[例15.1]设成熟期对水稻汕优2号大田测产，该田块约5亩，生长较均匀。采用棋盘式抽样，10个点，每点由12行间距计算平均行距。其中任选二行测查2m长度内的穴数及有效穗数。再在其中拔连续5穴，将稻穗分成大、中、小三级，按比例选取20穗，结合考查其他性状计数每穗总粒数及空瘪粒数，从而算出结实粒数。每点其余稻穗脱粒，称取千粒重。将10点数据汇总后求得每亩平均穴数4.2万，每穴平均有效穗数9.2个，每穗平均结实粒数53.7粒，平均千粒重25.2克。计算平均数的公式为。本例中土地利用系数定为98%，则估计每亩产量为：=513.75(kg/亩)简单典型抽样法的分析同样只计算。10001000土地利用系数千粒重每穗结实粒数每穴有效穗数每亩穴数100010009825.253.79.242000%nyy/二、简单随机抽样法简单随机抽样(simplerandomsampling)：每个抽样单位具有相同概率被抽入样本。总体编号方法及随机抽取方法依调查对象而定。[例15.2]设在一休闲地上调查小地蚕虫口密度每测框为1m2，随机取30点，调查结果列在表15.1。表15.130个单位的小地蚕幼虫头数4.3630131ffyy2.63130/30(131)77312nnfyfys22)(0.48302.63/nssy/每m2内幼虫头数(y)0123456789101112Σ单位数(个)123844222100130fy02624162012141690012131fy20212726410072981288100144773(头/㎡)(头/㎡)(头/㎡)即该田块小地蚕幼虫约为3.38～5.34(头/㎡)，折合每亩2253.4～3560.2头，这个估计的可靠性为95%。以上将所调查研究的总体看为面积甚大的一个无限总体进行分析，设若该30个单位从336㎡的一块田中抽出，这时调查研究的总体实为一有限总体，有限总体的两个参数为：平均数(15·1)0.984.360.482.0454.36置信限为：95ystyL05.0%NYY/(头/㎡)标准差N为总体内单位数，即总体容量。样本估计值仍为及，但估计抽样误差时应考虑到抽样分数的影响。1NYYNi2)()(1nssy（15·3）(15·2)本例中(头/㎡)该有限总体平均数的95%置信限为：(头/㎡)即3.42～5.30(头/㎡)，折合每亩2280.0～3533.4头。0.46)33630(1302.63)(1nssy0.944.360.462.045.36954%05.0yYstyL三、分层随机抽样法分层随机抽样法(stratifiedrandomsampling)：从各个层次或段落分别进行随机抽样或顺序抽样。分层随机抽样有三个步骤：（1）将所调查的总体按变异情况分为相对同质的若干部分、地段等称为区层，各区层可以相等，也可以不等。（2）独立地从每一区层按所定样本容量进行随机抽样。各区层所抽单位数可以相同，也可以不同。抽样单位总数在各区层的分配有：①比例配置法：指各区层大小不同时按区层在总体中的比例确定抽样单位数，若各区层大小相同，比例配置结果实际即为相等配置；②最优配置法：指根据各区层的大小、变异程度以及抽取一个单位的费用综合权衡，确定出抽样误差小、费用低的配置方案。（3）根据各区层的估计值，采用加权法估计总体参数。总平均数：(15·4)总标准误：iikkiiypypypypypy2211若各区层总体方差相同，则2/122222222212121)(kkkiiiynspnspnspnsps)(iiinsp22)(2iiynpss(15·５)(15·6)若各区层抽样单位数按区层比例配置，则(15·7)其中iynss)()()()(2112.111iiiiikinjiijnsnnyysi（15·8）四、整群抽样法整群随机抽样法(randomgroupsampling)：被抽取的整群中各抽样单位都进行调查，按群计算平均数及标准差，并估计其置信限。[例15.4]设某农场调查水稻螟害发生情况，在全场100个条田中随机抽取9条做调查，每田块采用平行线式取10点，每点连续查20穴，经初步整理后将结果列于15.2。某农场螟害率抽样调查结果田块123456789调查茎秆数198020622154251223152098242118672248螟害茎秆数178211335345212238460119298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25这资料以条田为抽样单位进行分析。)11.96(13.25)/910.23(8.99%nyy)3.85(1%/)(22nnyys)1.28(93.85%ys)2.95(11.961.282.30611.9695%%05.0ystyL819DF全场100条田平均螟害率95%的可能在9.01～14.91%范围内。本例的总体实际上是一个N=100的有限总体，故更确切地应为:)1.22(1009193.851%nssy)2.81(11.961.222.30611.9695%%05.0yYstyL即9.15～14.77(%)间。此外，本例是百分数资料，如果田块间的差异不大，可以采用百分数资料的分析方法，即由总调查茎秆数和总螟害茎秆数求出总螟害率，得这样，即11.69～12.59(%)。这个区间比前面所估小得多，这是因为前面以田块为抽样单位，而不是以)12.14(2396/19657%p%)(0.230.0023196570.1214)0.1214(11nppsp)0.45(12.140.231.9612.1495%%pL茎秆为单位，除了有茎秆受害与否的随机误差外，还包含有田块间的差异，所以此处不宜采用百分数的误差估计方法。五、分级随机抽样法巢式随机抽样法(nestedrandomsampling)：最简单的是二级随机抽样。例如全区的棉花结铃数，可以在区内随机抽取几个乡，乡内随机抽取若干户进行调查。这时，乡为初级抽样单位，户为次级抽样单位。又例如研究农药在叶面上的残留量，第一步随机抽取单株，第二步在单株上随机抽取叶片，分别作为初级和次数抽样单位。表15.3某农药残留量分析结果及其方差分析22BAn2A0.00662ˆA0.072440.00660.29612ˆB植株各叶片内的残留量(单位数)合计平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30变异来源自由度均方所估计的方差分量F植株间3MSB=0.2961*44.9F0.05(3,12)=3.49株内叶片间12MSA=0.0066巢式随机抽样数据可以应用方差分析法算出各阶段的抽样误差，从而估计平均数的标准误。二级抽样的公式如下：（15·13）其中，k=初级抽样单位数，n=次级抽样单位数。（15·14）、分别为次级和初级抽样误差的估计值。knyykn11knksBAy222ˆˆ2ˆA2ˆB二级抽样的数据按单向分组的组次数相等(也可能不相等)的随机模型进行方差分析。例题中k=4，n=4，方差分析结果F=0.2961/0.0066=44.9，说明植株间的误差显著大于株内叶片间的误差。这二个阶段的抽样误差是不同的，应该分别估计。但此处若将kn=4×4=16张叶片直接计算其方差则为0.0645。比扣除株间误差后剩余的株内叶片间误差0.0066大得多。[例15.5]表15.3数据的分析结果：3.16550.56/16knyykn11(单位)0.018506160.29611)ˆˆ(ˆˆ22222BABAynnkknks(单位)20.136ys(单位)0.4333.1650.1363.1823.16595ystyL05.0%(单位)此处DF=3，因2ys由均方MSB计算。2ys若只从1个初级单位估计置信限，如以株为单位作估计，则：0.0740340.29614414)ˆˆ(ˆˆ22222BABBys(单位)20.272ys(单位)0.8663.1080.2723.1823.10895ystyL05.0%(单位）由一株四张叶片估计，比四株16张叶片估计，误差要大得多。若每株只取一张叶片，四株共取4张叶片，则0.019750