食品试验设计与统计分析基础一、名词解释1.总体:具有共同性质的个体所组成的集团。2.样本:从总体中随机抽取一定数量,并且能代表总体的单元组成的这类资料称为样本。3.参数:由总体里所有观察值算得用以说明总体的数据特征,常用希腊字母表示。一般有总体平均数μ,总体方差δ2,总体标准差δ等几种参数恒定不变。4.统计数:有样本里全部观察值算得说明样本特征的数据。包括样本平局数,标准差S,样本方差S2.5.准确性:试验结果真是结果相接近的程序。6.精确性:在相对相同的条件下,重复进行同一试验,其结果相接近的程度。7.系统误差:认为因素造成的差异。8.随机误差:各种偶然的或人为无法控制的因素造成的差异。9.数量性状的资料:能够称量、测量和计数的方法所表示出来的资料。可分连续性.数量性状的资料和间断.数量性状的资料。10.连续性资料:用计量的方法得到的数据性资料。11.间断性资料:用计数的方法得到的数据性资料。12.质量性状的资料:只能观察、分类或用文字表述而不能测量的一类资料。13.两尾检验:具有两个否定域的假设试验。14.一尾检验:具有单个否定域的月统计假设试验。15.参数估计:又叫抽样估计,是样本统计数估计总体参数的一种方法。16.点估计:用样本统计数直接估计相应总体参数的方法。17.区间估计:在一定的概率保证下,用样本统计参数去估计相应总体参数所在范围。18.置信区间:估计出参数可能出现的一个区间,使绝大多数该参数的点估计值都包含在这个区间内,所给出的这个区间称为置信区间。19.α错误:把试验误差判断为真实差异,否定了正确的H0(措施:降低显著水平)。20.β错误:把真实差异判断为试验误差,接受了错误的H0(措施:科学的试验设计,提高样本容量)。21.置信度:保证参数出现在置信区间内的概率称为置信度。22.直线回归:研究x、y变量间因果依存的方法。23.直线相关:研究两个变量间直线关系的相关分析。24.试验指标:根据研究的目的而选定的用来衡量或考核试验效果的质量特性。25.试验因素:试验中所研究的试验指标的因素。26.因素水平:试验因素所处的某种特定状态或数量等级。27.试验处理:事先设计好的实施在试验单位上的一种具体措施或项目称为试验处理。28.试验单位:施加试验材料的单位。29.重复:指在一个处理有2个或2个以上的试验单位。30.随机化:将各个试验单位完全随机的分配在试验的各个处理中。31.局部控制:指当非试验因素,对试验指标的干扰不能从试验中排除时,通过采取一定的技术措施或方法来控制,从而降低或纠正它们的影响,提高统计推断的可靠性。32.试验方案:根据试验目的和要求而拟定的进行比较的一组试验处理的总称,是整个试验工作的核心部分。33.完全随机试验:将试验的所有处理各个复小区在试验中统一进行随机排列,但不设区组的方法。34.随机区组设计:按局部控制的原则,将试验的所有共享单元化合成与重复数相等的区间,再将每个区组化合成与处理数相等的小区。35.调查设计的概念:广义上,指整个调查范围计划的制定。狭义上,指抽样方法,抽样单位,抽样数目的确定等内容。二、填空题1.试验设计的基本原则:重复性、随机化、局部控制、唯一差异原则。2.常用的抽样方法:顺序抽样、随机抽样。随机抽样又分为:简单随机抽样、随机区组抽样、分层随机抽样、分级随机抽样。3.资料的整理:单项式分组法、组距式分组发。4.统计表由表题、横标目、纵标目、线条、数字及合计构成。5.统计表种类:简单统计表、复合统计表。6.常用的统计图:长条图、圆图、线图、直方图、折线图。7.连续性资料采用直方图和折线图,间断性和分类资料常用长条图或圆图,线图常用来表示动态变化情况。8.平均数的种类:算数平均数、中数、众数、几何平均数、调和平均数。9.变异数种类:全距、方差、标准差、变异系数。10.泊松分布的特点:μ=δ2=λ。11.标准正态分布:μ=0、δ2=1。12.t分布适用于小样本资料,δ未知时。v分布适用于大/小样本,δ2已知13.统计假设检验原理:小概率事件不可能发生性原理。14.方差分析的基本假设包括:效应的可加性,分布的正态性,方差的同质性。15.X2检验:适用性检验和独立性检验。三、简答题1.调查设计的作用。答:正确的调查设计能控制和降低抽样误差,提高调查的准确,为获得总体参数的可靠估计提供必需的数据。2.科学实验的要求。答:①必需特别重视对试验的合理设计和科安排;②注意试验过程的正确运行,保证试验结果的可靠性、准确性和代表性;③进行科学正确的统计分析,以真正揭示被研究对象的本质,得出科学的结论。3.试验误差的来源。答:①试验材料固有的差异;②测试方法不当或不正确;③仪器设备及试剂不合格或精度不高;④试验进行外用环境的差异;⑤操作不正确或操作人员生理上的差异。4.完全随机试验设计的优缺点。答:(1)优点:①遵循了重复性原则,随机性原则;②设计容易,简单灵活,不得已时各处理的重复次数可以不相等。(2)缺点:①试验条件不均匀时,试验误差大;②不遵循局部控制原则。5.随机组区间试验设计优缺点。答:(1)优点:①设计简单,容易掌握;②灵活多样,对试验的空间要求不严,区间可排位单、双、多排,也可分散排列;③对于单、双、多因素都可以用该方法,精确度高,可以进行无偏估计,目前应用最广泛的实验设计。(2)缺点:处理数不宜太多,一般3—5个处理。6.连续性资料整理步骤(常采用组矩式分组法)。答:①求全矩;②确定组数;③确定组矩;④确定组限及组中值;⑤制作次数分布表。7.间断性资料的整理。答:常采用单项式分组法,其步骤是用样本的观测值直接进行分组,每组均用一个观测值表示。分组时,将资料中的每个观测值归入相应的组内,然后记数制或次数分布表。8.分类资料的整理。答:对于分类资料,可按类别或特级进行分组,分别统计各组的次数,然后制成次数分布表。9.算数平均数的特性:①样本各测值与平均数之差的和为零:0x-x)(—;②样本中各观测值与平均数之差的平方和为最小,即离均差平均和最小22a-xx-x)(<)(—。10.标准差的特性。答:①标准差的大小受每个观测值的影响,若数值间变异大,其离均差亦大,由此求得的标准差必然大,反之则小。②计算标准差时,在样本各观测值加或减同一常数,标准差的值不变。③当样本资料中每个观测值乘以或除以一个不等于0的常数a时,所得的标准差原来的a倍或1/a。11.二项分布的特点及特征数。答:(1)性质:①P(x=k)=Pn(k)≥(k=0,1,2,……,n);②二项分布概率之后等于1,即k-nkn0kknqpC=(p+q)n=1;③P(x≤m)=Pn(k≤m)=k-nkm0kknqpC;④P(x≥m)=Pn(k≥m)=k-nkm0kknqpC;⑤P(m1≤x≤m2)=Pn(m1≤k≤m2)=k-nk0kknqpm2C(m1≤m2)。(2)特点:①当P值较小时且n不大时,分布是偏倚的。随着n的增大分布逐渐趋于对称;②当P趋于0.5时分布越对称;③对固定的n及P,当k增加时,Pn(k)先随之增加并达到某极大值后又下降。(3)特征数:平均数、方差(μ=np、δ2=npq、δ=npq)、总体特征数。12.正态分布的特征。答:①正态分布曲线是以均数μ为中心,左右对称分布的单峰悬钟性曲线,在平均数的左右两侧,只要(x-M)的绝对值相等,f(x)值就相等;②f(x)在x=μ时达到最大值且f(μ)=1/δπ2);③f(x)是非负函数,以横轴为渐近线,分布从从-∞到+∞,且曲线在μ±δ处各有一个拐点;④正态分布是以系数μ和δ2的不同表现的一系列曲线,其中μ是正态分布的位置系数,δ2是正态分布的形状参数;⑤正态分布的次数多数集中于μ的附近,离均数越远,其相应的次数就越少;⑥曲线f(x)与横轴之间围成的面积等于1。13.统计假设检验方法步骤。答:(1)方法:u检验、t检验、F检验和X2检验。(2)步骤:①建立假设H0::μ=μ0μ<μ0(两尾)(一尾);HA:μ≠μ0μ>μ0②确定显著水平α=0.05或α=0.01;③检验计算:均数标准误S=S/;统计量t值或u值:t=(x-μ0)/Sxu=(x-μ0)/δx自由度df=n-1;④统计推断:u检验时:|u|实际>uα,应否定H0,接受HA;|u|实际<uα,应接受H0,否定HA;t检验时,若|t|实际<t临界,接受H0,故P>0.05或0.01;若|t|实际<t临界,则应否定H0,故P<0.01或0.05。