大物实验之实验数据的处理

tatatoural
0 ℃
2020-09-21

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

2实验数据处理前一页休息在自然界中，有很多的现象是不能用我们以前所学的知识所能解决的－研究动机比如我们在耐液锌蚀腐蚀合金研究过程中，它是由许多种元素配合，再通过高温熔炼而成。可以用多少种成份来配料，熔炼温度需要多高，后续如何处理？这些往往都是未知数。而且没有一定的规律可言。那就需要我们进行大量的试验来寻找它的配方及烧制温度。前一页休息在实验过程中将要利用各种方法对样品进行分析测试，产生许多测量数据。按测量值获得的方法分为：直接测量、间接测量和组合测量直接测量：如用米尺测量长度间接测量：利用直接测量结果，根据特定关系计算特定物理量，如晶面间距测量组合测量：测量长宽，计算面积前一页休息第二章实验数据处理在自然科学领域，常用函数表达变量之间的数量关系–例如扩散层厚度与时间的关系，利用公式便于分析规律如何利用有限的实验数据拟合出一个近似公式,这就是参数拟合问题。–确定参数的方法主要有最小二乘法和最大似然法。如要判断一组数据是否在某个精度范围内与理论公式一致,就是假设检验问题。采用代数多项式来表示复杂的函数,可用插值法前一页休息§2.1误差理论简介误差的含义–绝对误差–相对误差置信区间–贝叶斯理论–区间估计不同分布样本的区间估计前一页休息一、误差的含义可以通过一定的试验测试或运算用估计值表示理论值的近似值。试验值（估计值）与理论值（真值）之间的差值称绝对误差，简称误差。真值往往很难得到，因而误差的绝对值也是无法知道的。但是根据测量工具或计算情况可以估计误差值上限或估计值的精确程度。前一页休息相对误差误差限的大小还不能完全表示近似值的好坏，如10±1与1000±5两个量，虽然前者绝对误差较小，但是显然后者更精确。所以除了考虑误差的大小以外，还应考虑准确值本身的大小，误差与准确值的比值称为近似值的相对误差。前一页休息系统误差与随机误差系统误差由于某种原因所产生，并遵循一定的规律进行变化.例如，随样品或试剂用量的大小按比例进行变化.系统误差有一定的指向，例如称量一种吸湿性物质，其误差总是正值.它属于方法和技术问题，知道了产生的原因，便可消除或修正，所以此种误差也称可定误差.随机误差在相同条件下重复多次测定同一物理量时，误差大小或正负变化纯属偶然而毫无规律，这种误差称为随机误差，也叫偶然误差.前一页休息系统误差的特点重现性单向性数值基本恒定系统误差可以校正。可用一定的方法消除。前一页休息随机误差分布随机误差是不可预测、不可避免的根据统计理论，随机误差服从高斯分布（正态分布）随机误差具有–单峰性：较小误差出现的几率较大–对称性：绝对值相等的正负误差出现的几率相等–有界性：大误差出现的几率较低因此，测量次数较多时，均值会趋于真值前一页休息随机误差的估算算术平均误差用算术平均代替真值，可以计算绝对误差的平均值。标准误差（方差）反映数据偏离真值的分散程度，即均值与真值之间的接近程度。前一页休息几个精度概念精密度：多次测量结果之间的符合程度，反映随机误差的大小，重现性正确度：系统误差的大小准确度：测量值与真值的一致程度，反映系统误差与随机误差的综合前一页休息•在热工、电工仪表中，正确度等级一般都用引用误差来表示，通常分为0.1,0.2,0.5,1.0,1.5,2.5,5.0七级。•例如，某仪表正确度等级为R级（引用误差R%），满量程的刻度为X，实际使用时的测量值为x（x≤X），则xRXRX%%测量值的相对误差测量值的绝对误差前一页休息通过上面的分析，可知为了减少仪表测量的误差，提高正确度，应该使仪表尽可能在靠近满量程刻度的2/3以上的区域内使用的原则。前一页休息提高实验数据准确度的方法减少系统误差的途径对照实验空白实验校准仪器校正方法减少偶然误差的途径多次测量、取平均值防范过失！前一页休息粗大误差粗大误差也称过失误差，是一种不应发生，而仅由于粗心、疏忽等引起的误差。往往是由于非正常实验条件或非正常操作所造成的.如测量时对错了标志,误读了数码,实验仪器未达到预想的指标，记录计算错误，加错了试剂等粗大误差的数值远大于系统误差和随机误差，实际上已超出了误差范围含有粗差的测量值常称为坏值或异常值,应予以剔除,否则会影响结果前一页休息坏值剔除用统计法进行坏值剔除的基本思想是：给定一显著性水平，并确定一门限值，凡超过这个门限的误差就认为它不属于随机误差的范畴，而是粗差，并予以剔除.前一页休息拉依达(Ρайта)准则拉依达准则又被简称为3σ准则。由于随机误差服从正态分布规律，因此P{|ε|≤3σ}=99.7％有限次测量误差超过3σ的几率很小，可以剔除由于实际上σ未知，如果可以剔除，弃真几率很小3ixxS前一页休息例某合金导线的电阻值测量次序电阻值/W测量次序电阻值/W测量次序电阻值/W140.42940.401740.42240.431040.431840.41340.381140.421940.39440.441240.432040.39540.461340.392140.30640.421440.362240.42740.401540.402340.43840.431640.432440.43前一页休息24个测量值的均值为40.4124个测量值的标准差S＝0.03213S＝0.0963与平均值偏差最大的是21次测量结果40.30，偏差＝0.11，超过3S，坏值去掉该值后，均值40.41，S＝0.0225偏差最大（5，14）0.053S，有效前一页休息肖维勒准则肖维勒认为，在n次测量中，某误差可能出现的次数小于半次时，则舍去这个误差值。误差等于或大于δ出现的相对频数可近似地取为1-Pδ测量次数为n，误差等于或大于出现的次数为n(1-Pδ)0.5实用上,如果误差εωS，即可判断为粗差前一页休息Chauvenet系数的数值表ninini34567891011121.381.531.651.731.801.861.921.962.002.03131415161718192021222.072.102.132.152.172.202.222.242.262.28232425304050751002005002.302.312.332.392.492.582.712.813.023.20前一页休息Grubbs准则格拉布斯(F．E．Grubbs)准则同样适用于对同一参数进行重复测量得到的一列测量数据的处理。这个准则经蒙持卡罗法考验后，认为是最有效的判别方法。同上，当时则认为xi是含有粗值的坏值，应予剔除(,)ins前一页休息Grubbs系数数值表nnn0.010.050.010.050.010.05345678910111.151.491.751.912.102.222.322.412.481.151.461.671.821.912.032.112.182.241213141516171819202.552.612.662.702.742.782.822.852.882.292.332.372.412.412.472.502.532.562122232425303540502.912.942.952.993.013.103.183.213.342.582.602.622.642.662.742.812.872.96前一页休息t检验法该准则又可称为罗曼诺夫准则。当测量次数较小时，按t分布的实际误差分布范围来判断粗大误差较为合理。t检验准则的原则是：首先剔除一个与均值偏离最大的数据，然后对剩余的数据进行统计计算，以判定该次剔除是否合理，即判定已被剔除的那个数据是否含有粗大误差。前一页休息在剔除某一数据xi后，重新计算均值和方差，如果时，剔除坏值xi其中T为t分布，自由度f=n-2(,)ikns21),()]1/([),(nntnkf前一页休息Dixon准则狄克松(Dixon)准则采用了极差比的方法，不必求方差。对于某一等精度重复测量，按测量值的大小排列为x1＜x2＜…＜xn如果上述测量值中有含有粗大误差的测量数据，首先值得怀疑的是x1、xn。狄克松首先定义了一个与x1，xn和、n有关的极差比统计量f(f的计算公式见表)，如果f＞临界值f(a,n)则认为在显著性水平下，x1、xn含有粗大误差，应予以剔除。狄克松准则一次能判别两个数据x1，xn，如果这两个数据都不含粗大误差，判断结束。如果这两个数据中有含粗大误差的数据，则予以剔除。剔除后的数据列当做新的数据列，重新进行判断前一页休息前一页休息实验结果的表示测量结果最常用的表示方式是均值和标准偏差。前者表征测试量的大小，后者表征测试的精密度。与之有关的是有效位的取舍.所谓有效位是指某种测量所达到的精度.如下列测试值：10.09,10.11,10.09,10.10和10.12，其均值为10.102，标准偏差为0.0130.但测试值仅准确到小数点后面第一位，而第二位为可疑位，故结果的表示为：)5(01.010.10Nsx)5(01.010.1032Nsx前一页休息二、置信度与置信区间设一未知参数X(例如材料的硬度),虽然其精确值未知，但是可由若干试验值（样本）估计它在某个范围内。如果有区间[x1,x2]，对于给定值m（0m1），X值在X1-X2之间出现的概率满足P(X1≤X≤X2)=m则称随机区间[x1,x2]是X的100m%置信区间，X1是置信下限，X2是置信上限，百分数100m%称为置信度。前一页休息置信区间举例假如真值为Xo，拟合出参数的值X±ΔX,意味着在某个概率下,多次测量的X估计值(近似等于Xo)可以落在以上范围内。如果估计值X服从正态分布,X在某范围(如[X1,X2]区间)选值的概率等于高斯概率密度曲线下X1到X2的面积。若采用标准误差σ和测量值X来表示测得的真值Xo范围,则–P(X-σ≤Xo≤X+σ)≈0.68–P(X-2σ≤Xo≤X+2σ)≈0.95–P(X-3σ≤Xo≤X+3σ)≈0.9974显然，区间越宽，置信度越高。前一页休息三、不同分布的区间估计1.对于正态分布样本，可以用若干样本平均值估计总体平均值如果总体方差已知，使用如下公式估计)1,0(~/Nnx如果总体方差未知，使用如下公式估计)1(~/ntnsx式中，x样本均值，总体均值，n样本数，s样本方差前一页休息举例例如，经过大量试验已知样本总体服从正态分布X～（μ，0.09），随机取得的4个观察值12.6,13.4,12.8和13.2,求总体均值的95%置信区间。样本均值x是μ的一个估计值，且()/xnxn~N(0,1)查正态函数表，满足P{-zTz}=0.95的z值为1.96即96.1)(3.0296.1x根据试验数据可以求得x=13.0，13.01.960.3/213.00.29413.00.3前一页休息例二如果方差未知，可以用样本方差s作为总体方差σ的近似值，样本均值与整体均值之间服从t分布。例如为确定某溶液的浓度，取样得到n=4个测定值的平均值8.34%x，样本离散差s=0.03%。设样本总体服从正态分布，的95%置信区间是4)14(34.8025.0st=8.34±3.1824×0.015=8.340.047736=8.29%—8.39%前一页休息例3钢中Cr含量的5次测定结果(%)为1.12，1.15，1.11，1.16，1.12。根据这批数据估计Cr的含量范围(90%)。[1.10,1.16]21.13,0.0217xs/2(1)sxtnn0.050.02171.13(4)5t0.02171.132.77651.130.026941.130.03前一页休息normfit[MU估计值,SIGMA估计值,MU区间,SIGMA区间]=normfit(x,alpha)对给定数据x，在