误差及数据分析的统计处理

aaron1992
1 ℃
2019-11-28

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

误差及数据分析的统计处理误差及数据分析的统计处理定量分析中的误差误差(Error)与准确度(Accuracy)1.误差——测定值xi与真实值μ之差误差的大小可用绝对误差E(AbsoluteError)和相对误差RE(RelativeError)表示。E=xi－μ%100ixRE相对误差表示误差占真值的百分率或千分率。误差及数据分析的统计处理2.准确度(1)测定平均值与真值接近的程度;(2)准确度高低常用误差大小表示,误差小，准确度高。例1：分析天平称量两物体的质量各为1.6380g和0.1637g，假定两者的真实质量分别为1.6381g和0.1638g，则两者称量的绝对误差分别为：(1.6380－1.6381)g=－0.0001g(0.1637－0.1638)g=－0.0001g两者称量的相对误差分别为：绝对误差相等，相对误差并不一定相同。%.%..00601006381100010%.%..0601001638000010误差及数据分析的统计处理3.说明(1)绝对误差相等，相对误差并不一定相同;(2)同样的绝对误差，被测定的量较大时，相对误差就比较小,测定的准确度也就比较高;(3)用相对误差来表示各种情况下测定结果的准确度更为确切;(4)绝对误差和相对误差都有正值和负值。正值表示分析结果偏高，负值表示分析结果偏低;(5)实际工作中，真值实际上是无法获得;常用纯物质的理论值、国家标准局提供的标准参考物质的证书上给出的数值、或多次测定结果的平均值当作真值;误差及数据分析的统计处理误差及数据分析的统计处理偏差(Deviation)与精密度(Precision)1.偏差个别测定结果xi与几次测定结果的平均值的差。绝对偏差di：测定结果与平均值之差；相对偏差dr：绝对偏差在平均值中所占的百分率或千分率。xxdii%100xxxdir误差及数据分析的统计处理算术平均偏差（AverageDeviation）：niniiixxndnd1111相对平均偏差表示为:%100xddr2.标准偏差（StandardDeviation）又称均方根偏差，当测定次数趋於无限多时，称为总体标准偏差，用σ表示如下：nxni12)(μ为总体平均值，在校正了系统误差情况下，μ即代表真值；n为测定次数。112-)(nxxsnii(n-1)表示n个测定值中具有独立偏差的数目，又称为自由度。有限次测定时，标准偏差称为样本标准差，以s表示：误差及数据分析的统计处理用下式计算标准偏差更为方便：s与平均值之比称为相对标准偏差，以sr表示:也可用千分率表示(即式中乘以1000‰)。如以百分率表示又称为变异系数CV(CoefficientofVariation)。11212nnxxsninii%100xssr误差及数据分析的统计处理已知两组数据，比较精密度好坏甲0.3-0.2-0.40.20.10.40.0-0.30.2-0.3乙0.00.1-0.70.2-0.1-0.20.5-0.20.30.1解：=0.24d甲=0.24d乙=0.28s甲=0.28s乙误差及数据分析的统计处理3.精密度（1）精密度：在确定条件下，将测试方法实施多次，求出所得结果之间的一致程度。精密度的大小常用偏差表示。（2）精密度的高低还常用重复性（Repeatability）和再现性（Reproducibility）表示。重复性(r)：同一操作者，在相同条件下，获得一系列结果之间的一致程度。再现性(R)：不同的操作者，在不同条件下，用相同方法获得的单个结果之间的一致程度。（3）用标准偏差比用算术平均偏差更合理。误差及数据分析的统计处理准确度与精密度的关系精密度是保证准确度的先决条件；精密度高不一定准确度高；两者的差别主要是由于系统误差的存在。精密度准确度好好好稍差差差很差偶然性误差及数据分析的统计处理例：分析铁矿中铁含量，得如下数据：37.45%,37.20%,37.50%,37.30%,37.25%计算此结果的平均值、平均偏差、标准偏差、变异系数。计算：%.%.%.%.%.%.3437525373037503720374537x%.%.....11050900401601401101nddnii%.%).().().().().(1301001509004016014011012222212ndsnii%.%..3501003437130xsCV误差及数据分析的统计处理误差的分类及减免误差的方法•系统误差或称可测误差(DeterminateError)•偶然误差或称未定误差、随机误差(IndeterminateErrors)1.系统误差产生的原因、特点及减免系统误差的特点(1)重复性：同一条件下，重复测定中，重复地出现；(2)单向性：测定结果系统偏高或偏低；(3)可校正性：其大小可以测定，可对结果进行校正。误差及数据分析的统计处理（1）方法误差(MethodErrors):——对照实验如反应不完全；干扰成分的影响；指示剂选择不当；对照试验：选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验，找出校正值加以校正。（2）仪器和试剂误差：——空白实验试剂或蒸馏水纯度不够；空白试验：指除了不加试样外，其他试验步骤与试样试验步骤完全一样的实验，所得结果称为空白值。产生原因误差及数据分析的统计处理（3）操作误差例：分析天平，E=±0.0001g，使其Er0.1%，则称量的物质最少为多少g?（4）主观误差（PersonalErrors），如观察颜色偏深或偏浅，第二次读数总是想与第一次重复等造成。误差及数据分析的统计处理系统误差的判断——回收实验在测定试样某组分含量的基础上，加入已知量的该组分，再次测定其组分含量。由回收试验所得数据计算出回收率。%100213xxx回收率由回收率的高低来判断有无系统误差存在。常量组分:一般为99%以上，微量组分:90~110%。误差及数据分析的统计处理2.偶然误差产生的原因、性质及减免由一些无法控制的不确定因素引起的。（1）如环境温度、湿度、电压、污染情况等的变化引起样品质量、组成、仪器性能等的微小变化；（2）操作人员实验过程中操作上的微小差别；（3）其他不确定因素等所造成。性质：时大时小，可正可负；非单向性；不可避免。减免方法：无法消除。误差及数据分析的统计处理偶然误差的分布服从正态分布横坐标：以σ为单位来表示的随机误差；纵坐标：误差出现的概率大小。1.服从正态分布的前提测定次数无限多；系统误差已经排除。2.定义xu误差及数据分析的统计处理3.误差范围与出现的概率之间的关系x-μu概率[-σ,+σ][-1,1]68.3%[-1.96σ,+1.96σ][-1.96,+1.96]95%[-2σ,+2σ][-2,+2]95.5%[-3σ,+3σ][-3,+3]99.7%xu误差及数据分析的统计处理置信度：在某一定范围内测定值或误差出现的概率。68.3%,95.5%,99.7%即为置信度置信区间：真实值在指定概率下，分布的某个区间。μ±σ，μ±2σ，μ±3σ等称为置信区间。置信度选得高，置信区间就宽。4.置信度与置信区间误差及数据分析的统计处理有限次测定中偶然误差服从t分布有限次测定无法计算总体标准差σ和总体平均值μ,则偶然误差并不完全服从正态分布，服从类似于正态分布的t分布(t分布由英国统计学家与化学家W.S.Gosset提出，以Student的笔名发表)。t的定义与u一致xtns误差及数据分析的统计处理t分布曲线t分布曲线随自由度f(f=n-1)而变，当f＞20时，与正态分布曲线很近似，当f→∞时，二者一致。t分布在分析化学中应用很多。t值与置信度和测定值的次数有关，可由表2-2中查得。误差及数据分析的统计处理置信度测定次数90%95%99%26.31412.70663.65732.9204.3039.92542.3533,1825.84152.1322.7764.60462.0152.5714.03271.9432.4473.70781.8952.3653,50091.8602.3063.355101.8332.2623.250111.8122.2283.169211.7252.0862.846∞1.6451.9602.576表2-2t值表误差及数据分析的统计处理讨论：(1)由式：得：ntsxxtns误差及数据分析的统计处理(2)上式的意义：在一定置信度下(如95%)，真值(总体平均值)将在测定平均值附近的一个区间即在ntsxntsx之间存在，把握程度95%。该式常作为分析结果的表达式。(3)置信度↑，置信区间↑，其区间包括真值的可能性↑，一般将置信度定为95%或90%。误差及数据分析的统计处理例：测定SiO2的质量分数，得到下列数据，求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。28.62,28.59,28.51,28.48,28.52,28.63解：查表2-2置信度为90%，n=6时，t=2.015。56286632852284828512859286228........x06016070040080050030060222222.).().().().().().(s0505628606057125628.....置信度为95%时：0705628606057125628.....置信度↑，置信区间↑。误差及数据分析的统计处理例：测定钢中含铬量时，先测定两次，测得的质量分数为1.12%和1.15%；再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次测定和五次测定平均值的置信区间（95%置信度）。查表2-2，得t95%=12.7。%.%.%.x14121511210210120150015022.).().(s%.%...%.W19014120210712141Cr解：n=2时误差及数据分析的统计处理n=5时：查表2-2，得t95%=2.78。%.%.%.%.%.%.x1315121161111151121022012.)(nxxs%.%...%.W03013150220782131Cr在一定测定次数范围内，适当增加测定次数，可使置信区间显著缩小，即可使测定的平均值与总体平均值μ接近。误差及数据分析的统计处理公差公差：生产部门对于分析结果允许误差的一种表示法超差：分析结果超出允许的公差范围。需重做。公差的确定：（1）组成较复杂的分析，允许公差范围宽一些；（2）一般工业分析，允许相对误差在百分之几到千分之几；（3）而原子质量的测定，要求相对误差很小；（4）国家规定。误差及数据分析的统计处理钢中的硫含量分析的允许公差范围硫的质量分数（%）≤0.0200.020～0.0500.050～0.1000.100～0.200≥0.200公差（绝对误差%）±0.002±0.004±0.006±0.010±0.015国家标准中，对含量与允许公差之关系常常用回归方程式表示。误差及数据分析的统计处理分析结果的数据处理为什么要对数据进行处理？数据进行处理包括哪些方面？可疑数据的取舍——过失误差的判断分析方法的准确度（可靠性）——系统误差的判断误差及数据分析的统计处理1.Q值检验法（1）数据排列x1x2……xn（2）求极差xn－x1（3）求可疑数据与相邻差：xn－xn-1或x2－x1（4）计算：11211xxxxQxxxxQnnnn或（5）根据测定次数和要求的置信度,(如90%)查表2-4：（6）将Q与Qx（如Q90）相比，若QQx舍弃该数据,（过失误差造成）若Q≤Qx保留该数据,（偶然误差所致）可疑数据的取舍误差及数据分析的统计处理表2-4Q值表测定次数nQ0.90Q0.95Q0.9