中国矿业大学2015级硕士研究生课程考试题目误差理论与数据处理学生姓名陈明学号TS15060128A3所在院系信息与电气工程学院任课教师唐守锋中国矿业大学研究生院培养管理处印制成绩误差理论与数据处理I目录1前言.............................................................................12测量不确定度.....................................................................32.1不确定度的基本概念..........................................................32.2测量不确定度的评定方法......................................................52.2.1标准不确定度的评定....................................................52.2.2合成标准不确定度的评定................................................72.2.3扩展标准不确定度的评定................................................72.3测量不确定度与测量误差的异同................................................83模糊数与不确定度.................................................................93.1模糊数......................................................................93.2空间数据的不确定性..........................................................93.3模糊数与不确定度...........................................................104余弦模糊数的极大可能性估计......................................................114.1极大可能性估计.............................................................114.2余弦模糊数的极大可能性估计.................................................125最小不确定度估计................................................................126总结............................................................................15参考文献..........................................................................16误差理论与数据处理11前言由于测量误差的客观存在,误差理论与数据处理一直在科学实验和生产实践中占有及其重要的地位。尤其在测绘领域,参数估计理论与方法一直是测量数据处理中最重要的基础研究方向之一。长期以来,这一重要研究领域的研究成果不计其数[1]。例如:极大似然估计、最小二乘估计、极大验后估计、贝叶斯估计、稳健估计、最小二乘配置、最小二乘滤波、非线性最小二乘估计、半参数估计等等。迄今为止的这些参数估计理论与方法,无一不是以概率论为其理论基础的,我们知道,概率论是用来处理“随机变量”的。在测量数据处理中,人们为了应用现有的参数估计理论总是把测量误差理想化,假定测量误差是随机变量。事实上,由于种种原因,测量数据的不确定性并非由随机误差组成,而是多种不确定因素的综合。例如GPS数据的不确定性除随机误差外,更主要的是多路径效应、电离层的影响等。随机变量是指在试验中可出现可不出现,在实验前不能确定的量[2]。在测量过程中,由于观测设备受分辨率的限制、操作者受生理方面的限制以及实际观测环境总与标准状态不一致等,必然导致测量不确定性的存在,即测量数据的不确定性在任何一次测量中是一定会出现的,它出现与否在测量前就是确知的。因此,测量数据的不确定性不完全满足“随机变量”的定义。因为测量数据的不确定性不完全满足概率论中的“随机变量”这一基本假设,所以使用目前的任何一种参数估计方法来处理测量数据都是不严密的,致使目前测量数据处理中的“最优性”也是虚假的。当然这一点早已被测量学家所公认。因此,在实际的测量数据处理中,人们总是根据实际情况对现有参数估计模型进行修正。例如,为了同时考虑系统误差的影响,提出了附有系统参数的估计模型;为了抵抗粗差的影响,提出了稳健估计模型等等。由于测量数据的不确定性是各种因素的综合,既包含随机性又包含模糊性。如此修修补补,必然顾此失彼,根本不能全面的处理测量数据的不确定性。另外,由于测量数据的不确定性不仅仅表现为随机性不确定性也表现为模糊性不确定性[3]。比如,对于遥感影像数据的分类,由于很多地理概念本身就存在模糊性,因而分类一定会产生模糊不确定性。而现有的测量数据质量评价体系也是以概率论为理论基础的方差体系,即用方差来衡量测量数据的质量。因为方差是描述随机误差的,而随机误差理论与数据处理2误差只是不确定性中极小的一部分,方差很小只能说明随机误差很小,方差并不能描述模糊不确定性的大小,因此方差很小并不代表测量数据的不确定性很小,也就不能说明测量数据的质量很高。即使只考虑随机误差,由于实际的测量数据并不一定服从正态分布,且服从什么分布并不知道,一律采用方差来作为衡量测量数据质量的标准也是不完全合理的,因为有的分布根本就不存在方差。其次,尽管目前国际上已广泛采用不确定度来评定测量结果的质量。但从目前不确定度的评定方法我们可以看到,其A类或B类评定不确定度的方法仍然都是基于某种概率分布,用方差或标准差进行定量的表达。计量部门定义的A类标准不确定度的大小是我们测量平差中导出的算术平均值的中误差的绝对值。A类标准不确定度越小,即误差越小,只能说明随机误差很小,还是不能代表测量数据的不确定性很小。由此可见,目前用A类或B类评定方法来进行不确定度的评定也有其不足之处[4]。综上所述,要全面的处理测量数据的不确定性,并准确评价测量数据的质量,有必要研究一种全新的参数估计理论,并建立相应的测量数据质量评价体系。这一全新的参数估计理论与相应的测量数据质量评价体系必须突破传统的“观测值的不确定性就是随机性”这一基本假设,能直接处理测量数据的不确定性。本文就旨在提出一种这样的参数估计理论——最小不确定度估计理论,它是以不确定度理论和模糊数理论为其理论基础,将观测值看作模糊数,以模糊数为研究对象,并用模糊幅度代替A类评定或B类评定来衡量不确定度,从与传统的参数估计思路完全不同的角度研究测量数据处理理论与方法。“不确定度”一词起源于1927年德国物理学家海森堡(Heisenbegr)在量子学领域中提出的测不准关系,也称为不确定度关系(uncertaintyrelation)。不确定度作为测量结果质量评价的合理性首先在于不确定度的表达是统一的并被广泛接受的,它有利于国际上实验室之间测量结果的相互比较和相互承认,从而为消除国际贸易中的技术壁垒提供了可能性[5]。其次,由于测量资源的不完善以及测量手段的有限性等因素使得测量误差总是客观存在,使得测量结果总是在一定范围波动。目前国际上都倾向于用测量不确定度表征测量结果的变化范围。不确定度是一个合理表征测量结果的分散性参数,它是一个容易定量、便于操作的质量指标。测量结果的可用性在很大程度上取决于其不确定度的大小。因此,在给出测量结果时,只有附加不确定度的说明才是完整和有意义的。不确定度越小,说明测量结果质量越高,使用越可靠。本文用不确定度来衡量测量结果的质量比现有的参数估计方法用方差或中误差来衡量测量结果的质量更合理,与目前评定不误差理论与数据处理3确定度方法不同,本文不是用A类评定或B类评定来评定不确定度,而是创新性地提出用模糊幅度来衡量不确定度。2测量不确定度2.1不确定度的基本概念测量不确定度(uncertaintyofmeasurement)是与测量结果相关联的参数,用于表征合理地赋予被测量值的分散性[6]。它意味着对测量结果的正确性或准确度的可疑程度,是用于表达测量结果的质量优劣的一个指标。即使不确定度的数字很大,测量结果也有可能接近于被测量真值,即不确定度不表示余下的误差,而只表示对被测量真值认识不足的程度。不确定度是与测量结果紧密相联的,离开了“测量”这个过程,测量不确定度是不存在的。一个完整的测量结果一般应包括对被测量的最佳估计及其分散性参数两部分。分散性参数即为测量不确定度,它应包括所有的不确定度分量。即除了不可避免的随机影响对测量结果的贡献外,还应包括由系统效应引起的分量,诸如一些与修正值和参考测量标准有关的分量,它们对分散性均有贡献。测量结果是测量的要素之一,而其它测量要素,如测量对象、测量资源、测量环境等均会在测量过程对测量结果产生不同程度的影响。测量不确定度,即表示测量结果受诸多不确定因素的影响,这些因素直接或间接影响了测量结果的准确性。因此,找出这些影响测量结果的不确定因素对评价测量结果的准确性有着实际的意义。所有对测量结果产生影响的因素,均是测量不确定度的来源。它们可能来自于以下几个方面[7]:(1)对被测量的定义不完整或不完善。如定义被测量是一根标称值为lm的钢棒的长度。如果要求测准至产m量级,则被测量的定义就不完整。由于定义的不完整会使得测量结果中引入温度和大气压力影响测长的不确定度。如果定义被测量是标称值为lm的钢棒在25.0℃和101325Pa时的长度,则为完整定义,就可避免由此引起的测量不确定度。(2)复现被测量定义的方法不理想;如对上例所述的完整定义进行测量,由于温度和压力实际上达不到定义的要求(包括温度和压力的测量本身存在不确定度),则使得测量结果仍然引入不确定度。(3)测量所取样本的代表性不够,即被测量的样本不能完全代表所定义的被测量;误差理论与数据处理4如被测量为某种介质材料在给定频率时的相对介电常数。由于测量方法和测量设备的限制,只能取这种材料的一部分做成样块进行测量,如果该样块在材料的成分或均匀性方面不能完全代表定义的被测量,则该样块就引入测量不确定度。(4)对测量过程受环境影响的认识不周全,或对环境条件的测量与控制不完善;同样以上述钢棒测量为例,不仅温度和压力会影响其长度,实际上,湿度和钢棒的支撑方式也会产生影响。由于认识不足,没有注意采取措施,也会引入测量不确定度。另外,测量温度、压力的温度计、压力表的不确定度也是测量不确定度的来源之一。(5)对模拟式仪器的读数存在人为偏差;(6)仪器计量性能上的局限性;(7)赋予测量标准和标准物质的标准值不准确;(8)引入常数或其他参量的不准确;(9)与测量原理、测量方法和测量程序有关的近似性或假设性;(10)在相同的测量条件下,被测量重复观测值的随机变化;这是在测量中不可避免的一种综合因素造成的随机影响,它必然也贡献于测量结果的不确定度。对一定系统误差的修正不完善;(12)测量列中的粗大误差因不明显而未被剔除;(13)在有的情况下,需要对某种测量条件变化,或者在一个较长的规定时间内,对测量结果的变化作出评定。此时,也应把该相应变化所赋予测量值的分散性大小,作为该测量结果的不确定度。以上的各种不确定度来源可以分别归为设备、方法、环境、人员等带来的不确定因素,以及各种随机影响和修正各种系统影响的不完善,特别还包括被测量定义、复现和抽样的随机性等等。总的说来