第十七章 误差理论与实验数据处理
在科学实验和生产实际中,为了掌握事物发展的规律性,总是通过各种方法对我们所需要的量观测记录下许多数据,但是由于外界的随机干扰,这些数据实际上是带有随机误差的近似数据,对这些近似数据必须根据需要进行合适的处理。一方面必须估计观测数据的可靠程度,并给以合理的解释;另一方面,还必须将所得数据加以整理归纳,用一定的方式表示出各数值之间的相互关系,或者对带有误差(噪声)的数据(信号)进行分析处理,把干扰“过滤”掉,得出真正需要的量。前者需要误差理论的基础知识(如高斯误差定律、各种平均值的计算法、误差的表示法、误差传递定律和近似计算法则等),后者则需要处理数据的基本技术(如插值法、曲线拟合的方法、实验曲线的光滑法和滤波方法等)。本章介绍了这些方法的主要内容。
§1 误 差 理 论
一、观测误差
[真值与误差] 观测对象的量是客观存在的,称为真值。每次观测所得数值称为观测值。设观测对象的真值为,
观测值为(),则差数
()
称为观测误差,简称为误差。
[误差的分类与鉴别]
分类 |
误差的原因 |
误差的鉴别 |
系 统 误 差 |
(i)仪器结构的不良 (ii) 周围环境的改变 |
(i) 观测值总往一个方向偏差 (ii) 误差的大小和符号在重复多次观
测中几乎相同 (iii) 经过校正和处理可以消除误差 |
随 机 误 差 |
某些难以控制的偶然因素造成的 |
观测值变化无常,但在等精度观测下有如下规律(即随机误差服从正态分布,参考本节,四): (i) 误差绝对值不会超过一定界限 (ii) 绝对值小的误差比绝对值大的误差出现的个数要多,近于零的误差出现的个数最多 (iii) 绝对值相等的正误差与负误差出现的个数几乎相等 (iv) 误差的算术平均值,随着观测次数的增加而趋近于零 |
过 失 误 差 |
粗枝大叶造成的观测误差或计算误差 |
(i) 观测结果与事实不符 (ii)认真操作可以消除误差 |
[观测的准确度与精确度] 如果观测的系统误差小,则称观测的准确度高,可以使用更精确的仪器来提高观测的准确度。如果观测的随机误差小,则称观测的精密度高,可以增加观测次数取其平均值来提高观测的精密度。
本章所指的误差都是随机误差。
二、平均值及其精密度指标
[常用平均值的求法] 设是某观测对象的一组观测数据。
名称 |
定义与符号 |
用途与说明 |
算 术 平 均 值 |
|
它在最小二乘法意义下是所求真值的最佳近似,是最常用的一种平均值 |
简 算 平 均 值 |
设,则 式中是组数, A是常数, c是组距,是第i组的频数,且
是第i组的组中值(即该组上下限的平均值) |
数据较多时,算术平均值常用此法计算 组数和组距根据数据的极差 适当选取 采取等组距c 变换中的A常取为处在中间组的组中值 |
几 何 平 均 值 |
或 |
当对一组观测值取常用对数所得图形的分布曲线更为对称(同比较)时,常用此法 |
加 权 平 均 值 |
式中是第i个观测值的对应权 |
计算用不同方法或不同条件观测同一物理量的均值时,常对不同可靠程度的数据给予不同的“权” |
中 位 数 |
观测值依大小顺序排列后处在中间位置的值。当n为偶数时,取为中间两数的算术平均 |
它是一种顺序统计量,能反映匀称观测值的取值中心 |
[算术平均值与离差] 观测对象的真值x可以用n次观测值的算术平均值.
近似代替,并用离差
代替误差。离差与误差有如下关系
(当n相当大)
[平均值的精密度指标]
|
相同精密度的观测 |
不同精密度的观测 |
观测值 权 平均值 标准差 真值x对算术平均值的误差 |
1 算术平均值 |
加权平均值 |
的值愈小,表明观测值的平均值(或)与真值x的偏差愈小,精密度愈高,即平均值可信赖的程度愈高。
三、误差的表示法
设是某观测对象的一组观测数据。其算术平均值
误差,离差,真值对平均值的误差。
名称与记号 |
定义与表示法 |
特 点 |
[标准误差] (中误差或均方误差) |
各个误差平方和的平均值的平方根,即 当观测次数较大时 显然 |
不取决于观测中个别误差的符号,对观测值中的较大误差或较小误差感觉比较灵敏,是表示精密度的较好方法 |
[平均误差] |
离差的绝对值的算术平均值 |
优点是计算简单,缺点是无法表示出各次观测间彼此符合的情况。例如一组观测中偏差彼此接近,而另一组观测中偏差有大中小三种。但在这两组不同的观测中所得平均误差可能相同。所以只有当n很大时才较可靠 |
[概率误差] |
它是这样一个数,绝对值比它大的误差和绝对值比它小的误差出现的可能性一样大,即 |
将误差按绝对值的大小顺序排列后,序列的中位数就是概率误差。 按排列方式来求概率误差,在工作上比较困难,同时只有当n的值很大时才较可靠。 |
[标准误差、平均误差、概率误差三者关系]
四、高斯误差定律
[高斯误差方程] 随机误差的分布密度函数为正态分布密度函数
它称为高斯误差方程,其图形称为误差曲线
(图17.1),式中
(是标准误差)
称为精密度指数。
误差曲线是一条连续曲线,当时,
递降趋于零。
根据实际情况选取的一个值作为界限,x超过这个界限的值非常小,被认为等于零。就被认为是正负误差的极大值,而一般误差值就是介于与之间的任何值,它们的概率就是这个区间上的值。
绝对值相等的正负误差,出现的概率相等。
绝对值小的误差比绝对值大的误差,概率较大。
[误差概率表及其用途] 令表示误差,表示标准误差,对于不同的t,概率的取值如下表。
误 差 概 率 表
误差限 |
|
|
|
|
概率 |
0.00 |
25% |
|
|
误差限 |
|
|
|
|
概率 |
|
|
|
|
主要用途
(1) 决定某一给定误差介于某一范围内的概率的大小,从而判断误差属于系统误差随机误差。例如当误差的绝对值大于时(其可能性只有),则不能相信是随机误差。
(2) 用各种不同方法去观测同一物理量时,判断所得结果彼此是否符合。
五、误差与有效数字
[绝对误差与相对误差] x为观测对象的真值,其近似值为。
误差名称 |
定义和计算公式 |
绝对误差 最大绝对误差 相对误差 最大相对误差 |
使不等式成立的最小的量 使不等式成立的最小的量 |
[误差传递的一般公式]
设表示m个自变量的函数,若自变量的最大绝对误差分别为,则函数y的最大绝对误差和最大相对误差分别为
近似值的简单运算的误差估计
(p为任意实数)
设看成随机变量的函数,并用和分别表示的标准误差和概率误差,则其误差传递公式为
[有效数字与可疑数字]
任何一个近似值都可用十进小数表示成
式中都是正整数,m为近似值的整数部分的位数,或表示成
如果近似值的最大绝对误差不超过左起第k位(从左边第一个非零数字算起)的半个单位,即
则称为有效数字。特别,当k=n时,称为具有n位有效数字的近似值。
如果近似值的最大绝对误差不超过左起第k位的一个单位,即
则称为可靠数字。特别,当k=n时,称为具有n位可靠数字的近似值。
由此看出,有效数字比可靠数字精确。一般都采用有效数字的概念。
如果近似值有k位有效数字(或可靠数字),则左起第k位数字称为可疑数字。
[记数法则]
记录观测数据时,只保留一位可疑数字。
除另有规定外,可疑数字表示末位上有个单位(或个单位)的误差。
表示精确度时,大多数情况下只取一位有效数字,最多取两位有效数字。
在数据计算中,当有效数字的位数确定之后,其余数字应一律舍去(按四舍五入法):
(i) 被舍去的第一位小于或等于4。
(ii) 被舍去的第一位大于5,或被舍去的第一位等于5且第二位大于零,则被保留的末位上增加1。
(iii) 被舍去的第一位等于5且第二位等于零,则有两种情况∶被保留的末位是奇数时应增加1;被保留的末位是偶数时不变。
[近似计算法则]
不超过十个近似值相加减时,要把小数位数较多的数四舍五入,使比小数位数最位的数多一位小数;计算结果保留的小数位数要与原近似值中小数位数最少者相同。
近似值相乘除时,各因子保留的位数应比有效数字位数最少者的位数大1,所得积(或商)的可靠数字的位数与原近似值中有效数字位数最少者的位数相等。
近似值乘方或开方时,原近似值有几位有效数字,计算结果就可以保留几位数字。
所取对数的位数应与真数有效数字的位数相等。
注意,
在进行计算的过程中,中间结果应比上述各法则所指示的位数多取一位;但在进入最后一次计算时,这一位“后备数字”仍要舍入。
两个相差不多的数相减或用近似于零的数作除数,常常是使计 算结果产生较大相对误差的原因。所以如有可能,应把计算程序组织好,尽量避免它。比如,一元二次方程的两个根是
当b>0,且时,用上式求会得到错误的结果。应将的公式变形,改用公式
进行计算。
[预定精确度的计位法则]
如果计算结果是由加减法求得的,那末原始数据的小数位数应比结果所要求的多一位。
如果计算结果是由乘、除、乘方、开方求得的,那末原始数据的有效数字位数应比结果所要求的数字位数多一位。
四个或四个以上的近似值的算术平均值的有效数字的位数可增加一位。