正态分布的概率密度分布图,越靠近分布函数的中部出现的概率越高
假设某一观测量的真实值为
X
~
{\displaystyle {\tilde {X}}}
,对其进行
n
{\displaystyle n}
次观测,可以得到由
n
{\displaystyle n}
个观测值组成的观测向量
X
=
[
X
1
X
2
⋯
X
n
]
T
{\displaystyle X={\begin{bmatrix}X_{1}&X_{2}&\cdots &X_{n}\end{bmatrix}}^{T}}
这些观测量的测量误差
Δ
{\displaystyle \Delta }
是其真实值与观测值之差:
Δ
=
X
~
−
X
{\displaystyle \Delta ={\tilde {X}}-X}
以概率论中的中心极限定理为依据,测量误差通常被视作是数学期望为
E
[
Δ
]
{\displaystyle \operatorname {E} [\Delta ]}
,标准差为
σ
{\displaystyle \sigma }
的随机变量,并且服从于相应的正态分布:
f
(
Δ
)
=
1
σ
2
π
e
−
(
Δ
−
E
[
Δ
]
)
2
2
σ
2
{\displaystyle f(\Delta )={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {(\Delta -\operatorname {E} [\Delta ])^{2}}{2\sigma ^{2}}}}}
基于这一假设,可以采用统计学的方法构造各类指标对测量误差的分布情况进行分析,以评价测量结果的准确度、精密度和正确度。又由于偶然误差和系统误差具有不同的统计特性,即偶然误差的数学期望为零,但系统误差不然。因此在进行测量结果的分析时,也常会将偶然误差与系统误差分别分析,即选用不同的精度指标来评价精密度和正确度。
偶然误差
编辑
偶然误差是指在大小和符号上表现出偶然性,但总体上符合一定统计规律的误差,其数学期望为零。精密度即是对偶然误差统计的描述。
方差与中误差
编辑
根据
E
[
Δ
]
=
0
{\displaystyle \operatorname {E} [\Delta ]=0}
的特性,可以得出偶然误差的中误差[註 1]为:
σ
=
E
[
Δ
2
]
−
E
[
Δ
]
2
=
E
[
Δ
2
]
{\displaystyle \sigma ={\sqrt {\operatorname {E} [\Delta ^{2}]-\operatorname {E} [\Delta ]^{2}}}={\sqrt {\operatorname {E} [\Delta ^{2}]}}}
其估计值由下列公式计算
σ
^
=
∑
i
=
1
n
Δ
2
n
{\displaystyle {\hat {\sigma }}={\sqrt {\frac {\sum _{i=1}^{n}\Delta ^{2}}{n}}}}
通过方差是中误差的平方的关系,亦可得到偶然误差的方差及其估计值。
极限误差
编辑
对于正态分布,误差分布于与平均值距离一倍及二倍、三倍中误差之间的概率分别为
{
Pr
(
−
σ
<
Δ
<
+
σ
)
=
68.3
%
Pr
(
−
2
σ
<
Δ
<
+
2
σ
)
=
95.5
%
Pr
(
−
3
σ
<
Δ
<
+
3
σ
)
=
99.7
%
{\displaystyle {\begin{cases}\operatorname {Pr} (-\sigma <\Delta <+\sigma )=68.3\%\\\operatorname {Pr} (-2\sigma <\Delta <+2\sigma )=95.5\%\\\operatorname {Pr} (-3\sigma <\Delta <+3\sigma )=99.7\%\end{cases}}}
在远离平均值时,误差出现的概率相当接近于零,可以在假设检验中将其排除,而选定的排除“该误差是偶然误差”这一假设的极限值即为极限误差。在测量学中,常以二倍或三倍中误差作为极限误差。
平均误差
编辑
平均误差即平均绝对误差,对于一定观测条件下的某组独立的偶然误差来说,是其绝对值的数学期望:[4][13][14]
θ
=
E
[
|
Δ
|
]
{\displaystyle \theta =\operatorname {E} [\left\vert \Delta \right\vert ]}
相应的估计值为
θ
^
=
1
n
∑
i
=
1
n
|
Δ
|
{\displaystyle {\hat {\theta }}={\frac {1}{n}}\sum _{i=1}^{n}\left\vert \Delta \right\vert }
根据正态分布的概率分布函数,可以得出平均误差
θ
{\displaystyle \theta }
与中误差
σ
{\displaystyle \sigma }
之间的数学关系:
θ
=
∫
−
∞
+
∞
|
Δ
|
f
(
Δ
)
d
Δ
=
∫
0
+
∞
2
Δ
f
(
Δ
)
d
Δ
=
2
π
σ
{\displaystyle \theta =\int _{-\infty }^{+\infty }\left\vert \Delta \right\vert f(\Delta )\operatorname {d} \!\Delta =\int _{0}^{+\infty }2\Delta f(\Delta )\operatorname {d} \!\Delta ={\sqrt {\frac {2}{\pi }}}\sigma }
即有
θ
≈
0.7979
σ
{\displaystyle \theta \approx 0.7979\sigma }
或然误差
编辑
或然误差(英语:Probable error)
ρ
{\displaystyle \rho }
是使区间
(
−
ρ
,
+
ρ
)
{\displaystyle (-\rho ,+\rho )}
内的累积概率分布为
1
/
2
{\displaystyle 1/2}
的值,即:[4][15]
∫
−
ρ
+
ρ
f
(
Δ
)
d
Δ
=
1
2
{\displaystyle \int _{-\rho }^{+\rho }f(\Delta )\operatorname {d} \!\Delta ={\frac {1}{2}}}
且可解得
ρ
≈
0.6745
σ
{\displaystyle \rho \approx 0.6745\sigma }
系统误差
编辑
观测量
X
{\displaystyle X}
中存在的系统误差是指观测量的真实值
X
~
{\displaystyle {\tilde {X}}}
与其数学期望
E
[
X
]
{\displaystyle \operatorname {E} [X]}
之间的差值:
ε
=
X
~
−
E
[
X
]
{\displaystyle \varepsilon ={\tilde {X}}-\operatorname {E} [X]}
均方误差
编辑
观测量
X
{\displaystyle X}
的均方误差
MSE
[
X
]
{\displaystyle \operatorname {MSE} [X]}
通过下列公式计算:[4][14]
MSE
[
X
]
=
E
[
(
X
−
X
~
)
2
]
{\displaystyle \operatorname {MSE} [X]=\operatorname {E} [(X-{\tilde {X}})^{2}]}
将其进行分解,可以得出以方差和系统误差的平方和表示的均方误差:
MSE
[
X
]
=
E
[
(
X
−
X
~
)
2
]
=
E
[
[
(
X
−
E
[
X
]
)
+
(
E
[
X
]
−
X
~
)
]
2
]
=
E
[
(
X
−
E
[
X
]
)
2
+
2
(
X
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
+
(
E
[
X
]
−
X
~
)
2
]
=
E
[
(
X
−
E
[
X
]
)
2
]
+
2
E
[
(
X
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
]
+
E
[
(
E
[
X
]
−
X
~
)
2
]
=
σ
X
2
+
2
(
E
[
X
]
−
E
[
X
]
)
(
E
[
X
]
−
X
~
)
+
ε
2
=
σ
X
2
+
ε
2
{\displaystyle {\begin{aligned}\operatorname {MSE} [X]&=\operatorname {E} [(X-{\tilde {X}})^{2}]\\[4pt]&=\operatorname {E} [[(X-\operatorname {E} [X])+(\operatorname {E} [X]-{\tilde {X}})]^{2}]\\[4pt]&=\operatorname {E} [(X-\operatorname {E} [X])^{2}+2(X-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})+(\operatorname {E} [X]-{\tilde {X}})^{2}]\\[4pt]&=\operatorname {E} [(X-\operatorname {E} [X])^{2}]+2\operatorname {E} [(X-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})]+\operatorname {E} [(\operatorname {E} [X]-{\tilde {X}})^{2}]\\[4pt]&=\sigma _{X}^{2}+2(\operatorname {E} [X]-\operatorname {E} [X])(\operatorname {E} [X]-{\tilde {X}})+\varepsilon ^{2}\\[4pt]&=\sigma _{X}^{2}+\varepsilon ^{2}\\[4pt]\end{aligned}}}
因此,均方误差被认为同时包含了对偶然误差和系统误差的定量描述,可以衡量测量学中的“精确度”。