传统统计方法与机器学习在预测中的应用及对传统测量数据的处理

最编程 2024-02-01 09:46:39

...

1、测量误差与测量结果的不确定度

①测量误差的定义

首先，需要明确测量误差的定义。当我们进行测量时，由于理论的近似性、实验仪器的局限性等，测量结果总不可能绝对准确。待测物理量的真值同我们的测量值之间总会存在某种差异。我们将测量误差定义为

测量误差=测量值-真值

②测量误差的分类

其次，按照习惯的分类方法，根据误差的性质，误差又分为系统误差和随机误差。

③系统误差

我们在这里讨论系统误差。系统误差指的是在相同条件下，多次测量同一物理量时，测量值对真值的偏离总是相同的误差。其造成原因大概分为三类：

（1）、实验理论、计算公式的局限性（例：测量单摆周期中使用在摆角趋于0的情况下的周期公式）

（2）、仪器的使用问题

（3）、测量者的生理心理因素的影响

（4）、未定系统误差（例如仪器的允差）

④随机误差

与系统误差相对应，随机误差是由于偶然的、不确定的因素造成每一次测量值的无规律的涨落，这类误差我们称作随机误差。

随机误差的特点在于它的随机性。即如果在相同宏观条件下，对某一物理量进行多次测量，每次的测量结果都不相同。但当测量次数足够多时，我们一般认为大多数的随机误差近似符合正态分布。

不妨记随机误差为连续型随机变量x，其概率密度函数为。由“概率论”中对于随机变量的数字特征的定义

数学期望

方差

正态分布的概率密度函数（1.1）

正态分布的函数图形如图1所示。

对于标准正态分布，其期望为0，标准差为。

我们可以发现（1.1）式的

，

我们用符号e表示误差绝对值可能的最大取值，x落入区间[-3,3]以外的可能性很小，所以一般称e=3为极限误差。

除了正态分布外，我们还经常会将误差分布近似看做均匀分布，这时。

⑤对于误差的处理

一般来讲，误差是不可避免的、不可消除的。但是改进实验方案和实验操作可以减小系统误差，进行多次测量可以减小随机误差。下面我们举一个例子：在物理实验中，经常会用到鼓轮式尺（比如在测量显微镜和声速测定仪中），而由于仪器的问题，不可避免有主尺和副尺零点不重合的问题。此时若是将全部读数都向上或向下进位都会造成巨大的系统误差，这就需要实验操作者在进行每次读数时都思考如何读数。【附加如何读数的问题】

⑥不确定度的定义

为了表达含有误差的实验结果，我们一般将实验结果写成（1.2）

（1.2）式中，Y是待测物理量，N为该物理量的测量值（既可以是单次测量值，亦可以是相同实验条件下的多次测量值），是一个恒正的量，称为“不确定度”。

（1.2）的含义是。它表示待测物理量的真值有一定概率在上述范围内。这里所说的“一定概率”一般被称做“置信概率”，而则被称作“置信区间”。当置信概率=1时，就被称作极限误差，即前文提到的e。

也有时被写成c的形式，此时（1.2）式应写为

系数c被称作置信系数。对于一定的概率分布，置信系数与置信概率成一一对应的关系。

⑦不确定度的估计（有些地方限于能力省略解释）

（1）直接测量，且只测量一次的不确定度：

这时一般取仪器的允差。

（2）直接测量，且相同条件下多次测量的不确定度

根据前文的误差理论，我们一般认为实验结果的算术平均值为多次测量的最佳值，记为。那么我们可以根据贝塞尔公式近似地认为，每个实验数据的标准差（这里只是一个近似处理）

所以各组实验数据的

二、测量结果的书写规则

①数值的书写规则

测量结果的有效数字位数由不确定度来确定．由于不确定度本身只是一个估计值，一般情况下，不确定度的有效数字位数只取一到两位．测量值的末位须与不确定度的末位取齐．在初学阶段，可以认为有效数字只有最后一位是不确定的．相应地，不确定度也只取一位有效数字，例如 L =（1.00 ±0.02 ）cm．一次直接测量结果的有效数字，由仪器极限误差或估计的不确定度来确定．多次直接测量算术平均值的有效数字，由计算得到平均值的不确定度来确定．间接测量结果的有效数字，也是先算出结果的不确定度，再由不确定度来确定．

当数值很大或很小时，用科学计数法来表示。

②有效数字的运算规则

在有效数字运算过程中，为了不致因运算而引进“误差”或损失有效位数，影响测量

结果的精度，统一规定有效数字的近似运算规则如下：

（1 ）诸量相加（或相减）时，其和（或差）数在小数点后所应保留的位数与诸数中小数点后位数最少的一个相同；

（2 ）诸量相乘（或除）后保留的有效数字，只须与诸因子中有效数字最少的一个相同．

（3 ）乘方与开方的有效数字与其底的有效数字位数相同．

（4 ）一般来说，函数运算的位数应根据误差分析来确定．在物理实验中，为了简便和统一起见，对常用的对数函数、指数函数和三角函数作如下规定：对数函数运算后的尾数取得与真数的位数相同；指数函数运算后的有效数字的位数可与指数的小数点后的位数相同（包括紧接小数点后的零）；三角函数的取位随弧度的有效数字而定；

（5 ）在运算过程中，我们可能碰到一种特定的数，它们叫作正确数．例如将半径化为直径d = 2r 时出现的倍数2 ，它不是由测量得来的．还有实验测量次数 n，它总是正整数，没有可疑部分．正确数不适用有效数字的运算规则，只须由其他测量值的有效数字的多少来决定运算结果的有效数字；

（6 ）在运算过程中，我们还可能碰到一些常数, 如π、g 之类，一般我们取这些常数与测量的有效数字的位数相同，例如：圆周长 l ＝2πR，当 R＝2.356 mm时，此时π应取3.142．

上一篇：理解PID算法：原理、调整方法与代码实现

下一篇：理解测量：一些相关术语简介