1、毕业设计(论文) 附录 1 中文翻译 实验误差与数据分析 by J.C. de Paula 1、随机误差和系统误差 每个实验的结果都是存在误差的,我们可以尝试用最小误差但是却不能完全消除误差,实验误差可以分为两大类:随机误差和系统误差。 随机误差是由于被测物理量的自然属性所引起的。例如,重复测量同一物理量会出现不同的结果,即使在同一个经过校对正常运行的仪器下进行测量,这种变化决定着测量的精度。精度同时也涉及重复性。 系统误差是由于测量过程中出现一些错误所引起的。例如,不正常运行的仪器就会产生系统误差,测量不准确度,用坏的仪器重复测量会出现重复性问题(高精度),但是每个测量量值却偏离真实值(低准
2、确度)。因此,准确度和精密度之间并没有关系。 2。数据分析的统计 常态分布。我们只要关注精密度,测量结果都会产生随机误差,不管准确度是多少。我们看如下 数据,通过用同一仪器测量金属条的质量 24 次得到的不同结果。 对金属棒多次测量数据 (克 ) 8.150 8.145 8.148 8.145 8.155 8.155 8.156 8.152 8.142 8.143 8.144 8.148 8.150 8.153 8.152 8.150 8.140 8.149 8.146 8.146 毕业设计(论文) 8.148 8.145 8.148 8.150 通过数据直方图,我们可以想象这种测量的重复性,
3、说明测量值在这个集合中出现的频率。这个实验的直方图如下图所示。 由图可知,最常出现的测量值是 8.148( 4 次),偏离 8.148 过多或过少的测量值很少。如果我们多次测量金属条的质量,我们将会得到一个形状如铃铛的直方图,如下图所示。 这个钟形曲线表示测量多次质量的正态概率分布,正态分布曲线有两个参数。即平均值 x 和标准差 1Niixx N ( 1) 211Niixxs N ( 2) 对于多次测量来说,平均值是最有可能的值,如上图所示,标准差是测量曲线的宽度:标准差大,分布更大。也就是说,测量精度越低,分布越宽,标准差值也就越大。 标准差的意义如下:有 68.30%的测量值 ix 介于
4、x 和 x 之间。也就是说,测量值中有 68.30%都在平均值的标准差内。举例说明,如果 x =1.848g, s=0.004g, 24 次测量金属条的质量结果中有 16 次的测量值会介于 1,844g 1,852g 之间。参照上面描绘的正态分布,两虚线之间钟形曲线的区域占整个区域的 68.30%。 人们对这个概率可能不会有深刻的印象。我们可以有不同的看法,但是,结果表明,在正态分布中,有 95.5%的测量值会在平均值 1.884g的 2 =0.008g 范围内。你相信,再一次测量金属条的结果又 95.5%的可能性落入 1.848 0.008g 的范围内。这个概率 决定你的实验的置信区间。你将
5、公诉读者,如果重新测量金属条的质量结果不在毕业设计(论文) 1.840-1.856g 的范围内,人们有权怀疑测量结果的真实性。 到目前为止 ,我们已经处理了基于整个正态分布曲线的标准差的单个测量结果的精密度。平均值 x 的精密度(不确定度)是多少?标准偏差值由下式给出: x ss N( 3) 概率为 95.5%的置信区间,平均值在 2xx 的范围内。我们接着看我们的例子。如果 x =1.848g, 2x=0.001g,平均值在 1.848 0.001g的范围内,也就是说,如果 20 名学生各自测量同一金属条的质量 24次, 20 个测量平均值中有 19 个测量平均值介于 1.847 1.849
6、 之间。 处理数据集。 在现实生活中,一个集合中很少有如此多的测量值,所有测量值的分布概率呈钟形曲线。有可能你的测量值很少有如此多的测 量值,所有测量值的分布概率呈钟形曲线,有可能你的测量值不具有钟形曲线的特性,在这种情况下,我们首先应该通过式 (1),(2)计算平均值和标准差,接着计算置信区间 ,置信区间 决定平均值两边界的范围,在给定的置信区间内可以查出真实值 tsN (4) t 值是置信水平值,注意式( 3)比式( 4)少一个 t 变量,如下是一个简明的 t 值表 N t (90%) t (95%) t (99%) 2 6.31 12.7 63.7 3 2.92 4.30 9.92 4 2.35 3.18 5.48 5 2.13 2.78 4.60 6 2.01 2.57 4.03 7 1.94 2.45 3.71