您的位置 首页 数据分析

计算误差线时的一个小问题-误差传播

在科研论文中展示数据时,图表中都要包含误差线(上图)。 误差线用标准差(standard deviation),也可以用标准误差(standard error of the mean),在图表的图注中加上bar代表的是 S.D.(标准差)或S.E.(标准误差)即可。在大家分析数据时不知道读者朋友是否遇到过这个小问题。做实验时,我们通常要平行做三次实验,获得数据后,能够很容易地利用Excel计算标准差,也就是获得了误差线。然而当我们想展示的数据并非原始所得数据,而是经过计算后的数据时呢,误差线应该如何计算呢?
举个例子,研究酶的热稳定性时,通常需要计算一个参数,叫作残留活性(residual activity)。计算残留活性,需要首先测定酶的初始活性,而后将酶置于高温一段时间后,再次测定其活性。残留活性就是加热后酶的活性与加热前酶活性的比值,其单位是%。酶的初始活性和加热后的活性都可以通过原始数据计算获得平均值以及误差。但是残留活性的误差应该如何计算呢?初始活性的计算过程中存在误差,加热后酶活性的计算也会存在误差,计算残留活性时应该如何考虑呢?

误差传播

其实上面提到的问题是有专门的解释的。这里介绍误差传播的概念, 在统计学上上,由于变量含有误差,而使函数受其影响也含有误差,称之为误差传播[1]。其数学解释如下:
设有这样一个函数

Z=f(x_{1},x_{2},\dots ,x_{n})

式中{\displaystyle x_{1},x_{2},\dots ,x_{n}} 为可直接观测的相互独立的未知量,z为不便于直接观测的未知量。已知{\displaystyle x_{1},x_{2},\dots ,x_{n}} 的标准差分别为{\displaystyle m_{1},m_{2},\dots ,m_{n}} ,现在要求z的标准差{\displaystyle m_{z}}
 
如果用上面的表述阐释上文提到的例子,就是这样的。
有函数:X=u/v。X为残留活性,u为酶加热后活性,v为初始活性。 现在已知u和v的标准差,如何计算X的标准差的?

误差传播公式

 
下面我们就介绍一下所谓的误差传播公式。统计学中标准差用 σ表示。对于上文提到的问题, σX的计算公式如下:

 

 
上面公式中`u以及 `v分别表示的是二者的平均值,也就是实验中三次实验数据的平均值。从上面的公式可以看出,X的标准差综合考虑了其变量的标准差,也就是说如果两个变量的误差大,那么函数的误差会更大。
除法运算的误差传播公式就是上面的了。那么加法,减法,乘法以及幂的运算呢?请读者往下看啦。
加减运法

乘法运算
有限次幂的运算

Reference:

作者: 于浩然

本科及硕士毕业于天津大学,博士毕业于伦敦大学学院。现就职于浙江大学化学工程与生物工程学院,PI,博导。研究方向为蛋白质工程、生物催化剂、合成生物学等。



发表评论

您的电子邮箱地址不会被公开。

评论列表(2)

  1. 为什么不是取三次比值的标准差,而是用均值的比值和误差传播来计算呢?

    1. 这样应该也可以。但是并不是三次的比值。如果分子有三个检测值,分母有三个检测值,这样应该有9次比值。

联系我们

联系我们

(44)07934433023

在线咨询: QQ交谈

邮箱: info@bioengx.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部
Designed by

best down free | web phu nu so | toc dep 2017