
二、数据处理
合理的实验设计只是实验成功的充分条件,如果没有实验数据的分析计算,就不可能对所研究的问题有一个明确的认识,也不可能从实验数据中寻找到规律性的信息,所以实验设计都是与一定的数据处理方法相对应的。实验数据处理在科学实验中的作用主要体现为如下几点:
(1)通过误差分析,可以评判实验数据的可靠性;
(2)确定影响实验结果的因素主次,从而可以抓住主要矛盾,提高实验效率;
(3)确定实验因素与实验结果之间存在的近似函数关系,并能对实验结果进行预测和优化;
(4)获得实验因素对实验结果的影响规律,为控制实验提供思路;
(5)确定最优的实验方案或配方。
(一)误差分析
1.误差来源
实验过程中,误差是不可避免的。引起误差的原因很多,主要有以下几种。
(1)模型误差 数学模型只是对实际问题的一种近似描述,因而它与实际问题之间必然存在误差。
(2)实验误差 数学模型中总包含一些变量,它们的值往往是由实验观测得到的。实验观测是不可能绝对准确的,由此产生的误差为实验误差。
(3)截断误差 一般数学问题常常难以求出精确解,需要简化为较易求解的问题,以简化问题的解作为原问题的近似解,这样由于简化问题所引起的误差称为方法误差或截断误差。
(4)舍入误差 在计算过程中往往要对数字进行舍入,无穷小数和位数很多的数必须舍入成一定的位数,由此产生的误差称为舍入误差。
2.误差的分类
实验误差根据其性质和来源不同,可分为三类:系统误差、随机误差和过失误差。
(1)系统误差是由仪器误差、方法误差和环境误差构成的误差,即仪器性能欠佳、使用不当、操作不规范,以及环境条件的变化引起的误差。系统误差是实验中潜在的弊端,若已知其来源,应设法消除。若无法在实验中消除,则应事先测出其数值的大小和规律,以便在数据处理时加以修正。
(2)随机误差是实验中普遍存在的误差,这种误差从统计学的角度看,具有有界性、对称性和抵偿性,即误差仅在一定范围内波动,不会发散,当实验次数足够大时,正、负误差将相互抵消,数据的算术平均值将趋于真值。因此,不易也不必去刻意地消除它。
(3)过失误差是由于实验者的操作失误造成的显著误差。这种误差通常造成实验结果的扭曲。在原因清楚的情况下,应及时消除。若原因不明,应根据统计学的准则进行判别和取舍。
3.误差的表达
在误差表达中所涉及的几个概念是数据的真值、绝对误差、相对误差、算术均差和标准误差。
(1)数据的真值 实验测量值的误差是相对于数据的真值而言的。严格地讲,真值应是某量的客观实际值。然而,在通常情况下,绝对的真值是未知的,只能用相对的真值来近似。在化工专业实验中,常采用三种相对真值,即标准真值、统计真值和引用真值。
①标准真值就是用高精度仪表测量值的平均值作为真值。要求高精度仪表的测量精度必须是低精度仪表的5 倍以上。
②统计真值就是用多次重复实验测量的平均值作为真值。重复实验次数越多,统计真值越趋近于实际真值,由于趋近速度是先快后慢,故重复实验的次数取3~5。
③引用真值就是引用文献或手册上那些已被前人的实验证实,并得到公认的数据作为真值。
(2)绝对误差与相对误差 绝对误差与相对误差在数据处理中被用来表示物理量的某次测定值与其真值之间的误差。
绝对误差的表达式为
相对误差的表达式为
式中,xi为第i次测定值;X为真值。
(3)算术均差和标准误差 算术均差和标准误差在数据处理中被用来表示一组测量值的平均误差。其中,算术均差的表达式为
式中,n为测量次数;xi为第i次测定值;为n次测得值的算术均值。
算术均差和标准误差是实验研究中常用的精度表示方法,其中因为标准误差对一组数据中的较大误差或较小误差比较敏感,能够更好地反映实验数据的离散程度,因而在化工专业实验中被广泛采用。
(二)误差的传递
在实际过程中,被测物理量不能直接测定,需要通过间接测定得到。一般先对精密度较高而又容易测定的物理量进行直接测定,然后借助已知函数进行推算。
(1)误差传递的基本关系式 若y是直接测定量x的函数,即y=f(x1,x2,…,xn),由于误差相对于测定量而言是较小的量,因此可将上式按照泰勒级数展开,略去二阶导数以上的项,可得函数y的绝对误差Δy的表达式:
式中,Δxi为直接测量值的绝对误差;为误差传递系数。
(2)函数误差传递的关系式 函数误差Δy不仅与各测量值的误差Δxi有关,而且与相应的误差传递系数有关。不考虑各测量值误差实际上相互抵消的可能性,函数的最大绝对误差和相对误差为
根据误差传递的基本公式,求取不同函数形式的误差及其精度,以对实验结果做出正确的判断。
(三)数值计算中应注意的问题
在实验数据处理和模型计算过程中,需要注意以下问题。
(1)在数据处理过程中的四舍五入问题:
①大于5时进1;
②小于5时舍去;
③等于5时,双数舍去,单数进1。
(2)由于误差的影响,计算过程中可能出现一些现象,需要避免如下几点:
①避免两个相近的数相减;
②避免大数“吃”小数的现象;
③避免除数的绝对值远小于被除数的绝对值;
④简化计算,减少运算次数,提高效率;
⑤选用数值稳定性好的算法。