19.8.2 计算机计算中的数值问题

19.8.2.1 引言、误差类型

计算机计算的一般性质与手工计算基本相同, 然而某些方面需要特别注意, 因为精度来自数的表示和关于计算机误差的判断. 更进一步, 计算机要比人类手工能做的实施多得多的计算步骤.

因此, 存在如何影响和控制误差的问题, 例如在数学上等价的方法中选用最适当的数值方法.

在后面的讨论中用到如下符号,其中 $x$ 表示在大多情况下未知的量的准确值, $\tilde{x}$ 表示 $x$ 的近似值:

绝对误差 $| Δ x | = | x - \tilde{x} |$ .(19.268)

相对误差 $| \frac{Δ x}{x} | = | \frac{x - \tilde{x}}{x} |$ .(19.269)

记号

\begin{matrix} (19.270) & ε (x) = x - \tilde{x} 和 ε_{rel} (x) = \frac{x - \tilde{x}}{x} \end{matrix}

也经常用到.

19.8.2.2 规范化十进制数和舍入

1. 规范化十进制数

每个实数 $x \neq 0$ 可表示为形如

\begin{matrix} (19.271) & x = \pm 0. b_{1} b_{2} \dots 10^{E} (b_{1} \neq 0) \end{matrix}

的十进制数. 这里由数字 $b_{i} \in {0, 1, 2, \dots, 9}$ 构成的 $0. b_{1} b_{2} \dots$ 称为尾数. 数 $E$ 为整数,是所谓关于基 10 的指数. 因为 $b_{1} \neq 0, (19.271)$ 称为正规十进制数.

因为真实的计算机只能处理有限多的字节,故必须限制尾数数字的固定数目 $t$ 和指数 $E$ 的固定范围. 故形如 (19.271) 的数根据舍入 (在实际计算中常用) 得到

\begin{matrix} (19.272) & \tilde{x} = {\begin{cases} \pm 0 \cdot b_{1} b_{2} \dots b_{t} \cdot 10^{E}, & b_{t + 1} < 5 (舍), \\ \pm (0 \cdot b_{1} b_{2} \dots b_{t} + 10^{- t}) 10^{E}, & b_{t + 1} \geq 5 (λ), \end{cases} \end{matrix}

由舍入引起的绝对误差为

\begin{matrix} (19.273) & | Δ x | = | x - \tilde{x} | \leq 0.5 \cdot 10^{- t} 10^{E} . \end{matrix}

2. 基本运算和数值计算

每个数值过程都是一系列基本运算. 特别用有限位浮点表示提出问题. 这里给出简要综述. 设 $x$ 和 $y$ 是非零的同号规范化无误差浮点数:

\begin{matrix} (19.274a) & x = m_{1} B^{E_{1}}, y = m_{2} B^{E_{2}} \end{matrix}

\begin{matrix} (19.274b) & m_{i} = \sum_{k = 1}^{t} a_{- k}^{(i)} B^{- k}, a_{- 1}^{(i)} \neq 0, \end{matrix}

\begin{matrix} (19.274c) & a_{- k}^{(i)} = 0 或 1 或 \dots 或 B - 1, k > 1 (i = 1, 2) . \end{matrix}

(1) 加法 若 $E_{1} > E_{2}$ ,因为正规化仅允许左移,则公共指数变为 $E_{1}$ . 随后尾数相加.

若

\begin{matrix} (19.275a) & B^{- 1} \leq | m_{1} + m_{2} B^{- (E_{1} - E_{2})} | < 2 \end{matrix}

和

\begin{matrix} (19.275b) & | m_{1} + m_{2} B^{- (E_{1} - E_{2})} | \geq 1, \end{matrix}

则将十进制小数点向左移一位而指数增加 1.

$0.9604 \cdot 10^{3} + 0.5873 \cdot 10^{2} = 0.9604 \cdot 10^{3} + 0.05873 \cdot 10^{3} = 1.01913 \cdot 10^{3} = 0.1019 \cdot 10^{4} .$

(2) 减法 如同在加法的情况均衡指数, 随后尾数相减. 若

\begin{matrix} (19.276a) & | m_{1} - m_{2} B^{- (E_{1} - E^{2})} | < 1 - B^{- t}, \end{matrix}

以及

\begin{matrix} (19.276b) & | m_{1} - m_{2} B^{- (E_{1} - E^{2})} | < B^{- t}, \end{matrix}

则将十进制小数点右移 $t$ 的最大值位,而指数相应减少.

$◼$ $0.1004 \cdot 10^{3} - 0.9988 \cdot 10^{2} = 0.1004 \cdot 10^{3} - 0.09988 \cdot 10^{3} = 0.00052 \cdot 10^{3} = 0.5200 \cdot 10^{0} .$

此例显示了减法的临界情况. 因为位数有限 (这里是 4), 从右边引进零代替准确字符.

(3) 乘法 指数相加而尾数相乘, 若

\begin{matrix} (19.277) & m_{1} m_{2} < B^{- 1}, \end{matrix}

则十进制小数点向右移一位, 且指数减少 1.

$(0.1004 \cdot 10^{3}) \cdot (0.2504 \cdot 10^{5}) = 0.07952704 \cdot 10^{8} = 0.7953 \cdot 10^{7} .$

(4)除法 指数相减而尾数相除. 若

\begin{matrix} (19.278) & \frac{m_{1}}{m_{2}} \geq 1 \end{matrix}

则十进制小数点向左移一位, 且指数增加 1.

$(0.3176 \cdot 10^{3}) / (0.2504 \cdot 10^{5}) = 1.2683706 \cdot 10^{- 2} = 0.1268 \cdot 10^{- 1} .$

(5) 结果的误差 在假定无误差项的四种基本运算中, 结果的误差是舍入误差. 对于位置为 $t$ 基为 $B$ 的数,相对误差的上限为

\begin{matrix} (19.279) & \frac{B}{2} B^{- t} . \end{matrix}

(6) 减法相消 如上所述, 几乎相等的浮点数的减法是临界运算. 若有可能, 应通过改变运算阶或利用某种等式来避免这种情况.

x = \sqrt{1985} - \sqrt{1984} = 0.4455 \cdot 10^{2} - 0.4454 \cdot 10^{2} = 0.1 \cdot 10^{- 1} 或

x = \sqrt{1985} - \sqrt{1984} = \frac{1985 - 1984}{\sqrt{1985} + \sqrt{1984}} = 0.1122 \cdot 10^{- 1} .

19.8.2.3 数值计算的精度

1. 误差类型

数值方法有误差. 有几类误差, 最后结果的总误差正是由这些误差积累的 (图 19.18).

01937d01-b6f6-7881-8294-3a9c82211946_73_307_480_1024_374_0.jpg

2. 输入误差

(1)输入误差的概念 输入误差是由不准确的输入数据产生的误差. 输入数据的轻微不准确称为扰动. 确定输入数据误差称为误差计算的直接问题. 其反问题如下: 输入数据可有多大的误差能够保证最终的输入误差不超过可以接受的允许值. 在相当复杂的问题里估计输入误差是非常困难且通常几乎是不可能的. 一般对实值函数 $y = f (\underset{―}{x}), \underset{―}{x} = {(x_{1}, x_{2}, \dots, x_{n})}^{T}$ ,若对 $y = f (\underset{―}{x}) = f (x_{1}, x_{2}, \dots, x_{n})$ 应用带线性余项的泰勒公式 (参见第 630 页 7.3.3.3), $ξ_{1}, ξ_{2}, \dots, ξ_{n}$ 表示中间值, ${\tilde{x}}_{1}, {\tilde{x}}_{2}, \dots, {\tilde{x}}_{n}$ 表示 $x_{1}, x_{2}, \dots, x_{n}$ 的近似值,则输入误差的绝对值为

| Δ y | = | f (x_{1}, x_{2}, \dots, x_{n}) - f ({\tilde{x}}_{1}, {\tilde{x}}_{2}, \dots, {\tilde{x}}_{n}) |

= | \sum_{i = 1}^{n} \frac{\partial f}{\partial x_{i}} (ξ_{1}, ξ_{2}, \dots, ξ_{n}) (x_{i} - \tilde{x_{i}}) |

\begin{matrix} (19.280) & \leq \sum_{i = 1}^{n} (max_{x} | \frac{\partial f}{\partial x_{i}} (\underset{―}{x}) |) | Δ x_{i} |, \end{matrix}

近似值是扰动了的输入数据. 这里也考虑高斯误差传播定律 (参见第 1114 页 16.4.2.1).

(2)简单算术运算的输入误差 已知简单算术运算的输入误差. 对四种基本运算用 (19.268) (19.270) 的记号:

\begin{matrix} (19.281) & ε (x \pm y) = ε (x) \pm ε (y), \end{matrix}

\begin{matrix} (19.282) & ε (x y) = y ε (x) + x ε (y) + ε (x) ε (y), \end{matrix}

\begin{matrix} (19.283) & ε (\frac{x}{y}) = \frac{1}{y} ε (x) - \frac{x}{y^{2}} ε (y) + ε 的高阶项, \end{matrix}

\begin{matrix} (19.284) & ε_{rel} (x \pm y) = \frac{ε_{rel} (x) \pm ε_{rel} (y)}{x \pm y}, \end{matrix}

\begin{matrix} (19.285) & ε_{rel} (x y) = ε_{rel} (x) + ε_{rel} (y) + ε_{rel} (x) ε_{rel} (y), \end{matrix}

\begin{matrix} (19.286) & ε_{rel} (\frac{x}{y}) = ε_{rel} (x) + ε_{rel} (y) + ε 的高阶项. \end{matrix}

公式表明: 对于乘法和除法, 输入数据的相对误差小, 导致结果的相对误差也小. 对于加法和减法,若 $| x \pm y | ≪ | x | + | y |$ ,相对误差可能非常大.

3. 方法的误差

(1)方法误差的记号 方法误差源于理论上连续的现象作为极限以不同的方式被数值逼近的事实. 因此, 在极限过程中有截断误差 (例如在迭代法中) 及在用有限离散系 (例如数值积分) 逼近连续现象时的离散误差. 方法误差与输入和舍入误差无关, 因此, 仅在关系到应用解法的方法论时研究方法误差.

(2) 应用迭代法 若使用迭代法, 可能出现两种情况: 得到问题的正确解或错误解. 也可能尽管有解但不能用迭代法得到.

为使迭代法更清晰安全, 应考虑如下建议:

a) 为避免 “无穷迭代”, 若步数超过预定值即停止过程 (即尚未达到要求的精度便停止).

b) 应在屏幕上以数值或者图表的形式跟踪中间结果的位置.

c) 应该用到解的所有已知性质如梯度、单调性等.

d) 应研究变量和函数计量的可能性.

e) 应通过改变步长、截断条件、初始值等进行多种试验.

4. 舍入误差

产生舍入误差是因为中间结果被舍入. 这对按精度要求判断数学方法时有本质的重要性. 舍入误差与输入误差和方法误差一起决定给定的方法是强稳定、弱稳定或不稳定. 若总误差随着步数增加分别减少、有相同的阶或增加, 便发生强稳定、弱稳定或不稳定.

在不稳定性方面, 我们区别舍入误差和离散误差 (数值不稳定) 以及理论上准确的计算中初始数据误差 (自然不稳定) 的灵敏度. 若数值不稳定不大于自然不稳定, 则计算过程是合适的.

对于舍入误差的局部误差传播, 即从一个计算步到下一步的误差传递, 可使用在输入误差中用过的同样的估计过程.

5. 数值计算的例子

上述某些问题用数值例子来说明.

$◼ A$ : 二次方程的根带实系数 $a, b, c$ 的二次方程 $a x^{2} + b x + c = 0, D =$ $b^{2} - 4 a c \geq 0$ (实根). 临界状态为

**a) $| * * 4 a c | ≪ b^{2}$ 和 b) $4 a c \approx b^{2}$ . 推荐程序:

**i) $x_{1} * * = - \frac{b + sign (b) \sqrt{D}}{2 a}, x_{2} = \frac{c}{a x_{1}}$ (韦达根定理,参见第 56 页 1.6.3.1,3.).

ii) 用直接法难免把 $D$ 化零. 因为 $| b | ≫ \sqrt{D}$ 成立,将发生减法抵消,除非 $(b + sign (b \sqrt{D}))$ 中误差不是太大.

$◼ B$ : $h \leq r$ 的薄锥壳的体积因为 $(r + h) \approx r, V = 4 π \frac{{(r + h)}^{3} - r^{3}}{3}$ 存在减法消去的情况. 而在等式 $V = 4 π \frac{3 r^{2} h + 3 r h^{2} + h^{3}}{3}$ 中则没有这个问题.

$◼ C$ : 求和 $S = \sum_{k = 1}^{\infty} \frac{1}{k^{2} + 1} (S = 1.07667 \dots)$ 要求有三位有效数字的精度. 用 8 位数字进行计算,大约需要加 6000 项. 在作恒等变换 $\frac{1}{k^{2} + 1} = \frac{1}{k^{2}} - \frac{1}{k^{2} (k^{2} + 1)}$ 后, 成立

S = \sum_{k = 1}^{\infty} \frac{1}{k^{2}} - \sum_{k = 1}^{\infty} \frac{1}{k^{2} (k^{2} + 1)} 及 S = \frac{π^{2}}{6} - \sum_{k = 1}^{\infty} \frac{1}{k^{2} (k^{2} + 1)} .

通过这一变换后, 则只需考虑 8 项.

$◼ D$ : 避免 $\frac{0}{0}$ 的状态当 $x = y = 0$ 时,函数 $z = (1 - \sqrt{1 + x^{2} + y^{2}}) \frac{x^{2} - y^{2}}{x^{2} + y^{2}}$ . 分子和分母同时乘以 $(1 + \sqrt{1 + x^{2} + y^{2}})$ 即可避免这一状态.

$◼ E$ : 不稳定递推过程的例子若满足条件 $| \frac{a}{2} \pm \sqrt{\frac{a^{2}}{4} + b} | < 1$ ,则一般形式的算法 $y_{n + 1} = a y_{n} + b y_{n - 1} (n = 1, 2, \dots)$ 是稳定的. 特殊情况 $y_{n + 1} = - 3 y_{n} +$ $4 y_{n - 1} (n = 1, 2, \dots)$ 是不稳定的. 若 $y_{0}$ 和 $y_{1}$ 有误差 $ε$ 和 $- ε$ ,则对 $y_{2}, y_{3}, y_{4}, y_{5}$ , $y_{6}, \dots$ 误差为 $7 ε, - 25 ε, 103 ε, - 409 ε, 1639 ε, \dots$ ,该过程对于参数 $a = - 3$ 与 $b = 4$ 是不稳定的.

$◼ F$ : 微分方程的数值求积数值求解一阶常微分方程

\begin{matrix} (19.287) & y^{'} = f (x, y), 其中 f (x, y) = a y, \end{matrix}

其初值用 $y (x_{0}) = y_{0}$ 表示.

a) 天然不稳定 准确解 $y (x)$ 有准确初值 $y (x_{0}) = y_{0}$ ,设 $u (x)$ 为扰动初值的解. 不失一般性, 设扰动解形如:

\begin{matrix} (19.288a) & u (x) = y (x) + ε η (x), \end{matrix}

其中 $ε (0 < ε < 1)$ 为参数,而 $η (x)$ 是所谓扰动函数. 考虑 $u^{'} (x) = f (x, u)$ 从泰勒展开式得到 (参见第 630 页 7.3.3.3)

\begin{matrix} (19.288b) & u^{'} (x) = f (x, y (x) + ε η (x)) = f (x, y) + ε η (x) f_{y} (x, y) + 高阶项. \end{matrix}

这意味着微分变差方程

\begin{matrix} (19.288c) & η^{'} (x) = f_{y} (x, y) η (x) . \end{matrix}

由 $f (x, y) = a y$ ,问题的解为

\begin{matrix} (19.288d) & η (x) = η_{0} e^{a (x - x_{0})}, 其中 η_{0} = η (x_{0}) . \end{matrix}

对 $a > 0$ ,即便是小的初始扰动 $η_{0}$ 也导致无限增长的扰动 $η (x)$ . 故为天然不稳定.

b) 梯形公式的误差研究 当 $a = - 1$ 时,稳定的微分方程 $y^{'} (x) = - y (x)$ 有准确解

\begin{matrix} (19.289a) & y (x) = y_{0} e^{a (x - x_{0})}, 其中 y_{0} = y (x_{0}) . \end{matrix}

梯形公式为

\begin{matrix} (19.289b) & \int_{x_{i}}^{x_{i + 1}} y (x) d x \approx \frac{y_{i} + y_{i + 1}}{2} h, 其中 h = x_{i + 1} - x_{i} . \end{matrix}

对给定微分方程用上述公式, 成立

{\tilde{y}}_{i + 1} = {\tilde{y}}_{i} + \int_{x_{i}}^{x_{i + 1}} (- y) d x = {\tilde{y}}_{i} - \frac{{\tilde{y}}_{i} + {\tilde{y}}_{i + 1}}{2} h, {\tilde{y}}_{i + 1} = \frac{2 - h}{2 + h} {\tilde{y}}_{i},

\begin{matrix} (19.289c) & {\tilde{y}}_{i} = {(\frac{2 - h}{2 + h})}^{i} {\tilde{y}}_{0} \end{matrix}

其中 $x_{i} = x_{0} + i h$ ,即对 $0 \leq h < 2$ 有 $i = (x_{i} - x_{0}) / h$ ,得到

{\tilde{y}}_{i} = {(\frac{2 - h}{2 + h})}^{(x_{i} - x_{0}) / h} {\tilde{y}}_{0} = {\tilde{y}}_{0} e^{c (h) (x_{i} - x_{0})},

\begin{matrix} (19.289d) & c (h) = \frac{\ln (\frac{2 - h}{2 + h})}{h} = - 1 - \frac{h^{2}}{12} - \frac{h^{4}}{80} - \dots . \end{matrix}

若 ${\tilde{y}}_{0} = y_{0}$ ,则 ${\tilde{y}}_{i} < y_{i}$ ,且对 $h \to 0, {\tilde{y}}_{i}$ 也趋向于准确解 $y_{0} e^{- (x_{i} - x_{0})}$ .

c) 在 b) 中的输入误差设准确和近似的初值相同. 现研究当 ${\tilde{y}}_{0} \neq y_{0}$ 及 $| {\tilde{y}}_{0} - y_{0} | < ε_{0}$ 时的性态.

因为 $({\tilde{y}}_{i + 1} - y_{i + 1}) \leq \frac{2 - h}{2 + h} ({\tilde{y}}_{i} - y_{i})$ ,有

\begin{matrix} (19.290a) & ({\tilde{y}}_{i + 1} - y_{i + 1}) \leq {(\frac{2 - h}{2 + h})}^{i + 1} ({\tilde{y}}_{0} - y_{0}), \end{matrix}

故 $ε_{i + 1}$ 最多和 $ε_{0}$ 同阶,且该方法关于初值是稳定的. 应该提到,在用辛普森方法求解上述微分方程时引进了人为的不稳定. 此时,对 $h \to 0$ ,得到通解如:

\begin{matrix} (19.290b) & {\tilde{y}}_{i} = C_{1} e^{- x_{i}} + C_{2} {(- 1)}^{i} e^{x_{i} / 3} . \end{matrix}

问题是该数值解法使用了比相应的微分方程的阶更高阶的差分.

19.8.2 计算机计算中的数值问题 ​

19.8.2.1 引言、误差类型 ​

19.8.2.2 规范化十进制数和舍入 ​

1. 规范化十进制数 ​

2. 基本运算和数值计算 ​

19.8.2.3 数值计算的精度 ​

1. 误差类型 ​

2. 输入误差 ​

3. 方法的误差 ​

4. 舍入误差 ​

5. 数值计算的例子 ​