LU分解

线性代数
A = [ 1 2 3 4 ] {\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix}}}

向量 · 向量空间 · 基底  · 行列式  · 矩阵

向量

标量 · 向量 · 向量空间 · 向量投影 · 外积向量积 · 七维向量积) · 内积数量积) · 二重向量

矩阵与行列式

矩阵 · 行列式 · 线性方程组 · 秩 · · 跡 · 單位矩陣 · 初等矩阵 · 方块矩阵 · 分块矩阵 · 三角矩阵 · 非奇异方阵 · 转置矩阵 · 逆矩阵 · 对角矩阵 · 可对角化矩阵 · 对称矩阵 · 反對稱矩陣 · 正交矩阵 · 幺正矩阵 · 埃尔米特矩阵 · 反埃尔米特矩阵 · 正规矩阵 · 伴随矩阵 · 余因子矩阵 · 共轭转置 · 正定矩阵 · 幂零矩阵 · 矩阵分解 (LU分解 · 奇异值分解 · QR分解 · 极分解 · 特征分解) · 子式和余子式 · 拉普拉斯展開 · 克罗内克积

线性空间与线性变换

线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 線性無關 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化

线性代数数值分析中,LU分解矩阵分解的一种,将一个矩阵分解为一个下三角矩阵和一个上三角矩阵的乘积,有时需要再乘上一个置换矩阵。LU分解可以被視為高斯消去法的矩陣形式。在数值计算上,LU分解經常被用来解线性方程组、且在求逆矩阵和计算行列式中都是一個關鍵的步驟。

定义

對於方阵 A {\displaystyle A} A {\displaystyle A} LU 分解是将它分解成一個下三角矩阵 L 與上三角矩阵 U 的乘積,也就是

A = L U {\displaystyle A=LU}

如果適當的改變 A {\displaystyle A} 的行的順序或列的順序,就可以將 A {\displaystyle A} 做 LU 分解。

舉例來說一个 3 × 3 {\displaystyle 3\times 3} 的矩阵 A ,其 LU 分解會寫成下面的形式:

A = [ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] = [ l 11 0 0 l 21 l 22 0 l 31 l 32 l 33 ] [ u 11 u 12 u 13 0 u 22 u 23 0 0 u 33 ] {\displaystyle A={\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\\\end{bmatrix}}={\begin{bmatrix}l_{11}&0&0\\l_{21}&l_{22}&0\\l_{31}&l_{32}&l_{33}\\\end{bmatrix}}{\begin{bmatrix}u_{11}&u_{12}&u_{13}\\0&u_{22}&u_{23}\\0&0&u_{33}\\\end{bmatrix}}}

事實上,並不是每個矩陣都有 LU 分解。例如,從上式可知 a 11 = l 11 u 11 {\displaystyle a_{11}=l_{11}u_{11}} ,若 a 11 = 0 {\displaystyle a_{11}=0} ,則 l 11 {\displaystyle l_{11}} u 11 {\displaystyle u_{11}} 等於 0,故 L 或 U 是非可逆矩阵,A 必須也是非可逆矩阵。然而,存在著可逆矩阵 A 滿足 a 11 = 0 {\displaystyle a_{11}=0} ,這些 A 就是沒有 LU 分解的例子。該問題可藉由置換 A 的各行順序來解決,最終會得到一個 A 的 PLU 分解。

PLU 分解

方陣 A 的 PLU 分解是是将它分解成一个置换矩阵 P、一個下三角矩阵 L 與上三角矩阵 U 的乘積,即

A = P L U {\displaystyle A=PLU}

事實上,所有的方陣都可以寫成 PLU 分解的形式,由於左乘置換矩陣 P 1 {\displaystyle P^{-1}} 是在交換行的順序,所以由 P 1 A = L U {\displaystyle P^{-1}A=LU} 推得適當的交換 A 的行的順序,即可將 A 做 LU 分解。事實上,PLU 分解有很高的數值穩定性,因此實用上是很好用的工具。

有時為了計算上的方便,會同時間換行與列的順序,此時會將 A 分解成

A = P L U Q {\displaystyle A=PLUQ}

其中 P、L、U 同上,Q 是一個置換矩陣

LDU 分解

方陣 A 的 LDU 分解是是将它分解成一個單位下三角矩阵 L、對角矩陣 D 與單位上三角矩阵 U 的乘積,即

A = L D U {\displaystyle A=LDU}

其中單位上、下三角矩陣是指对角线上全是 1 的上、下三角矩阵。

事實上,LDU 分解可以推廣到 A 是一般的矩陣,而非方陣。此時,L 和 D 是方陣,並且與 A 有相同的行,U 則有和 A 相同的長寬。注意到現在 U 是上三角的定義改為主對角線的下方都是 0,而主對角線是收集所有 U i j {\displaystyle U_{ij}} 滿足 i=j。

存在性和唯一性

一个可逆矩阵可以进行LU分解当且仅当它的所有子式都非零。如果要求其中的L矩阵(或U矩阵)为单位三角矩阵,那么分解是唯一的。同理可知,矩阵的LDU可分解条件也相同,并且总是唯一的。

即使矩阵不可逆,LU仍然可能存在。实际上,如果一个k的矩阵的前k个顺序主子式不为零,那么它就可以进行LU分解,但反之则不然。

目前,在任意域上一个方块矩阵可进行LU分解的充要条件已经被发现,这些充要条件可以用某些特定子矩阵的秩表示。用高斯消元法来得到LU分解的算法也可以扩张到任意域上。

任意矩阵A(不仅仅是方块矩阵)都可以进行LUP分解。其中的LU矩阵是方阵,P矩阵则与A形状一样。

正定矩阵

如果矩阵A埃尔米特矩阵,并且是正定矩阵,那么可以使,UL共轭转置。也就是说,A可以写成

A = L L   {\displaystyle A=LL^{*}\ }

这个分解被称作Cholesky分解。对每一个正定矩阵,Cholesky分解都唯一存在。此外,比起一般的LU分解,计算Cholesky分解更为快捷,并具有更高的数值稳定性

具体的表达式

由于LDU分解唯一存在,对给定的矩阵,可以给出相应三个矩阵LDU的具体的表达式。表达式由A主子式之比构成(因此要求它们不为零)。设 d 1 , d 2 , d n {\displaystyle d_{1},d_{2},\cdots d_{n}} 为矩阵D的对角线系数,则有 d 1 = A 1 , 1 {\displaystyle d_{1}=\mathbf {A} _{1,1}} 。对 i = 2 , , n {\displaystyle i=2,\ldots ,n} d i {\displaystyle d_{i}} 的值等于A的第 i {\displaystyle i} 个顺序主子式与第 i 1 {\displaystyle i-1} 个顺序主子式之比,其中约定 d 0 {\displaystyle d_{0}} =1。

算法

LU分解在本质上是高斯消元法的一种表达形式。实质上是将A通过初等行变换变成一个上三角矩阵,其变换矩阵就是一个单位下三角矩阵。这正是所谓的杜尔里特算法(Doolittle algorithm):从下至上地对矩阵A做初等行变换,将对角线左下方的元素变成零,然后再证明这些行变换的效果等同于左乘一系列单位下三角矩阵,这一系列单位下三角矩阵的乘积的逆就是L矩阵,它也是一个单位下三角矩阵。

这类算法的复杂度一般在 2 n 3 3 {\displaystyle {\frac {2n^{3}}{3}}} 左右,对充分消元的分解则不然。

杜尔里特算法

对给定的N × N矩阵

A = ( a n , n ) {\displaystyle A=(a_{n,n})}

A ( 0 ) := A {\displaystyle A^{(0)}:=A}

然后定义对于n = 1,...,N-1的情况如下:

在第n步,消去矩阵A(n-1)的第n列主对角线下的元素:将A(n-1)的第n行乘以 l i , n := a i , n ( n 1 ) a n , n ( n 1 ) {\displaystyle l_{i,n}:=-{\frac {a_{i,n}^{(n-1)}}{a_{n,n}^{(n-1)}}}} 之后加到第i行上去。其中 i = n + 1 , , N {\displaystyle i=n+1,\ldots ,N}

这相当于在A(n-1)的左边乘上一个单位下三角矩阵:

L n = [ 1 0 1 l n + 1 , n 0 l N , n 1 ] {\displaystyle L_{n}={\begin{bmatrix}1&&&&&0\\&\ddots &&&&\\&&1&&&\\&&l_{n+1,n}&\ddots &&\\&&\vdots &&\ddots &\\0&&l_{N,n}&&&1\\\end{bmatrix}}}

于是,定义为:设

A ( n ) := L n A ( n 1 ) {\displaystyle A^{(n)}:=L_{n}A^{(n-1)}}

经过N-1轮操作后,所有在主对角线下的系数都为0了,于是我们得到了一个上三角矩阵:A(N-1),这时就有:

A = L 1 1 L 1 A ( 0 ) = L 1 1 A ( 1 ) = L 1 1 L 2 1 L 2 A ( 1 ) = L 1 1 L 2 1 A ( 2 ) = = L 1 1 L N 1 1 A ( N 1 ) {\displaystyle A=L_{1}^{-1}L_{1}A^{(0)}=L_{1}^{-1}A^{(1)}=L_{1}^{-1}L_{2}^{-1}L_{2}A^{(1)}=L_{1}^{-1}L_{2}^{-1}A^{(2)}=\ldots =L_{1}^{-1}\ldots L_{N-1}^{-1}A^{(N-1)}}

这时,矩阵A(N-1) 就是U L = L 1 1 L N 1 1 {\displaystyle L=L_{1}^{-1}\ldots L_{N-1}^{-1}} 。 下三角矩阵 L k {\displaystyle L_{k}} 的逆依然是下三角矩阵,而且下三角矩阵的乘积仍是下三角矩阵,所以 L {\displaystyle L} 是下三角矩阵。 于是我们得到分解: A = L U {\displaystyle A=LU}

显然,要是算法成立,在每步操作时必须有 a n , n ( n 1 ) 0 {\displaystyle a_{n,n}^{(n-1)}\neq 0} 。如果这一条件不成立,就要将第n行和另一行交换,由此就会出现一个置换矩阵P。这就是为什么一般来说LU分解里会带有一个置换矩阵的原因。

例子

将一个简单的3×3矩阵A进行LU分解:

A = [ 1 2 3 2 5 7 3 5 3 ] {\displaystyle A={\begin{bmatrix}1&2&3\\2&5&7\\3&5&3\\\end{bmatrix}}}

先将矩阵第一列元素中a11以下的所有元素变为0,即

L 1 A = [ 1 0 0 2 1 0 3 0 1 ] × [ 1 2 3 2 5 7 3 5 3 ] = [ 1 2 3 0 1 1 0 1 6 ] {\displaystyle L_{1}A={\begin{bmatrix}1&0&0\\-2&1&0\\-3&0&1\\\end{bmatrix}}\times {\begin{bmatrix}1&2&3\\2&5&7\\3&5&3\\\end{bmatrix}}={\begin{bmatrix}1&2&3\\0&1&1\\0&-1&-6\\\end{bmatrix}}}

再将矩阵第二列元素中a22以下的所有元素变为0,即

L 2 ( L 1 A ) = [ 1 0 0 0 1 0 0 1 1 ] × [ 1 2 3 0 1 1 0 1 6 ] = [ 1 2 3 0 1 1 0 0 5 ] = U {\displaystyle L_{2}(L_{1}A)={\begin{bmatrix}1&0&0\\0&1&0\\0&1&1\\\end{bmatrix}}\times {\begin{bmatrix}1&2&3\\0&1&1\\0&-1&-6\\\end{bmatrix}}={\begin{bmatrix}1&2&3\\0&1&1\\0&0&-5\\\end{bmatrix}}=U}
L = L 1 1 L 2 1 = [ 1 0 0 2 1 0 3 0 1 ] × [ 1 0 0 0 1 0 0 1 1 ] = [ 1 0 0 2 1 0 3 1 1 ] {\displaystyle L=L_{1}^{-1}L_{2}^{-1}={\begin{bmatrix}1&0&0\\2&1&0\\3&0&1\\\end{bmatrix}}\times {\begin{bmatrix}1&0&0\\0&1&0\\0&-1&1\\\end{bmatrix}}={\begin{bmatrix}1&0&0\\2&1&0\\3&-1&1\\\end{bmatrix}}}

还有一种方法是通过方程求解,如下所示,将以下矩阵进行LU分解:

[ 4 3 6 3 ] = [ l 11 0 l 21 l 22 ] [ u 11 u 12 0 u 22 ] {\displaystyle {\begin{bmatrix}4&3\\6&3\\\end{bmatrix}}={\begin{bmatrix}l_{11}&0\\l_{21}&l_{22}\\\end{bmatrix}}{\begin{bmatrix}u_{11}&u_{12}\\0&u_{22}\\\end{bmatrix}}}

由于矩阵阶数只是2,可以直接列方程解:

l 11 u 11 + 0 0 = 4 {\displaystyle l_{11}*u_{11}+0*0=4}
l 11 u 12 + 0 u 22 = 3 {\displaystyle l_{11}*u_{12}+0*u_{22}=3}
l 21 u 11 + l 22 0 = 6 {\displaystyle l_{21}*u_{11}+l_{22}*0=6}
l 21 u 12 + l 22 u 22 = 3 {\displaystyle l_{21}*u_{12}+l_{22}*u_{22}=3}

这个线性方程组有无数多组解。因此,可以假设其中一个是单位三角矩阵,比如说L,也就是说其对角线上的两个系数都是1。这时可以解出:

l 21 = 1.5 {\displaystyle l_{21}=1.5}
u 11 = 4 {\displaystyle u_{11}=4}
u 12 = 3 {\displaystyle u_{12}=3}
u 22 = 1.5 {\displaystyle u_{22}=-1.5}

也就是说

[ 4 3 6 3 ] = [ 1 0 1.5 1 ] [ 4 3 0 1.5 ] {\displaystyle {\begin{bmatrix}4&3\\6&3\\\end{bmatrix}}={\begin{bmatrix}1&0\\1.5&1\\\end{bmatrix}}{\begin{bmatrix}4&3\\0&-1.5\\\end{bmatrix}}}

稀疏矩阵分解

对于阶数很大的稀疏矩阵,有特别的简便算法来获得其LU分解:这时的LU也是稀疏矩阵。理论上来说,算法的复杂度约等于非零系数的个数,而不是矩阵的大小阶数。这些算法通过运用行和列的交换,使得过程中零系数因为操作而变成非零系数的次数减到最少。

一般的将零系数因为操作而变成非零系数的次数减到最少的方法是运用图论

应用

求解线性方程

对于给定的线性方程组

A x = L U x = b {\displaystyle Ax=LUx=b\,}

要解出x,可以进行以下步骤:

  1. 首先,解方程 L y = b {\displaystyle Ly=b} 得到 y {\displaystyle y}
  2. 然后解方程 U x = y {\displaystyle Ux=y} 得到 x {\displaystyle x}

在两次的求解中,我们遇到的都是三角矩阵,因此运用向前(向后)替代法就可以简洁地求解(参见三角矩阵),而不需要用到高斯消元法。然而,在将A进行LU分解时,仍然要用到高斯消元法。因此,这个方法适合在要对许多个不同的b求解时用。

求逆矩阵

求矩阵A的逆时,可以直接求LU的逆矩阵,然后代入: A 1 = U 1 L 1 {\displaystyle A^{-1}=U^{-1}L^{-1}} 。也可以将单位矩阵分解成n个列向量,然后用上面求解线性方程的方法解出逆矩阵的列向量,然后拼起来。后者的复杂度在n2级别[來源請求],较高斯法为优。

计算行列式

矩阵 L {\displaystyle L} U {\displaystyle U} 可以用来快速地计算矩阵 A {\displaystyle A} 行列式,因为det(A) = det(L) det(U),而三角矩阵的行列式就是对角线元素的乘积。如果要求L 是单位三角矩阵,那么 det ( A ) = det ( L ) det ( U ) = i = 1 n u i i {\displaystyle \det(A)=\det(L)\det(U)=\prod _{i=1}^{n}u_{ii}}

同样的方法也可以应用于LUP分解,只需乘上P的行列式,即相应置换的符号差。

参见

参考来源

  • Trefethen, Lloyd; Bau, David, Numerical Linear Algebra 
  • Cormen, T.H.; Leisserson, C.E; Rivest, R.L., Introduction to Algorithms 
  • Golub, Gene H.; Van Loan, Charles F., Matrix Computations 3rd, Baltimore: Johns Hopkins, 1996, ISBN 978-0-8018-5414-9 .
  • Horn, Roger A.; Johnson, Charles R., Matrix Analysis, Cambridge University Press, 1985, ISBN 0-521-38632-2 . See Section 3.5.
  • Okunev, Pavel; Johnson, Charles, Necessary And Sufficient Conditions For Existence of the LU Factorization of an Arbitrary Matrix, 1997,  .
  • Householder, Alston, The Theory of Matrices in Numerical Analysis, 1975 .
  • LU decomposition (页面存档备份,存于互联网档案馆) on MathWorld.
  • LU decomposition (页面存档备份,存于互联网档案馆) on Math-Linux.
  • LU decomposition (页面存档备份,存于互联网档案馆

外部链接

  • LAPACK (页面存档备份,存于互联网档案馆) is a collection of FORTRAN subroutines for solving dense linear algebra problems
  • ALGLIB (页面存档备份,存于互联网档案馆) includes a partial port of the LAPACK to C++, C#, Delphi, etc.
  • Online Matrix Calculator performs LU decomposition
  • LU decomposition (页面存档备份,存于互联网档案馆) at Holistic Numerical Methods Institute
  • Module for LU Factorization with Pivoting
  • LU Decomposition (页面存档备份,存于互联网档案馆) by Ed Pegg, Jr.,The Wolfram Demonstrations Project,2007.