§2  矩阵的运算

 

一、矩阵的相等、加、减、数乘、乘法、转置与共轭

 

运算及其规则

  性质与说明

  [相等]

=

当且仅当

             

 

    相等矩阵必须具有相同行数与相同列数.

    两矩阵相等,指各对应位置的元素分别相等.

  [加减]

±

                   =

其中

                        

 

 

 

同类型的矩阵才能相加减(各对应位置的元素相加减).

A+B=B+A      (交换律)

(A+B)+C=A+(B+C)  

               (结合律)

 

  [数乘]

=

数乘矩阵时,将数乘到矩阵的每个元素上.

kA=Ak

k(A+B)=kA+kB

(k+l)A=kA+lA

k(lA)=(kl)A

(k,l为任意两个复数)

  [乘法]

  A=(aij)m´n矩阵

  B=(bij)n´s矩阵,

  AB=(aij) (bij)=(cij)=C

式中Cm´s矩阵,且

cij=    

 

 

 

 

 

 

   运算及其规则

乘积的元素cij,等于左矩阵的第i行与右矩阵的第j列对应元素相乘之后相加.

左矩阵的列数必须等于右矩阵的行数.

ABC=ABC    (结合律)  

  k(AB)=(kA)B=A(kB)

      (k是任意复数)

[]AB=BA一般情况下不成立,即无交换律.

   性质与说明

  [转置] m´n矩阵A=(aij)的列同行互换后所得到的n´m矩阵称为A的转置矩阵,记作,

 

   =         

 

 

 

 

 

 

(A+B)t=At+Bt

(kA)t=kAt(k为任意复数)

(AB)t=BtAt(反序定律)

(A1A2...As)t=

(Ak)t=(At)k (k为整数)

[共轭] 把矩阵A=(aij)的所有元素换成它们的共轭复数后所得到的矩阵称为A的共轭矩阵,记作,即

                  =

 

   (k为任意复数)

 

二、矩阵的初等变换与初等矩阵

 

I=,称为单位矩阵.

初等变换

初等矩阵

初等矩阵与初等变换之间的关系

 

 

 

 

 

矩阵的第i列(或行)与第j列(或行)互调

 

 

 

 

 

 

 

 

 

 

 

 

 

 

      初等变换

  对单位矩阵I施行这种初等变换后得到的矩阵称为初等矩阵,记作Iij

 

 

       

 

 

 

      初等矩阵

  对矩阵A施行这种初等变换相当于用初等矩阵Iij右(或左)乘A.例如

    

  

 

 

初等矩阵与初等变换之间的关系

用数k¹0)乘矩阵的第i列(或行)

 对单位矩阵I施行这种初等变换后得到的矩阵称为初等矩阵,记作Pi(k)

         

Pi(k)=

  对矩阵A施行这种初等变换相当于用初等矩阵Pi(k)右(或左)乘A.例如

P2(k)A=

   =

   

矩阵的第i行(或列)加上第j列(或行)的k

对单位矩阵I施行这种初等变换后得到的矩阵称为初等矩阵,记作Aij(k)

          

Aij(k)=

对矩阵A施行这种初等变换相当于用初等矩阵Aij(k)右(或左)乘A.例如

AA12(k)=

      

    =

初等变换具有性质:

1°  任何矩阵(aij)都可经过有限次初等变换化为对角矩阵

aij®

2°  初等变换不改变矩阵的秩.

 

三、矩阵的微积分

 

       假设矩阵A的元素aij都是参数t的函数,那末

   1°  矩阵A的导数定义为

同样可定义矩阵的高阶导数.

    2°  矩阵A的积分定义为

同样可定义矩阵的多重积分.

 

四、特殊矩阵

 

[零矩阵与零因子元素aij全为零的矩阵称为零矩阵,记作

O=(0)=

零矩阵具有性质:

O+A=A+O=A

OA=AO=O

A+(A)=O,A称为A的负矩阵

       A,B为非零矩阵,即A¹O,B¹O,AB=O,则称矩阵A为矩阵B的左零因子,矩阵B为矩阵A的右零因子,例如

A=B=

AB===O

       [对角矩阵主对角线以外的元素都是零(dij=0,i¹j)的方阵称为对角矩阵,记作

D==diag(d1,d2,...,dn)=[ d1  d2  ...  dn]

   对角矩阵具有性质:

   1°  左乘B

DB==

             =

   2° 右乘B

BD==

   3°  两个对角矩阵的和、差、积仍为对角矩阵.

   [数量矩阵di=d(i=1,2,...,n)的对角矩阵称为数量矩阵,记作

D==[d  d     ...    d]

       显然DB=BD=dB.

       [单位矩阵d=1的数量矩阵称为单位矩阵,记作

I==1  1     ...    1

       显然IB=BI=B.

       [对称矩阵满足条件

aij=aji       (i,j=1,2,...,n)

的方阵A=(aij)称为对称矩阵.例如

A=

是对称矩阵.对称矩阵具有性质:

       A,B都是对称矩阵,则,A1(使A1=A1A=I的矩阵.详见本节,六),Am(m为正整数)A+B仍是对称矩阵.

       [实对称矩阵]实对称矩阵按其特征值(本节,七)可分为正定矩阵,半正定矩阵、负定矩阵、半负定矩阵和不定矩阵,它们的定义与充分必要条件如下

  

  

充分必要条件

正定矩阵

 

 

半正定矩阵

 

 

 

负定矩阵

 

 

 

半负定矩阵

 

 

 

 

不定矩阵

特征值都大于零的实对称矩阵

 

特征值都不小于零的实对称矩阵

 

特征值都小于零的实对称矩阵

 

 

特征值都不大于零的实对称矩阵

 

 

 

特征值既有大于零又有小于零的实对称矩阵

所有主子式都大于零,即

Ai>0   (i=1,2,...,n)

 

detA=0

Ai³0   (i=1,2,...,n1)

 

  

=1,2,...,n

 

detA=0

  

  =1,2,...,n1

 

或有一个偶数阶主子式A2k=0,或有两个奇数阶主子式,其中一个为正另一个为负

       [反对称矩阵满足条件

          (i,j=1,2,...,n)

的方阵A=(aij)称为反对称矩阵.例如

A=

是反对称矩阵.反对称矩阵具有性质:

    °  A,B都是反对称矩阵,则Aτ=A,A1, A+B仍是反对称矩阵,

Am    

    °  任意方阵A都可分解为一个对称矩阵B=(bij)与一个反对称矩阵C=(cij)之和,即

A=B+C

只需取

bij= (aij+aji),     cij= (aij-aji)

(i,j=1,2,...n)

    [埃尔米特矩阵满足条件

At=

的方阵A称为埃尔米特矩阵.例如

A=

是埃尔米特矩阵.埃尔米特矩阵具有性质:

    A,B都是埃尔米特矩阵,则,A+B仍是埃尔米特矩阵.A又是实方阵(即aij全为实数),则A就是对称矩阵.

       [反埃尔米特矩阵满足条件

At=

的方阵A称为反埃尔米特矩阵.例如

A=

是反埃尔米特矩阵.反埃尔米特矩阵具有性质:

       A,B都是反埃尔米特矩阵,则, A+B仍是反埃尔米特矩阵.A又是实方阵,则A就是反对称矩阵.

       [正交矩阵满足条件

At=

的方阵A称为正交矩阵.例如

A=

是正交矩阵.正交矩阵具有性质:

       A=(aij)B都是正交矩阵,则

   1°  , AB仍是正交矩阵.

   2°  detA=±1.

   3°      

                

       [(U)矩阵满足条件

的方阵A称为酉(U)矩阵.例如:

A=

是酉矩阵.酉矩阵具有性质:

       A=(aij)B都是酉矩阵,则

    1°  A-1,AB仍是酉矩阵.

    2°  det A·det=1.

    3°  A又是实方阵,则A是正交矩阵.

       [带型矩阵满足条件

aij=0    

的方阵A=(aij)称为带型矩阵.2m+1称为带宽.一般形式为

A=

       [三角矩阵满足条件

aij=0  (i>j)

的方阵A=(aij)称为上三角形矩阵,一般形式为

                              A=

满足条件

                            

的方阵称为下三角形矩阵,一般形式为

B=

       三角形矩阵具有性质:

       1°  任何秩为r的方阵C的前r个顺序的主子式不为0时,C可表为一个上三角形矩阵A与一个下三角形矩阵B的乘积,即

C=AB

       2°  上(或下)三角形矩阵的和积及数乘仍是上(或下)三角形矩阵.

       [分块矩阵用水平和垂直虚线将矩阵A中的元素的阵列分成小块(称为子阵),A就成为分块矩阵.例如

A==

式中

                 B11=B12=

                        B21=B22=

它们都是A的子阵.

       进行分块矩阵的运算时,可将子阵当作通常矩阵的元素看待.这些运算指加乘法数乘转置与共轭等.

       [分块对角矩阵主对角线上的子阵都是方阵,其余子阵都是零矩阵的分块矩阵称为分块对角矩阵.一般形式为

A=

分块对角矩阵A的逆矩阵A1A的行列式可以用下面简单公式求出

A1=

det A=det B11·det B22·...·det Bkk

       注意,一般分块矩阵的行列式不能用把子阵当作通常矩阵的元素的方法来计算,例如把四阶方阵化为分块矩阵

A==

一般det A=det B11·det B22det B21·det B12不成立(参见§1,二,3中的四阶行列式).

 

五、相似变换

 

       [相似变换如果有一非奇异矩阵X(即det X¹0)使得

B= AX

那末称矩阵A与矩阵B相似,也称A经相似变换化为B,记作A~B.它具有下列性质:

       1°  A~A,At~A.

       2°  A~B,B~A.

       3°  A~C,B~C,A~B.            

       4°   (A1+ A2+...+ Am)X=A1X+ A2X+ ...+ AmX

       5°   (A1 A2 ...Am)X=A1 X·A2 X·... ·Am X

       6°  AmX=( AX)m

       7°    为矩阵A的多项式,则

X=

       8°  A~B,则

       AB的秩相同,即rank A=rank B.

       AB的行列式相同,即det A=det B.

       AB的迹(定义见本节,七)相同,即tr A=tr B.

       AB具有相同的特征多项式和特征值(本节,七).

       [正交变换] Q为正交矩阵(即=Qt,则称

QtAQ

为矩阵A的正交变换,其性质与相似变换类似.特别还有性质:

对称矩阵A经正交变换后仍是对称矩阵.

[旋转变换取正交矩阵U

                                                          

Upq=(uij)=

 

upp=uqq=

upq=-uqp=

  uii=1         (i¹p,q)

                                  uij=0      (i,j¹p,q;i¹j)

这时称

B=

 

A的旋转变换,q称为旋转角,如果A是对称矩阵,那末B的元素bijA的元素aij

如下对应关系:
               

同时有性质:          

=

       若取旋转角

则旋转变换使

 

六、逆矩阵

 

       [逆矩阵及其性质若方阵A,B满足等式

AB=BA=I    (I为单位矩阵)

则称AB的逆矩阵,或称BA的逆矩阵,记作

A=   或B=

这时A,B都称为可逆矩阵(或非奇异矩阵,或满秩矩阵).否则称为不可逆矩阵(或奇异矩阵,或降秩矩阵).

可逆矩阵具有性质:

1°  A,B为可逆矩阵,则AB仍为可逆矩阵,且

     (反序定律)

一般地,若A1 ,A2 ,…,As为可逆矩阵,则

       2°  矩阵A可逆的充分必要条件是:det A¹0.

       3°  若矩阵A可逆,则

det¹0      det=(det

=A,             (a¹0)

=()t,           

       4°  矩阵A可逆的充分必要条件是:矩阵A的特征值全不为零.

       [伴随矩阵与逆矩阵表达式Aij为矩阵A=(aij)的第i行第j列元素aij的代数余子式,则矩阵

A*=

称为矩阵A的伴随矩阵.

       A为非奇异矩阵,即det A¹0,A的逆矩阵表达式为

       注意,A*的第i行第j列元素是A的第j行第i列元素的代数余子式.

       [对角矩阵的逆矩阵对角矩阵

D=,      di¹0   (i=1,2,...,n)

的逆矩阵为

D1=

       显然对角矩阵的逆矩阵仍是对角矩阵.

       [三角形矩阵的逆矩阵三角形矩阵

L=,         

的逆矩阵为

=P=

式中

                     (i=1,2,...,n)

           

                     

       显然非奇异下(上)三角形矩阵的逆矩阵仍是下(上)三角形矩阵.

       [正定矩阵的逆矩阵]

       1°  高斯—若当法

       正定矩阵A=(aij)的逆A1=(bij)可由下列递推公式求出:

,      ,       

         

                                         (k=1,2,...,n)

最后得到

式中n为该正定矩阵A的阶.

       2°  三角阵法  其步骤如下:

       1 把正定矩阵A=(aij)表示为

A=LDLt

式中D为实的非奇异对角矩阵

D=

L为实的非奇异下三角矩阵.

L=

LtL的转置矩阵.di(i=1,2,...,n)lij(i=2,...,n;j=1,…,n)由下面递推公式算出:

        

         

                

                   

          

       2)求出D的逆矩阵

=

       3)求出L的逆矩阵

=

式中

     

       4)求出A的逆矩阵

=(LD=()t

=

式中

               

       注意,这种方法的好处是避免了求平方根的运算.

       [分块矩阵的逆矩阵设非奇异矩阵A的分块矩阵为

A=

式中B11,B22为方子阵,那末A的逆矩阵

A1=

由下面公式求出

       [初等变换法求逆矩阵

===B

对矩阵

作一系列行的初等变换,使虚线左边一块矩阵化为单位矩阵,而右边一块单位矩阵就变为A的逆矩阵B=A1,

       [逆矩阵的近似求法为矩阵A的初始近似逆矩阵,可由下列迭代公式求出更精确的逆矩阵:

          (n=0,1,2,...)

式中I为与A同阶的单位矩阵.

       [计算机求逆程序的检验矩阵用下列n阶非奇异矩阵及其逆矩阵,来检验大矩阵求逆的计算程序.

A=


=

 

七、   特征值与特征矢量

 

       [特征值与特征矢量n阶方阵

 

A=

n维非零列矢量

=(a1,a2,...,an)t

如果有一个数λ,使得

Aα=λα

则称λ为矩阵A的特征值(特征根),α为矩阵A的特征值λ所对应的特征矢量.

       矩阵A的所有特征值中绝对值最大的一个称为A的第一特征值.

       [特征矩阵·特征多项式·特征方程n阶方阵

A=

的特征矩阵定义为

式中In阶单位矩阵.行列式|AλI|称为矩阵A的特征多项式,记作

jl=|λI|

方程

jl)=0

称为矩阵A的特征方程.

       [矩阵的迹与谱n阶方阵A的主对角线上各元素之和称为A的迹,记作

       特征方程jl)=0的n个根l1l2...ln就是矩阵An个特征值.集合{l1l2...ln }称为矩阵A的谱,记作chA.

       线性齐次方程组

的非零解a便是矩阵A的特征值li所对应的特征矢量.

       [特征值与特征矢量的性质

       1°  l1l2...lnn阶方阵An个特征值,则

          Ak的特征值为 k为正整数).

          A的逆矩阵A1的特征值为.

      A的伴随矩阵A*的特征值为.

       2°   n阶方阵An个特征值之和等于A的迹,矩阵An个特征值之积等于A的行列式,即

l1+l2+...+ln=a11+a22+...+ann

               l1l2...ln=

由此可以推出矩阵可逆的另一充分必要条件是:A的所有特征值都不为零.

       3°  li是特征方程的k重根,则对应于li的线性无关的特征矢量的个数不大于k.li为单根时,对应于li的线性无关特征矢量只有一个.

       4°  矩阵A的不同特征值所对应的特征矢量线性无关.

       n阶方阵A对应于特征值l1l2...ls的线性无关的特征矢量分别有k1,k2,...,ks个,则这个特征矢量线性无关,且.

    5°  实对称矩阵的特征值都是实数,并且有 n个线性无关(而且是正交)的特征矢量.

       6°  矩阵的特征值在相似变换下保持不变,特别,AtA具有相同的特征值.

       [求第一特征值的迭代法在实际问题中,往往不要求算出矩阵A的全部特征值,只需算出第一特征值,用迭代法计算如下:

              

       假定当时,可以认为a(k) a(m+1),那末迭代到即可.这时为矩阵A的第一特征值的近似值,a(m+1)为所对应的特征矢量.

       [求实对称矩阵的雅可比法] n阶实对称矩阵A=(aij)的特征值是l1l2...ln,则必存在一正交矩阵Q,使得

QtAQ=

为对角矩阵.正交矩阵Q可用一系列旋转矩阵的积来逼近:

Q=

式中

                    

       因为在这种旋转变换下,消去了矩阵中位于第p行第q(p¹q)交点上的元素(见本节,五),而矩阵所有元素的平方和保持不变,而且对角线上的元素的平方和增大,因而非对角线元素的平方和随之减小,因此,当旋转次数足够大时,可使非对角线元素的绝对值足够小.对于预先给定的精度e>0,如果aij<e(i¹j),则可认为aij0.于是得到求矩阵A的特征值与特征矢量的具体迭代方法.

       1°  按以下递推公式求特征值l1l2...ln

       假定当时,可以认为,则迭代到即可.而取作为li的近似值:

       2°  求特征矢量  

 

=

Pm=U1…Um-1Um

 

APm= Pm

所以Pm为特征矢量矩阵.

       Pm由下列递推公式算出:

 

最后得到     

 

          

 

为对应于特征值li的特征矢量的近似值.

       [求对称三对角矩阵特征值的方法]

       1°  相似变换法  An阶对称三对角矩阵:

 

                            A=                               (1)

经过相似变换

 

 

式中I为单位矩阵,tk为适当选定的常数,Ui为雅可比旋转矩阵:

Ui的转置矩阵.A1=AAk+1I相似,且Am相似.因此,若Am的特征值为,则A1的特征值li(i=1,2,...,n)

                      (i=1,2,…,n)

       假定当时,可认为,那末可适当选择sici,使得当m充分大时,Am在该精度下化为对角线矩阵;其特征值.

        (i=1,2,...,n)可由下列递推公式算出:

       tk的选择对收敛速度影响较大,取tk为二阶矩阵

的接近于的那个特征值,即

tk =

式中                         

       2°  二分法  An阶对称三对角矩阵(如(1)式),对任意l,设序列

q1(l)=d1-l

qi(l)=

qi(l)<0的个数为N(l)(在这些关系式中,对于某些i,如果qi-1(l)=0,则只需用适当小的数代替即可),则N(l)等于矩阵A 的小于l的特征值的个数.

假定矩阵A的第k个特征值lk(l1l2 lkln) 在区间[u,]中,令 ,N(r1)k时,则lkÎ[u, r1];当N(r1)<k时,则lkÎ[ r1,v];…依此类推,m步之后,lk包含在宽度为的区间中.m充分大时,便可得到所求的特征值.

 

八、矩阵多项式与最小多项式

 

       [矩阵多项式] (i=1,2,...,n)为某一数域(实数域或复数域)中的数,A为这个数域上的n阶方阵,则表示式

f(A)=a0I+a1A+...+anAn

称为矩阵A的多项式,式中In阶单位矩阵.

       如果矩阵A使得

f(A)=O

那末称A为多项式

f(l)=a0l+ a1l+ ...+anln

的根.

       [哈密顿-凯莱定理] 任一方阵都是它的特征多项式的根.

       [最小多项式及其性质] 以矩阵A为根的非零多项式f(l)中,存在首项系数为1次数最低的多项式j (l),它就称为矩阵A的最小多项式.

       最小多项式具有性质:

       1°  任一方阵仅有一个最小多项式;

       2°  任一以A为根的多项式f(l)都可被A的最小多项式j (l)所整除.特别,任一方阵的最小多项式可整除其特征多项式;

       3°  方阵A的特征多项式的根都是A的最小多项式的根:

       4°  相似矩阵具有相同的特征多项式和最小多项式.