Обращение прямоугольных матриц. Псевдообратная матрица.
Если А — квадратная и невырожденная матрица, то для неё существует обратная матрица А -1. Если же А — не квадратная, а прямоугольная m?n – матрица (m ? n) или квадратная, но вырожденная, то матрица А не имеет обратной и символ А -1не имеет смысла. Однако, как будет показано далее, для произвольной прямоугольной матрицы А существует «псевдообратная» матрица А+, которая обладает некоторыми свойствами обратной матрицы и имеет важные применения при решении системы линейных уравнений. В случае, когда А –квадратная невырожденная матрица, псевдообратная матрица А+ совпадает с обратной А -1).1
1. Скелетное разложение матрицы.
В дальнейшем мы будем пользоваться представлением произвольной прямоугольной m?n – матрицы А = || аik || ранга r в виде произведения двух матриц В и С, имеющих соответственно размеры m ? r и r ? n:
( r = rA ). (1)
Здесь ранги сомножителей В и С обязательно равны рангу произведения А, rВ = rс = r. Действительно, r rВ, rс. Но ранги rВ и rс не могут превосходить r, так как r – один из размеров матриц В и С. Поэтому rВ = rс = r.
Для того чтобы получить разложение (1), достаточно в качестве столбцов матрицы В взять любые r линейно независимых столбцов матрицы А, либо любые r линейно независимых столбцов, через которые линейно выражаются столбцы матрицы А.2 Тогда произвольный j-й столбец матрицы А будет линейной комбинацией столбцов матрицы В с коэффициентами c1j, c2j, …, crj ; эти коэффициенты и образуют j-й столбец матрицы С ( j = 1, …, n ).3
1) Определение псевдообратной матрицы было дано в 1920 г. Муром, указавшим на важные применения этого понятия. Позже независимо от Мура в несколько иной форме псевдообратная матрица определялась и исследовалась в работах Бьерхаммара, Пенроуза и других авторов.
2) Мы исходим из известного положения: в матрице А ранга r имеется r линейно независимых столбцов, через которые линейно (т. е. в виде линейных комбинаций с числовыми коэффициентами из данного поля) выражаются все остальные столбцы. Аналогичное утверждение имеет место и для строк.
3) Совершенно так же строками матрицы С могут быть любые r строк, через которые выражаются в виде линейных комбинаций все строки матрицы А. Тогда коэффициенты этих линейных комбинаций образуют строки матрицы В.
Поскольку матрицы В и С имеют максимально возможный ранг r, то квадратные матрицы В*В и СС* являются невырожденными:
| В*В | ? 0, | СС* | ? 0. (2)
Действительно, пусть столбец x – произвольное решение уравнения
В*Вx = 0. (3)
Умножим это уравнение слева на строку х*. Тогда х*В*Вx = (Вх)*Вх = 0. Отсюда следует Вх = 0 и (поскольку Вx – линейная комбинация линейно независимых столбцов матрицы В); x = 0. Из того, что уравнение (3) имеет только нулевое решение х = 0, вытекает, что | В*В | ? 0. Аналогично устанавливается второе неравенство (2).1 Разложение (1) будем называть скелетным разложением матрицы А.
1) Неравенства (2) также непосредственно следует из формулы Бине – Коши. Согласно этой формуле определитель | В*В | (| СС* | ) равен сумме квадратов модулей всех миноров r – го порядка матрицы В (соответственно С).
2. Существование и единственность псевдообратной матрицы.
Рассмотрим матричное уравнение:
АХА = А. (4)
Если А – квадратная невырожденная матрица, то это уравнение имеет единственное решение Х = А-1. Если же А – произвольная прямоугольная m?n –матрица, то искомое решение Х имеет размеры n?m, но не определяется однозначно. В общем случае уравнение (4) имеет бесчисленное множество решений. Ниже будет показано, что среди этих решений имеется только одно, обладающее тем свойством, что его строки и столбцы являются линейными комбинациями соответственно строк и столбцов сопряженной матрицы А*. Именно это решение мы будем называть псевдообратной матрицей для А и обозначать через А+.
Матрица А+ размеров n?m называется псевдообратной для m?n – матрицы А, если выполняются равенства 1.
АА+А = А, (5)
А+ = UА* = А*V, (6)
где U и V – некоторые матрицы.
Докажем сначала, что для данной матрицы А не может существовать двух различных псевдообратных матриц А1+ и А2+. Действительно,
из равенств
АА1+А = АА2+А = А, А1+ = U1А* = А*V1, А2+ = U2А* = А*V2,
полагая D = А2+ – А1+, U = U2 – U1, V = V2 – V1;
Найдём: АDА = 0, D = UА* = А*V. Отсюда (DА)*DА = А*D*DА = А*V*АDА = 0 и, следовательно DА = 0. Но тогда DD* = DАU* = 0, т.е. D = А2+ – А1+ = 0.
Для того чтобы установить существование матрицы А+, мы воспользуемся скелетным разложением (1) и будем искать сначала псевдообратные матрицы В+ и С+.2 Так как по определению должны иметь место равенства:
ВВ+В = В, В+ = В* , (7)
где – некоторая матрица, то ВВ*В = В.
1) Условия (6) означают, что строки (столбцы) матрицы А+ являются линейными комбинациями строк (столбцов) матрицы А*.
2) Из определения сразу следует, что если А = 0, то и А+ = 0. Поэтому в дальнейшем предполагается, что А ? 0, и потому r = rA > 0.
Умножая слева на В* и замечая, что В*В – невырожденная квадратная матрица, найдём: = (В*В)-1.
Но тогда второе из равенств (7) даёт искомое выражение для В+:
В+ = (В*В)-1В*. (8)
Совершенно аналогично найдем:
С+ = С*(СС*)-1. (9)
Покажем теперь, что матрица
А+ = С+В+ = С*(СС*)-1(В*В)-1В* (10)
удовлетворяет
условиям (5), (6) и, следовательно, является
псевдо-
обратной
матрицей для А.
В самом деле,
АА+А = ВСС*(СС*)-1(В*В)-1В*ВС = ВС = А.
С другой стороны, из равенств (8) – (10) с учётом равенства А* = С*В*, полагая К = (СС*)-1(В*В)-1, находим:
А+ = С*КВ* = С*К(СС*)-1СС*В* = UС*В* = UА*,
А+ = С*КВ* = С*В*В(В*В)-1КВ* = С*В*V = А*V,
где U = С*К(СС*)-1С, V = В(В*В)-1КВ*.
Таким образом доказано, что для произвольной прямоугольной матрицы А существует одна и только одна псевдообратная матрица А+, которая определяется формулой (10), где В и С – сомножители в скелетном разложении А = ВС матрицы А.1 Из самого определения псевдообратной матрицы непосредственно следует, что в случае квадратной невырожденной матрицы A псевдообратная матрица A+ совпадает с обратной А-1 .
П Р И М Е Р. Пусть:
.
Здесь r = 2. Примем в качестве столбцов матрицы В первые два столбца матрицы А.
1) Разложение (1) не определяет однозначно сомножителей ВС. Однако поскольку, как было доказано, существует только одна псевдообратная матрипа А+ , формула (10) при всех скелетных разложениях матрицы А даёт одно и то же значение для А+.
Тогда: ,
и В*В = , (В*В)-1 = ,
СС* = (СС*)-1 =
Поэтому согласно формуле (10):
А+ = , = .
3. Свойства псевдообратной матрицы.
Отметим следующие свойства псевдообратной матрицы:
(А*)+ = (А+)*;
(А+)+ = А;
(АА+)* = АА+, (АА+)2 = АА+;
(А+А)* = А+А, (А+А)2 = А+А.
Первое свойство означает, что операции перехода к сопряжённой и к псевдообратной матрице перестановочны между собой. Равенство 2 выражает собой взаимность понятия псевдообратной матрицы, так как, согласно 2, псевдообратной матрицей для А+ является исходная матрица А. Согласно равенствам 3 и 4 матрицы АА+ и А+А являются эрмитовыми и инволютивными (квадрат каждой из этих матриц равен самой матрице).
Для вывода равенства 1 воспользуемся скелетным разложением (1):
А = ВС. Тогда равенство А* = С*В* даёт скелетное разложение матрицы А*.
Поэтому, заменяя в формуле (10) матрицу В на С*, а матрицу С на В*, получим:
(А*)+ = В(В*В)-1(СС*)-1С = [С*(СС*)-1(В*В)-1В*]* = (А+)*.
Равенства А+ = С+В+, В+ = (В*В)-1В*, С+ = С*(СС*)-1 являются скелетными разложениями. Следовательно,
(А+)+ = (В+)+ (С+)+ = (В*)+ В* ВСС* (С*)+.
Используя свойство 1, а также выражения для В+ и С+, найдем:
(А+)+ = В(В*В)-1В*ВСС*(СС*)-1С = ВС = А.
Справедливость равенств 3 и 4 проверяется непосредственно путём подстановки в эти равенства вместо А+ соответствующего выражения из формулы (10).
Заметим, что в общем случае, когда разложение А = ВС не является скелетным, не всегда имеет место равенство А+ = С+В+. Так, например, = ВС. Здесь А+ = А-1 = ,
В+ = = ()+ = = , С+ = = = = .
С+В+ = ? А+.
4. Наилучшее приближённое решение.
(по методу наименьших квадратов). Рассмотрим произвольную систему линейных уравнений:
(11)
или в матричной записи:
Ах = у. (12)
Здесь у1, у2, …, уm – заданные числа, а х1, х2, …, хn – искомые.
В общем случае система (11) может быть и несовместной. Столбец
х0 = (,, …, ) (13)
называется наилучшим приближённым решением системы (11), если при значениях х1 = , х2 = , …, хn = «квадратичное отклонение»
| у – Ах |2 = (14)
достигает своего наименьшего значения и среди всех столбцов х, для которых это отклонение имеет минимальное значение, столбец х0 имеет наименьшую «длину», т. е. для этого столбца величина
| х2| = х*х = (15)
имеет наименьшее значение.
Покажем, что система (11) всегда имеет одно и только одно наилучшее приближённое решение и это приближённое решение определяется по формуле:
х0 = А+у , (16)
где А+ – псевдообратная матрица для матрицы А.
Для этого рассмотрим произвольный столбец х и положим:
у – Ах = u + v,
где u = у – Ах0 = у – АА +у, v = А( х0 – х ). (17)
Тогда получим:
| у – Ах |2 = (у – Ах)*(у – Ах) = (u + v)*(u + v) = u*u + v*u + u*v + v*v. (18)
Но:
v*u = ( х0 – х )*А*( у – АА+у) = ( х0 – х )*( А* – А* АА +)у. (19)
Исходя из разложения (1) и формулы (10), найдем:
А*АА+ = С*В*ВСС*(СС*)-1(В*В)-1В* = С*В* = А*,
Поэтому из равенства (19) следует:
v*u = 0, (20)
но тогда и u*v = (v*u)* = 0. (21)
Поэтому из равенства (18) находим:
| у – Ах |2 =| u |2 + | v |2 = | у – Ах0 |2 + | А( х0 – х ) |2, (22)
И, следовательно, для любого столбца х:
| у – Ах | | у – Ах0 |, (23)
Пусть теперь: | у – Ах | = | у – Ах0 |;
тогда, согласно равенству (22),
Аz = 0, (24)
где z = х – х0.
С другой стороны, | х2| = (х0 + z)*(х0 + z) = | х0|2 + | z |2 + (х0)*z + z*х0. (25)
Вспоминая, что A+ = А*V, получим в силу (24):
(х0)*z = (А+y)*z = (А*Vy)*z = y*V*Аz = 0. (26)
Но тогда и z*х0 = ((х0)*z)* = 0.
Поэтому из равенства (25) находим:
| х2| = | х0|2 + | z |2
И, следовательно,
| х2| | х0|2, (27)
причём знак = имеет место только при z = 0, т.е. при х = х0, где х0 = А+y.
Пример. Найти наилучшее приближённое решение (по методу наименьших квадратов) системы линейных уравнений:
х1 - х2 + 2х3 = 3,
- х1 + 2х2 – 3х3 + х4 = 6,
х2 - х3 + х4 = 0.
Здесь:
.
Но тогда:
,
И потому:
.
Следовательно, = 1, = 1, = 0, = 2.
Определим норму m ? n – матрицы A = как неотрицательное число, задаваемое формулой:
. (28)
При этом очевидно, что:
(29)
Рассмотрим матричное уравнение:
АХ= У, (30)
где А и У – заданные m ? n и m ? р – матрицы, а Х – искомая n ? р – матрица.
Определим наилучшее приближённое решение Х0 уравнения (30) из условия:
причем в случае, когда:
требуется чтобы: .
Из соотношений: , (31)
(32)
следует, что k-й столбец искомой матрицы Х0·k должен быть наилучшим
приближённым решением системы линейных уравнений:
А Х·k = У·k .
Поэтому: Х0·k = А+У·k .
Поскольку это равенство справедливо при любом k = 1, ..., р, то
Х0 = А+У. (33)
Таким образом, уравнение (30) всегда имеет одно и только одно наилучшее приближённое решение, определяемое формулой (33).
В частном случае, когда У = Е – единичная матрица m-го порядка, имеем X0=А+. Следовательно, псевдообратная матрица А+ является наилучшим приближённым решением (по методу наименьших квадратов) матричного уравнения:
АХ = Е.
Это свойство псевдообратной матрицы А+ может быть принято в качества её определения.
5. Метод Гревилля последовательного нахождения псевдообратной матрицы.
Пусть аk – k-й столбец в m ? n – матрице А, Аk = ( а1, …, аk ) – матрица, образованная первыми k столбцами матрицы А, bk – последняя строка в матрице Аk+( k = 1, …, n, A1 = a1, An = A)
Тогда: Аk+ = а1+ = (34)
и для k > 1 имеют место рекуррентные формулы:
Аk+ = , Вk = – dkbk , dk = аk ; (35)
При этом, если сk = аk –dk ? 0, то
bk = = ( аk –dk )+ ; (36)
если же сk = 0, т.е. аk =dk , то
bk = ( 1 + dk*dk )-1dk*. (37)
Далее проверим, что матрица является псевдообратной для матрицы Аk+, если матрица Вk и строка bk определяются формулами (28)—(32). Этот метод не требует вычисления детерминантов и может быть использован для вычисления обратной матрицы.
П р и м е р. Пусть
Заметим, что для каждой вещественной матрицы М мы можем писать М' вместо М*.
Тогда = = ,
d2 = = , c2 – a2 – A1d2 = ,
= ,
B2 = .
Таким образом,
.
Далее:
и
Поэтому:
и