Вход

Псевдообратные матрицы

Реферат по математике
Дата добавления: 10 декабря 2005
Язык реферата: Русский
Word, rtf, 1.3 Мб (архив zip, 82 кб)
Реферат можно скачать бесплатно
Скачать
Данная работа не подходит - план Б:
Создаете заказ
Выбираете исполнителя
Готовый результат
Исполнители предлагают свои условия
Автор работает
Заказать
Не подходит данная работа?
Вы можете заказать написание любой учебной работы на любую тему.
Заказать новую работу



Обращение прямоугольных матриц. Псевдообратная матрица.

Если А — квадратная и невырожденная матрица, то для неё сущест­вует обратная матрица А -1. Если же А — не квадратная, а прямоуголь­ная m?n – матрица (m ? n) или квадратная, но вырожденная, то матри­ца А не имеет обратной и символ А -1не имеет смысла. Однако, как будет показано далее, для произвольной прямоугольной матрицы А су­ществует «псевдообратная» матрица А+, которая обладает некоторыми свойствами обратной матрицы и имеет важные применения при решении системы линейных уравнений. В случае, когда А –квадратная невырож­денная матрица, псевдообратная матрица А+ совпадает с обратной А -1).1

1. Скелетное разложение матрицы.

В дальнейшем мы будем пользоваться представлением произвольной прямоугольной m?n – матрицы А = || аik || ранга r в виде произведения двух матриц В и С, имеющих соответственно размеры m ? r и r ? n:


( r = rA ). (1)

Здесь ранги сомножителей В и С обязательно равны рангу произведе­ния А, rВ = rс = r. Действительно, r rВ, rс. Но ранги rВ и rс не могут превосходить r, так как r – один из размеров матриц В и С. Поэтому rВ = rс = r.

Для того чтобы получить разложение (1), достаточно в качестве столбцов матрицы В взять любые r линейно независимых столбцов матрицы А, либо любые r линейно независимых столбцов, через кото­рые линейно выражаются столбцы матрицы А.2 Тогда произвольный j-й столбец матрицы А будет линейной комбинацией столбцов матрицы В с коэффициентами c1j, c2j, …, crj ; эти коэффициенты и образуют j-й столбец матрицы С ( j = 1, …, n ).3

1) Определение псевдообратной матрицы было дано в 1920 г. Муром, указавшим на важные применения этого понятия. Позже независимо от Мура в несколько иной форме псевдообратная матрица определялась и исследовалась в работах Бьерхаммара, Пенроуза и других авторов.

2) Мы исходим из известного положения: в матрице А ранга r имеется r линейно независимых столбцов, через которые линейно (т. е. в виде линейных комбинаций с число­выми коэффициентами из данного поля) выражаются все остальные столбцы. Анало­гичное утверждение имеет место и для строк.

3) Совершенно так же строками матрицы С могут быть любые r строк, через которые выражаются в виде линейных комбинаций все строки матрицы А. Тогда коэф­фициенты этих линейных комбинаций образуют строки матрицы В.

Поскольку матрицы В и С имеют максимально возможный ранг r, то квадратные матрицы В*В и СС* являются невырожденными:

| В*В | ? 0, | СС* | ? 0. (2)

Действительно, пусть столбец x – произвольное решение уравнения

В*Вx = 0. (3)

Умножим это уравнение слева на строку х*. Тогда х*В*Вx = (Вх)*Вх = 0. Отсюда следует Вх = 0 и (поскольку Вx – линейная комбинация линейно независимых столбцов матрицы В); x = 0. Из того, что уравнение (3) имеет только нулевое решение х = 0, выте­кает, что | В*В | ? 0. Аналогично устанавливается второе неравенство (2).1 Разложение (1) будем называть скелетным разложением матрицы А.




















1) Неравенства (2) также непосредственно следует из формулы Бине – Коши. Согласно этой формуле определитель | В*В | (| СС* | ) равен сумме квадратов модулей всех миноров r – го порядка матрицы В (соответственно С).


2. Существование и единственность псевдообратной матрицы.

Рассмотрим матричное уравнение:

АХА = А. (4)

Если А – квадратная невырожденная матрица, то это уравнение имеет единственное решение Х = А-1. Если же А – произвольная прямоуголь­ная m?n –матрица, то искомое решение Х имеет размеры n?m, но не определяется однозначно. В общем случае уравнение (4) имеет бес­численное множество решений. Ниже будет показано, что среди этих решений имеется только одно, обладающее тем свойством, что его строки и столбцы являются линейными комбинациями соответственно строк и столбцов сопряженной матрицы А*. Именно это решение мы будем называть псевдообратной матрицей для А и обозначать через А+.

Матрица А+ размеров n?m называется псевдо­обратной для m?n – матрицы А, если выполняются равенства 1.

АА+А = А, (5)

А+ = UА* = А*V, (6)

где U и V – некоторые матрицы.

Докажем сначала, что для данной матрицы А не может существо­вать двух различных псевдообратных матриц А1+ и А2+. Действительно,

из равенств

АА1+А = АА2+А = А, А1+ = U1А* = А*V1, А2+ = U2А* = А*V2,

полагая D = А2+ – А1+, U = U2 – U1, V = V2 – V1;

Найдём: АDА = 0, D = UА* = А*V. Отсюда (DА)*DА = А*D*DА = А*V*АDА = 0 и, следовательно DА = 0. Но тогда DD* = DАU* = 0, т.е. D = А2+ – А1+ = 0.

Для того чтобы установить существование матрицы А+, мы восполь­зуемся скелетным разложением (1) и будем искать сначала псевдообратные матрицы В+ и С+.2 Так как по определению должны иметь место равенства:

ВВ+В = В, В+ = В* , (7)

где – некоторая матрица, то ВВ*В = В.

1) Условия (6) означают, что строки (столбцы) матрицы А+ являются линейными комбинациями строк (столбцов) матрицы А*.

2) Из определения сразу следует, что если А = 0, то и А+ = 0. Поэтому в дальнейшем предполагается, что А ? 0, и потому r = rA > 0.

Умножая слева на В* и замечая, что В*В – невырожденная квадратная матрица, найдём: = (В*В)-1.

Но тогда второе из равенств (7) даёт искомое выражение для В+:

В+ = (В*В)-1В*. (8)

Совершенно аналогично найдем:

С+ = С*(СС*)-1. (9)

Покажем теперь, что матрица

А+ = С+В+ = С*(СС*)-1*В)-1В* (10)

удовлетворяет условиям (5), (6) и, следовательно, является псевдо-
обратной матрицей для А.

В самом деле,

АА+А = ВСС*(СС*)-1*В)-1В*ВС = ВС = А.

С другой стороны, из равенств (8) – (10) с учётом равенства А* = С*В*, полагая К = (СС*)-1*В)-1, находим:

А+ = С*КВ* = С*К(СС*)-1СС*В* = UС*В* = UА*,

А+ = С*КВ* = С*В*В(В*В)-1КВ* = С*В*V = А*V,

где U = С*К(СС*)-1С, V = В(В*В)-1КВ*.

Таким образом доказано, что для произвольной прямоугольной матрицы А существует одна и только одна псевдообратная матрица А+, которая определяется формулой (10), где В и С – сомножители в скелетном разложении А = ВС матрицы А.1 Из самого определения псевдообрат­ной матрицы непосредственно следует, что в случае квадратной невырож­денной матрицы A псевдообратная матрица A+ совпадает с обратной А-1 .

П Р И М Е Р. Пусть:

.

Здесь r = 2. Примем в качестве столбцов матрицы В первые два столбца матрицы А.

1) Разложение (1) не определяет однозначно сомножителей ВС. Однако поскольку, как было доказано, существует только одна псевдообратная матрипа А+ , формула (10) при всех скелетных разложениях матрицы А даёт одно и то же значение для А+.

Тогда: ,

и В*В = , (В*В)-1 = ,

СС* = (СС*)-1 =

Поэтому согласно формуле (10):

А+ = , = .



















3. Свойства псевдообратной матрицы.

Отметим следующие свойства псевдообратной матрицы:

  1. *)+ = (А+)*;

  2. +)+ = А;

  3. (АА+)* = АА+, (АА+)2 = АА+;

  4. +А)* = А+А, (А+А)2 = А+А.

Первое свойство означает, что операции перехода к сопряжённой и к псевдообратной матрице перестановочны между собой. Равенство 2 выражает собой взаимность понятия псевдообратной матрицы, так как, согласно 2, псевдообратной матрицей для А+ является исходная матрица А. Согласно равенствам 3 и 4 матрицы АА+ и А+А являются эрмитовыми и инволютивными (квадрат каждой из этих матриц равен самой матрице).

Для вывода равенства 1 воспользуемся скелетным разложением (1):

А = ВС. Тогда равенство А* = С*В* даёт скелетное разложение матрицы А*.

Поэтому, заменяя в формуле (10) матрицу В на С*, а матрицу С на В*, получим:

*)+ = В(В*В)-1(СС*)-1С = [С*(СС*)-1*В)-1В*]* = (А+)*.

Равенства А+ = С+В+, В+ = (В*В)-1В*, С+ = С*(СС*)-1 являются скелет­ными разложениями. Следовательно,

+)+ = (В+)++)+ = (В*)+ В* ВСС**)+.

Используя свойство 1, а также выражения для В+ и С+, найдем:

+)+ = В(В*В)-1В*ВСС*(СС*)-1С = ВС = А.

Справедливость равенств 3 и 4 проверяется непосредственно путём подстановки в эти равенства вместо А+ соответствующего выражения из формулы (10).

Заметим, что в общем случае, когда разложение А = ВС не является скелетным, не всегда имеет место равенство А+ = С+В+. Так, например, = ВС. Здесь А+ = А-1 = ,

В+ = = ()+ = = , С+ = = = = .

С+В+ = ? А+.

4. Наилучшее приближённое решение.

(по методу наименьших квадратов). Рассмотрим произвольную систему линейных уравнений:

(11)

или в матричной записи:

Ах = у. (12)

Здесь у1, у2, …, уm – заданные числа, а х1, х2, …, хn – искомые.

В общем случае система (11) может быть и несовместной. Столбец

х0 = (,, …, ) (13)

называется наилучшим приближённым решением системы (11), если при значениях х1 = , х2 = , …, хn = «квадратичное отклонение»

| у – Ах |2 = (14)

достигает своего наименьшего значения и среди всех столбцов х, для которых это отклонение имеет минимальное значение, столбец х0 имеет наименьшую «длину», т. е. для этого столбца величина

| х2| = х*х = (15)

имеет наименьшее значение.

Покажем, что система (11) всегда имеет одно и только одно наилучшее приближённое решение и это приближённое решение определяется по формуле:

х0 = А+у , (16)

где А+ – псевдообратная матрица для матрицы А.

Для этого рассмотрим произвольный столбец х и положим:

у – Ах = u + v,

где u = у – Ах0 = у – АА +у, v = А( х0 – х ). (17)

Тогда получим:

| у – Ах |2 = (у – Ах)*(у – Ах) = (u + v)*(u + v) = u*u + v*u + u*v + v*v. (18)

Но:

v*u = ( х0 – х )*А*( у – АА+у) = ( х0 – х )*( А* – А* АА +)у. (19)

Исходя из разложения (1) и формулы (10), найдем:

А*АА+ = С*В*ВСС*(СС*)-1*В)-1В* = С*В* = А*,

Поэтому из равенства (19) следует:

v*u = 0, (20)

но тогда и u*v = (v*u)* = 0. (21)

Поэтому из равенства (18) находим:

| у – Ах |2 =| u |2 + | v |2 = | у – Ах0 |2 + | А( х0 – х ) |2, (22)

И, следовательно, для любого столбца х:

| у – Ах | | у – Ах0 |, (23)

Пусть теперь: | у – Ах | = | у – Ах0 |;

тогда, согласно равенству (22),

Аz = 0, (24)

где z = х – х0.

С другой стороны, | х2| = (х0 + z)*0 + z) = | х0|2 + | z |2 + (х0)*z + z*х0. (25)

Вспоминая, что A+ = А*V, получим в силу (24):

0)*z = (А+y)*z = (А*Vy)*z = y*V*Аz = 0. (26)

Но тогда и z*х0 = ((х0)*z)* = 0.

Поэтому из равенства (25) находим:

| х2| = | х0|2 + | z |2

И, следовательно,

| х2| | х0|2, (27)

причём знак = имеет место только при z = 0, т.е. при х = х0, где х0 = А+y.

Пример. Найти наилучшее приближённое решение (по методу наименьших квадратов) системы линейных уравнений:

х1 - х2 + 2х3 = 3,

- х1 + 2х2 – 3х3 + х4 = 6,

х2 - х3 + х4 = 0.

Здесь:

.

Но тогда:

,


И потому:

.

Следовательно, = 1, = 1, = 0, = 2.

Определим норму m ? n – матрицы A = как неотрицательное число, задаваемое формулой:

. (28)

При этом очевидно, что:

(29)


Рассмотрим матричное уравнение:

АХ= У, (30)

где А и У – заданные m ? n и m ? р – матрицы, а Х – искомая n ? р – матрица.

Определим наилучшее приближённое решение Х0 уравнения (30) из условия:

причем в случае, когда:

требуется чтобы: .

Из соотношений: , (31)

(32)

следует, что k-й столбец искомой матрицы Х0·k должен быть наилучшим

приближённым решением системы линейных уравнений:

А Х·k = У·k .

Поэтому: Х0·k = А+У·k .

Поскольку это равенство справедливо при любом k = 1, ..., р, то

Х0 = А+У. (33)

Таким образом, уравнение (30) всегда имеет одно и только одно наилуч­шее приближённое решение, определяемое формулой (33).

В частном случае, когда У = Е – единичная матрица m-го порядка, имеем X0+. Следовательно, псевдообратная матрица А+ является наилучшим приближённым решением (по методу наименьших квадратов) матричного уравнения:

АХ = Е.

Это свойство псевдообратной матрицы А+ может быть принято в качества её определения.
















5. Метод Гревилля последовательного нахождения псевдообратной матрицы.

Пусть аkk-й столбец в m ? n – матрице А, Аk = ( а1, …, аk ) – матрица, образованная первыми k столбцами матрицы А, bk – последняя строка в матрице Аk+( k = 1, …, n, A1 = a1, An = A)

Тогда: Аk+ = а1+ = (34)

и для k > 1 имеют место рекуррентные формулы:

Аk+ = , Вk = dkbk , dk = аk ; (35)

При этом, если сk = аkdk ? 0, то

bk = = ( аk dk )+ ; (36)

если же сk = 0, т.е. аk =dk , то

bk = ( 1 + dk*dk )-1dk*. (37)

Далее проверим, что матрица является псевдо­обратной для матрицы Аk+, если матрица Вk и строка bk определяются формулами (28)—(32). Этот метод не требует вычисления детерминантов и может быть использован для вычисления обратной матрицы.

П р и м е р. Пусть

Заметим, что для каждой вещественной матрицы М мы можем писать М' вместо М*.

Тогда = = ,

d2 = = , c2 – a2 – A1d2 = ,

= ,

B2 = .

Таким образом,

.

Далее:

и

Поэтому:

и

5



© Рефератбанк, 2002 - 2017