Вход

Псевдообратные матрицы

Реферат* по математике
Дата добавления: 10 декабря 2005
Язык реферата: Русский
Word, rtf, 1.3 Мб (архив zip, 82 кб)
Реферат можно скачать бесплатно
Скачать
Данная работа не подходит - план Б:
Создаете заказ
Выбираете исполнителя
Готовый результат
Исполнители предлагают свои условия
Автор работает
Заказать
Не подходит данная работа?
Вы можете заказать написание любой учебной работы на любую тему.
Заказать новую работу
* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.
Очень похожие работы
Найти ещё больше



Обращение прямоугольных матриц. Псевдообратная матрица.

Если А — квадратная и невырожденная матрица, то для неё сущест­вует обратная матрица А -1. Если же А — не квадратная, а прямоуголь­ная m?n – матрица (m ? n) или квадратная, но вырожденная, то матри­ца А не имеет обратной и символ А -1не имеет смысла. Однако, как будет показано далее, для произвольной прямоугольной матрицы А су­ществует «псевдообратная» матрица А+, которая обладает некоторыми свойствами обратной матрицы и имеет важные применения при решении системы линейных уравнений. В случае, когда А –квадратная невырож­денная матрица, псевдообратная матрица А+ совпадает с обратной А -1).1

1. Скелетное разложение матрицы.

В дальнейшем мы будем пользоваться представлением произвольной прямоугольной m?n – матрицы А = || аik || ранга r в виде произведения двух матриц В и С, имеющих соответственно размеры m ? r и r ? n:


( r = rA ). (1)

Здесь ранги сомножителей В и С обязательно равны рангу произведе­ния А, rВ = rс = r. Действительно, r rВ, rс. Но ранги rВ и rс не могут превосходить r, так как r – один из размеров матриц В и С. Поэтому rВ = rс = r.

Для того чтобы получить разложение (1), достаточно в качестве столбцов матрицы В взять любые r линейно независимых столбцов матрицы А, либо любые r линейно независимых столбцов, через кото­рые линейно выражаются столбцы матрицы А.2 Тогда произвольный j-й столбец матрицы А будет линейной комбинацией столбцов матрицы В с коэффициентами c1j, c2j, …, crj ; эти коэффициенты и образуют j-й столбец матрицы С ( j = 1, …, n ).3

1) Определение псевдообратной матрицы было дано в 1920 г. Муром, указавшим на важные применения этого понятия. Позже независимо от Мура в несколько иной форме псевдообратная матрица определялась и исследовалась в работах Бьерхаммара, Пенроуза и других авторов.

2) Мы исходим из известного положения: в матрице А ранга r имеется r линейно независимых столбцов, через которые линейно (т. е. в виде линейных комбинаций с число­выми коэффициентами из данного поля) выражаются все остальные столбцы. Анало­гичное утверждение имеет место и для строк.

3) Совершенно так же строками матрицы С могут быть любые r строк, через которые выражаются в виде линейных комбинаций все строки матрицы А. Тогда коэф­фициенты этих линейных комбинаций образуют строки матрицы В.

Поскольку матрицы В и С имеют максимально возможный ранг r, то квадратные матрицы В*В и СС* являются невырожденными:

| В*В | ? 0, | СС* | ? 0. (2)

Действительно, пусть столбец x – произвольное решение уравнения

В*Вx = 0. (3)

Умножим это уравнение слева на строку х*. Тогда х*В*Вx = (Вх)*Вх = 0. Отсюда следует Вх = 0 и (поскольку Вx – линейная комбинация линейно независимых столбцов матрицы В); x = 0. Из того, что уравнение (3) имеет только нулевое решение х = 0, выте­кает, что | В*В | ? 0. Аналогично устанавливается второе неравенство (2).1 Разложение (1) будем называть скелетным разложением матрицы А.




















1) Неравенства (2) также непосредственно следует из формулы Бине – Коши. Согласно этой формуле определитель | В*В | (| СС* | ) равен сумме квадратов модулей всех миноров r – го порядка матрицы В (соответственно С).


2. Существование и единственность псевдообратной матрицы.

Рассмотрим матричное уравнение:

АХА = А. (4)

Если А – квадратная невырожденная матрица, то это уравнение имеет единственное решение Х = А-1. Если же А – произвольная прямоуголь­ная m?n –матрица, то искомое решение Х имеет размеры n?m, но не определяется однозначно. В общем случае уравнение (4) имеет бес­численное множество решений. Ниже будет показано, что среди этих решений имеется только одно, обладающее тем свойством, что его строки и столбцы являются линейными комбинациями соответственно строк и столбцов сопряженной матрицы А*. Именно это решение мы будем называть псевдообратной матрицей для А и обозначать через А+.

Матрица А+ размеров n?m называется псевдо­обратной для m?n – матрицы А, если выполняются равенства 1.

АА+А = А, (5)

А+ = UА* = А*V, (6)

где U и V – некоторые матрицы.

Докажем сначала, что для данной матрицы А не может существо­вать двух различных псевдообратных матриц А1+ и А2+. Действительно,

из равенств

АА1+А = АА2+А = А, А1+ = U1А* = А*V1, А2+ = U2А* = А*V2,

полагая D = А2+ – А1+, U = U2 – U1, V = V2 – V1;

Найдём: АDА = 0, D = UА* = А*V. Отсюда (DА)*DА = А*D*DА = А*V*АDА = 0 и, следовательно DА = 0. Но тогда DD* = DАU* = 0, т.е. D = А2+ – А1+ = 0.

Для того чтобы установить существование матрицы А+, мы восполь­зуемся скелетным разложением (1) и будем искать сначала псевдообратные матрицы В+ и С+.2 Так как по определению должны иметь место равенства:

ВВ+В = В, В+ = В* , (7)

где – некоторая матрица, то ВВ*В = В.

1) Условия (6) означают, что строки (столбцы) матрицы А+ являются линейными комбинациями строк (столбцов) матрицы А*.

2) Из определения сразу следует, что если А = 0, то и А+ = 0. Поэтому в дальнейшем предполагается, что А ? 0, и потому r = rA > 0.

Умножая слева на В* и замечая, что В*В – невырожденная квадратная матрица, найдём: = (В*В)-1.

Но тогда второе из равенств (7) даёт искомое выражение для В+:

В+ = (В*В)-1В*. (8)

Совершенно аналогично найдем:

С+ = С*(СС*)-1. (9)

Покажем теперь, что матрица

А+ = С+В+ = С*(СС*)-1*В)-1В* (10)

удовлетворяет условиям (5), (6) и, следовательно, является псевдо-
обратной матрицей для А.

В самом деле,

АА+А = ВСС*(СС*)-1*В)-1В*ВС = ВС = А.

С другой стороны, из равенств (8) – (10) с учётом равенства А* = С*В*, полагая К = (СС*)-1*В)-1, находим:

А+ = С*КВ* = С*К(СС*)-1СС*В* = UС*В* = UА*,

А+ = С*КВ* = С*В*В(В*В)-1КВ* = С*В*V = А*V,

где U = С*К(СС*)-1С, V = В(В*В)-1КВ*.

Таким образом доказано, что для произвольной прямоугольной матрицы А существует одна и только одна псевдообратная матрица А+, которая определяется формулой (10), где В и С – сомножители в скелетном разложении А = ВС матрицы А.1 Из самого определения псевдообрат­ной матрицы непосредственно следует, что в случае квадратной невырож­денной матрицы A псевдообратная матрица A+ совпадает с обратной А-1 .

П Р И М Е Р. Пусть:

.

Здесь r = 2. Примем в качестве столбцов матрицы В первые два столбца матрицы А.

1) Разложение (1) не определяет однозначно сомножителей ВС. Однако поскольку, как было доказано, существует только одна псевдообратная матрипа А+ , формула (10) при всех скелетных разложениях матрицы А даёт одно и то же значение для А+.

Тогда: ,

и В*В = , (В*В)-1 = ,

СС* = (СС*)-1 =

Поэтому согласно формуле (10):

А+ = , = .



















3. Свойства псевдообратной матрицы.

Отметим следующие свойства псевдообратной матрицы:

  1. *)+ = (А+)*;

  2. +)+ = А;

  3. (АА+)* = АА+, (АА+)2 = АА+;

  4. +А)* = А+А, (А+А)2 = А+А.

Первое свойство означает, что операции перехода к сопряжённой и к псевдообратной матрице перестановочны между собой. Равенство 2 выражает собой взаимность понятия псевдообратной матрицы, так как, согласно 2, псевдообратной матрицей для А+ является исходная матрица А. Согласно равенствам 3 и 4 матрицы АА+ и А+А являются эрмитовыми и инволютивными (квадрат каждой из этих матриц равен самой матрице).

Для вывода равенства 1 воспользуемся скелетным разложением (1):

А = ВС. Тогда равенство А* = С*В* даёт скелетное разложение матрицы А*.

Поэтому, заменяя в формуле (10) матрицу В на С*, а матрицу С на В*, получим:

*)+ = В(В*В)-1(СС*)-1С = [С*(СС*)-1*В)-1В*]* = (А+)*.

Равенства А+ = С+В+, В+ = (В*В)-1В*, С+ = С*(СС*)-1 являются скелет­ными разложениями. Следовательно,

+)+ = (В+)++)+ = (В*)+ В* ВСС**)+.

Используя свойство 1, а также выражения для В+ и С+, найдем:

+)+ = В(В*В)-1В*ВСС*(СС*)-1С = ВС = А.

Справедливость равенств 3 и 4 проверяется непосредственно путём подстановки в эти равенства вместо А+ соответствующего выражения из формулы (10).

Заметим, что в общем случае, когда разложение А = ВС не является скелетным, не всегда имеет место равенство А+ = С+В+. Так, например, = ВС. Здесь А+ = А-1 = ,

В+ = = ()+ = = , С+ = = = = .

С+В+ = ? А+.

4. Наилучшее приближённое решение.

(по методу наименьших квадратов). Рассмотрим произвольную систему линейных уравнений:

(11)

или в матричной записи:

Ах = у. (12)

Здесь у1, у2, …, уm – заданные числа, а х1, х2, …, хn – искомые.

В общем случае система (11) может быть и несовместной. Столбец

х0 = (,, …, ) (13)

называется наилучшим приближённым решением системы (11), если при значениях х1 = , х2 = , …, хn = «квадратичное отклонение»

| у – Ах |2 = (14)

достигает своего наименьшего значения и среди всех столбцов х, для которых это отклонение имеет минимальное значение, столбец х0 имеет наименьшую «длину», т. е. для этого столбца величина

| х2| = х*х = (15)

имеет наименьшее значение.

Покажем, что система (11) всегда имеет одно и только одно наилучшее приближённое решение и это приближённое решение определяется по формуле:

х0 = А+у , (16)

где А+ – псевдообратная матрица для матрицы А.

Для этого рассмотрим произвольный столбец х и положим:

у – Ах = u + v,

где u = у – Ах0 = у – АА +у, v = А( х0 – х ). (17)

Тогда получим:

| у – Ах |2 = (у – Ах)*(у – Ах) = (u + v)*(u + v) = u*u + v*u + u*v + v*v. (18)

Но:

v*u = ( х0 – х )*А*( у – АА+у) = ( х0 – х )*( А* – А* АА +)у. (19)

Исходя из разложения (1) и формулы (10), найдем:

А*АА+ = С*В*ВСС*(СС*)-1*В)-1В* = С*В* = А*,

Поэтому из равенства (19) следует:

v*u = 0, (20)

но тогда и u*v = (v*u)* = 0. (21)

Поэтому из равенства (18) находим:

| у – Ах |2 =| u |2 + | v |2 = | у – Ах0 |2 + | А( х0 – х ) |2, (22)

И, следовательно, для любого столбца х:

| у – Ах | | у – Ах0 |, (23)

Пусть теперь: | у – Ах | = | у – Ах0 |;

тогда, согласно равенству (22),

Аz = 0, (24)

где z = х – х0.

С другой стороны, | х2| = (х0 + z)*0 + z) = | х0|2 + | z |2 + (х0)*z + z*х0. (25)

Вспоминая, что A+ = А*V, получим в силу (24):

0)*z = (А+y)*z = (А*Vy)*z = y*V*Аz = 0. (26)

Но тогда и z*х0 = ((х0)*z)* = 0.

Поэтому из равенства (25) находим:

| х2| = | х0|2 + | z |2

И, следовательно,

| х2| | х0|2, (27)

причём знак = имеет место только при z = 0, т.е. при х = х0, где х0 = А+y.

Пример. Найти наилучшее приближённое решение (по методу наименьших квадратов) системы линейных уравнений:

х1 - х2 + 2х3 = 3,

- х1 + 2х2 – 3х3 + х4 = 6,

х2 - х3 + х4 = 0.

Здесь:

.

Но тогда:

,


И потому:

.

Следовательно, = 1, = 1, = 0, = 2.

Определим норму m ? n – матрицы A = как неотрицательное число, задаваемое формулой:

. (28)

При этом очевидно, что:

(29)


Рассмотрим матричное уравнение:

АХ= У, (30)

где А и У – заданные m ? n и m ? р – матрицы, а Х – искомая n ? р – матрица.

Определим наилучшее приближённое решение Х0 уравнения (30) из условия:

причем в случае, когда:

требуется чтобы: .

Из соотношений: , (31)

(32)

следует, что k-й столбец искомой матрицы Х0·k должен быть наилучшим

приближённым решением системы линейных уравнений:

А Х·k = У·k .

Поэтому: Х0·k = А+У·k .

Поскольку это равенство справедливо при любом k = 1, ..., р, то

Х0 = А+У. (33)

Таким образом, уравнение (30) всегда имеет одно и только одно наилуч­шее приближённое решение, определяемое формулой (33).

В частном случае, когда У = Е – единичная матрица m-го порядка, имеем X0+. Следовательно, псевдообратная матрица А+ является наилучшим приближённым решением (по методу наименьших квадратов) матричного уравнения:

АХ = Е.

Это свойство псевдообратной матрицы А+ может быть принято в качества её определения.
















5. Метод Гревилля последовательного нахождения псевдообратной матрицы.

Пусть аkk-й столбец в m ? n – матрице А, Аk = ( а1, …, аk ) – матрица, образованная первыми k столбцами матрицы А, bk – последняя строка в матрице Аk+( k = 1, …, n, A1 = a1, An = A)

Тогда: Аk+ = а1+ = (34)

и для k > 1 имеют место рекуррентные формулы:

Аk+ = , Вk = dkbk , dk = аk ; (35)

При этом, если сk = аkdk ? 0, то

bk = = ( аk dk )+ ; (36)

если же сk = 0, т.е. аk =dk , то

bk = ( 1 + dk*dk )-1dk*. (37)

Далее проверим, что матрица является псевдо­обратной для матрицы Аk+, если матрица Вk и строка bk определяются формулами (28)—(32). Этот метод не требует вычисления детерминантов и может быть использован для вычисления обратной матрицы.

П р и м е р. Пусть

Заметим, что для каждой вещественной матрицы М мы можем писать М' вместо М*.

Тогда = = ,

d2 = = , c2 – a2 – A1d2 = ,

= ,

B2 = .

Таким образом,

.

Далее:

и

Поэтому:

и

5



© Рефератбанк, 2002 - 2024