2.8: Елементарні матриці
Тепер звернемо увагу на особливий тип матриці під назвою елементарна матриця. Елементарна матриця - це завжди квадратна матриця. Згадайте операції з рядками, наведені у Визначенні 1.3.2. Будь-яка елементарна матриця, яку ми часто позначаємоE, виходить від застосування однієї рядкової операції до ідентичної матриці однакового розміру.
Наприклад, матрицяE=[0110] - це елементарна матриця, отримана при перемиканні двох рядків. МатрицяE=[100030001] - це елементарна матриця, отримана при множенні другого рядка матриці3×3 ідентичності на3. МатрицяE=[10−31] - це елементарна матриця, отримана при додаванні−3 разів першого рядка до третього рядка.
Ви можете побудувати елементарну матрицю з будь-якої операції рядка, але пам'ятайте, що ви можете застосувати лише одну операцію.
Розглянемо наступне визначення.
EДозволяти бутиn×n матрицею. ТодіE є елементарною матрицею, якщо вона є результатом застосування однієї операції рядка до матриціn×n ідентичностіIn.
Ті, які передбачають перемикання рядків матриці ідентичності, називаються матрицями перестановки.
ТомуE побудована вище шляхом перемикання двох рядківI2 називається матрицею перестановки.
Елементарні матриці можуть бути використані замість рядкових операцій і тому дуже корисні. Виявляється, множення (з лівого боку) на елементарну матрицюE матиме такий же ефект, як і операція рядка, яка використовується для отриманняE.
Наступна теорема є важливим результатом, який ми будемо використовувати в цьому тексті.
Для виконання будь-якої з трьох рядкових операцій над матрицеюA досить взяти добутокEA, деE - елементарна матриця, отримана за допомогою потрібної операції рядка на ідентифікаційній матриці.
Тому замість виконання рядкових операцій над матрицеюA ми можемо зменшити рядків через множення матриці з відповідною елементарною матрицею. Ми детально розглянемо цю теорему для кожної з трьох рядкових операцій, наведених у Визначенні 1.3.2.
Спочатку розглянемо наступну лему.
ДозвольтеPij позначити елементарну матрицю, яка передбачає перемиканняith іjth рядків. ПотімPij йде матрицяPijA=B перестановки і звідкиB виходитьA шляхом перемиканняith іjth рядків.
Ми розглянемо цю ідею докладніше в наступному прикладі.
НехайP12=[010100001],A=[abgdef]
ЗнайтиB деB=P12A.
Рішення
Можна помітити, що матрицяP12 виходить перемиканням першого і другого рядків матриці3×3 ідентичностіI.
Використовуючи нашу звичайну процедуру, обчислити вирібP12A=B. Результат видається
B=[gdabef]
Зверніть увагу, що матрицяB отримується при перемиканні2 рядків1 і зA. Тому, множившиA наP12, дляI отримання застосовується операція рядка, яка булаP12 застосованаA до отриманняB.
Теорема2.8.1 застосовується до всіх трьох рядкових операцій, і тепер ми розглянемо операцію рядка множення рядка на скаляр. Розглянемо наступну лему.
НехайE(k,i) позначимо елементарну матрицю, відповідну операції рядка, в якійith рядок множиться на ненульовий скаляр,k. Тоді
E(k,i)A=B
деB виходить відA множенняith рядкаA наk.
Ми розглянемо цю лему далі в наступному прикладі.
Нехай
E(5,2)=[100050001],A=[abcdef]
Знайдіть матрицюB, деB=E(5,2)A
Рішення
Ви можете бачити,E(5,2) що виходить множенням другого рядка матриці ідентичності на5.
Використовуючи нашу звичайну процедуру множення матриць, ми можемо обчислити твірE(5,2)A. Отримана матриця задається
B=[ab5c5def]
Зверніть увагу,B що виходить множенням другого рядкаA на скаляр5.
Існує одна остання операція рядка, яку слід розглянути. Наступна лема обговорює остаточну операцію додавання кратного рядка до іншого рядка.
НехайE(k×i+j) позначимо елементарну матрицюI, отриману від додаванняk разівith рядка доjth. Тоді
E(k×i+j)A=B
деB виходитьA, додаючиk разith ряд доjth рядуA.
Розглянемо наступний приклад.
Нехай
E(2×1+3)=[100010201],A=[abcdef]
ЗнайтиB деB=E(2×1+3)A.
Рішення
Ви можете бачити, що матрицяE(2×1+3) була отримана шляхом додавання2 разів першого рядкаI до третього рядкаI.
Використовуючи нашу звичайну процедуру, ми можемо обчислити продуктE(2×1+3)A. ОтриманаB матриця задаєтьсяB=[abcd2a+e2b+f]
Ви можете бачити,B що матриця отримана шляхом додавання2 разів першого рядкаA до третього рядка.
Припустимо, ми застосували операцію рядка до матриціA. Розглянемо операцію рядка, необхіднуA для повернення до початкового вигляду, щоб скасувати операцію рядка. Виявляється, це дія, як ми знаходимо зворотну елементарної матриціE.
Розглянемо наступну теорему.
Кожна елементарна матриця є оборотною, а її зворотна також є елементарною матрицею.
Фактично, зворотна елементарна матриця будується шляхом виконання операції зворотного рядка наI. E−1буде отримано, виконуючи операцію рядка, до якої будеE перенесеноI.
- ЯкщоE виходить шляхом перемикання рядівi іj, тоE−1 виходить також шляхом перемикання рядівi іj.
- ЯкщоE виходить множенням рядкаi на скалярk, тоE−1 виходить множенням рядкаi на скаляр1k.
- ЯкщоE виходить шляхом додаванняk разів рядокi до рядкаj, тоE−1 виходить шляхом відніманняk разів рядкаi з рядуj.
Розглянемо наступний приклад.
НехайE=[1002]
ЗнайтиE−1.
Рішення
Розглянемо елементарну матрицю,E задану
E=[1002]
ТутE отримується з матриці2×2 ідентичності множенням другого рядка на2. Для того щобE віднести назад до тотожності, нам потрібно помножити другий рядE на12. Отже,
E−1даєтьсяE−1=[10012]
Ми можемо це перевіритиEE−1=I. Візьміть продуктEE−1, даний
EE−1=[1002][10012]=[1001]
Це дорівнюєI тому ми знаємо, що у нас є обчисленняE−1 належним чином.
Припустимо,A щоm×n матриця - це рядок, зведений до його зменшеної рядково-ешелонової форми. Відстежуючи кожну виконану операцію рядка, це скорочення рядка може бути завершено шляхом множення на елементарні матриці.
Розглянемо наступне визначення.
AДозволяти бутиm×n матриця і нехайB бути зменшений рядок ешелон формаA. Тоді ми можемо записатиB=UA, деU є добуток всіх елементарних матриць, що представляють рядкові операції, зробленіA для отриманняB.
Розглянемо наступний приклад.
НехайA=[011020]. ЗнайдітьB, скорочений ряд-ешелон формуA і запишіть його в бланкB=UA.
Рішення
Щоб знайтиB, ряд зменшитиA. Для кожного кроку запишемо відповідну елементарну матрицю. Спочатку перемикають ряди1 і2.
[011020]→[100120]
Отримана матриця еквівалентна знаходженню добуткуP12=[010100001] іA.
Далі додайте(−2) раз рядок1 до рядка3.
[100120]→[100100]
Це еквівалентно множенню на матрицюE(−2×1+3)=[100010−201]. Зверніть увагу, що отримана матрицяB, необхідна зменшена рядо-ешелонова формаA.
Потім ми можемо написати
B=E(−2×1+2)(P12A)=(E(−2×1+2)P12)A=UA
Залишилося знайти матрицюU.
U=E(−2×1+2)P12=[100010−201][010100001]=[0101000−21]
Ми можемо перевірити, щоB=UA тримає цю матрицюU:UA=[0101000−21][011020]=[100100]=B
Хоча процес, використаний у наведеному вище прикладі, є надійним і простим, коли використовуються лише кілька рядкових операцій, він стає громіздким у випадку, коли багато операцій рядків потрібноA виконатиB. Наступна теорема надає альтернативний спосіб пошуку матриціU.
AДозволяти бутиm×n матрицею і нехайB буде його зменшена рядка-ешелон форма. ТодіB=UA деU знаходиться оборотнаm×m матриця, знайдена шляхом формування матриці[A|Im] і рядка, що зменшується до[B|U].
Давайте повернемося до наведеного вище прикладу за допомогою процесу, викладеного в теоремі2.8.3.
НехайA=[011020]. Використовуючи процес, викладений в теоремі2.8.3, знайдітьU такий, щоB=UA.
Рішення
Спочатку налаштовуємо матрицю[A|Im]. [011001001020001]Тепер, рядок зменшити цю матрицю до тих пір, поки ліва сторона не дорівнює зменшеному рядку-ешелону формиA.
[011001001020001]→[100100110020001]→[1001001100000−21]
Ліва частина цієї матриці єB, а права -U. Порівнюючи це з матрицею,U знайденою вище в прикладі2.8.5, ви можете побачити, що одна і та ж матриця виходить незалежно від того, який процес використовується.
Нагадаємо з Алгоритму 2.7.1, щоn×n матрицяA є інвертованою тоді і тільки тоді, колиA може бути перенесена до матриціn×n ідентичності за допомогою звичайних рядкових операцій. Це призводить до важливого наслідку, пов'язаного з вищезазначеним обговоренням.
Припустимо,A цеn×n оборотна матриця. Потім встановіть матрицю,[A|In] як це зроблено вище, і рядок зменшуйте, поки вона не має форми[B|U]. У цьому випадкуB=In тому, щоA є оборотним.
B=UAIn=UAU−1=A
Тепер припустимо, щоU=E1E2⋯Ek де коженEi є елементарною матрицею, що представляє рядок операції використовуєтьсяA для перенесенняI. Потім,
U−1=(E1E2⋯Ek)−1=E−1k⋯E−12E1−1
Пам'ятайте, що якщоEi є елементарною матрицею, так теж єE−1i. Звідси випливає, що
A=U−1=E−1k⋯E−12E1−1
іA може бути записаний як добуток елементарних матриць.
AДозволяти бутиn×n матрицею. ТодіA є оборотним тоді і тільки тоді, коли його можна записати як добуток елементарних матриць.
Розглянемо наступний приклад.
НехайA=[0101100−21]. ЗапишітьA як добуток елементарних матриць.
Рішення
Ми будемо використовувати процес, викладені в теоремі,2.8.3 для записуA як добуток елементарних матриць. Ми налаштуємо матрицю[A|I] і скорочення рядків, записуючи кожну операцію рядка як елементарну матрицю.
Перший:
[0101001100100−21001]→[1100100101000−21001]
представлена елементарною матрицеюE1=[010100001].
По-друге:
[1100100101000−21001]→[100−1100101000−21001]
представлена елементарною матрицеюE2=[1−10010001].
Нарешті:
[100−1100101000−21001]→[100−110010100001201]
представлена елементарною матрицеюE3=[100010021].
Зверніть увагу, що зменшена рядно-ешелонова формаA єI. ЗвідсиI=UA деU знаходиться добуток вищевказаних елементарних матриць. Звідси випливає, щоA=U−1. Оскільки ми хочемо писатиA як добуток елементарних матриць, ми хочемо висловитиU−1 як добуток елементарних матриць. U−1=(E3E2E1)−1=E−11E−12E−13=[010100001][110010001][1000100−21]=A
Це даєA записані як добуток елементарних матриць. За теоремою2.8.4 випливає, щоA є оборотним.