2.7: Властивості зворотної матриці
- Що означає сказати, що два твердження є «еквівалентними?»
- T/F: Якщо неA обертається, то неA→x=→0 може мати рішень.
- T/F: Якщо неA є оборотним, тоA→x=→b може мати нескінченні рішення.
- Що таке зворотне від зворотногоA?
- T/F: РішенняA→x=→b за допомогою гаусової елімінації швидше, ніж використання зворотногоA.
Ми закінчили попередній розділ тим, що оборотні матриці важливі. Так як вони є, то в цьому розділі ми вивчаємо оборотні матриці двома способами. По-перше, ми розглянемо способи визначити, чи є матриця оборотною, а по-друге, вивчаємо властивості оборотних матриць (тобто, як вони взаємодіють з іншими матричними операціями).
Почнемо зі збору способів, за допомогою яких ми знаємо, що матриця є оборотною. Істинність цієї теореми ми насправді вже знаємо з нашої роботи в попередньому розділі, але добре перерахувати наступні твердження в одному місці. Коли ми рухаємося через інші розділи, ми додамо до цієї теореми.
AДозволяти бутиn×n матрицею. Наступні твердження рівнозначні.
- Aє оборотним.
- ІснуєB така матриця, щоBA=I.
- ІснуєC така матриця, щоAC=I.
- Скорочений ряд ешелон формаA єI.
- РівнянняA→x=→b має рівно один розв'язок для кожногоn×1 вектора→b.
- РівнянняA→x=→0 має рівно одне рішення (а саме,→x=→0).
Давайте звернемо увагу на кілька речей про теорему про оборотну матрицю.
- По-перше, зауважте, що теорема використовує фразу «наступні твердження рівнозначні. Коли два або більше тверджень еквівалентні, це означає, що істина будь-якого з них означає, що решта також вірні; якщо будь-яке одне із тверджень є помилковим, то всі вони помилкові. Так, наприклад, якби миA→x=→0 визначили, що рівняння має рівно одне рішення (іA булоn×n матрицею), то ми б знали, щоAA→x=→b було обернено, що було тільки одне рішення, що зменшений рядок ешелон формаA була іI т.д.
- Давайте пройдемося по кожному з тверджень і подивимося, чому ми вже знали, що всі вони сказали по суті одне і те ж.
- Це просто говорить, щоA є оборотним — тобто існуєA−1 така матриця, щоA−1A=AA−1=I. Ми продовжуватимемо, щоб показати, чому всі інші твердження в основному говорять нам «Aє оборотним».
- Якщо ми знаємо, щоA є оборотним, то ми вже знаємо, що є матрицяB деBA=I. Це частина визначення оборотного. Однак ми також можемо «піти іншим шляхом». Нагадаємо з теореми 2.6.1, що навіть якщо все, що ми знаємо, що є матрицяB деBA=I, то ми також знаємо, щоAB=I. Тобто ми знаємо, щоB є зворотнимA (а отже, іA є оборотним).
- Ми використовуємо ту ж логіку, що і в попередньому твердженні, щоб показати, чому це те ж саме, що і «Aобертається».
- ЯкщоA обертається, ми можемо знайти зворотне за допомогою Key Idea 2.6.1 (що, в свою чергу, залежить від теореми 2.6.1). Суть Key Idea 2.6.1 полягає в тому, що зменшена форма ешелону рядківA єI; якщо це щось інше, ми не можемо знайтиA−1 (його не існує). Знаючи, щоA є оборотним, означає, що зменшена форма ешелону рядуA єI. Ми можемо піти іншим шляхом; якщо ми знаємо, що зменшена форма ешелону рядківA єI, то ми можемо використовувати Key Idea 2.6.1, щоб знайтиA−1, так самоA є оборотним.
- З теореми 2.6.4 ми знаємо, що якщоA є оборотним, то заданим будь-яким вектором→b, завждиA→x=→b має рівно одне рішення, а саме→x=A−1→b. Однак ми можемо піти іншим шляхом; скажімо, ми знаємо, щоA→x=→b завжди має саме рішення. Як можна зробити висновок, щоA є оборотним?
Подумайте про те, як ми до цього моменту визначили рішенняA→x=→b. Налаштовуємо доповнену матрицю[A→b] і поміщаємо її в зменшену форму ешелону рядка. Ми знаємо, що отримання матриці ідентичності зліва означає, що у нас було унікальне рішення (а не отримання ідентичності означає, що ми або не маємо рішення, або нескінченні рішення). Отже, потрапляючиI ліворуч, означає мати унікальне рішення; маючиI ліворуч означає, що зменшена форма ешелону рядкаA єI, яку ми знаємо зверху - це те саме,A що бути оборотним. - Це те саме, що і вище; просто→b замініть вектор на вектор→0.
Ось ми і придумали список тверджень, які всі еквівалентні твердженню «Aє оборотним». Знову ж таки, якщо ми знаємо, що якщо будь-який з них є істинним (або помилковим), то всі вони істинні (або всі помилкові).
Теорема формально2.7.1 стверджує, що якщоA є оборотним, тоA→x=→b має рівно одне рішення, а самеA−1→b. Що робитиA, якщо не обертається? Які можливості для вирішенняA→x=→b?
Ми знаємо, щоA→x=→b не може мати рівно одного рішення; якби це було, то за нашою теоремою воно було б обернене. Згадуючи, що лінійні рівняння мають або одне рішення, нескінченні розв'язки, або не розв'язок, ми залишаємося з останніми варіантами, коли неA є оборотними. Ця ідея важлива, і тому ми знову заявимо про це як ключову ідею.
Розглянемо систему лінійних рівняньA→x=→b.
- ЯкщоA оборотний, тоA→x=→b має рівно одне рішення, а самеA−1→b.
- Якщо неA є оборотним, тоA→x=→b має або нескінченні рішення, або немає.
У2.7.1 теоремі ми придумали список способів, за допомогою яких ми можемо сказати, чи є матриця оборотною. У той же час ми придумали список властивостей оборотних матриць — речі, які ми знаємо, які правдиві щодо них. (Наприклад, якщо ми знаємо, щоA є оборотним, то ми знаємо, щоA→x=→b має лише одне рішення.)
Тепер ми продовжуємо відкривати інші властивості оборотних матриць. Зокрема, ми хочемо з'ясувати, як оборотність взаємодіє з іншими матричними операціями. Наприклад, якщо ми знаємо, щоA іB є оборотними, що таке зворотнеA+B? Що таке зворотнеAB? Що таке «зворотне від зворотного?» Ми розглянемо ці питання на прикладі.
Нехай
A=[3201]andB=[−2011].
Знайти:
- A−1
- B−1
- (AB)−1
- (A−1)−1
- (A+B)−1
- (5A)−1
Крім того, постарайтеся знайти зв'язки між кожним з перерахованих вище.
Рішення
- ОбчисленняA−1 є простим; ми будемо використовувати теорему 2.6.3.
A−1=13[1−203]=[1/3−2/301] - ОбчислюємоB−1 так само, як і вище.
B−1=1−2[10−1−2]=[−1/201/21] - Для обчислення(AB)−1 ми спочатку обчислюємоAB: Тепер
AB=[3201][−2011]=[−4211]
ми застосовуємо теорему 2.6.3, щоб знайти(AB)−1.
(AB)−1=1−6[1−2−1−4]=[−1/61/31/62/3] - Для обчислення(A−1)−1 ми просто застосуємо теорему 2.6.3 доA−1:
(A−1)−1=11/3[12/301/3]=[3201]. - Для обчислення ми спочатку обчислюємо(A+B)−1,A+B а потім застосовуємо теорему 2.6.3:
A+B=[3201]+[−2011]=[1212].
Отже,
(A+B)−1=10[2−2−11]=!
наш останній вираз справді дурниця; ми знаємоad−bc=0, що якщо, то дана матриця не є зворотною. Це стосуєтьсяA+B, тому ми робимо висновок, щоA+B це не обертається. - Для обчислення ми обчислюємо(5A)−1,5A а потім застосовуємо теорему 2.6.3.
(5A)−1=([151005])−1=175[5−10015]=[1/15−2/1501/5]
Тепер ми шукаємо зв'язки міжA−1,B−1,(AB)−1,(A−1)−1 і(A+B)−1.
- Чи існує якийсь зв'язок між(AB)−1 іA−1 іB−1? Перше припущення, яке здається правдоподібним, є(AB)−1=A−1B−1. Це правда? Використовуючи нашу роботу зверху, ми маємо
A−1B−1=[1/3−2/301][−1/201/21]=[−1/2−2/31/21].
Очевидно, що це не дорівнює(AB)−1. Перш ніж ми зробимо якесь подальше ворожіння, давайте подумаємо про те,AB що має робити зворотне. Зворотне - назвемо цеC - має бути матрицею, такою, що
(AB)C=C(AB)=I.
При вивченні виразу ми бачимо(AB)C, що хочемоB якось «скасувати» зC. Що «скасовує»B? Очевидною відповіддю єB−1. Це дає нам думку: можливо, ми отримали порядокA−1 іB−1 неправильно раніше. Зрештою, ми сподівалися знайти, що,
ABA−1B−1?=I,
але алгебраїчно кажучи, важко скасувати ці умови. 1Однак перемикання порядкуA−1 іB−1 дає нам деяку надію. Є(AB)−1=B−1A−1? Давайте подивимося.
(AB)(B−1A−1)=A(BB−1)A−1(regrouping by the associative property)=AIA−1(BB−1=I)=AA−1(AI=A)=I(AA−1=I)
Таким чином здається, що(AB)−1=B−1A−1. Підтвердимо це нашими прикладами матриць.
B−1A−1=[−1/201/21][1/3−2/301]=[−1/61/31/62/3]=(AB)−1.
Це спрацювало! - Чи існує якийсь зв'язок між(A−1)−1 іA? Відповідь досить очевидна: вони рівні. «Обернене обернене» повертає одиницю до початкової матриці.
- Чи є якісь відносини між(A+B)−1,A−1 іB−1? Звичайно, якби ми були змушені зробити припущення, не працюючи жодних прикладів, ми б здогадалися, що
(A+B)−1?=A−1+B−1.
Однак, ми побачили, що в нашому прикладі матриця навіть(A+B) не обертається. Це в значній мірі вбиває будь-яку надію на зв'язок. - Чи існує зв'язок між(5A)−1 іA−1? Врахуйте:
(5A)−1=[1/15−2/1501/5]=15[1/3−2/301/5]=15A−1
Так, зв'язок є!
Підіб'ємо підсумки цього прикладу. ЯкщоA іB є оборотними матрицями, то так і їх добуток,AB. Ми продемонстрували це на нашому прикладі, і є ще що сказати. Припустимо, щоA іB єn×n матрицями, але ми ще не знаємо, чи є вони оборотними. ЯкщоAB є оборотним, то кожен зA іB є; якщоAB не обертається, тоA абоB теж не обертається.
Коротше кажучи, оборотність «добре працює» з матричним множенням. Однак ми побачили, що це погано працює з додаванням матриці. Знання того, щоA іB є оборотними, не допомагає нам знайти зворотне(A+B); насправді остання матриця може навіть не бути оборотною. 2
Давайте зробимо ще один приклад, потім підсумуємо результати цього розділу в теоремі.
Знайти зворотнеA=[20003000−7].
Рішення
Ми знайдемоA−1 using Key Idea 2.6.1.
[20010003001000−7001]→rref[1001/20001001/3000100−1/7]
Тому
A−1=[1/20001/3000−1/7].
МатрицяA в попередньому прикладі являє собою діагональну матрицю: єдині ненульові записиA лежать по діагоналі. 3Відносини міжA іA−1 в наведеному вище прикладі здаються досить міцними, і це справедливо в цілому. Ми викладемо це і підсумуємо результати цього розділу наступною теоремою.
Властивості оборотних матриць
BДозволятиA і бутиn×n оборотними матрицями. Потім:
- ABє оборотним;(AB)−1=B−1A−1.
- A−1є оборотним;(A−1)−1=A.
- nAобертається для будь-якого ненульового скаляраn;(nA)−1=1nA−1.
- ЯкщоA діагональна матриця, з діагональними записамиd1,d2,⋯,dn, де немає жодної діагональної записи0, тоA−1 існує і є діагональною матрицею. Крім того, діагональні записиA−1 є1/d1,1/d2,⋯,1/dn.
Крім того,
- Якщо продукт неAB є оборотним, тоA або неB є оборотним.
- ЯкщоA або неB є оборотними, то неAB є оборотними.
Закінчуємо цей розділ коментарем про рішення систем рівнянь «в реальному житті». 4Вирішення системиA→x=→b за допомогою обчисленьA−1→b здається досить гладким, тому було б сенс, що це так, як це зазвичай робиться. Однак на практиці це робиться рідко. Є дві основні причини, чому це так.
По-перше, обчисленняA−1 іA−1→b є «дорогим» в тому сенсі, що займає багато обчислювального часу. Звичайно, наші калькулятори не мають проблем з тими3×3 випадками, які ми часто розглядаємо в цьому підручнику, але в реальному житті розглядаються матриці дуже великі (як у сотнях тисяч рядків і стовпців). A−1Поодинці обчислення досить непрактичні, і ми витрачаємо багато часу, якщо прийдемо з'ясувати, щоA−1 не існує. Навіть якщо ми вже знаємо, щоA−1 таке, обчисленняA−1→b коштують обчислювально дорого - гаусова елімінація швидше.
По-друге, обчисленняA−1 за допомогою описаного нами методу часто породжують числові помилки округлення. Незважаючи на те, що комп'ютери часто роблять обчислення з точністю до більш ніж 8 знаків після коми, після тисяч обчислень округлення можуть спричинити великі помилки. (У «маленькій»1,000×1,000 матриці є1,000,000 записи! Ось багато місць, де накопичуються помилки округлення!) Це не нечуване мати комп'ютер обчислюватиA−1 для великої матриці, а потім відразу ж змусити його обчислитиAA−1 і не отримати ідентифікаційну матрицю. 5
Тому в реальному житті рішення зазвичай знаходять за допомогою методів,A→x=→b які ми дізналися в розділі 2.4. Виявляється, навіть при всіх наших досягненнях в математиці важко обіграти базовий метод, який Гаусс давно ввів.
Виноски
[1] Нагадаємо, що множення матриці не є комутативним.
[2] Той факт, що оборотність добре працює з множенням матриць, не повинен стати несподіванкою. Адже кажучи, щоA є оборотним, робить твердження про багатоплікаційні властивостіA. У ньому написано, що я можу помножити заA допомогою спеціальної матриці, щоб отриматиI. Зворотність, сама по собі, нічого не говорить про додавання матриць, тому ми не повинні бути занадто здивовані, що це погано працює з ним.
[3] Ми досі формально не визначили діагональ, але визначення є досить візуальним, тому ми ризикуємо. Докладніші відомості див. у Визначенні 3.1.2.
[4] Так, реальні люди вирішують лінійні рівняння в реальному житті. Не тільки математикам, але економістам, інженерам і вченим усіх смаків регулярно потрібно вирішувати лінійні рівняння, а матриці, які вони використовують, часто величезні.
Більшість людей бачать матриці на роботі, не замислюючись про це. Цифрові картинки - це просто «прямокутні масиви» чисел, що представляють кольори — вони є матрицями кольорів. Багато стандартних операцій обробки зображень включають операції з матрицею. Дружина автора має «7-мегапіксельну» камеру, яка створює знімки3072×2304 розміром, даючи понад 7 мільйонів пікселів, і це навіть не вважається «великою» картиною в наші дні.
[5] Результат, як правило, дуже близький, з цифрами на діагоналі близькими до 1, а інші записи близько 0. Але це не зовсім матриця ідентичності.