2.7: Властивості зворотної матриці
- Page ID
- 63422
- Що означає сказати, що два твердження є «еквівалентними?»
- T/F: Якщо не\(A\) обертається, то не\(A\vec{x}=\vec{0}\) може мати рішень.
- T/F: Якщо не\(A\) є оборотним, то\(A\vec{x}=\vec{b}\) може мати нескінченні рішення.
- Що таке зворотне від зворотного\(A\)?
- T/F: Рішення\(A\vec{x}=\vec{b}\) за допомогою гаусової елімінації швидше, ніж використання зворотного\(A\).
Ми закінчили попередній розділ тим, що оборотні матриці важливі. Так як вони є, то в цьому розділі ми вивчаємо оборотні матриці двома способами. По-перше, ми розглянемо способи визначити, чи є матриця оборотною, а по-друге, вивчаємо властивості оборотних матриць (тобто, як вони взаємодіють з іншими матричними операціями).
Почнемо зі збору способів, за допомогою яких ми знаємо, що матриця є оборотною. Істинність цієї теореми ми насправді вже знаємо з нашої роботи в попередньому розділі, але добре перерахувати наступні твердження в одному місці. Коли ми рухаємося через інші розділи, ми додамо до цієї теореми.
\(A\)Дозволяти бути\(n\times n\) матрицею. Наступні твердження рівнозначні.
- \(A\)є оборотним.
- Існує\(B\) така матриця, що\(BA = I\).
- Існує\(C\) така матриця, що\(AC = I\).
- Скорочений ряд ешелон форма\(A\) є\(I\).
- Рівняння\(A\vec{x}=\vec{b}\) має рівно один розв'язок для кожного\(n\times 1\) вектора\(\vec{b}\).
- Рівняння\(A\vec{x}=\vec{0}\) має рівно одне рішення (а саме,\(\vec{x}=\vec{0}\)).
Давайте звернемо увагу на кілька речей про теорему про оборотну матрицю.
- По-перше, зауважте, що теорема використовує фразу «наступні твердження рівнозначні. Коли два або більше тверджень еквівалентні, це означає, що істина будь-якого з них означає, що решта також вірні; якщо будь-яке одне із тверджень є помилковим, то всі вони помилкові. Так, наприклад, якби ми\(A\vec{x}=\vec{0}\) визначили, що рівняння має рівно одне рішення (і\(A\) було\(n\times n\) матрицею), то ми б знали, що\(A\)\(A\vec{x}=\vec{b}\) було обернено, що було тільки одне рішення, що зменшений рядок ешелон форма\(A\) була і\(I\) т.д.
- Давайте пройдемося по кожному з тверджень і подивимося, чому ми вже знали, що всі вони сказали по суті одне і те ж.
- Це просто говорить, що\(A\) є оборотним — тобто існує\(A^{-1}\) така матриця, що\(A^{-1}A=AA^{-1}=I\). Ми продовжуватимемо, щоб показати, чому всі інші твердження в основному говорять нам «\(A\)є оборотним».
- Якщо ми знаємо, що\(A\) є оборотним, то ми вже знаємо, що є матриця\(B\) де\(BA=I\). Це частина визначення оборотного. Однак ми також можемо «піти іншим шляхом». Нагадаємо з теореми 2.6.1, що навіть якщо все, що ми знаємо, що є матриця\(B\) де\(BA=I\), то ми також знаємо, що\(AB=I\). Тобто ми знаємо, що\(B\) є зворотним\(A\) (а отже, і\(A\) є оборотним).
- Ми використовуємо ту ж логіку, що і в попередньому твердженні, щоб показати, чому це те ж саме, що і «\(A\)обертається».
- Якщо\(A\) обертається, ми можемо знайти зворотне за допомогою Key Idea 2.6.1 (що, в свою чергу, залежить від теореми 2.6.1). Суть Key Idea 2.6.1 полягає в тому, що зменшена форма ешелону рядків\(A\) є\(I\); якщо це щось інше, ми не можемо знайти\(A^{-1}\) (його не існує). Знаючи, що\(A\) є оборотним, означає, що зменшена форма ешелону ряду\(A\) є\(I\). Ми можемо піти іншим шляхом; якщо ми знаємо, що зменшена форма ешелону рядків\(A\) є\(I\), то ми можемо використовувати Key Idea 2.6.1, щоб знайти\(A^{-1}\), так само\(A\) є оборотним.
- З теореми 2.6.4 ми знаємо, що якщо\(A\) є оборотним, то заданим будь-яким вектором\(\vec{b}\), завжди\(A\vec{x}=\vec{b}\) має рівно одне рішення, а саме\(\vec{x}=A^{-1}\vec{b}\). Однак ми можемо піти іншим шляхом; скажімо, ми знаємо, що\(A\vec{x}=\vec{b}\) завжди має саме рішення. Як можна зробити висновок, що\(A\) є оборотним?
Подумайте про те, як ми до цього моменту визначили рішення\(A\vec{x}=\vec{b}\). Налаштовуємо доповнену матрицю\(\left[\begin{array}{cc}{A}&{\vec{b}}\end{array}\right]\) і поміщаємо її в зменшену форму ешелону рядка. Ми знаємо, що отримання матриці ідентичності зліва означає, що у нас було унікальне рішення (а не отримання ідентичності означає, що ми або не маємо рішення, або нескінченні рішення). Отже, потрапляючи\(I\) ліворуч, означає мати унікальне рішення; маючи\(I\) ліворуч означає, що зменшена форма ешелону рядка\(A\) є\(I\), яку ми знаємо зверху - це те саме,\(A\) що бути оборотним. - Це те саме, що і вище; просто\(\vec{b}\) замініть вектор на вектор\(\vec{0}\).
Ось ми і придумали список тверджень, які всі еквівалентні твердженню «\(A\)є оборотним». Знову ж таки, якщо ми знаємо, що якщо будь-який з них є істинним (або помилковим), то всі вони істинні (або всі помилкові).
Теорема формально\(\PageIndex{1}\) стверджує, що якщо\(A\) є оборотним, то\(A\vec{x}=\vec{b}\) має рівно одне рішення, а саме\(A^{-1}\vec{b}\). Що робити\(A\), якщо не обертається? Які можливості для вирішення\(A\vec{x}=\vec{b}\)?
Ми знаємо, що\(A\vec{x}=\vec{b}\) не може мати рівно одного рішення; якби це було, то за нашою теоремою воно було б обернене. Згадуючи, що лінійні рівняння мають або одне рішення, нескінченні розв'язки, або не розв'язок, ми залишаємося з останніми варіантами, коли не\(A\) є оборотними. Ця ідея важлива, і тому ми знову заявимо про це як ключову ідею.
Розглянемо систему лінійних рівнянь\(A\vec{x}=\vec{b}\).
- Якщо\(A\) оборотний, то\(A\vec{x}=\vec{b}\) має рівно одне рішення, а саме\(A^{-1}\vec{b}\).
- Якщо не\(A\) є оборотним, то\(A\vec{x}=\vec{b}\) має або нескінченні рішення, або немає.
У\(\PageIndex{1}\) теоремі ми придумали список способів, за допомогою яких ми можемо сказати, чи є матриця оборотною. У той же час ми придумали список властивостей оборотних матриць — речі, які ми знаємо, які правдиві щодо них. (Наприклад, якщо ми знаємо, що\(A\) є оборотним, то ми знаємо, що\(A\vec{x}=\vec{b}\) має лише одне рішення.)
Тепер ми продовжуємо відкривати інші властивості оборотних матриць. Зокрема, ми хочемо з'ясувати, як оборотність взаємодіє з іншими матричними операціями. Наприклад, якщо ми знаємо, що\(A\) і\(B\) є оборотними, що таке зворотне\(A+B\)? Що таке зворотне\(AB\)? Що таке «зворотне від зворотного?» Ми розглянемо ці питання на прикладі.
Нехай
\[A=\left[\begin{array}{cc}{3}&{2}\\{0}&{1}\end{array}\right]\quad\text{and}\quad B=\left[\begin{array}{cc}{-2}&{0}\\{1}&{1}\end{array}\right] . \nonumber \]
Знайти:
- \(A^{-1}\)
- \(B^{-1}\)
- \((AB)^{-1}\)
- \((A^{-1})^{-1}\)
- \((A+B)^{-1}\)
- \((5A)^{-1}\)
Крім того, постарайтеся знайти зв'язки між кожним з перерахованих вище.
Рішення
- Обчислення\(A^{-1}\) є простим; ми будемо використовувати теорему 2.6.3.
\[A^{-1}=\frac{1}{3}\left[\begin{array}{cc}{1}&{-2}\\{0}&{3}\end{array}\right]=\left[\begin{array}{cc}{1/3}&{-2/3}\\{0}&{1}\end{array}\right] \nonumber \] - Обчислюємо\(B^{-1}\) так само, як і вище.
\[B^{-1}=\frac{1}{-2}\left[\begin{array}{cc}{1}&{0}\\{-1}&{-2}\end{array}\right]=\left[\begin{array}{cc}{-1/2}&{0}\\{1/2}&{1}\end{array}\right] \nonumber \] - Для обчислення\((AB)^{-1}\) ми спочатку обчислюємо\(AB\): Тепер
\[AB=\left[\begin{array}{cc}{3}&{2}\\{0}&{1}\end{array}\right]\left[\begin{array}{cc}{-2}&{0}\\{1}&{1}\end{array}\right]=\left[\begin{array}{cc}{-4}&{2}\\{1}&{1}\end{array}\right] \nonumber \]
ми застосовуємо теорему 2.6.3, щоб знайти\((AB)^{-1}\).
\[(AB)^{-1}=\frac{1}{-6}\left[\begin{array}{cc}{1}&{-2}\\{-1}&{-4}\end{array}\right]=\left[\begin{array}{cc}{-1/6}&{1/3}\\{1/6}&{2/3}\end{array}\right] \nonumber \] - Для обчислення\((A^{-1})^{-1}\) ми просто застосуємо теорему 2.6.3 до\(A^{-1}\):
\[(A^{-1})^{-1}=\frac{1}{1/3}\left[\begin{array}{cc}{1}&{2/3}\\{0}&{1/3}\end{array}\right]=\left[\begin{array}{cc}{3}&{2}\\{0}&{1}\end{array}\right]. \nonumber \] - Для обчислення ми спочатку обчислюємо\((A+B)^{-1}\),\(A+B\) а потім застосовуємо теорему 2.6.3:
\[A+B=\left[\begin{array}{cc}{3}&{2}\\{0}&{1}\end{array}\right]+\left[\begin{array}{cc}{-2}&{0}\\{1}&{1}\end{array}\right]=\left[\begin{array}{cc}{1}&{2}\\{1}&{2}\end{array}\right]. \nonumber \]
Отже,
\[(A+B)^{-1}=\frac{1}{0}\left[\begin{array}{cc}{2}&{-2}\\{-1}&{1}\end{array}\right]=! \nonumber \]
наш останній вираз справді дурниця; ми знаємо\(ad-bc=0\), що якщо, то дана матриця не є зворотною. Це стосується\(A+B\), тому ми робимо висновок, що\(A+B\) це не обертається. - Для обчислення ми обчислюємо\((5A)^{-1}\),\(5A\) а потім застосовуємо теорему 2.6.3.
\[(5A)^{-1}=\left(\left[\begin{array}{cc}{15}&{10}\\{0}&{5}\end{array}\right]\right)^{-1}=\frac{1}{75}\left[\begin{array}{cc}{5}&{-10}\\{0}&{15}\end{array}\right]=\left[\begin{array}{cc}{1/15}&{-2/15}\\{0}&{1/5}\end{array}\right] \nonumber \]
Тепер ми шукаємо зв'язки між\(A^{-1}\),\(B^{-1}\),\((AB)^{-1}\),\((A^{-1})^{-1}\) і\((A+B)^{-1}\).
- Чи існує якийсь зв'язок між\((AB)^{-1}\) і\(A^{-1}\) і\(B^{-1}\)? Перше припущення, яке здається правдоподібним, є\((AB)^{-1}=A^{-1}B^{-1}\). Це правда? Використовуючи нашу роботу зверху, ми маємо
\[A^{-1}B^{-1}=\left[\begin{array}{cc}{1/3}&{-2/3}\\{0}&{1}\end{array}\right]\left[\begin{array}{cc}{-1/2}&{0}\\{1/2}&{1}\end{array}\right]=\left[\begin{array}{cc}{-1/2}&{-2/3}\\{1/2}&{1}\end{array}\right]. \nonumber \]
Очевидно, що це не дорівнює\((AB)^{-1}\). Перш ніж ми зробимо якесь подальше ворожіння, давайте подумаємо про те,\(AB\) що має робити зворотне. Зворотне - назвемо це\(C\) - має бути матрицею, такою, що
\[(AB)C=C(AB)=I. \nonumber \]
При вивченні виразу ми бачимо\((AB)C\), що хочемо\(B\) якось «скасувати» з\(C\). Що «скасовує»\(B\)? Очевидною відповіддю є\(B^{-1}\). Це дає нам думку: можливо, ми отримали порядок\(A^{-1}\) і\(B^{-1}\) неправильно раніше. Зрештою, ми сподівалися знайти, що,
\[ABA^{-1}B^{-1}\stackrel{?}{=} I, \nonumber \]
але алгебраїчно кажучи, важко скасувати ці умови. \(^{1}\)Однак перемикання порядку\(A^{-1}\) і\(B^{-1}\) дає нам деяку надію. Є\((AB)^{-1}=B^{-1}A^{-1}\)? Давайте подивимося.
\[\begin{align}\begin{aligned}(AB)(B^{-1}A^{-1})&=A(BB^{-1})A^{-1} &\text{(regrouping by the associative property)} \\ &=AIA^{-1} &(BB^{-1}=I) \\ &=AA^{-1} &(AI=A) \\ &=I &(AA^{-1}=I)\end{aligned}\end{align} \nonumber \]
Таким чином здається, що\((AB)^{-1}=B^{-1}A^{-1}\). Підтвердимо це нашими прикладами матриць.
\[B^{-1}A^{-1}=\left[\begin{array}{cc}{-1/2}&{0}\\{1/2}&{1}\end{array}\right]\left[\begin{array}{cc}{1/3}&{-2/3}\\{0}&{1}\end{array}\right]=\left[\begin{array}{cc}{-1/6}&{1/3}\\{1/6}&{2/3}\end{array}\right]=(AB)^{-1}. \nonumber \]
Це спрацювало! - Чи існує якийсь зв'язок між\((A^{-1})^{-1}\) і\(A\)? Відповідь досить очевидна: вони рівні. «Обернене обернене» повертає одиницю до початкової матриці.
- Чи є якісь відносини між\((A+B)^{-1}\),\(A^{-1}\) і\(B^{-1}\)? Звичайно, якби ми були змушені зробити припущення, не працюючи жодних прикладів, ми б здогадалися, що
\[(A+B)^{-1}\stackrel{?}{=} A^{-1}+B^{-1}. \nonumber \]
Однак, ми побачили, що в нашому прикладі матриця навіть\((A+B)\) не обертається. Це в значній мірі вбиває будь-яку надію на зв'язок. - Чи існує зв'язок між\((5A)^{-1}\) і\(A^{-1}\)? Врахуйте:
\[\begin{align}\begin{aligned}(5A)^{-1}&=\left[\begin{array}{cc}{1/15}&{-2/15}\\{0}&{1/5}\end{array}\right] \\ &=\frac{1}{5}\left[\begin{array}{cc}{1/3}&{-2/3}\\{0}&{1/5}\end{array}\right] \\ &=\frac{1}{5}A^{-1}\end{aligned}\end{align} \nonumber \]
Так, зв'язок є!
Підіб'ємо підсумки цього прикладу. Якщо\(A\) і\(B\) є оборотними матрицями, то так і їх добуток,\(AB\). Ми продемонстрували це на нашому прикладі, і є ще що сказати. Припустимо, що\(A\) і\(B\) є\(n\times n\) матрицями, але ми ще не знаємо, чи є вони оборотними. Якщо\(AB\) є оборотним, то кожен з\(A\) і\(B\) є; якщо\(AB\) не обертається, то\(A\) або\(B\) теж не обертається.
Коротше кажучи, оборотність «добре працює» з матричним множенням. Однак ми побачили, що це погано працює з додаванням матриці. Знання того, що\(A\) і\(B\) є оборотними, не допомагає нам знайти зворотне\((A+B)\); насправді остання матриця може навіть не бути оборотною. \(^{2}\)
Давайте зробимо ще один приклад, потім підсумуємо результати цього розділу в теоремі.
Знайти зворотне\(A=\left[\begin{array}{ccc}{2}&{0}&{0}\\{0}&{3}&{0}\\{0}&{0}&{-7}\end{array}\right].\)
Рішення
Ми знайдемо\(A^{-1}\) using Key Idea 2.6.1.
\[\left[\begin{array}{cccccc}{2}&{0}&{0}&{1}&{0}&{0}\\{0}&{3}&{0}&{0}&{1}&{0}\\{0}&{0}&{-7}&{0}&{0}&{1}\end{array}\right]\quad\vec{\text{rref}}\quad\left[\begin{array}{cccccc}{1}&{0}&{0}&{1/2}&{0}&{0}\\{0}&{1}&{0}&{0}&{1/3}&{0}\\{0}&{0}&{1}&{0}&{0}&{-1/7}\end{array}\right] \nonumber \]
Тому
\[A^{-1}=\left[\begin{array}{ccc}{1/2}&{0}&{0}\\{0}&{1/3}&{0}\\{0}&{0}&{-1/7}\end{array}\right]. \nonumber \]
Матриця\(A\) в попередньому прикладі являє собою діагональну матрицю: єдині ненульові записи\(A\) лежать по діагоналі. \(^{3}\)Відносини між\(A\) і\(A^{-1}\) в наведеному вище прикладі здаються досить міцними, і це справедливо в цілому. Ми викладемо це і підсумуємо результати цього розділу наступною теоремою.
Властивості оборотних матриць
\(B\)Дозволяти\(A\) і бути\(n\times n\) оборотними матрицями. Потім:
- \(AB\)є оборотним;\((AB)^{-1}=B^{-1}A^{-1}\).
- \(A^{-1}\)є оборотним;\((A^{-1})^{-1}=A\).
- \(nA\)обертається для будь-якого ненульового скаляра\(n\);\((nA)^{-1}=\frac{1}{n}A^{-1}\).
- Якщо\(A\) діагональна матриця, з діагональними записами\(d_{1},\: d_{2},\cdots , d_{n}\), де немає жодної діагональної записи\(0\), то\(A^{−1}\) існує і є діагональною матрицею. Крім того, діагональні записи\(A^{−1}\) є\(1/d_{1},\: 1/d_{2},\cdots , 1/d_{n}\).
Крім того,
- Якщо продукт не\(AB\) є оборотним, то\(A\) або не\(B\) є оборотним.
- Якщо\(A\) або не\(B\) є оборотними, то не\(AB\) є оборотними.
Закінчуємо цей розділ коментарем про рішення систем рівнянь «в реальному житті». \(^{4}\)Вирішення системи\(A\vec{x}=\vec{b}\) за допомогою обчислень\(A^{-1}\vec{b}\) здається досить гладким, тому було б сенс, що це так, як це зазвичай робиться. Однак на практиці це робиться рідко. Є дві основні причини, чому це так.
По-перше, обчислення\(A^{-1}\) і\(A^{-1}\vec{b}\) є «дорогим» в тому сенсі, що займає багато обчислювального часу. Звичайно, наші калькулятори не мають проблем з тими\(3 \times 3\) випадками, які ми часто розглядаємо в цьому підручнику, але в реальному житті розглядаються матриці дуже великі (як у сотнях тисяч рядків і стовпців). \(A^{-1}\)Поодинці обчислення досить непрактичні, і ми витрачаємо багато часу, якщо прийдемо з'ясувати, що\(A^{-1}\) не існує. Навіть якщо ми вже знаємо, що\(A^{-1}\) таке, обчислення\(A^{-1}\vec{b}\) коштують обчислювально дорого - гаусова елімінація швидше.
По-друге, обчислення\(A^{-1}\) за допомогою описаного нами методу часто породжують числові помилки округлення. Незважаючи на те, що комп'ютери часто роблять обчислення з точністю до більш ніж 8 знаків після коми, після тисяч обчислень округлення можуть спричинити великі помилки. (У «маленькій»\(1,000 \times 1,000\) матриці є\(1,000,000\) записи! Ось багато місць, де накопичуються помилки округлення!) Це не нечуване мати комп'ютер обчислювати\(A^{-1}\) для великої матриці, а потім відразу ж змусити його обчислити\(AA^{-1}\) і не отримати ідентифікаційну матрицю. \(^{5}\)
Тому в реальному житті рішення зазвичай знаходять за допомогою методів,\(A\vec{x}=\vec{b}\) які ми дізналися в розділі 2.4. Виявляється, навіть при всіх наших досягненнях в математиці важко обіграти базовий метод, який Гаусс давно ввів.
Виноски
[1] Нагадаємо, що множення матриці не є комутативним.
[2] Той факт, що оборотність добре працює з множенням матриць, не повинен стати несподіванкою. Адже кажучи, що\(A\) є оборотним, робить твердження про багатоплікаційні властивості\(A\). У ньому написано, що я можу помножити за\(A\) допомогою спеціальної матриці, щоб отримати\(I\). Зворотність, сама по собі, нічого не говорить про додавання матриць, тому ми не повинні бути занадто здивовані, що це погано працює з ним.
[3] Ми досі формально не визначили діагональ, але визначення є досить візуальним, тому ми ризикуємо. Докладніші відомості див. у Визначенні 3.1.2.
[4] Так, реальні люди вирішують лінійні рівняння в реальному житті. Не тільки математикам, але економістам, інженерам і вченим усіх смаків регулярно потрібно вирішувати лінійні рівняння, а матриці, які вони використовують, часто величезні.
Більшість людей бачать матриці на роботі, не замислюючись про це. Цифрові картинки - це просто «прямокутні масиви» чисел, що представляють кольори — вони є матрицями кольорів. Багато стандартних операцій обробки зображень включають операції з матрицею. Дружина автора має «7-мегапіксельну» камеру, яка створює знімки\(3072\times 2304\) розміром, даючи понад 7 мільйонів пікселів, і це навіть не вважається «великою» картиною в наші дні.
[5] Результат, як правило, дуже близький, з цифрами на діагоналі близькими до 1, а інші записи близько 0. Але це не зовсім матриця ідентичності.
