Loading [MathJax]/jax/output/HTML-CSS/jax.js
Skip to main content
LibreTexts - Ukrayinska

2.7: Властивості зворотної матриці

Цілі навчання
  • Що означає сказати, що два твердження є «еквівалентними?»
  • T/F: Якщо неA обертається, то неAx=0 може мати рішень.
  • T/F: Якщо неA є оборотним, тоAx=b може мати нескінченні рішення.
  • Що таке зворотне від зворотногоA?
  • T/F: РішенняAx=b за допомогою гаусової елімінації швидше, ніж використання зворотногоA.

Ми закінчили попередній розділ тим, що оборотні матриці важливі. Так як вони є, то в цьому розділі ми вивчаємо оборотні матриці двома способами. По-перше, ми розглянемо способи визначити, чи є матриця оборотною, а по-друге, вивчаємо властивості оборотних матриць (тобто, як вони взаємодіють з іншими матричними операціями).

Почнемо зі збору способів, за допомогою яких ми знаємо, що матриця є оборотною. Істинність цієї теореми ми насправді вже знаємо з нашої роботи в попередньому розділі, але добре перерахувати наступні твердження в одному місці. Коли ми рухаємося через інші розділи, ми додамо до цієї теореми.

Теорема2.7.1: Invertible Matrix Theorem

AДозволяти бутиn×n матрицею. Наступні твердження рівнозначні.

  1. Aє оборотним.
  2. ІснуєB така матриця, щоBA=I.
  3. ІснуєC така матриця, щоAC=I.
  4. Скорочений ряд ешелон формаA єI.
  5. РівнянняAx=b має рівно один розв'язок для кожногоn×1 вектораb.
  6. РівнянняAx=0 має рівно одне рішення (а саме,x=0).

Давайте звернемо увагу на кілька речей про теорему про оборотну матрицю.

  1. По-перше, зауважте, що теорема використовує фразу «наступні твердження рівнозначні. Коли два або більше тверджень еквівалентні, це означає, що істина будь-якого з них означає, що решта також вірні; якщо будь-яке одне із тверджень є помилковим, то всі вони помилкові. Так, наприклад, якби миAx=0 визначили, що рівняння має рівно одне рішення (іA булоn×n матрицею), то ми б знали, щоAAx=b було обернено, що було тільки одне рішення, що зменшений рядок ешелон формаA була іI т.д.
  2. Давайте пройдемося по кожному з тверджень і подивимося, чому ми вже знали, що всі вони сказали по суті одне і те ж.
    1. Це просто говорить, щоA є оборотним — тобто існуєA1 така матриця, щоA1A=AA1=I. Ми продовжуватимемо, щоб показати, чому всі інші твердження в основному говорять нам «Aє оборотним».
    2. Якщо ми знаємо, щоA є оборотним, то ми вже знаємо, що є матрицяB деBA=I. Це частина визначення оборотного. Однак ми також можемо «піти іншим шляхом». Нагадаємо з теореми 2.6.1, що навіть якщо все, що ми знаємо, що є матрицяB деBA=I, то ми також знаємо, щоAB=I. Тобто ми знаємо, щоB є зворотнимA (а отже, іA є оборотним).
    3. Ми використовуємо ту ж логіку, що і в попередньому твердженні, щоб показати, чому це те ж саме, що і «Aобертається».
    4. ЯкщоA обертається, ми можемо знайти зворотне за допомогою Key Idea 2.6.1 (що, в свою чергу, залежить від теореми 2.6.1). Суть Key Idea 2.6.1 полягає в тому, що зменшена форма ешелону рядківA єI; якщо це щось інше, ми не можемо знайтиA1 (його не існує). Знаючи, щоA є оборотним, означає, що зменшена форма ешелону рядуA єI. Ми можемо піти іншим шляхом; якщо ми знаємо, що зменшена форма ешелону рядківA єI, то ми можемо використовувати Key Idea 2.6.1, щоб знайтиA1, так самоA є оборотним.
    5. З теореми 2.6.4 ми знаємо, що якщоA є оборотним, то заданим будь-яким векторомb, завждиAx=b має рівно одне рішення, а самеx=A1b. Однак ми можемо піти іншим шляхом; скажімо, ми знаємо, щоAx=b завжди має саме рішення. Як можна зробити висновок, щоA є оборотним?
      Подумайте про те, як ми до цього моменту визначили рішенняAx=b. Налаштовуємо доповнену матрицю[Ab] і поміщаємо її в зменшену форму ешелону рядка. Ми знаємо, що отримання матриці ідентичності зліва означає, що у нас було унікальне рішення (а не отримання ідентичності означає, що ми або не маємо рішення, або нескінченні рішення). Отже, потрапляючиI ліворуч, означає мати унікальне рішення; маючиI ліворуч означає, що зменшена форма ешелону рядкаA єI, яку ми знаємо зверху - це те саме,A що бути оборотним.
    6. Це те саме, що і вище; простоb замініть вектор на вектор0.

Ось ми і придумали список тверджень, які всі еквівалентні твердженню «Aє оборотним». Знову ж таки, якщо ми знаємо, що якщо будь-який з них є істинним (або помилковим), то всі вони істинні (або всі помилкові).

Теорема формально2.7.1 стверджує, що якщоA є оборотним, тоAx=b має рівно одне рішення, а самеA1b. Що робитиA, якщо не обертається? Які можливості для вирішенняAx=b?

Ми знаємо, щоAx=b не може мати рівно одного рішення; якби це було, то за нашою теоремою воно було б обернене. Згадуючи, що лінійні рівняння мають або одне рішення, нескінченні розв'язки, або не розв'язок, ми залишаємося з останніми варіантами, коли неA є оборотними. Ця ідея важлива, і тому ми знову заявимо про це як ключову ідею.

Ключова ідея2.7.1: Solutions to Ax=b and the Invertibility of A

Розглянемо систему лінійних рівняньAx=b.

  1. ЯкщоA оборотний, тоAx=b має рівно одне рішення, а самеA1b.
  2. Якщо неA є оборотним, тоAx=b має або нескінченні рішення, або немає.

У2.7.1 теоремі ми придумали список способів, за допомогою яких ми можемо сказати, чи є матриця оборотною. У той же час ми придумали список властивостей оборотних матриць — речі, які ми знаємо, які правдиві щодо них. (Наприклад, якщо ми знаємо, щоA є оборотним, то ми знаємо, щоAx=b має лише одне рішення.)

Тепер ми продовжуємо відкривати інші властивості оборотних матриць. Зокрема, ми хочемо з'ясувати, як оборотність взаємодіє з іншими матричними операціями. Наприклад, якщо ми знаємо, щоA іB є оборотними, що таке зворотнеA+B? Що таке зворотнеAB? Що таке «зворотне від зворотного?» Ми розглянемо ці питання на прикладі.

Приклад2.7.1

Нехай

A=[3201]andB=[2011].

Знайти:

  1. A1
  2. B1
  3. (AB)1
  4. (A1)1
  5. (A+B)1
  6. (5A)1

Крім того, постарайтеся знайти зв'язки між кожним з перерахованих вище.

Рішення

  1. ОбчисленняA1 є простим; ми будемо використовувати теорему 2.6.3.
    A1=13[1203]=[1/32/301]
  2. ОбчислюємоB1 так само, як і вище.
    B1=12[1012]=[1/201/21]
  3. Для обчислення(AB)1 ми спочатку обчислюємоAB: Тепер
    AB=[3201][2011]=[4211]
    ми застосовуємо теорему 2.6.3, щоб знайти(AB)1.
    (AB)1=16[1214]=[1/61/31/62/3]
  4. Для обчислення(A1)1 ми просто застосуємо теорему 2.6.3 доA1:
    (A1)1=11/3[12/301/3]=[3201].
  5. Для обчислення ми спочатку обчислюємо(A+B)1,A+B а потім застосовуємо теорему 2.6.3:
    A+B=[3201]+[2011]=[1212].
    Отже,
    (A+B)1=10[2211]=!
    наш останній вираз справді дурниця; ми знаємоadbc=0, що якщо, то дана матриця не є зворотною. Це стосуєтьсяA+B, тому ми робимо висновок, щоA+B це не обертається.
  6. Для обчислення ми обчислюємо(5A)1,5A а потім застосовуємо теорему 2.6.3.
    (5A)1=([151005])1=175[510015]=[1/152/1501/5]

Тепер ми шукаємо зв'язки міжA1,B1,(AB)1,(A1)1 і(A+B)1.

  1. Чи існує якийсь зв'язок між(AB)1 іA1 іB1? Перше припущення, яке здається правдоподібним, є(AB)1=A1B1. Це правда? Використовуючи нашу роботу зверху, ми маємо
    A1B1=[1/32/301][1/201/21]=[1/22/31/21].
    Очевидно, що це не дорівнює(AB)1. Перш ніж ми зробимо якесь подальше ворожіння, давайте подумаємо про те,AB що має робити зворотне. Зворотне - назвемо цеC - має бути матрицею, такою, що
    (AB)C=C(AB)=I.
    При вивченні виразу ми бачимо(AB)C, що хочемоB якось «скасувати» зC. Що «скасовує»B? Очевидною відповіддю єB1. Це дає нам думку: можливо, ми отримали порядокA1 іB1 неправильно раніше. Зрештою, ми сподівалися знайти, що,
    ABA1B1?=I,
    але алгебраїчно кажучи, важко скасувати ці умови. 1Однак перемикання порядкуA1 іB1 дає нам деяку надію. Є(AB)1=B1A1? Давайте подивимося.
    (AB)(B1A1)=A(BB1)A1(regrouping by the associative property)=AIA1(BB1=I)=AA1(AI=A)=I(AA1=I)
    Таким чином здається, що(AB)1=B1A1. Підтвердимо це нашими прикладами матриць.
    B1A1=[1/201/21][1/32/301]=[1/61/31/62/3]=(AB)1.
    Це спрацювало!

  2. Чи існує якийсь зв'язок між(A1)1 іA? Відповідь досить очевидна: вони рівні. «Обернене обернене» повертає одиницю до початкової матриці.

  3. Чи є якісь відносини між(A+B)1,A1 іB1? Звичайно, якби ми були змушені зробити припущення, не працюючи жодних прикладів, ми б здогадалися, що
    (A+B)1?=A1+B1.
    Однак, ми побачили, що в нашому прикладі матриця навіть(A+B) не обертається. Це в значній мірі вбиває будь-яку надію на зв'язок.

  4. Чи існує зв'язок між(5A)1 іA1? Врахуйте:
    (5A)1=[1/152/1501/5]=15[1/32/301/5]=15A1
    Так, зв'язок є!

Підіб'ємо підсумки цього прикладу. ЯкщоA іB є оборотними матрицями, то так і їх добуток,AB. Ми продемонстрували це на нашому прикладі, і є ще що сказати. Припустимо, щоA іB єn×n матрицями, але ми ще не знаємо, чи є вони оборотними. ЯкщоAB є оборотним, то кожен зA іB є; якщоAB не обертається, тоA абоB теж не обертається.

Коротше кажучи, оборотність «добре працює» з матричним множенням. Однак ми побачили, що це погано працює з додаванням матриці. Знання того, щоA іB є оборотними, не допомагає нам знайти зворотне(A+B); насправді остання матриця може навіть не бути оборотною. 2

Давайте зробимо ще один приклад, потім підсумуємо результати цього розділу в теоремі.

Приклад2.7.2

Знайти зворотнеA=[200030007].

Рішення

Ми знайдемоA1 using Key Idea 2.6.1.

[200100030010007001]rref[1001/20001001/30001001/7]

Тому

A1=[1/20001/30001/7].

МатрицяA в попередньому прикладі являє собою діагональну матрицю: єдині ненульові записиA лежать по діагоналі. 3Відносини міжA іA1 в наведеному вище прикладі здаються досить міцними, і це справедливо в цілому. Ми викладемо це і підсумуємо результати цього розділу наступною теоремою.

Теорема2.7.2

Властивості оборотних матриць

BДозволятиA і бутиn×n оборотними матрицями. Потім:

  1. ABє оборотним;(AB)1=B1A1.
  2. A1є оборотним;(A1)1=A.
  3. nAобертається для будь-якого ненульового скаляраn;(nA)1=1nA1.
  4. ЯкщоA діагональна матриця, з діагональними записамиd1,d2,,dn, де немає жодної діагональної записи0, тоA1 існує і є діагональною матрицею. Крім того, діагональні записиA1 є1/d1,1/d2,,1/dn.

Крім того,

  1. Якщо продукт неAB є оборотним, тоA або неB є оборотним.
  2. ЯкщоA або неB є оборотними, то неAB є оборотними.

Закінчуємо цей розділ коментарем про рішення систем рівнянь «в реальному житті». 4Вирішення системиAx=b за допомогою обчисленьA1b здається досить гладким, тому було б сенс, що це так, як це зазвичай робиться. Однак на практиці це робиться рідко. Є дві основні причини, чому це так.

По-перше, обчисленняA1 іA1b є «дорогим» в тому сенсі, що займає багато обчислювального часу. Звичайно, наші калькулятори не мають проблем з тими3×3 випадками, які ми часто розглядаємо в цьому підручнику, але в реальному житті розглядаються матриці дуже великі (як у сотнях тисяч рядків і стовпців). A1Поодинці обчислення досить непрактичні, і ми витрачаємо багато часу, якщо прийдемо з'ясувати, щоA1 не існує. Навіть якщо ми вже знаємо, щоA1 таке, обчисленняA1b коштують обчислювально дорого - гаусова елімінація швидше.

По-друге, обчисленняA1 за допомогою описаного нами методу часто породжують числові помилки округлення. Незважаючи на те, що комп'ютери часто роблять обчислення з точністю до більш ніж 8 знаків після коми, після тисяч обчислень округлення можуть спричинити великі помилки. (У «маленькій»1,000×1,000 матриці є1,000,000 записи! Ось багато місць, де накопичуються помилки округлення!) Це не нечуване мати комп'ютер обчислюватиA1 для великої матриці, а потім відразу ж змусити його обчислитиAA1 і не отримати ідентифікаційну матрицю. 5

Тому в реальному житті рішення зазвичай знаходять за допомогою методів,Ax=b які ми дізналися в розділі 2.4. Виявляється, навіть при всіх наших досягненнях в математиці важко обіграти базовий метод, який Гаусс давно ввів.

Виноски

[1] Нагадаємо, що множення матриці не є комутативним.

[2] Той факт, що оборотність добре працює з множенням матриць, не повинен стати несподіванкою. Адже кажучи, щоA є оборотним, робить твердження про багатоплікаційні властивостіA. У ньому написано, що я можу помножити заA допомогою спеціальної матриці, щоб отриматиI. Зворотність, сама по собі, нічого не говорить про додавання матриць, тому ми не повинні бути занадто здивовані, що це погано працює з ним.

[3] Ми досі формально не визначили діагональ, але визначення є досить візуальним, тому ми ризикуємо. Докладніші відомості див. у Визначенні 3.1.2.

[4] Так, реальні люди вирішують лінійні рівняння в реальному житті. Не тільки математикам, але економістам, інженерам і вченим усіх смаків регулярно потрібно вирішувати лінійні рівняння, а матриці, які вони використовують, часто величезні.

Більшість людей бачать матриці на роботі, не замислюючись про це. Цифрові картинки - це просто «прямокутні масиви» чисел, що представляють кольори — вони є матрицями кольорів. Багато стандартних операцій обробки зображень включають операції з матрицею. Дружина автора має «7-мегапіксельну» камеру, яка створює знімки3072×2304 розміром, даючи понад 7 мільйонів пікселів, і це навіть не вважається «великою» картиною в наші дні.

[5] Результат, як правило, дуже близький, з цифрами на діагоналі близькими до 1, а інші записи близько 0. Але це не зовсім матриця ідентичності.