3.2: Матричне трасування
- T/F: Ми обчислюємо лише слід квадратних матриць.
- T/F: Можна визначити, чи є матриця оборотною шляхом обчислення сліду.
У попередньому розділі ми дізналися про операцію, яку ми можемо виконати над матрицями, а саме про транспонування. З огляду на матрицюA, ми можемо «знайти транспонування»A, яка є іншою матрицею. У цьому розділі ми дізнаємося про нову операцію під назвою трасування. Це інший тип операції, ніж транспонування. З огляду на матрицюA, ми можемо «знайти слід»A, який не є матрицею, а числом. Ми формально визначаємо його тут.
AДозволяти бутиn×n матрицею. СлідA, позначаєтьсяtr(A), є сумою діагональних елементівA. Тобто,
tr(A)=a11+a22+⋯+ann.
Це здається простим визначенням, і це дійсно так. Просто щоб переконатися в цьому зрозуміло, давайте потренуємося.
Знайдіть слідAB, іCI4, де
A=[1234],B=[120381−27−5]andC=[123456].
Рішення
Щоб знайти слідA, зверніть увагу, що діагональними елементамиA є1 і4. Тому,tr(A)=1+4=5.
Бачимо, що діагональні елементиB є1,8 і−5, такtr(B)=1+8−5=4.
Матриця неC є квадратною матрицею, і наше визначення стверджує, що ми повинні почати з квадратної матриці. Томуtr(C) не визначено.
Нарешті, діагональI4 складається з чотирьох 1s. Томуtr(I4)=4.
Тепер, коли ми визначили слід матриці, ми повинні думати як математики і задавати деякі питання. Перші питання, які повинні з'явитися в нашій свідомості, повинні бути схожі на «Як працює трасування з іншими матричними операціями?» 1Слід подумати про те, як працює трасування з додаванням матриць, скалярним множенням, множенням матриць, зворотними матрицями та транспонуванням.
Ми дамо теорему, яка формально скаже нам, що правда в даний момент, але спочатку давайте пограємо з двома матрицями зразків і подивимося, якщо ми можемо побачити, що буде. Нехай
A=[21320−13−13]andB=[201−12002−1].
Повинно бути зрозуміло, щоtr(A)=5 іtr(B)=3. Що такеtr(A+B)?
tr(A+B)=tr([21320−13−13]+[201−12002−1])=tr([41412−1312])=8
Таким чином, ми помічаємо, щоtr(A+B)=tr(A)+tr(B). Це, мабуть, не випадковість.
Як працює трасування зі скалярним множенням? ЯкщоA помножити на4, то діагональні елементи будуть8,0 і12, такtr(4A)=20. Це збіг, що це4 раз слідA?
Перейдемо до множення матриці. Як слід будеAB ставитися до слідівA іB? Давайте подивимося:
tr(AB)=tr([21320−13−13][201−12002−1])=tr([38−14−23740])=1
Не зовсім зрозуміло, які відносини міжtr(A),tr(B) іtr(AB). Перш ніж рухатися далі, знайдемоtr(BA):
tr(BA)=tr([201−12002−1][21320−13−13])=tr([7192−1−511−5])=1
Ми це помічаємоtr(AB)=tr(BA). Це випадково?
Як проходять слідиA іA−1 пов'язані з ними? Ми обчислюємоA−1 і знаходимо, що
A−1=[1/176/171/179/173/17−8/172/17−5/172/17].
Томуtr(A−1)=6/17. Знову ж таки, відносини не зрозумілі. 2
Нарешті, давайте подивимося, як слід пов'язаний з транспонуванням. Ми насправді не повинні формально обчислювати що-небудь. Нагадаємо з попереднього розділу, що діагоналіA іAT однакові; отже,tr(A)=tr(AT). Це, ми точно знаємо, не випадковість.
Тепер ми формально заявляємо, які рівності є істинними при розгляді взаємодії сліду з іншими операціями матриці.
ABДозволяти і бутиn×n матрицями. Потім:
- tr(A+B)=tr(A)+tr(B)
- tr(A−B)=tr(A)−tr(B)
- tr(kA)=k⋅tr(A)
- tr(AB)=tr(BA)
- tr(AT)=tr(A)
Однією з ключових речей, яку слід зазначити, є те, що ця теорема не говорить. Це нічого не говорить про те, як слід відноситься до зворотних. Причина мовчання в цих сферах полягає в тому, що стосунків просто немає.
Ми закінчуємо цей розділ, знову дивуючись, чому хтось буде піклуватися про слід матриці. Одна з причин, по якій математики цікавляться, полягає в тому, що він може дати вимір «3розміру» матриці.
Розглянемо наступні2×2 матриці:
A=[1−211]andB=[6711−4].
Ці матриці мають однаковий слід, алеB явно мають більші елементи в ньому. Отже, як ми можемо використовувати трасування для визначення «розміру» цих матриць? Ми можемо розглянутиtr(ATA) іtr(BTB).
tr(ATA)=tr([11−21][1−211])=tr([2−1−15])=7
tr(BTB)=tr([6117−4][6711−4])=tr([157−2−265])=222
Наше занепокоєння полягає не в тому, як інтерпретувати, що означає це «розмір» вимірювання, а скоріше, щоб продемонструвати, що слід (разом з транспонуванням) може бути використаний для надання (можливо, корисної) інформації про матрицю. 4
Виноски
[1] Нагадаємо, що ми задали подібне питання, коли дізналися про транспонування.
[2] Щось подумати: ми знаємо, що не всі квадратні матриці є оборотними. Чи зможемо ми сказати просто по сліду? Це здається малоймовірним.
[3] Існує багато різних вимірювань розміру матриці. У цьому тексті ми просто посилаємося на його розміри. Деякі вимірювання розміру відносяться до величини елементів в матриці. У наступному розділі описано ще одне вимірювання розміру матриці.
[4] Цей приклад виводить на світ багато цікавих ідей, які ми трохи втілимо тут.
- Зверніть увагу, що елементиA є1−2,1 і1. Складіть квадрати цих чисел:12+(−2)2+12+12=7=tr(ATA).
Зверніть увагу, що елементиB є67,11 і−4. Додайте квадрати цих чисел:62+72+112+(−4)2=222=tr(BTB).
Чи можете ви зрозуміти, чому це правда? Дивлячись на множенняATA, зосередьтеся лише на тому, звідки беруться елементи на діагоналі, оскільки вони єдині, які мають значення при отриманні сліду. - Ви можете самостійно підтвердити, що незалежно від габаритівA,tr(ATA)=tr(AAT). Щоб зрозуміти, чому це правда, розглянемо попередній пункт. (Нагадаємо також, щоATA іAAT завжди квадратні, незалежно від габаритівA.)
- Математиків насправді більше цікавить√tr(ATA), ніж простоtr(ATA). Причина цього трохи складна; коротка відповідь полягає в тому, що «він працює краще». Причина «це працює краще» пов'язана з теоремою Піфагора, всі речі. Якщо ми знаємо, що ніжки прямокутного трикутника мають довжинуa іb, нас більше цікавить,√a2+b2 ніж простоa2+b2. Звичайно, це пояснення викликає більше питань, ніж відповідає; наша мета тут - просто підігріти апетит і змусити вас зробити трохи більше читання. Книга чисельної лінійної алгебри буде гарним місцем для початку.