3.2: Матричне трасування
- Page ID
- 63392
- T/F: Ми обчислюємо лише слід квадратних матриць.
- T/F: Можна визначити, чи є матриця оборотною шляхом обчислення сліду.
У попередньому розділі ми дізналися про операцію, яку ми можемо виконати над матрицями, а саме про транспонування. З огляду на матрицю\(A\), ми можемо «знайти транспонування»\(A\), яка є іншою матрицею. У цьому розділі ми дізнаємося про нову операцію під назвою трасування. Це інший тип операції, ніж транспонування. З огляду на матрицю\(A\), ми можемо «знайти слід»\(A\), який не є матрицею, а числом. Ми формально визначаємо його тут.
\(A\)Дозволяти бути\(n\times n\) матрицею. Слід\(A\), позначається\(\text{tr}(A)\), є сумою діагональних елементів\(A\). Тобто,
\[\text{tr}(A)=a_{11}+a_{22}+\cdots +a_{nn}. \nonumber \]
Це здається простим визначенням, і це дійсно так. Просто щоб переконатися в цьому зрозуміло, давайте потренуємося.
Знайдіть слід\(A\)\(B\), і\(C\)\(I_{4}\), де
\[A=\left[\begin{array}{cc}{1}&{2}\\{3}&{4}\end{array}\right],\quad B=\left[\begin{array}{ccc}{1}&{2}&{0}\\{3}&{8}&{1}\\{-2}&{7}&{-5}\end{array}\right]\quad\text{and}\quad C=\left[\begin{array}{ccc}{1}&{2}&{3}\\{4}&{5}&{6}\end{array}\right]. \nonumber \]
Рішення
Щоб знайти слід\(A\), зверніть увагу, що діагональними елементами\(A\) є\(1\) і\(4\). Тому,\(\text{tr}(A)=1+4=5\).
Бачимо, що діагональні елементи\(B\) є\(1,\: 8\) і\(-5\), так\(\text{tr}(B)=1+8-5=4\).
Матриця не\(C\) є квадратною матрицею, і наше визначення стверджує, що ми повинні почати з квадратної матриці. Тому\(\text{tr}(C)\) не визначено.
Нарешті, діагональ\(I_{4}\) складається з чотирьох 1s. Тому\(\text{tr}(I_{4}) = 4\).
Тепер, коли ми визначили слід матриці, ми повинні думати як математики і задавати деякі питання. Перші питання, які повинні з'явитися в нашій свідомості, повинні бути схожі на «Як працює трасування з іншими матричними операціями?» \(^{1}\)Слід подумати про те, як працює трасування з додаванням матриць, скалярним множенням, множенням матриць, зворотними матрицями та транспонуванням.
Ми дамо теорему, яка формально скаже нам, що правда в даний момент, але спочатку давайте пограємо з двома матрицями зразків і подивимося, якщо ми можемо побачити, що буде. Нехай
\[A=\left[\begin{array}{ccc}{2}&{1}&{3}\\{2}&{0}&{-1}\\{3}&{-1}&{3}\end{array}\right]\quad\text{and}\quad B=\left[\begin{array}{ccc}{2}&{0}&{1}\\{-1}&{2}&{0}\\{0}&{2}&{-1}\end{array}\right]. \nonumber \]
Повинно бути зрозуміло, що\(\text{tr}(A)=5\) і\(\text{tr}(B)=3\). Що таке\(\text{tr}(A+B)\)?
\[\begin{align}\begin{aligned}\text{tr}(A+B)&=\text{tr}\left(\left[\begin{array}{ccc}{2}&{1}&{3}\\{2}&{0}&{-1}\\{3}&{-1}&{3}\end{array}\right]+\left[\begin{array}{ccc}{2}&{0}&{1}\\{-1}&{2}&{0}\\{0}&{2}&{-1}\end{array}\right]\right) \\ &=\text{tr}\left(\left[\begin{array}{ccc}{4}&{1}&{4}\\{1}&{2}&{-1}\\{3}&{1}&{2}\end{array}\right]\right) \\ &=8\end{aligned}\end{align} \nonumber \]
Таким чином, ми помічаємо, що\(\text{tr}(A+B)=\text{tr}(A)+\text{tr}(B)\). Це, мабуть, не випадковість.
Як працює трасування зі скалярним множенням? Якщо\(A\) помножити на\(4\), то діагональні елементи будуть\(8,\: 0\) і\(12\), так\(\text{tr}(4A)=20\). Це збіг, що це\(4\) раз слід\(A\)?
Перейдемо до множення матриці. Як слід буде\(AB\) ставитися до слідів\(A\) і\(B\)? Давайте подивимося:
\[\begin{align}\begin{aligned}\text{tr}(AB)&=\text{tr}\left(\left[\begin{array}{ccc}{2}&{1}&{3}\\{2}&{0}&{-1}\\{3}&{-1}&{3}\end{array}\right]\left[\begin{array}{ccc}{2}&{0}&{1}\\{-1}&{2}&{0}\\{0}&{2}&{-1}\end{array}\right]\right) \\ &=\text{tr}\left(\left[\begin{array}{ccc}{3}&{8}&{-1}\\{4}&{-2}&{3}\\{7}&{4}&{0}\end{array}\right]\right) \\ &=1\end{aligned}\end{align} \nonumber \]
Не зовсім зрозуміло, які відносини між\(\text{tr}(A)\),\(\text{tr}(B)\) і\(\text{tr}(AB)\). Перш ніж рухатися далі, знайдемо\(\text{tr}(BA)\):
\[\begin{align}\begin{aligned}\text{tr}(BA)&=\text{tr}\left(\left[\begin{array}{ccc}{2}&{0}&{1}\\{-1}&{2}&{0}\\{0}&{2}&{-1}\end{array}\right]\left[\begin{array}{ccc}{2}&{1}&{3}\\{2}&{0}&{-1}\\{3}&{-1}&{3}\end{array}\right]\right) \\ &=\text{tr}\left(\left[\begin{array}{ccc}{7}&{1}&{9}\\{2}&{-1}&{-5}\\{1}&{1}&{-5}\end{array}\right]\right) \\ &=1\end{aligned}\end{align} \nonumber \]
Ми це помічаємо\(\text{tr}(AB)=\text{tr}(BA)\). Це випадково?
Як проходять сліди\(A\) і\(A^{-1}\) пов'язані з ними? Ми обчислюємо\(A^{-1}\) і знаходимо, що
\[A^{-1}=\left[\begin{array}{ccc}{1/17}&{6/17}&{1/17}\\{9/17}&{3/17}&{-8/17}\\{2/17}&{-5/17}&{2/17}\end{array}\right]. \nonumber \]
Тому\(\text{tr}(A^{-1})=6/17\). Знову ж таки, відносини не зрозумілі. \(^{2}\)
Нарешті, давайте подивимося, як слід пов'язаний з транспонуванням. Ми насправді не повинні формально обчислювати що-небудь. Нагадаємо з попереднього розділу, що діагоналі\(A\) і\(A^{T}\) однакові; отже,\(\text{tr}(A)=\text{tr}(A^{T})\). Це, ми точно знаємо, не випадковість.
Тепер ми формально заявляємо, які рівності є істинними при розгляді взаємодії сліду з іншими операціями матриці.
\(A\)\(B\)Дозволяти і бути\(n\times n\) матрицями. Потім:
- \(\text{tr}(A+B)=\text{tr}(A)+\text{tr}(B)\)
- \(\text{tr}(A-B)=\text{tr}(A)-\text{tr}(B)\)
- \(\text{tr}(kA)=k\cdot\text{tr}(A)\)
- \(\text{tr}(AB)=\text{tr}(BA)\)
- \(\text{tr}(A^{T})=\text{tr}(A)\)
Однією з ключових речей, яку слід зазначити, є те, що ця теорема не говорить. Це нічого не говорить про те, як слід відноситься до зворотних. Причина мовчання в цих сферах полягає в тому, що стосунків просто немає.
Ми закінчуємо цей розділ, знову дивуючись, чому хтось буде піклуватися про слід матриці. Одна з причин, по якій математики цікавляться, полягає в тому, що він може дати вимір «\(^{3}\)розміру» матриці.
Розглянемо наступні\(2 \times 2\) матриці:
\[A=\left[\begin{array}{cc}{1}&{-2}\\{1}&{1}\end{array}\right]\quad\text{and}\quad B=\left[\begin{array}{cc}{6}&{7}\\{11}&{-4}\end{array}\right]. \nonumber \]
Ці матриці мають однаковий слід, але\(B\) явно мають більші елементи в ньому. Отже, як ми можемо використовувати трасування для визначення «розміру» цих матриць? Ми можемо розглянути\(\text{tr}(A^{T}A)\) і\(\text{tr}(B^{T}B)\).
\[\begin{align}\begin{aligned}\text{tr}(A^{T}A)&=\text{tr}\left(\left[\begin{array}{cc}{1}&{1}\\{-2}&{1}\end{array}\right]\left[\begin{array}{cc}{1}&{-2}\\{1}&{1}\end{array}\right]\right) \\ &=\text{tr}\left(\left[\begin{array}{cc}{2}&{-1}\\{-1}&{5}\end{array}\right]\right) \\ &=7\end{aligned}\end{align} \nonumber \]
\[\begin{align}\begin{aligned}\text{tr}(B^{T}B)&=\text{tr}\left(\left[\begin{array}{cc}{6}&{11}\\{7}&{-4}\end{array}\right]\left[\begin{array}{cc}{6}&{7}\\{11}&{-4}\end{array}\right]\right) \\ &=\text{tr}\left(\left[\begin{array}{cc}{157}&{-2}\\{-2}&{65}\end{array}\right]\right) \\ &=222\end{aligned}\end{align} \nonumber \]
Наше занепокоєння полягає не в тому, як інтерпретувати, що означає це «розмір» вимірювання, а скоріше, щоб продемонструвати, що слід (разом з транспонуванням) може бути використаний для надання (можливо, корисної) інформації про матрицю. \(^{4}\)
Виноски
[1] Нагадаємо, що ми задали подібне питання, коли дізналися про транспонування.
[2] Щось подумати: ми знаємо, що не всі квадратні матриці є оборотними. Чи зможемо ми сказати просто по сліду? Це здається малоймовірним.
[3] Існує багато різних вимірювань розміру матриці. У цьому тексті ми просто посилаємося на його розміри. Деякі вимірювання розміру відносяться до величини елементів в матриці. У наступному розділі описано ще одне вимірювання розміру матриці.
[4] Цей приклад виводить на світ багато цікавих ідей, які ми трохи втілимо тут.
- Зверніть увагу, що елементи\(A\) є\(1\)\(-2\),\(1\) і\(1\). Складіть квадрати цих чисел:\(1^2 + (-2)^2 + 1^2 + 1^2 = 7 =\text{tr}(A^{T}A)\).
Зверніть увагу, що елементи\(B\) є\(6\)\(7\),\(11\) і\(-4\). Додайте квадрати цих чисел:\(6^2 + 7^2 + 11^2 + (-4)^2 = 222 =\text{tr}(B^{T}B)\).
Чи можете ви зрозуміти, чому це правда? Дивлячись на множення\(A^{T}A\), зосередьтеся лише на тому, звідки беруться елементи на діагоналі, оскільки вони єдині, які мають значення при отриманні сліду. - Ви можете самостійно підтвердити, що незалежно від габаритів\(A\),\(\text{tr}(A^{T}A)=\text{tr}(AA^{T})\). Щоб зрозуміти, чому це правда, розглянемо попередній пункт. (Нагадаємо також, що\(A^{T}A\) і\(AA^{T}\) завжди квадратні, незалежно від габаритів\(A\).)
- Математиків насправді більше цікавить\(\sqrt{\text{tr}(A^{T}A)}\), ніж просто\(\text{tr}(A^{T}A)\). Причина цього трохи складна; коротка відповідь полягає в тому, що «він працює краще». Причина «це працює краще» пов'язана з теоремою Піфагора, всі речі. Якщо ми знаємо, що ніжки прямокутного трикутника мають довжину\(a\) і\(b\), нас більше цікавить,\(\sqrt{a^2+b^2}\) ніж просто\(a^2+b^2\). Звичайно, це пояснення викликає більше питань, ніж відповідає; наша мета тут - просто підігріти апетит і змусити вас зробити трохи більше читання. Книга чисельної лінійної алгебри буде гарним місцем для початку.
