1.6: Операції з матрицями
У попередньому розділі ми побачили важливий зв'язок між лінійними функціями та матрицями. У цьому розділі ми обговоримо різні операції над матрицями, які нам знадобляться в нашій подальшій роботі з лінійними функціями.
Алгебра матриць
ЯкщоM n×mматриця withaij вi -му рядку іj й стовпціi=1,2,…,n,j=1,2,…,m, то напишемоM=[aij]. За допомогою цього позначення визначення додавання, віднімання та скалярного множення для матриць є прямими.
Визначення1.6.1
ПрипустимоN=[bij],M=[aij] і єn×m матрицями іc є дійсним числом. Потім визначаємо
M+N=[aij+bij],
M−N=[aij−bij],
і
cM=[caij].
Іншими словами, ми визначаємо додавання, віднімання та скалярне множення для матриць, виконуючи ці операції над окремими елементами матриць, подібно до того, як ми виконуємо ці операції над векторами.
Приклад1.6.1
Якщо
\ [M=\ left [\ begin {масив} {rrr}
1 & 2 & 3\\
-5 & 3 & -1
\ end {масив}\ праворуч]\ nonumber\]
і
\ [N=\ left [\ begin {масив} {rrr}
3 & 1\\
1 & -3 & 2
\ end {масив}\ праворуч],\ nonumber\]
то, наприклад,
\ [\ почати {вирівняний}
&M+N=\ лівий [\ почати {масив} {rrr}
1+3 & 2+1 & 3+4\\
-5+1 & 3-3 & -1+2
\ кінець {масив}\ справа] =\ лівий [\ початок {масив} {rrr}
4 & 3\\
-4 & 0 & 1
\ кінець {масив}\ праворуч], \\
&M-N=\ лівий [\ почати {масив} {rrr}
1-3 & 2-1 & 3-4\\
-5-1 & 3+3 & -1-2
\ кінець {масив}\ справа] =\ лівий [\ begin {масив} {lll}
-2 & 1\\
-6 & 6 & -3
\ end {масив}\ праворуч],
\ end {вирівняний}\ nonumber\]
і
\ [3 M=\ лівий [\ begin {масив} {rrr}
3 & 6 & 9\\
-15 & 9 & -2
\ end {масив}\ праворуч]. \ номер\]
Ці операції мають природні інтерпретації з точки зору лінійних функцій. ПрипустимоK:Rm→Rn ,L:Rm→Rn і є лінійними зL(x)=Mx іK(x)=Nx дляn×m матрицьM іN. Якщо миL+K:Rn→Rm визначимо
(L+K)(x)=L(x)+K(x),
потім
(L+K)(ej)=L(ej)+K(ej)
дляj=1,2,…,m. Звідсиj й стовпець матриці,L+K який представляє собою сумуj го стовпцівM іN. Іншими словами,
(L+K)(x)=(M+N)x
для всіхx вRm. Аналогічно, якщо миL−K:Rm→Rn визначимо
(L−K)(x)=L(x)−K(x),
потім
(L−K)(x)=(M−N)x.
Якщо, для будь-якого скаляраc, ми визначаємоcL:Rm→Rn по
cL(x)=c(L(x)),
потім
cL(ej)=c(L(ej))
дляj=1,2,…,m. Звідсиj й стовпець матриці, який представляє,cL є скалярним,c кращим відj го стовпцяM. Тобто,
cL(x)=(cM)x
для всіхx вRm. Коротше кажучи, операції додавання, віднімання та скалярного множення для матриць природним чином відповідають операціям додавання, віднімання та скалярного множення для лінійних функцій.
Тепер розглянемо випадок, деL:Rm→Rp іK:Rp→Rn знаходяться лінійні функції. MДозволятиp×m матриця така, щоL(x)=Mx для всіхx вRm і нехайN будеn×p матриця така, щоK(x)=Nx для всіхx вRp. Так як для будь-якогоx вRm,L(x) знаходиться вRp, ми можемо сформуватиK∘L:Rm→Rn, складK зL, визначається
K∘L(x)=K(L(x)).
Зараз
K(L(x))=N(Mx),
тому було б природно визначитиNM, добуток матрицьN іM, щоб бути матрицеюK∘L, в цьому випадку ми б
N(Mx)=(NM)x.
Таким чином, ми хочемо, щобj той стовпецьNMj=1,2,…,m,, бути
K∘L(ej)=N(L(ej)),
який є лише точковимL(ej) добутком з рядківN. АлеL(ej) цеj й стовпецьM, тому стовпець зNM формується шляхом прийняття точкового добуткуj го стовпцяM з рядківN.j Іншими словами, запис уi -му рядку таj стовпціNM - це крапковийi добуток го рядкаN зj го стовпчикаM. Ми виписуємо це явно в наступному визначенні.
Визначення1.6.2
ЯкщоN=[aij]n×p матриця іM=[bij] єp×m матрицею, то визначаємо добутокN іM бутиn×m матрицеюNM=[cij], де
cij=p∑k=1aikbkj,
i=1,2,…,n and j=1,2,…,m.
Зауважте, щоNM єn×m матрицею, оскількиK∘L:Rm→Rn. ПричомуNM добуток двох матрицьN іM визначається тільки тоді, коли кількість стовпцівN дорівнює числу рядківM.
Приклад1.6.2
Якщо
\ [N=\ left [\ begin {масив} {rr}
1 & 2\\
-1 & 3\\
2 & -2
\ end {масив}\ праворуч]\ nonumber\]
і
\ [M=\ left [\ begin {масив} {rrrr}
2 & -2 & 1\\
1 & 2 & -1 & -2
\ end {масив}\ праворуч],\ nonumber\]
потім
\ begin {вирівняний}
N M &=\ лівий [\ begin {масив} {rr}
1 & 2\\
-1 & 3\
2 & -2
\ кінець {масив}\ праворуч]\ лівий [\ begin {масив} {rrrr}
2 & -2 & 1\\
1 & 2 & 1 & 2 & -1 & -2
\ кінець {масив}\ праворуч]\\
&=\ ліворуч [\ почати {масив} {rrrr}
2+2 & -2+4 & 1-2\\
-2+3 & 2+6 & -1-3 & -3-6\\
4-2 & -4-4 & 2+2 & 6+4
\ end {масив}\ праворуч]\\
&=\ лівий [\ почати {масив} {rrrr}
4 & 2 & -1 & -1\\
1 & 8 & -4 & -9\\
2 & -8 & 4 & 10
\ end {масив}\ праворуч].
\ end {вирівняний}
Зверніть увагу, щоN є3×2,M є2×4, іNM є3×4. Також врахуйте, що неможливо сформувати товар в іншому порядку.
Приклад1.6.3
L:R2→R3Дозволяти лінійну функцію, визначену
L(x,y)=(3x−2y,x+y,4y)
і нехайK:R3→R2 буде лінійна функція, визначена
K(x,y,z)=(2x−y+z,x−y−z).
Тоді матрицяL для
\ [M=\ left [\ begin {масив} {rr}
3 & -2\\
1 & 1\\
0 & 4
\ end {масив}\ праворуч],\ nonumber\]
матрицяK для
\ [N=\ left [\ begin {масив} {rrr}
2 & -1 & 1\
1 & -1 & -1
\ end {масив}\ праворуч],\ nonumber\]
і матрицяK∘L:R2→R2 для
\ [N M =\ лівий [\ початок {масив} {rrr}
2 & -1 & 1\
1 & -1 & -1
\ кінець {масив}\ праворуч]\ лівий [\ початок {масив} {rr}
3 & -2\\
1 & 1\\
0 & 4
\ end {масив}\ праворуч] =\ left [\ begin {масив} {ll}
6-1+0 & -4-1+4\\
3-1+0 & -2-1-4
\ end {масив}\ праворуч] =\ лівий [\ begin {масив} {ll}
5 & -1\\
2 & -7
\ end {масив}\ праворуч]. \ номер\]
Іншими словами,
\ [K\ circ L (x, y) =\ лівий [\ почати {масив} {ll}
5 & -1\\
2 & -7
\ кінець {масив}\ праворуч]\ лівий [\ початок {масив} {l}
x\
y
\ кінець {масив}\ праворуч] =\ лівий [\ початок {масив} {c}
5 x-y\
2 x-7 y
\ кінець {масив}\ право]. \ номер\]
Відзначимо, що саме в цьому випадку можна сформувати композицію в іншому порядку. МатрицяL∘K:R3→R3 для
\ [M N =\ лівий [\ початок {масив} {rr}
3 & -2\\
1 & 1\\
0 & 4
\ кінець {масив}\ праворуч]\ лівий [\ початок {масив} {rrr}
2 & -1 &
1\ -1 & -1
\ кінець {масив}\ праворуч] =\ лівий [\ почати {масив} {rrr}
6-2 & -3+2 & 3+2\\
2+1 & -1-1 & 1-1\\
0+4 & 0-4 & 0-4
\ кінець {масив}\ праворуч] =\ лівий [\ почати {масив} {rrr}
4 & -1 & 5\\
3 & -2 & 0\\
4 & -4 & -4 & -4
\ кінець {масив }\ право],\ nonnumber\]
і так
\ [L\ circ K (x, y, z) =\ лівий [\ почати {масив} {rrr}
4 & -1 & 5\\
3 & -2 & 0\\
4 & -4 & -4
\ end {масив}\ справа]\ лівий [\ початок {масив} {l}
x\
y\
z
\ кінець {масив}\ праворуч] =\ лівий [\ почати {масив} {c}
4 x-y+5 z\\
3 x-2 y\\
4 x-4 y-4 z
\ end {масив}\ праворуч]. \ номер\]
Зокрема, відзначимо, що не тільки єNM≠MN, але насправдіNM іMN навіть не однакового розміру.
Детермінанти
Поняття детермінанти матриці тісно пов'язане з ідеєю площі та обсягу. Для початку нашого визначення розглянемо2×2 матрицю
\ [M=\ left [\ begin {масив} {ll}
a_ {1} & a_ {2}\\
b_ {1} & b_ {2}
\ end {масив}\ праворуч]\ nonumber\]

і нехайa=(a1,a2) іb=(b1,b2). ЯкщоP паралелограм, який маєa іb для суміжних сторін іA є площеюP (див. Рис. 1.6.1), то ми побачили в розділі 1.3 що
A=‖(a1,a2,0)×(b1,b2,0)‖=‖(0,0,a1b2−a2b1‖=|a1b2−a2b1|.
Це мотивує наступне визначення.
Визначення1.6.3
Задано2×2 матрицю
\ [M=\ left [\ begin {масив} {ll}
a_ {1} & a_ {2}\\
b_ {1} & b_ {2}
\ кінець {масив}\ праворуч],\ nonumber\]
визначникM, позначається det (M), є
det(M)=a1b2−a2b1.
Звідси ми маємоA=|det(M)|. Словом, для2×2 матриціM абсолютне значення детермінантаM дорівнює площі паралелограма, який має рядкиM для сусідніх сторін.
Приклад1.6.4
У нас є
\ [\ ім'я оператора {det}\ left [\ begin {масив} {rr}
1 & 3\\
-4 & 5
\ end {масив}\ справа] =( 1) (5) - (3) (-4) =5+12=17. \ номер\]
Тепер розглянемо3×3 матрицю
\ [M=\ лівий [\ почати {масив} {lll}
a_ {1} & a_ {2} & a_ {3}\\
b_ {1} & b_ {2} & b_ {2} & b_ {3}\\
c_ {1} & c_ {2} & c_ {3}
\ кінець {масив}\ праворуч]\ nonumber\]
і нехайa=(a1,a2,a3)b=(b1,b2,b3), іc=(c1,c2,c3). ЯкщоV обсяг паралелепіпедаP з сусідніми ребрамиab, іc, то, знову з розділу 1.3,
\ [\ почати {вирівняти}
V &=|\ mathbf {a}\ точка (\ mathbf {b}\ раз\ mathbf {c}) |\ номер\
&=\ ліворуч | a_ {1}\ ліворуч (b_ {2} c_ {3} -b_ {3} c_ {2}\ праворуч) +a_ {2}\ ліворуч (b_ {3} c_ {1} -b_ {1} c_ {3}\ праворуч) +a_ {3}\ ліворуч (b_ {1} c_ {2} -b_ {2} c_ {1}\ праворуч)\\ nonnumber\\
&=\ left|a_ {1}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {2} & b_ {3}\ nonumber\\
c_ {2} & c_ {3}
\ кінець {масив}\ справа] -a_ {2}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {1} & b_ {3}\ nonumber\
c_ {1} & c_ {3}
\ end {масив}\ право] +a_ {3}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {1} & b_ {2}\ nonumber\\
c_ {1} & c_ {2}
\ end {масив}\ право]\ right|. \ етикетка {}
\ end {вирівняти}\]
Визначення1.6.4
Задано3×3 матрицю
\ [M=\ лівий [\ почати {масив} {lll}
a_ {1} & a_ {2} & a_ {3}\\
b_ {1} & b_ {2} & b_ {2} & b_ {3}\\
c_ {1} & c_ {2} & c_ {3}
\ кінець {масив}\ праворуч],\ nonumber\]
визначникM, позначається det (M), є
\ [\ ім'я оператора {det} (M) =a_ {1}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {2} & b_ {3}\\
c_ {2} & c_ {3}
\ кінець {масив}\ справа] -a_ {2}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {1} & b_ {3}\\
c_ {1} & c_ {3}
\ end { масив}\ праворуч] +a_ {3}\ ім'я оператора {det}\ left [\ begin {масив} {ll}
b_ {1} & b_ {2}\\
c_ {1} & c_ {2}
\ end {масив}\ право]. \ етикетка {1.6.20}\]
Аналогічно2×2 випадку, у нас єV=|det(M)|.
Приклад1.6.5
У нас є
\ begin {вирівняний}
\ ім'я оператора {det}\ left [\ begin {масив} {llr}
2 & 3 & 9\\
2 & 1 & -4\\
5 & 1 & -1
\ end {масив}\ праворуч] &=2\ ім'я оператора {det}\ left [\ begin {масив} {cc}
1 & -4\\
1 & amp; -1
\ end {масив}\ праворуч] -3\ ім'я оператора {det}\ left [\ begin {масив} {cc}
2 & -4
\
5 & -1\ кінець {масив}\ праворуч] +9\ ім'я оператора {det}\ left [\ begin {масив} {cc}
2 & 1\
\ end {масив}\ праворуч]\
&=2 (-1+4) -3 (-2+20) +9 (2-5)\\
&=6-54-27\\
&=-75.
\ end {вирівняний}
Заданоn×n матрицюM=[aij], нехайMij буде(n−1)×(n−1) матриця, отримана шляхом видаленняi го рядка таj стовпчикаM. Якщо дляn=1 ми спочатку визначаємоdet(M)=a11 (тобто детермінант1×1 матриці - це лише значення її єдиного запису), то ми могли б висловитиn=2, для, визначення детермінанти2×2 матриці, заданої в (???) у вигляді
det(M)=a11det(M11)−a12det(M12)=a11a22−a12a21.
Аналогічноn=3, з, ми могли б висловити визначенняM детермінанти заданого в (???) у формі
det(M)=a11det(M11)−a12det(M12)+a13det(M13).
За цією схемою ми можемо сформувати рекурсивне визначення детермінантиn×n матриці.
Визначення1.6.5
Припустимо,M=[aij] цеn×n матриця і нехайMij буде(n−1)×(n−1) матриця, отримана шляхом видаленняi го рядка іj го стовпцяM,i=1,2,…,n іj=1,2,…,n. Дляn=1, визначаємо детермінантM, позначаєтьсяdet(M), по
det(M)=a11
Дляn>1, визначаємо детермінантM, позначаєтьсяdet(M), по
\ [\ begin {вирівнювання}
\ ім'я оператора {det} (M) &=a_ {11}\ ім'я оператора {det}\ left (M_ {11}\ праворуч) -a_ {12}\ ім'я оператора {det}\ left (M_ {12}\ праворуч) +\ cdots+ (-1) ^ {1+n} a_ {1 n}\ ім'я оператора {det}\ ліворуч (M_ {1 n}\ праворуч)\ номер\\
&=\ sum_ {j=1} ^ {n} (-1) ^ {1+j} a_ {1 j}\ ім'я оператора {det}\ left (M_ {1 j}\ праворуч). \ етикетка {1.6.24}
\ кінець {вирівнювання}\]
Ми називаємо визначення рекурсивним, тому що ми визначили детермінантn×n матриці через детермінант(n−1)×(n−1) матриць, які, в свою чергу, визначаються через детермінант(n−2)×(n−2) матриць і так далі, поки ми не звели задачу до обчислення детермінанти1×1 матриць.
Приклад1.6.6
Для прикладу детермінанти4×4 матриці ми маємо
\ begin {вирівняний}
\ ім'я оператора {det}\ left [\ begin {масив} {rrrr}
2 & 1 & 3\
2 & 1 & 1\\ 2 & 1\\
-2 & 3 & -1 & 2\\
1 & 1 & 1
\ end {масив}\ праворуч] =2 &\\ ім'я оператора {det}\ ліворуч [\ почати {масив} {rrr}
1 & 4 & 1\\
3 & -1 & 2\\
2 & 1 & 1
\ кінець {масив}\ право] -\ ім'я оператора {det}\ left [\ begin {масив} {rrr}
2 & 4 & 1\
-2 & -1 & 2\\
1 & 11 & amp; 1
\ кінець {масив}\ праворуч]\\
&+3\ ім'я оператора {det}\ лівий [\ begin {масив} {rrr}
2 & 1\\
-2 & 3\\
1 & 2 & 2 & 1
\ end {масив}\ справа] -2\ ім'я оператора {det}\ left [\ почати {масив} {rrr}
2 & 1 & 4\\
-2 & 3 & -1\\
1 & 1 & 1
\ кінець {масив}\ праворуч]\\
=& 2 (-1-2) -4 (3-4) + (3+2)) - (2 (-1-2)\\
&\ quad-4 (-2-2) + (-2+1)) +3 (2 (3-4) - (-2-2)\\
&+ (-4-3) -2 (2 (3+2) - (-2+1) +4 (-4-3))\\
=& 2 (-3+4+5) - (-6+16-1) +3 (-2+4-7)\\
&\ квадро-2 (10+1-28)\\
=& 12-9-15+34\\
=& 22.
\ end {вирівняний}
Наступна теорема стверджує, що немає нічого особливого у використанні першого рядка матриці в розширенні детермінанти, зазначеної в (???), а також немає нічого особливого щодо розширення вздовж рядка замість стовпця. Практичний ефект полягає в тому, що ми можемо обчислити детермінант даної матриці, що розширюється вздовж того, який рядок або стовпчик є найбільш зручним. Доказ цієї теореми приведе нас занадто далеко на цьому етапі, тому ми опустимо її (але вас попросять перевірити теорему для особливих випадківn=2 таn=3 у вправі 10).
Теорема1.6.1
M=[aij]Дозволятиn×n матриця іMij нехай(n−1)×(n−1) матриця отримана шляхом видаленняi го рядка іj го стовпцяM. Тоді для будь-якогоi=1,2,…,n,
det(M)=n∑j=1(−1)i+jaijdet(Mij),
і для будь-якогоj=1,2,…,n,
det(M)=n∑i=1(−1)i+jaijdet(Mij),
Приклад1.6.7
Найпростіший спосіб обчислення визначника матриці
\ [M=\ left [\ begin {масив} {rrr}
4 & 0 & 3\\
2 & 3 & 1\\
-3 & 0 & -2
\ кінець {масив}\ праворуч]\ nonumber\]
полягає в розширенні уздовж другого стовпчика. А саме,
\ begin {вирівняний}
\ ім'я оператора {det} (M) =& (-1) ^ {1+2} (0)\ ім'я оператора {det}\ left [\ begin {масив} {rr}
2 & 1\
-3 & -2
\ end {масив}\ праворуч] + (-1) ^ {2+2} (3)\ ім'я оператора {det}\ left [\ begin {масив} {rr}
4 & 3\\
-3 & -2
\ end {масив}\ праворуч]\\
&+ (-1) ^ {3+2} (0)\ ім'я оператора {det}\ left [\ begin {масив} {ll}
4 & 3\\
2 & 1
\ end {масив}\ праворуч]\\
=& 3 (-8+9)\\
=& 3.
\ end {вирівняний}
Слід переконатися, що розширення уздовж першого ряду, як ми це робили при визначенні детермінанта, дає той же результат.
Для того щоб повернутися до проблеми обчислення обсягів, нам потрібно визначити паралелепіпед вRn. Спочатку зауважте, що якщоP є паралелограмом вR2 з сусідніми сторонами, заданими векторамиa іb, то
P={y:y=ta+sb,0≤t≤1,0≤s≤1}.
Тобто, for0≤t≤1, ta є точкою між0 іa, і for0≤s≤1,sb є точкою між0 іb; отжеta+sb, точка в паралелограміP. Причому кожен пункт вP може бути виражений саме в такому вигляді. Див. Малюнок 1.6.2. Наступне визначення узагальнює цю характеристику паралелограм.

Визначення1.6.6
a1,a2,…,anДозволяти лінійно незалежні вектори вRn. Дзвонимо
P={y:y=t1a1+t2a2+⋯+tnan,0≤ti≤1,i=1,2,…,n}
n-мірний паралелепіпед з сусідніми ребрамиa1,a2,…,an.
Визначення1.6.7
PДозволяти n -мірний паралелепіпед з сусідніми ребрамиa1,a2,…,an іM нехайn×n матриця, яка маєa1,a2,…,an для своїх рядків. Тоді обсягP визначається бути|det(M)|.
За допомогою (???) та індукції може бути показано, що якщоN матриця отримана шляхом зміни рядків та стовпцівn×n матриціM, тоdet(N)=det(M) (див. Вправа 12). Таким чином, ми могли б визначитиM в попередньому визначенні, використовуючиa1,a2,…,an для стовпців, а не рядків.
Тепер припустимоL:Rn→Rn , лінійний і нехайM будеn×n матриця така, щоL(x)=Mx для всіхx вRn. CДозволятиn -мірний паралелепіпед з суміжними ребрамиe1,e2,…,en, стандартні базисні вектори дляRn. ТодіC 1×1квадрат колиn=2 і1×1×1 куб колиn=3. Загалом, ми можемо розглядатиC якn -мірний одиничний куб. Зверніть увагу, що обсягC є, за визначенням,
\ [\ ім'я оператора {det}\ лівий [\ почати {масив} {ccccc}
1 & 0 & 0 &\ cdots &
0\\ 0 & 1 & 0 & 0 & 0\\
cdots & 0\\ 0 & 0 &
\ cdots &
0\\ vdots &\ vdots &\\ dots\\ підсилювач; 0 & 0 &\ cdots & 1
\ end {масив}\ праворуч] =1. \ номер\]
ПрипустимоL(e1),L(e2),…,L(en), лінійно незалежні і нехайP бутиn -мірний паралелепіпед з сусідніми ребрамиL(e1),L(e2),…,L(en). Зверніть увагу, що якщо
x=t1e1+t2e2+⋯+tnen,
де0≤tk≤1 дляk=1,2,…,n, це точка вC, то
L(x)=t1L(e1)+t2L(e2)+⋯+tnL(en)
це точка вP. Фактично,L відображає n -вимірний одиничний кубC точно наn - розмірний паралелепіпедP. ОскількиL(e1),L(e2),…,L(en) є стовпцямиM, то випливає, що обсягP дорівнює|det(M)|. Іншими словами,|det(M)| вимірює, наскількиL розтягує або зменшує об'єм одиничного куба.
Теорема1.6.2
ПрипустимоL:Rn→Rn , єM лінійним і єn×n матриця така, щоL(x)=Mx. ЯкщоL(e1),L(e2),…,L(en) лінійні незалежні і являютьP собоюn -мірний паралелепіпед з сусідніми ребрамиL(e1),L(e2),…,L(en), то обсягP дорівнює|det(M)|.