Loading [MathJax]/jax/output/HTML-CSS/jax.js
Skip to main content
LibreTexts - Ukrayinska

4.1: Найменші квадрати

Вступ

Ми дізналися в попередньому розділі, що неAx=b потрібно володіти розв'язком, коли кількість рядківA перевищує його ранг, тr<m. Оскільки така ситуація виникає досить часто на практиці, як правило, під виглядом «більше рівнянь, ніж невідомих», ми встановлюємо обґрунтування абсурдуAx=b.

Нормальні рівняння

Мета полягає в тому, щоб вибратиx таку,Ax яка максимально наближена доb. Вимірюючи близькість через суму квадратів складових, ми приходимо до задачі мінімізації «найменших квадратів»

res

(||Axb||)2=(Axb)T(Axb)

над усімxR. Шляху до розв'язку висвітлює фундаментальна теорема. Точніше, пишемо

bR,bN,bRR(A)bNN(AT):(b=bR+bN). Відзначивши, що (i)bR,xRn:((AxbR)R(A)) і (ii)R(A)N(AT) ми приходимо до теореми Піфагора.

Визначення: Теорема Піфагора

norm2(Axb)=(||AxbR+bN||)2

=(||AxbR||)2+(||bN||)2

З теореми Піфагора тепер зрозуміло, що найкращимx є той, який задовольняє

Ax=bR

ОскількиbRR(A) це рівняння дійсно має рішення. Однак ми ще не вказуємо, як один обчислюєbR даніb. Хоча явний вираз дляbR ортогональної проекціїb наR(A), з точки зоруA іb знаходиться в межах нашої досяжності, ми, строго кажучи, не вимагатимемо цього. Щоб побачити це, зауважимо, що якщоx задовольняє вищевказане рівняння, то bортогональна проекція наR(A), з точки зоруA іb знаходиться в межах нашої досяжності, ми, строго кажучи, не вимагатимемо цього. Щоб переконатися в цьому, зауважимо, що якщоx задовольняє вищевказаному рівнянню, то

Axb=AxbR+bN

=bN

ЯкbN це не легше обчислюється, ніжbR ви можете стверджувати, що ми просто йдемо по колу. Однак «практична» інформація у вищенаведеному рівнянні полягає в тому(Axb)AT, щоAT(Axb)=0, тобто,

ATAx=ATb

ОскількиATbR(AT) незалежно відb цієї системи, часто називають нормальними рівняннями, дійсно має рішення. Це рішення є унікальним до тих пір, покиATA стовпці лінійно незалежні, тобто так довго, якN(ATA)=0. Згадуючи главу 2, вправу 2, зауважимо, що це еквівалентноN(A)={0}

Набір,xbR для якого невідповідність(||Axb||)2 найменша, складається з тих,x для яких завждиATAx=ATb є хоча б один такийx. Є рівно один такийx якщоN(A)={0}.

Як конкретний приклад, припустимо з посиланням на рис. 1, щоA=(110100) іA=(111)

Знімок екрана 2020-09-28 в 9.54.33 PM.png
Малюнок4.1.1: Розкладанняb

ЯкbR(A) немаєx такого, щоAx=b. Дійсно(||Axb||)2=(x1+x2+1)2+(x21)2+11, при мінімумі однозначно досягається приx=(01), згідно з унікальним рішенням вищевказаного рівняння, дляATA=(1112) іATb=(12). Тепер ми визнаємо, апостеріорі,bR=Ax=(110) це ортогональна проекція b на простір стовпцівA.

Застосування найменших квадратів до двовісної тестової задачі

Ми сформулюємо ідентифікацію жорсткості волокна 20 на цьому попередньому малюнку, як задачу найменших квадратів. Ми передбачаємо навантаження, вузли 9 та вимірювання пов'язаних з ними переміщень 18,x. xЗі знань іf ми хочемо зробити висновок про компонентиK=diag(k) деk знаходиться вектор невідомих жорсткості волокон. Першим кроком є визнання цього

ATKAx=f

може бути написано як

B,B=ATdiag(Ax):(Bk=f)

Хоча концептуально просто це не дуже корисно на практиці, боB є 18 на 20 і, отже, вищевказане рівняння має багато рішень. Виходом з ситуації є обчислення вk результаті не одного експерименту. Ми побачимо, що для нашого невеликого зразка вистачить 2 експериментів. Якщо бути точним, ми припускаємо, щоx1 це переміщення, вироблене навантаженням,f1 тоді якx2 це переміщення, вироблене навантаженнямf2. Потім ми збираємо пов'язані шматки в

B=(ATdiag(Ax1)ATdiag(Ax2))

і

f=(f1f2).

BЦе 36 на 20, і тому системаBk=f завищена і, отже, дозріла для найменших квадратів.

Приступаємо потім до збіркиB іf. Припускаємоf1 іf2 відповідати горизонтальному і вертикальному розтягуванню

f1=(100010100010100010)T

f2=(010101010101010101)T

відповідно. Для цілей нашого прикладу ми припускаємо, що коженkj=1 крімk8=5. ЗбираємоATKA як у главі 2 і вирішуємо

ATKAxj=fj

за допомогою псевдозворотного. Для того, щоб надати деяку «реальність» цій проблемі, ми забруднимо коженxj з 10-відсотковим шумом перед будівництвомB

BTBk=BTf

ми зауважимо, що Matlab вирішує цю систему, коли представлена з K=b\ f, коли BB прямокутний. Результати цієї процедури ми побудували за посиланням. Жорстке волокно легко ідентифікується.

Знімок екрана 2020-09-28 о 10.14.02 PM.png
Малюнок4.1.1: Результати успішного двовісного тесту.

Проекції

З алгебраїчної точки зору Рівняння є елегантною переформулюванням задачі найменших квадратів. Хоча легко запам'ятати це, на жаль, затьмарює геометричний зміст, запропонований словом «проекція» Рівняння. Оскільки прогнози часто виникають у багатьох додатках, ми робимо паузу тут, щоб розробити їх більш ретельно. Відносно нормальних рівнянь відзначимо, що якщоN(A)={0} тоді

x=(ATA)1ATb

і тому ортогональна проекція bb наR(A) це:

bR=Ax

=A(ATA)1ATb

Визначення

P=A(ATA)1AT

набуває формуbR=Pb. Сумісно з нашим уявленням про те, якою має бути «проекція», ми очікуємо, що векториP карти неR(A) потрапляють на,R(A) залишаючи вектори вжеR(A) неушкодженими. Більш лаконічно, ми очікуємо,PbR=bR що тPbR=PbR. Як останнє повинно триматися для всіх,bRm ми очікуємо, що

P2=P

Ми вважаємо, що дійсно

P2=A(ATA)1ATA(ATA)1AT

=A(ATA)1AT

=P

Відзначимо також,P що симетрична. Ми високо оцінимо ці властивості через

Визначення: Ортогональна проекція

МатрицяP, якаP2=P задовольняє, називається проекцією. Симетрична проекція називається ортогональної проекцією.

Ми доклали певних зусиль, щоб мотивувати використання слова «проекція». Однак вам може бути цікаво, яке симетрія має відношення до ортогональності. Ми пояснюємо це з точки зору тавтології

b=PbIb

Тепер, якщоP проекція, то так теж єIP. Крім того, якщоP симетричний, то крапковий добутокb.

\ [\ почати {вирівнювати*} (Пб) ^Т (І-П) б &= б ^ {Т} Р^ {Т} (I-P) b\\ [4pt] &= b^ {T} (Р-Р^ {2}) б\\ [4pt] &= b^ {T} 0 б\\ [4pt] &= 0\ кінець {вирівнювати*}

тобто,Pb є ортогональним до(IP)b. Як приклади неортогональних проекцій ми пропонуємо

P=(100120014121)

іIP. Нарешті, відзначимо, що центральна формулаP=A(ATA)1AT, навіть трохи більш загальна, ніж рекламована. Він був виставлений рахунком як ортогональна проекція на простір колонA. Однак часто виникає необхідність ортогональної проекції на якийсь довільний підпростір М. Ключем до використання старого РР є просто усвідомити, що кожен підпростір є простором стовпців деякої матриці. Точніше, якщо

{x1,,xm}

є основою для ММ, то ясно, якщоxj вони поміщені в стовпці матриці називаєтьсяA тодіR(A)=M. Наприклад, якщоM лінія через,(11)T то

P=(11)12(11)

P=12(1111)

ортогональна проекція наM.

Вправи

Вправа4.1.1

Гілберт Странг розтягувався на стійці довжиноюl=6,7,8 ноги під прикладеною силоюf=1,2,4 тонн. Припускаючи закон ГукаlL=cf, знайдіть його відповідністьc, і початкову висотуL, найменшими квадратами.

Вправа4.1.2

Що стосується прикладу § 3, зауважте, що через випадкову генерацію шуму, який засмічує переміщення, кожен раз, коли код викликається, кожен раз, коли код викликається.

  1. Напишіть цикл, який викликає код статистично значущу кількість разів і подайте штрихові графіки середньої жорсткості волокна та його стандартного відхилення для кожного волокна разом із пов'язаним M—файлом.
  2. Експериментуйте з різними рівнями шуму з метою визначення рівня, вище якого стає важко розрізнити жорстке волокно. Ретельно поясніть свої висновки.
Вправа4.1.3

Знайдіть матрицю, якаR3 проектує на лінію, яку охоплює(101)T.

Вправа4.1.4

Знайдіть матрицю, якаR3 проектує на лінію, що охоплює(101)T і(111)T.

Вправа4.1.5

ЯкщоP проекціяRm на k — вимірний підпростірM, що таке рангP і що такеR(P)?