12.8: Екстремальні значення
З огляду на функціюz=f(x,y), нас часто цікавлять точки, деz приймає найбільші або найменші значення. Наприклад, якщоz представляє функцію витрат, ми, швидше за все, хочемо знати, які(x,y) значення мінімізують вартість. Якщоz представляє відношення обсягу до площі поверхні, ми, швидше за все, хотіли б знати,z де найбільше. Це призводить до наступного визначення.
Визначення 97 Відносна і Абсолютна Екстремума
z=f(x,y)Дозволяти визначатися на множині,S що містить точкуP=(x0,y0).
- Якщо є відкритий диск, щоD міститьP таке, щоf(x0,y0)≥f(x,y) для всіх(x,y) вD, тоf має відносний максимум вP; якщоf(x0,y0)≤f(x,y) для всіх(x,y) вD, тоf має відносний мінімум приP.
- Якщоf(x0,y0)≥f(x,y) для всіх(x,y) вS, тоf має абсолютний максимум вP; якщоf(x0,y0)≤f(x,y) для всіх(x,y) вS, тоf має абсолютний мінімум приP.
- Якщоf має відносний максимум або мінімум приP, тоf має відносну крайність приP; якщоf має абсолютний максимум або мінімум приP, тоf має абсолютну крайність приP.
Якщоf має відносний або абсолютний максимум atP=(x0,y0), це означає, що кожна крива на поверхніf наскрізного такожP матиме відносний або абсолютний максимум приP. Згадуючи те, що ми дізналися в розділі 3.1, нахили дотичних ліній до цих кривихP повинні бути 0 або невизначені. Оскільки спрямовані похідні обчислюються за допомогоюfx іfy, ми приводимо до наступного визначення та теореми.
Визначення 98 Критична точка
z=f(x,y)Дозволяти бути безперервним на відкритому наборіS. КритичноюP=(x0,y0) точкоюf є точка вS такому, що
- fx(x0,y0)=0іfy(x0,y0)=0, або
- fx(x0,y0)і/абоfy(x0,y0) не визначено.
Теорема 114 Критичні точки і відносна екстрема
z=f(x,y)Дозволяти визначатися на відкритому наборі,S що міститьP=(x0,y0). Якщоf має відносну крайність приP, тоP є критичною точкоюf.
Тому, щоб знайти відносні екстреми, ми знаходимо критичні точкиf і визначаємо, які відповідають відносним максимумам, відносним мінімумам або ні ні. Наступні приклади демонструють цей процес.
Приклад12.8.1: Finding critical points and relative extrema
Нехайf(x,y)=x2+y2−xy−x−2. Знайти відносну крайністьf.
Рішення
Почнемо з обчислення часткових похіднихf:
fx(x,y)=2x−y−1andfy(x,y)=2y−x.
Кожен ніколи не є невизначеною. Критична точка виникає, колиfx і одночасноfy дорівнює 0, приводячи нас до вирішення наступної системи лінійних рівнянь:
2x−y−1=0and−x+2y=0.
Це рішення цієї системи єx=2/3,y=1/3. (Переконайтеся(2/3,1/3), що при,fy обидваfx і 0.)

Графік на малюнку 12.27 показуєf разом з цією критичною точкою. З графіка видно, що це відносний мінімум; подальший розгляд функції показує, що це насправді абсолютний мінімум.
Приклад12.8.2: Finding critical points and relative extrema
Нехайf(x,y)=−√x2+y2+2. Знайти відносну крайністьf.
Рішення
Почнемо з обчислення часткових похіднихf:
fx(x,y)=−x√x2+y2andfy(x,y)=−y√x2+y2.
Зрозуміло, щоfx=0 колиx=0\ &y≠0, і щоfy=0 колиy=0\ &x≠0. При(0,0), обидваfx і неfy є0, а скоріше невизначені. Однак ця точка все ще(0,0) є критичною точкою, оскільки часткові похідні не визначені. Це єдина критична точкаf.

Поверхняf зображена на малюнку 12.28 разом з точкою(0,0,2). Графік показує, що ця точка є абсолютним максимумомf.
У кожному з попередніх двох прикладів ми знайшли критичну точку,f а потім визначали, чи є це відносним (або абсолютним) максимумом або мінімумом за допомогою графіків. Було б непогано зуміти визначити, чи відповідає критична точка max або min без графіка. Перш ніж розробити такий тест, ми робимо ще один приклад, який проливає більше світла на питання, які повинен розглянути наш тест.
Приклад12.8.3: Finding critical points and relative extrema
Нехайf(x,y)=x3−3x−y2+4y. Знайти відносну крайністьf.
Рішення
Ще раз почнемо з пошуку часткових похіднихf:
fx(x,y)=3x2−3andfy(x,y)=−2y+4.
Кожен завжди визначається. Встановлюючи кожен рівний 0 і вирішуючи дляx іy, знаходимо
\ [\ begin {align*}
f_x (x, y) = 0\ quad &\ стрілка вправо x =\ pm 1\\
f_y (x, y) = 0\ квад &\ стрілка вправо y = 2.
\ end {вирівнювати*}\]
У нас є дві критичні моменти:(−1,2) і(1,2). Щоб визначити, чи відповідають вони відносному максимуму або мінімуму, розглянемо графік наf малюнку 12.29.

Критична точка(−1,2) чітко відповідає відносному максимуму. Однак критична точка в не(1,2) є ні максимумом, ні мінімумом, відображаючи іншу, цікаву характеристику.
Якщо йти паралельноy -осі до цієї критичної точки, то ця точка стає відносним максимумом на цьому шляху. Але якщо йти до цієї точки паралельноx -осі, ця точка стає відносним мінімумом уздовж цього шляху. Точка, яка, здається, діє як макс, так і хв, - це точка сідла. Далі слід формальне визначення.
Визначення 99 Точка сідла
P=(x0,y0)Дозволяти бути в областіf деfx=0 іfy=0 вP. Pє сідловою точкоюf якщо, для кожного відкритого дискаP,D що містить, є точки(x1,y1) і(x2,y2) вD таких, щоf(x0,y0)>f(x1,y1) іf(x0,y0)<f(x2,y2).
У точці сідла миттєва швидкість зміни у всіх напрямках дорівнює 0 і є точки поблизу зz -значеннями як менше, так і більшеz -значення точки сідла.
Перед прикладом 12.8.3 ми згадували про необхідність тесту для розмежування відносних максимумів і мінімумів. Тепер ми визнаємо, що наш тест також повинен враховувати точки сідла. Для цього розглянемо другі часткові похідні відf.
Нагадаємо, що з одинарними змінними функціямиy=f(x), такими якf″, якщо,f то увігнута вгору вc, а якщоf'(c) =0, тоf має відносний мінімум приx=c. (Ми назвали це другим похідним тестом.) Зверніть увагу, що в точці сідла здається, що графік «обидва» увігнуті вгору і увігнуті вниз, залежно від того, який напрямок ви розглядаєте.
Було б непогано, якби вірно було наступне:
Однак це не так. Функціїf існують там, деf_{xx} іf_{yy} є позитивними, але точка сідла все ще існує. У такому випадку, поки увігнутість вx -напрямку вгору (тобтоf_{xx}>0), а увігнутість вy -напрямку також вгору (тобтоf_{yy}>0), увігнутість перемикається десь міжx - іy -напрямками.
Щоб врахувати це, розглянемоD = f_{xx}f_{yy}-f_{xy}f_{yx}. Оскількиf_{xy} і рівніf_{yx}, коли безперервні (поверніться до теореми 103), ми можемо переписати це якD = f_{xx}f_{yy}-f_{xy}^{\,2}. Dможе використовуватися для перевірки того, чи змінюється увігнутість у точці залежно від напрямку. ЯкщоD>0, увігнутість не перемикається (тобто в цій точці графік увігнутий вгору або вниз у всіх напрямках). ЯкщоD<0, увігнутість дійсно перемикається. ЯкщоD=0, наш тест не зможе визначити, вимикається увігнутість чи ні. Ми констатуємо використанняD в наступній теоремі.
ТЕОРЕМА 115 Другий тест на похідну
z=f(x,y)Дозволяти диференціюватися на відкритому множиніP = (x_0,y_0), що містить, і нехай
D = f_{xx}(x_0,y_0)f_{yy}(x_0,y_0)-f_{xy}^{\,2}(x_0,y_0).
- ЯкщоD>0 іf_{xx}(x_0,y_0)>0,P то відносний мінімумf.
- ЯкщоD>0 іf_{xx}(x_0,y_0)<0,P то відносний максимумf.
- ЯкщоD<0, тоP є сідловою точкоюf.
- ЯкщоD=0, тест непереконливий.
Ми спочатку практикуємося використовувати цей тест з функцією в попередньому прикладі, де ми візуально визначили, що у нас є відносний максимум і точка сідла.
Приклад\PageIndex{4}: Using the Second Derivative Test
Нехайf(x,y) = x^3-3x-y^2+4y як у прикладі 12.8.3. Визначте, чи має функція відносну мінімальну, максимальну або сідлову точку в кожній критичній точці.
Рішення
Ми визначили раніше, що критичними точкамиf є(-1,2) і(1,2). Щоб використовувати другий тест похідних, ми повинні знайти другі часткові похідніf:
f_{xx} = 6x;\qquad f_{yy} = -2;\qquad f_{xy} = 0.
Таким чиномD(x,y) = -12x.
За адресою(-1,2):D(-1,2) = 12>0, іf_{xx}(-1,2) = -6. За Другим похідним тестом,f має відносний максимум при(-1,2).
За адресою(1,2):D(1,2) = -12 <0. Другий тест похідних стверджує, щоf має точку сідла в(1,2).
Другий тест похідних підтвердив те, що ми визначили візуально.
Приклад\PageIndex{5}: Using the Second Derivative Test
Знайти відносну крайністьf(x,y) = x^2y+y^2+xy.
Рішення
Почнемо з знаходження першого і другого часткових похіднихf:
\ [\ почати {масив} {ccc}
f_x = 2xy+y & f_y = x^2+2y+x\\
f_ {xx} = 2y & f_ {yy} = 2\\ f_ {xy} = 2x+1 &
f_ {yx} = 2х+1 & f_ {yx} = 2x+1.
\ end {масив}\]
Ми знаходимо критичні точки, знаходячи деf_x іf_y одночасно 0 (вони обидва ніколи не визначені). Налаштуванняf_x=0, у нас є:
f_x=0 \quad \Rightarrow \quad 2xy+y=0\quad \Rightarrow \quad y(2x+1)=0.
Це означає, що дляf_x=0, абоy=0 або2x+1=0.
Припустимоy=0, тоді розглянемоf_y=0:
\ [\ begin {align*}
f_y &= 0\\
x^2y+x &= 0,\ qquad\ text {і оскількиy=0, ми маємо}\\
x^2+x &= 0\\
x (x+1) & = 0.
\ end {вирівнювати*}\]
Таким чиномy=0, якщо, у нас єx=0 абоx=-1, даючи дві критичні точки:(-1,0) і(0,0).
Повертаючись доf_x, тепер припустимо2x+1=0, тобто, щоx=-1/2, потім розглянемоf_y=0:
\ [\ begin {align*}
f_y &= 0\\
x^2y+x &= 0,\ qquad\ text {і оскількиx=-1/2 ми маємо}\\
1/4+2y-1/2 &= 0\\
y&= 1/8.
\ end {вирівнювати*}\]
Таким чиномx=-1/2, якщо,y=1/8 даючи критичну точку(-1/2,1/8).
ЗD = 4y-(2x+1)^2, ми застосовуємо Другий тест похідних до кожної критичної точки.
В(-1,0)D <0, так(-1,0) це точка сідла.
В(0,0)D<0, так само(0,0) є і сідлової точкою.
В(-1/2,1/8),D>0 іf_{xx} > 0, так(-1/2,1/8) це відносний мінімум.

На малюнку 12.30 показаний графікf і три критичні точки. Зверніть увагу, як ця функція не сильно змінюється поблизу критичних точок — тобто візуально важко визначити, чи є точка точкою сідла або відносним мінімумом (або навіть критичною точкою взагалі!). Це одна з причин, чому другий похідний тест так важливо мати.
Обмежена оптимізація
При оптимізації функцій однієї змінної, таких якy=f(x), ми використовували теорему 25, теорему екстремальних значень, яка говорила, що протягом замкнутого інтервалу безперервна функція має як максимальнеI, так і мінімальне значення. Щоб знайти ці максимальні і мінімальні значення, ми оцінилиf у всіх критичних точках інтервалу, а також в кінцевих точках («кордоні») інтервалу.
Аналогічна теорема і процедура застосовується до функцій двох змінних. Неперервна функція над замкнутою множиною також досягає максимального та мінімального значення (див. наступну теорему). Ми можемо знайти ці значення, оцінюючи функцію при критичних значеннях у множині та за межами множини. Після формального викладання цієї теореми про крайні значення наведемо приклади.
Теорема 116 Теорема про екстремальні значення
z=f(x,y)Дозволяти бути безперервна функція на замкнутому обмеженому множиніS. Потімf має максимальне і мінімальне значення наS.
Приклад\PageIndex{6}: Finding extrema on a closed set
Дозволятиf(x,y) = x^2-y^2+5 іS нехай трикутник з вершинами(-1,-2),(0,1) і(2,-2). Знайти максимальне і мінімальне значенняf включенняS.
Рішення
Це може допомогти побачити графікf разом з безліччюS. На малюнку 12.31 (a) визначення трикутникаS показано уxy -площині пунктирною лінією. Над нею знаходиться поверхняf; нас стосується лише частина,f укладена «трикутником» на його поверхні.

Починаємо з пошуку критичних точокf. Зf_x = 2x іf_y = -2y, знаходимо тільки одну критичну точку, в(0,0).
Тепер знайдемо максимальне і мінімальне значення,f які досягають уздовж кордонуS, тобто по краях трикутника. На малюнку 12.31 (б) ми бачимо накиданий в площині трикутник з рівняннями ліній, що утворюють його краї з маркуванням.
Почніть з нижнього краю, по лініїy=-2. Якщоy є-2, то на поверхні ми розглядаємо точкиf(x,-2); тобто наша функція зводиться доf(x,-2) = x^2-(-2)^2+5 = x^2+1=f_1(x). Ми хочемо максимізувати/мінімізуватиf_1(x)=x^2+1 на інтервалі[-1,2]. Для цього ми оцінюємоf_1(x) в критичних точках і в кінцевих точках.
Критичні точкиf_1 знаходять шляхом встановлення її похідної рівною 0:
f'_1(x)=0\qquad \Rightarrow x=0.
Оцінюванняf_1 в цій критичній точці, а в кінцевих точках[-1,2] дає:
\ [\ begin {align*}
f_1 (-1) = 2\ qquad&\ Rightarrow\ qquad f (-1, -2) = 2\\
f_1 (0) = 1\ qquad&\ Стрілка вправо\ квадрат f (0, -2) = 1\\
f_1 (2) = 5\ qquad&\ Стрілка вправо\ квадрат f (2, -2) = 5.
\ end {align*}\]
Зауважте, як оцінкаf_1 в точці збігається з оцінкоюf у відповідній точці.
Нам потрібно зробити цей процес в два рази більше, для двох інших країв трикутника.
Уздовж лівого краю, по лініїy=3x+1, підставляємо3x+1 в дляy inf(x,y):
f(x,y) = f(x,3x+1) = x^2-(3x+1)^2+5 = -8x^2-6x+4 = f_2(x).
Ми хочемо максимальне і мінімальне значенняf_2 на інтервалі[-1,0], тому оцінюємоf_2 в його критичних точках і кінцевих точках інтервал. Знаходимо критичні точки:
f'_2(x) = -16x-6=0 \qquad \Rightarrow \qquad x=-3/8.
Оцінитиf_2 в його критичній точці та кінцевих точках[-1,0]:
\ [\ begin {align*}
f_2 (-1) = 2\ qquad&\ Rightarrow\ qquad f (-1, -2) = 2\\
f_2 (-3/8) = 41/8=5,125\ qquad&\ Rightarrow\ qquad f (-3/8, -0.125) = 5,125\
f_2 (0) = 1\ квадратний&\ стрілка вправо\ квадрат f (0,1) = 4.
\ end {вирівнювати*}\]
Нарешті, оцінюємоf уздовж правого краю трикутника, деy = -3/2x+1.
f(x,y) = f(x,-3/2x+1) = x^2-(-3/2x+1)^2+5 = -\frac54x^2+3x+4=f_3(x).
Критичні точки:f_3(x) Ми
f'_3(x) = 0 \qquad \Rightarrow \qquad x=6/5=1.2.
оцінюємоf_3 в цій критичній точці і в кінцевих точках інтервалу[0,2]:
\ [\ begin {align*}
f_3 (0) = 4\ qquad&\ Rightarrow\ qquad f (0,1) = 4\\
f_3 (1,2) = 5.8\ qquad&\ Стрілка вправо\ квадрат f (1,2, -0,8) = 5,8\\
f_3 (2) = 5\ qquad&\\ Стрілка вправо\ квадрат f (2, -2) = 5.
\ end {align*}\]
Остання точка для перевірки: критична точкаf,(0,0). Знаходимоf(0,0) = 5.

Ми оцінилиf в цілому 7 різних місць, все це показано на малюнку 12.32. Ми перевірили кожну вершину трикутника двічі, оскільки кожна виявилася кінцевою точкою інтервалу двічі. З усіхz знайдених -значень максимальне дорівнює 5,8, знайдено при(1.2,-0.8); мінімальне - 1, знайдено в(0,-2).
Ця частина тексту має назву «Обмежена оптимізація», оскільки ми хочемо оптимізувати функцію (тобто знайти її максимальні та/або мінімальні значення) з урахуванням обмежень — обмежень, на які розглядаються вхідні точки. У попередньому прикладі ми обмежилися, розглядаючи функцію тільки в межах трикутника. Це було багато в чому довільно; функція і межа були обрані просто як приклад, без реального «значення» за функцією або обраним обмеженням.
Однак вирішення обмежених задач оптимізації є дуже важливою темою в прикладній математиці. Розроблені тут методики є основою для вирішення більших задач, де задіяно більше двох змінних.
Проілюструємо техніку ще раз класичною задачею.
Приклад\PageIndex{7}: Constrained Optimization
Поштова служба США стверджує, що обхват+довжина стандартного поштового пакету не повинна перевищувати 130». З огляду на прямокутну коробку, «довжина» - найдовша сторона, а «обхват» в два рази більше ширини+висота.
Враховуючи прямокутну коробку, де ширина та висота рівні, які розміри коробки надають максимальний обсяг за умови обмеження розміру стандартного поштового пакету?
Рішення
Нехайw,h і\ell позначають ширину, висоту і довжину прямокутної коробки; ми припускаємо тут, щоw=h. Обхват тоді2(w+h) = 4w. Обсяг коробки дорівнюєV(w,\ell) = wh\ell = w^2\ell. Бажаємо максимізувати цей обсяг за умови обмеження4w+\ell\leq 130, або\ell\leq 130-4w. (Здоровий глузд також вказує на це\ell>0, w>0.)
Почнемо з знаходження критичних значеньV. Ми знаходимо, щоV_w = 2w\ell іV_\ell = w^2; вони одночасно 0 тільки в(0,0). Це дає обсяг 0, тому ми можемо ігнорувати цю критичну точку.
Тепер розглянемо обсяг по обмеженню\ell=130-4w. Уздовж цієї лінії у нас є:
V(w,\ell) = V(w,130-4w) = w^2(130-4w) = 130w^2-4w^3 = V_1(w).
Обмеження застосовується наw -інтервалі,[0,32.5] як зазначено на малюнку. Таким чином, ми хочемо максимізуватиV_1[0,32.5].
Знайшовши критичні значенняV_1, беремо похідну і ставимо її рівною 0:
V\,'_1(w) = 260w-12w^2 = 0 \quad \Rightarrow \quad w(260-12w)= 0 \quad \Rightarrow \quad w=0,\frac{260}{12}\approx 21.67.
Ми знайшли два критичних значення: колиw=0 і колиw=21.67. Ми знову ігноруємоw=0 рішення; максимальний обсяг, за умови обмеження, приходить наw=h=21.67,\ell = 130-4(21.6) =43.33. Це дає обсягV(21.67,43.33) \approx 19,408 в^3.

Функція гучностіV(w,\ell) показана на малюнку 12.33 разом з обмеженням\ell = 130-4w. Як і раніше, обмеження малюється пунктирним уxy -площині, а також вздовж поверхні функції. Позначається точка, де обсяг максимізується.
Важко переоцінити важливість оптимізації. У «реальному світі» ми зазвичай прагнемо зробити щось краще. Висловлюючи щось як математичну функцію, «зробити щось краще» означає «оптимізувати якусь функцію».
Методи, показані тут, є лише початком неймовірно важливого поля. Багато функцій, які ми прагнемо оптимізувати, неймовірно складні, що робить крок «знайти градієнт і встановити його рівним\vec 0" вельми нетривіальним. Оволодіння принципами тут є ключовим для того, щоб мати можливість вирішити ці більш складні проблеми.