Skip to main content
LibreTexts - Ukrayinska

Джерело

  • Page ID
    65768
    • Bob Dumas and John E. McCarthy
    • University of Washington and Washington University in St. Louis
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ГЛАВА 0

    Вступ

    Чому ця книга

    Більше студентів сьогодні, ніж будь-коли раніше, беруть обчислення в середній школі. Однак це коштує: все менше і менше беруть суворий курс евклідової геометрії. Більш того, курс обчислення, прийнятий майже всіма учнями, будь то в середній школі чи коледжі, уникає доказів, і часто навіть не дає формального визначення межі. Дійсно, деякі студенти вступають до університету, ніколи не читаючи і не писали докази шляхом індукції, або зіткнулися з математичним доказом будь-якого роду.

    Як наслідок, викладачам вищих курсів математики бакалаврату з лінійної алгебри, абстрактної алгебри, аналізу та топології доводиться надзвичайно наполегливо працювати, прищеплюючи концепцію доказу, одночасно намагаючись охопити навчальний план. Ця проблема була вирішена в багатьох університетах шляхом введення мостового курсу з назвою «Основи вищої математики», прийнятий студентами, які завершили регулярну послідовність обчислення. Деякі з цих студентів планують стати математичними спеціальностями. Інші просто хочуть вивчити трохи більше математики; але якщо те, що вони піддаються, цікаво і задовольняє, багато хто вибере спеціальну або подвійну спеціальність в математиці.

    Ця книга написана для студентів, які взяли обчислення і хочуть дізнатися, що таке «справжня математика». Ми сподіваємося, що матеріал буде цікавим і цікавим, і що вам буде запропоновано вивчити більш просунуту математику.

    Що це за книга

    Мета цієї книги - познайомити вас з культурою, мовою та мисленням математиків. Ми говоримо «математики», а не «математика», щоб підкреслити, що математика - це, в душі, людське починання. Якщо в Erewhemos є розумне життя, то Erewhemosians, безумовно, погодяться з цим\(2+2=4\). Якщо вони ретельно продумали питання, вони не повірять, що квадратний корінь з двох може бути точно заданий співвідношенням двох цілих чисел, або що простих чисел скінченно багато. Однак ми можемо лише міркувати про те, чи знайдуть вони ці останні питання віддалено цікавими чи що вони можуть вважати задовольняючими відповідями на питання такого роду.

    Математики після тисячоліть боротьби та суперечок досягли широкої (якщо не зовсім універсальної) згоди щодо того, що є прийнятним математичним аргументом. Вони називають це «доказом», і це є ретельно аргументований аргумент, заснований на узгоджених приміщеннях. Методологія математики була надзвичайно успішною, і вона породила багато інших галузей. У ХХ столітті комп'ютерне програмування і прикладна статистика переросли з відгалужень математики в власні дисципліни. У дев'ятнадцятому столітті так робили астрономія і фізика. Зростаюча доступність даних робить обробку даних складним математичним способом однією з великих наукових проблем двадцять першого століття.

    У цій книзі ми спробуємо навчити вас, що таке доказ - який рівень аргументу вважається переконливим, що вважається перевищеним, а який рівень деталізації вважається занадто великим. Ми спробуємо навчити вас, як думають математики - які структури вони використовують для організації своїх думок. Будова схожа на скелет - якщо ви позбавите несуттєві деталі, ви можете зосередитися на реальній проблемі. Чудовим прикладом цього є ідея числа, найдавнішої математичної структури людини. Якщо ви навчитеся рахувати яблука, і що два яблука плюс два яблука складають чотири яблука, і якщо ви думаєте, що мова йде про яблука, а не підрахунку, то ви все одно не знаєте, що роблять дві вівці плюс дві вівці. Але як тільки ви зрозумієте, що існує основна структура числа, і що два плюс два є чотири в абстрактному, то додавання вовни або ніг до об'єктів не змінює арифметику.

    Чого ця книга не

    Існує підхід до викладання перехідного курсу, який багато викладачів віддають перевагу. Це мати курс вирішення проблем, в якому студенти вчаться писати докази в контексті, де їх інтуїція може допомогти, наприклад, в комбінаториці або теорії чисел. Це допомагає зробити курс цікавим, і може утримати студентів від повної втрати.

    Ми не взяли на озброєння такого підходу. Наша причина полягає в тому, що крім навчання навику написання логічного доказу, ми також хочемо навчити навику ретельного аналізу визначень. Значна частина праці інструктора в курсі алгебри або аналізу вищого ділення полягає в тому, щоб змусити студентів уважно читати визначення нових і незнайомих об'єктів, вирішувати, які математичні об'єкти задовольняють визначенню, а які ні, і зрозуміти, що випливає «негайно» з визначення. Дійсно, основною причиною того, що епсилон-дельта визначення межі зникло з більшості вступних курсів обчислення, є складність пояснення того\(\forall \varepsilon \exists \delta\), як квантори, саме в такому порядку, дають точне поняття межі, до якої ми прагнемо. Таким чином, хоча студенти повинні більше працювати в цьому курсі, щоб вивчити більше абстрактної математики, вони будуть краще підготовлені до просунутих курсів.

    Також це не текст у прикладній логіці. Ранні глави книги знайомлять учня з основними математичними структурами через формальні визначення. Хоча ми надаємо досить формальну обробку логіки першого порядку та математичної індукції, наша мета полягає в тому, щоб перейти до більш просунутих класичних математичних структур та аргументів, як тільки студент має адекватне розуміння логіки, що лежить в основі математичних доказів.

    Поради студенту

    Ласкаво просимо до вищої математики! Якщо ваш вплив на університетську математику обмежується обчисленням, ця книга, ймовірно, буде дуже відрізнятися від ваших попередніх текстів. Багато студентів вивчають обчислення, швидко скануючи текст і приступаючи безпосередньо до проблем. Бореться з проблемою, вони шукають подібні проблеми в тексті та намагаються наслідувати знайдене рішення. Нарешті, вони перевіряють рішення, яке зазвичай знаходиться в задній частині тексту, щоб «підтвердити» методологію.

    Ця книга, як і багато текстів, що стосуються більш просунутих тем, написана не з обчислювальними проблемами на увазі. Наша мета - познайомити вас з різними елементами вищої математики - культурою, мовою, методами, темами, стандартами та результатами. Проблеми цих курсів полягають у тому, щоб довести правдиві математичні твердження або спростувати неправдиві твердження. У контексті обчислення математик повинен довести результати, якими ви вільно користувалися. Більшості людей ця діяльність здається дуже відрізняється від обчислень. Наприклад, ви, ймовірно, вважаєте за необхідне подумати про проблему протягом деякого часу, перш ніж почати писати. На відміну від числення, в якому загальний напрямок методів зазвичай очевидний, спроба довести математичні претензії може відчувати себе безспрямованим або випадковим. Однак це стратегічне, а не випадкове. Це одна з великих проблем математики на вищих рівнях, вона творча, а не роте. З практикою і дисциплінованим мисленням, ви навчитеся бачити свій шлях до доведення математичних претензій.

    Почнемо наше лікування вищої математики з великої кількості визначень. Це звичайно в курсі математики, і це необхідно, оскільки математика вимагає точного вираження. Постараємося мотивувати ці визначення так, щоб їх корисність була очевидна якомога раніше. Після подання та обговорення деяких визначень наведемо аргументи для деяких елементарних тверджень, що стосуються цих визначень. Це дасть нам деяку практику в читанні, письмі та обговоренні математики. У перших розділах книги ми включаємо численні дискусії та зауваження, які допоможуть вам зрозуміти основний напрямок аргументів. У наступних розділах книги ви прочитаєте більш складні аргументи для деяких глибоких класичних результатів. Ми рекомендуємо вам прочитати ці аргументи навмисно, щоб забезпечити ваше повне розуміння аргументу та виховати ваше почуття рівня деталізації та строгості, очікуваного в математичному доказі бакалавра.

    В кінці кожної глави є вправи, покликані спрямувати вашу увагу на читання і змусити вас продумати деталі доказів. Деякі з цих вправ прості, але багато хто з них дуже важкі. Ми не очікуємо, що кожен студент зможе вирішити кожну проблему. Однак витрачати годину (або більше) на роздуми про складну проблему - це добре витрачений час, навіть якщо ви не вирішите проблему: це зміцнює ваші математичні м'язи, і дозволяє оцінити і глибше зрозуміти рішення, якщо воно в кінцевому підсумку буде показано вам. Зрештою, ви зможете вирішити деякі важкі проблеми самостійно, глибоко подумавши про них. Тоді ви будете справжнім математиком!

    Математика - це, з однієї точки зору, логічна вправа. Ми визначаємо об'єкти, які фізично не існують, і використовуємо логіку, щоб зробити найглибші висновки щодо цих об'єктів. Якби на цьому історія закінчилася, математика була б не більше ніж грою, і була б мало стійкого інтересу. Буває, однак, що інтерпретація фізичних об'єктів, процесів, поведінки та інших суб'єктів інтелектуального інтересу, як математичних об'єктів, і застосування висновків і прийомів вивчення цих математичних об'єктів дозволяє зробити достовірні та потужні висновки про практичні проблеми. Цей метод використання математики для розуміння світу називається математичним моделюванням. Світ, в якому ви живете, те, як ви розумієте цей світ, і чим він відрізняється від світу і розуміння ваших далеких предків, значною мірою є результатом математичного дослідження. У цій книзі ми спробуємо пояснити, як з упевненістю робити математичні висновки. Коли ви вивчали обчислення, ви використовували численні глибокі теореми, щоб зробити висновки, які в іншому випадку могли б зайняти місяці, а не хвилини. Тепер ми розробимо розуміння того, як виводяться результати цієї глибини і потужності.

    Поради інструктору

    Вивчення термінології - що означають «контрапозитивний» і «зворотний» - легко приходить більшості учнів. Ваше завдання в курсі полягає в тому, щоб навчити їх читати визначення уважно, а потім, як маніпулювати ними. Це набагато складніше, коли немає конкретного образу, який студенти можуть мати на увазі. Вектори в\(\mathbb{R}^{n}\), наприклад, більш страхітливі, ніж в\(\mathbb{R}^{3}\), не через будь-якого великого притаманного збільшення складності, а тому, що їх важче мислити геометрично, тому учні повинні довіряти алгебрі поодинці. Ця довіра потребує часу, щоб побудувати.

    Глава 1 полягає в основному для встановлення позначень та обговорення необхідних понять, які деякі, можливо, вже бачили (наприклад, ін'єкції та відмови). На жаль, це може бути першим впливом деяких з цих ідей для багатьох студентів, тому лікування досить тривале. Швидкість, з якою матеріал покривається природним шляхом, буде залежати від сили та фону учнів. Витратьте деякий час, пояснивши, чому послідовність можна розглядати як функцію з доменом\(\mathbb{N}\) - варіації цієї ідеї повторяться.

    Глава 2 знайомить з відносинами. Це важко зрозуміти, через абстрактний характер визначення. Еквіваленти та лінійні впорядкування повторюються по всій книзі, і комфорт студентів з ними збільшиться.

    Ні глава 1, ні глава 2 не зупиняються на доказах. Насправді математичні докази та елементарна логіка першого порядку не вводяться до глави 3. Наша мета полягає в тому, щоб змусити студента думати про математичні структури та визначення без додаткової психічної ваги читання та письма доказів. Ми використовуємо приклади для ілюстрації визначень. Перші розділи забезпечують основні концептуальні основи для наступних розділів, і ми виявляємо, що більшість студентів мають свої руки повноцінними, просто намагаючись прочитати та зрозуміти визначення та приклади. У вправах просимо учнів «показати» правду деяких математичних тверджень. Наш намір полягає в тому, щоб змусити студента задуматися над завданням доведення математичних претензій. Не очікується, що вони напишуть успішні аргументи перед главою 3. Ми заохочуємо студентів спробувати проблеми, хоча вони, ймовірно, будуть невпевнені щодо вимог до математичного доказу. Якщо ви відчуваєте, що математичні докази потрібно обговорити перед початком математичних визначень, ви можете спочатку охопити главу 3.

    Глава 3 досить формальна і повинна йти швидко. Глава 4 знайомить студентів з першою основною технікою доказування - індукцією. З практикою можна очікувати, що вони освоять цю техніку. Ми також введемо як поточну тему вивчення многочленів, і доведемо, наприклад, що многочлен не має більше коренів, ніж його ступінь.

    Глави 5,6 і 7 повністю незалежні один від одного. Глава 5 розглядає межі та безперервність, аж до доказу того, що рівномірна межа послідовності неперервних функцій є безперервною. Глава 6 присвячена нескінченним множинам, доводячи теореми Кантора та теорему Шредера-Бернштейна. До кінця глави, студенти прийшли до розуміння того, що це, як правило, набагато простіше побудувати два ін'єкції, ніж один біекція!

    Глава 7 містить трохи теорії чисел - аж до доказу невеликої теореми Ферма. Потім він показує, скільки структури переходить на алгебру дійсних поліномів.

    Глава 8 будує дійсні числа, використовуючи розрізи Дедекінда, і доводить, що вони мають найменшу верхню межу властивість. Потім це використовується для доведення основних теорем реального аналізу - теореми про проміжні значення та теореми про екстремальні значення. Розділи\(8.1\) через\(8.4\) вимагають лише розділів\(1-4\) та розділу 6.1. Розділи\(8.5-8.8\) вимагають розділів\(5.1\) і 5.2. Розділ\(8.9\) вимагає глави 6.

    У главі 9 введемо комплексні числа. Розділи\(9.1\)\(9.3\) доводять формулу Тартаглія-Кардано для знаходження коренів кубічного, і вказують на те, як необхідно використовувати комплексні числа навіть для знаходження дійсних коренів реальних кубіків. Ці розділи вимагають лише глави 1 - 4. У розділі\(9.4\) доведено фундаментальну теорему алгебри. Для цього потрібна глава 5 та теорема Больцано-Вейєрштрасса з розділу 8.6.

    Що таке розумний курс, заснований на цій книзі? Глави 1 - 4 необхідні для будь-якого курсу. Протягом одного квартального курсу можна також охопити главу 6 і або главу 5, або 7. У семестровому курсі можна було охопити глави\(1-6\) та одну з решти трьох глав. Глава 9 може бути охоплена без глави 8, якщо хтось готовий стверджувати властивість найменшої верхньої межі як аксіому дійсних чисел, а потім Розділ\(8.6\) може бути охоплений перед Розділом\(9.4\) без будь-якого іншого матеріалу з глави 8.

    Ми пропонуємо вам погодитися зі своїми колегами щодо загальної навчальної програми для цього курсу, щоб теми, які ви ретельно висвітлюєте (наприклад, кардинальність), не повинні повторюватися на послідовних курсах.

    Цей перехідний курс стає одним з найважливіших курсів у навчальній програмі з математики та першим важливим курсом для математики. Для талановитих і інтелектуально розбірливих студентів першого або другого курсу стандартні ранні курси в навчальній програмі з математики - числення, диференціальні рівняння, матрична алгебра - забезпечують невеликий стимул для вивчення математики. Дійсно, математики в цих курсах мало, і менше все ще з еволюцією навчальних програм для нижчих студентів до служби наук та техніки. Це особливо тривожно, оскільки це стосується талановитого студента, який ще не визначився з спеціальністю і, можливо, ніколи не розглядав математику. Ми вважаємо, що кращих студентів слід заохочувати пройти цей курс якомога раніше - навіть одночасно з другим семестром або третім кварталом першого року обчислення. Це не просто допомогти майбутнім математичним спеціальностям, але також може відігравати цінну роль у їх наборі, дозволяючи розумним студентам побачити, що математика є складною і, більш до речі, цікавою та глибокою. Математика - свій найкращий апологет. Викрийте студентів на початку автентичного математичного мислення та результатів і дайте їм зробити усвідомлений вибір. Це може стати несподіванкою для деяких, але хороші студенти все ще шукають те, чого прагнули математики як студенти - задоволення від освоєння важкої, цікавої та корисної дисципліни.

    Подяка

    Ми отримали велику допомогу в написанні цієї книги. Окрім підтримки наших сімей, ми отримали цінні поради та відгуки від наших студентів та колег, а також від рецензентів рукопису. Зокрема, ми хотіли б подякувати Метью Валеріоте за багато корисних дискусій, а Олександру Мендесу за те, що він намалював усі цифри в книзі. ГЛАВА 1

    Попередні етапи

    Для спілкування математики вам потрібно буде зрозуміти і дотримуватися конвенцій математиків. У цьому розділі ми розглянемо деякі з цих конвенцій.

    1. «І» «Або»

    Твердження - це декларативні речення; тобто твердження - це речення, яке є істинним чи хибним. Математики роблять математичні твердження - речення про математику, які є істинними або хибними. Наприклад, заява:

    «Усі прості числа, крім числа 2, непарні.»

    є правдивим твердженням. Твердження:\[" 3<2 . "\] неправдиве.

    Ми використовуємо природничі мовні зв'язки для об'єднання математичних тверджень. Коннективи «і» і «або» мають особливе використання в математичній прозі. \(Q\)Дозволяти\(P\) і бути математичними твердженнями. Твердження\[P \text { and } Q\] є твердженням, що обидва\(P\) і\(Q\) є правдивими.

    Математики використовують те, що називається «інклюзивним або». У повсякденному використанні твердження "\(P\)або\(Q\)" іноді може означати, що саме одне (але не обидва) твердження\(P\) і\(Q\) є істинним. У математиці твердження\[P \text { or } Q\] є істинним, коли одне або обидва твердження є істинними, тобто коли будь-яка з наступних дій:

    \(P\)є\(Q\) істинним і є помилковим.

    \(P\)є помилковим і\(Q\) є істинним.

    \(P\)є правдою і\(Q\) є правдою.

    Набори

    Інтуїтивно математичний набір - це сукупність математичних об'єктів. На жаль, ця проста характеристика наборів, необережно поводяться, породжує протиріччя. Деякі колекції виявляться не мають властивостей, які ми вимагаємо від математичних наборів. Приклад того, як це може відбуватися, представлений у розділі 1.7. Тут ми не будемо розвивати теорію формальних множин з нуля. Натомість ми припустимо, що певні набори будівельних блоків відомі, і опишемо способи побудови нових наборів з цих будівельних блоків.

    Нашими початковими будівельними блоками будуть набори натуральних чисел, цілих чисел, раціональних чисел і дійсних чисел. У розділі 8 ми покажемо, як побудувати все це з натуральних чисел. Однак не можна йти набагато далі цього: для того, щоб займатися математикою, потрібно починати з аксіом, які стверджують, що існує безліч натуральних чисел.

    Визначення. Елемент,\(\in\) Якщо\(X\) набір і\(x\) є об'єктом в\(X\), ми говоримо, що\(x\) це елемент, або член, з\(X\). Це написано\[x \in X .\] Ми пишемо\(x \notin X\) якщо не\(x\) є членом\(X\).

    Існує безліч способів визначення множин. Якщо набір має мало елементів, його можна визначити за допомогою лістингу. Наприклад,\[X=\{2,3,5,7\}\] це набір перших чотирьох простих чисел. За відсутності будь-яких інших вказівок, набір, визначений списком, вважається, що в якості елементів має тільки об'єкти в списку. Для наборів із занадто великою кількістю елементів для переліку ми повинні надати читачеві засіб для визначення членства в наборі. Автор може повідомити читачеві, що перераховані не всі елементи множини, але що надано достатньо інформації для того, щоб читач міг виявити закономірність визначення приналежності до множини. Наприклад, нехай\[X=\{2,4,6,8, \ldots, 96,98\} .\] Then\(X\) - це множина позитивних парних чисел менше 100. Однак використання крапки для визначення набору не завжди може спрацювати: він передбачає, що читач визначить шаблон, який ви хочете охарактеризувати. Хоча це зазвичай працює, це несе ризик того, що читач не в змозі правильно визначити шаблон, призначений автором.

    Деякі набори настільки важливі, що мають стандартні імена та позначення, які вам потрібно буде знати.

    Позначення. Натуральні числа,\(\mathbb{N}\) Натуральні числа є елементами\[\{0,1,2,3, \ldots\} .\] множини Ця множина позначається\(\mathbb{N}\).

    Остерігайтеся: Багато авторів називають\(\{1,2,3, \ldots\}\) набір натуральних чисел. Це питання визначення, і немає універсальної конвенції; логіки, як правило, віддають перевагу нашій конвенції, а алгебраїсти іншого. У цій книзі ми будемо використовувати\(\mathbb{N}^{+}\) для позначення\(\{1,2,3, \ldots\}\).

    ПОЗНАЧЕННЯ. \(\mathbb{N}^{+} \mathbb{N}^{+}\)множина натуральних чисел,\[\{1,2,3, \ldots\} \text {. }\] ПОЗНАЧЕННЯ. Цілі числа,\(\mathbb{Z} \mathbb{Z}\) це множина цілих чисел,\[\{\ldots,-3,-2,-1,0,1,2,3, \ldots\} \text {. }\] ПОЗНАЧЕННЯ. Раціональні числа,\(\mathbb{Q} \mathbb{Q}\) являє собою набір раціональних чисел,\[\left\{\frac{p}{q} \text { where } p, q \in \mathbb{Z} \text { and } q \neq 0\right\} \text {. }\] ПОЗНАЧЕННЯ. Реальні числа,\(\mathbb{R} \mathbb{R}\) це набір дійсних чисел. Гарне розуміння дійсних чисел вимагає трохи математичного розвитку. Насправді, тільки в дев'ятнадцятому столітті ми дійсно прийшли до сучасного розуміння\(\mathbb{R}\). Ми будемо мати багато, щоб сказати про реальні числа в розділі 8.

    ВИЗНАЧЕННЯ. Число\(x\) позитивне, якщо\(x>0\). Число\(x\) є невід'ємним if\(x \geq 0\).

    ПОЗНАЧЕННЯ. \(X^{+}\)Якщо набір\(X\) дійсних чисел, ми використовуємо\(X^{+}\) для позитивних чисел у множині\(X\).

    Представлені нами позначення для цих наборів широко використовуються. Введено остаточну умовність щодо імен множин, яка не настільки широко визнана, але корисна для теорії множин.

    ПОЗНАЧЕННЯ. \(\ulcorner n\urcorner\)множина всіх натуральних чисел менше, ніж\(n\):\[\ulcorner n\urcorner=\{0,1,2, \ldots, n-1\} .\] Однією з цілей цього позначення є канонічне асоціювання будь-якого натурального числа\(n\) з множиною, що має саме\(n\) елементи.

    Читач повинен зауважити, що ми не визначили вищевказані набори. Ми припускаємо, що ви знайомі з ними, і деякими їх властивостями, в силу вашого попереднього досвіду в математиці. Зрештою, ми будемо систематично визначати набори в розділі\(8 .\)

    Більш точним методом визначення множини є використання однозначних умов, що характеризують приналежність до множини.

    Позначення. \(\{x \in X \mid P(x)\}\)\(X\)Дозволяти бути (раніше визначений) набір, і нехай\(P(x)\) бути умова або властивість. Тоді набір\[Y=\{x \in X \mid P(x)\}\] - це набір елементів, в\(X\) яких задовольняють умові\(P\). Множина\(X\) називається доменом змінної.

    У словах, (1.1) читається: "\(Y\)дорівнює множині всіх (мало)\(x\) в (великих)\(X\) таких,\(P\) що вірно з\(x\)». Символ "\(\mid\)" in (1.1) часто пишеться замість двокрапки, а саме\(\{x \in X: P(x)\}\). У математиці часто\(P(x)\) є математичною формулою. Наприклад, припустимо,\(P(x)\) що формула "\(x^{2}=4\)». Під\(P(2)\) ми маємо на увазі формулу з 2 замінені для\(x\), тобто\[" 2^{2}=4 "\] Якщо підміна призводить до істинного твердження, ми говоримо, що\(P(x)\) тримає на 2, або\(P(2)\) є істинним. Якщо твердження, яке є результатом підміни, є помилковим, наприклад\(P(1)\), ми говоримо, що\(P(x)\) не тримається на 1, або\(P(1)\) це помилково.

    Приклад 1.2. Розглянемо\[X=\{0,1,4,9, \ldots\} .\] множину. Точне визначення одного і того ж множини виглядає наступним чином:\[X=\left\{x \in \mathbb{N} \mid \text { for some } y \in \mathbb{N}, x=y^{2}\right\} .\] ПРИКЛАД 1.3. \(Y\)Дозволяти множина позитивних парних чисел менше 100. Потім\(Y\) може бути написано:\[\left\{x \in \mathbb{N} \mid x<100 \text { and there is } n \in \mathbb{N}^{+} \text {such that } x=2 \cdot n\right\}\] ПРИКЛАД 1.4. Інтервал\(I\) - це непорожня підмножина\(\mathbb{R}\) з властивістю, що коли\(a, b \in I\) і\(a<c<b\), то\(c\) знаходиться в\(I\). Обмежений інтервал повинен мати одну з чотирьох форм\ [\ begin {вирівняні} (a, b) &=\ {x\ in\ mathbb {R}\ mid a<x<b\}\\ {[a, b)} &=\ {x\ in\ mathbb {R}\ mid a\ leq x<b\}\ (a, b] &=\ {x\\ in\ mathbb {R}\ середина a<x\ leq b\}\\ {[a, b]} &=\ {x\ in\ mathbb {R}\ середина a\ leq x \ leq b\} \ end {aligned}\] де в перших трьох випадках\(a\) і\(b\) є дійсними числами з\(a<b\) і в четвертому випадку ми просто вимагаємо\(a \leq b\). Необмежені інтервали мають п'ять форм:\ [\ begin {вирівняні} (-\ infty, b) &=\ {x\ in\ mathbb {R}\ середина x<b\}\ (-\ infty, b] &=\ {x\ in\ mathbb {R}\ середина х\ leq b\}\ (b,\ infty) &=\ {x\ in\ mathbb {R}\ середина x>b\}\\ {[b,\ intty)} &=\ {x\ in\ mathbb {R}\ середина х\ geq b\}\\ \ mathbb {R} & \ end {вирівняний}\] де\(b\) є деяке дійсне число. Інтервал називається закритим, якщо він містить всі його кінцеві точки (як\(a\) і\(b\) в першій групі прикладів, тільки\(b\) в перших чотирьох прикладах другої групи), і відкритим, якщо він не містить жодної з них. Зверніть увагу, що це робить\(\mathbb{R}\) єдиний інтервал, який є як закритим, так і відкритим.

    Заради стислості автор не може явно ідентифікувати область змінної. Будьте обережні з цим, так як автор спирається на читача, щоб зробити необхідні припущення. Наприклад, розглянемо множину\[X=\left\{x \mid\left(x^{2}-2\right)(x-1)\left(x^{2}+1\right)=0\right\} .\] Якщо домен змінної вважається\(\mathbb{N}\), то\[X=\{1\} .\] якщо домен змінної вважається\(\mathbb{R}\), то\[X=\{1, \sqrt{2},-\sqrt{2}\} .\] якщо домен змінної вважається комплексні числа, то,\[X=\{1, \sqrt{2},-\sqrt{2}, i,-i\}\] де\(i\) - комплексне число\(\sqrt{-1}\). Пам'ятайте, тягар чіткого спілкування лягає на автора, а не читача.

    Іншою альтернативою є включення домену змінної в умову, що визначає членство в множині. Отже, якщо\(X\) це передбачувана область множини і\(P(x)\) є умовою для членства в наборі,\[\{x \in X \mid P(x)\}=\{x \mid x \in X \text { and } P(x)\} .\] Поки визначення зрозуміло, автор має деяку гнучкість щодо позначення.

    1.2.1. Встановити ідентичність. Коли дві множини рівні? Ви можете бути схильні сказати, що два набори рівні за умови, що вони є однаковою колекцією об'єктів. Звичайно, це правда, але рівність як відношення між об'єктами не дуже цікаво. Однак ви, мабуть, витратили багато часу на дослідження рівнянь (які є лише твердженнями рівності), і ми сумніваємось, що рівність здавалася тривіальною. Це пояснюється тим, що в цілому рівність слід розуміти як зв'язок між описами або назвами об'єктів, а не між самими об'єктами. Заява\[a=b\] являє собою твердження про те, що представлений об'єкт\(a\) є тим же об'єктом, що представлений\(b\). Наприклад, твердження\[5-3=2\] - це твердження про те, що число, представлене арифметичним виразом\(5-3\), таке ж число, яке представлено числівником 2.

    У випадку множин це поняття рівності називається розширеністю.

    ВИЗНАЧЕННЯ. Розширення Дозволяти\(X\) і\(Y\) бути множинами. Тоді\(X=Y\) за умови, що кожен елемент також\(X\) є елементом\(Y\) і кожен елемент також\(Y\) є елементом\(X\).

    Існує гнучкість у тому, як характеризується набір, доки нам зрозуміло, які об'єкти складають набір. Наприклад, розглянемо множинне рівняння\[\{\text { Mark Twain, Samuel Clemens }\}=\{\text { Mark Twain }\} .\] Якщо під «Марк Твен» і «Семюель Клеменс», ми маємо на увазі померлого американського автора, ці набори рівні, за розширенням, і твердження є істинним. Набір з лівого боку рівняння має лише один елемент, оскільки обидва імена відносяться до однієї особи. Якщо ж розглядати «Марка Твена» і «Семюеля Клеменса» як імена, твердження помилкове, оскільки «Семюель Клеменс» є членом множини на лівій стороні рівняння, але не права сторона. Ви можете бачити, що визначення набору можуть залежати від неявного домену змінної, навіть якщо набори визначені лістингом.

    Приклад 1.5. Розглянемо наступні шість множин:\ [\ begin {вирівняні} &X_ {1} =\ {1,2\}\ &X_ {2} =\ {2,1\}\ &X_ {3} =\ {1,2,1\}\ &X_ {4} =\ {n\ in\ mathbb {N}\ середина 0<n<3\}\ &X_ {5} =\ ліворуч\ {n\ in\ mathbb {N}\ середині\ текст {існують} x, y, z\ in\ mathbb {N} ^ {+}\ текст {такий, що} x^ {n} +y^ {n} =z^ {n}\ право\}\ &X_ {6} =\ {0,1,2\}. \ end {aligned}\] Перші п'ять множин рівні, а шостий - різні. Однак поки очевидно, що\(X_{1}=X_{2}=X_{3}=X_{4}\), той факт, що\(X_{5}=X_{1}\) це знаменита теорема Ендрю Уайлза (його доказ останньої теореми Ферма).

    1.2.2. Пов'язані набори. Для того, щоб сказати щось цікаве про набори, нам потрібні способи їх співвіднесення, і нам потрібні способи створення нових наборів з існуючих наборів.

    Визначення. Підмножина,\(\subseteq\) Дозволяти\(X\) і\(Y\) бути множини. \(X\)є підмножиною,\(Y\) якщо кожен елемент також\(X\) є елементом\(Y\). Це пишеться\[X \subseteq Y .\] Superset,\(\supseteq\) If\(X \subseteq Y\), то\(Y\) називається надмножиною\(X\), написано Для\[Y \supseteq X .\] того, щоб показати два множини рівні (або що два опису множин відносяться до одного і того ж set), ви повинні показати, що вони мають точно такі ж елементи. Часто простіше, якщо аргумент розбитий на два простіші аргументи, в яких ви показуєте взаємне стримування множин. Іншими словами, сказати те\(X=Y\) саме, що говорити\[X \subseteq Y \text { and } Y \subseteq X,\] та перевіряти дві окремі претензії в (1.6) часто простіше (або принаймні зрозуміліше), ніж показувати, що\(X=Y\) все відразу.

    Давайте додамо ще кілька елементарних понять до нашого обговорення множин.

    ВИЗНАЧЕННЯ. Правильна підмножина,\(\subsetneq, \supsetneq\) Дозволяти\(X\) і\(Y\) бути множини. \(X\)є належним підмножиною,\(Y\) якщо\[X \subseteq Y \text { and } X \neq Y \text {. }\] ми пишемо це як\[X \subsetneq Y\] або\[Y \supsetneq X .\] ВИЗНАЧЕННЯ. Порожній набір,\(\emptyset\) Порожній набір - це набір без елементів. Позначається вона за допомогою\(\emptyset\).

    Так що для будь-якого набору,\(X\),\[\emptyset \subseteq X \text {. }\] (Подумайте, чому це правда). Просто тому\(\emptyset\), що порожній, не означає, що це неважливо. Дійсно, багато математичних питань зводяться до того, чи є певний набір порожнім чи ні. Крім того, як ви побачите в розділі 8, ми можемо побудувати весь реальний рядок з порожнього набору за допомогою операцій набору.

    ВПРАВА. (Див. Вправи 1.1). Покажіть,\[\{n \in \mathbb{N} \mid n \text { is odd and } n=k(k+1) \text { for some } k \in \mathbb{N}\}\] що порожньо.

    Давайте обговоримо деякі способи визначення нових наборів з існуючих множин. ВИЗНАЧЕННЯ. Союз,\(\cup\) Нехай\(X\) і\(Y\) бути набори. Об'єднання\(X\) і\(Y\), написане\(X \cup Y\), є множиною\[X \cup Y=\{x \mid x \in X \text { or } x \in Y\} .\] (Згадаймо нашу дискусію в розділі 1.1 про математичне значення слова «або».)

    ВИЗНАЧЕННЯ. Перетин,\(\cap\) Дозволяти\(X\) і\(Y\) бути множини. Перетин\(X\) і\(Y\), написане\(X \cap Y\), є множиною\[X \cap Y=\{x \mid x \in X \text { and } x \in Y\} .\] DEFINITION. Встановити різницю,\(\backslash\) Дозволяти\(X\) і\(Y\) бути набори. Встановлена різниця\(X\) і\(Y\), написана\(X \backslash Y\), є множиною\[X \backslash Y=\{x \in X \mid x \notin Y\} .\] DeFinition. Роз'єднані Дозволяти\(X\) і\(Y\) бути набори. \(X\)і\(Y\) нез'єднані, якщо\[X \cap Y=\emptyset .\] Часто один має справу з множинами, які є підмножинами деякої фіксованої заданої множини\(U\). Наприклад, при роботі з множинами натуральних чисел\(U\) множина буде\(\mathbb{N}\).

    ВИЗНАЧЕННЯ. Доповніть нехай\(X \subseteq U\). Доповненням\(X\) в\(U\) є набір\(U \backslash X\). Коли\(U\) розуміється з контексту,\(X\) пишеться доповнення\(X^{c}\).

    Як щодо операцій набору, що включають більше двох наборів? На відміну від арифметики, в якій існує порядок операцій за замовчуванням (степеней, добутків, сум), не існує універсальної умовності порядку, в якому виконуються множинні операції. Якщо перетину і об'єднання фігурують в одному виразі, то порядок, в якому виконуються операції, може мати значення. Наприклад, припустимо,\(X\) і\(Y\) є несполучними, непорожніми множинами, і розглянемо вираз\[X \cap X \cup Y \text {. }\] Якщо ми маємо на увазі для перетину буде виконано перед об'єднанням, то\[(X \cap X) \cup Y=X \cup Y .\] якщо, однак, ми маємо намір об'єднання обчислити перед перетин, то\[X \cap(X \cup Y)=X .\]\(Y\) Since непорожній і\(X\) нероз'єднаний від,\[(X \cap X) \cup Y \neq X \cap(X \cup Y) .\] Отже, порядок, в якому виконуються операції множини, потрібно явно прописати дужками.

    Приклад 1.7. Нехай\(X=\mathbb{N}\) і\(Y=\mathbb{Z} \backslash \mathbb{N}\). Тоді\[(X \cap X) \cup Y=\mathbb{N} \cup Y=\mathbb{Z} .\] Однак\[X \cap(X \cup Y)=\mathbb{N} \cap \mathbb{Z}=\mathbb{N} .\] ВИЗНАЧЕННЯ. Декартовий продукт, Прямий продукт,\(X \times Y\) Нехай\(X\) і\(Y\) бути набори. Декартове добуток\(X\) і\(Y\), написане\(X \times Y\), являє собою набір\[\{(x, y) \mid x \in X \text { and } y \in Y\} .\] впорядкованих пар Декартовий твір також називають прямим твором.

    ПРИКЛАД 1.8. Нехай\[X=\{1,2,3\}\] і\[Y=\{1,2\} .\] тоді\[X \times Y=\{(1,1),(1,2),(2,1),(2,2),(3,1),(3,2)\} .\] Зверніть увагу, що порядок має значення - тобто\[(1,2) \neq(2,1) .\] Так\(X \times Y\) це набір з шістьма елементами. Оскільки прямі продукти самі по собі є наборами, ми можемо легко визначити прямий добуток більш ніж двох факторів. Наприклад, нехай\(X, Y\) і\(Z\) бути множин, то\[(X \times Y) \times Z=\{((x, y), z) \mid x \in X, y \in Y, z \in Z\} .\] Формально,\[(X \times Y) \times Z \neq X \times(Y \times Z),\] тому що\(((x, y), z)\) і\((x,(y, z))\) не однакові. Однак майже в кожному додатку ця відмінність не важлива, і математики, як правило, розглядають прямий добуток більш ніж двох наборів без урахування цієї деталі. Тому ви, як правило, побачите декартовий добуток трьох наборів, написаних без дужок.\[X \times Y \times Z \text {. }\] У цьому випадку ви можете інтерпретувати прямий твір як будь-яку сторону твердження 1.8.

    З деякою думкою можна зробити висновок, що ми по суті описали декартове добуток довільної скінченної колекції множин. Елементи декартового добутку є\(X \times Y\) впорядкованими парами. Наша характеристика декартового добутку трьох множин,\(X, Y\) і\(Z\), вказує на те, що його елементи можна розглядати як впорядковану пару елементів\(X \times Y\) і\(Z\), відповідно. З практичної точки зору простіше думати про елементи\(X \times Y \times Z\) як впорядкованих трійок. Узагальнюємо це наступним чином.

    ВИЗНАЧЕННЯ. Декартовий продукт, прямий продукт,\(\prod_{i=1}^{n} X_{i}\) нехай\(n \in\)\(\mathbb{N}^{+}\), і\(X_{1}, X_{2}, \ldots, X_{n}\) бути набори. Декартова добуток\(X_{1}, \ldots, X_{n}\), написана\(X_{1} \times X_{2} \times \ldots \times X_{n}\), є множиною\[\left\{\left(x_{1}, x_{2}, \ldots, x_{n}\right) \mid x_{i} \in X_{i}, 1 \leq i \leq n\right\} .\] Це також може бути написано\[\prod_{i=1}^{n} X_{i} .\] Коли ми беремо декартовий твір множини\(X\) з самим собою\(n\) час, ми пишемо його як \(X^{n}\):\[X^{n}:=\overbrace{X \times X \times \cdots \times X}^{n \text { times }} .\]

    Функції

    Як і множини, функції всюдисущі в математиці.

    Визначення. Функція,\(f: X \rightarrow Y\) Дозволяти\(X\) і\(Y\) бути множини. Функція\(f\) від\(X\) до\(Y\), позначається\(f: X \rightarrow Y\), є присвоєнням рівно одного елемента\(Y\) кожному елементу\(X\).

    Для кожного елемента\(x \in X\) функція\(f\) асоціює або вибирає унікальний елемент\(y \in Y\). Умова унікальності не дозволяє\(x\) привласнювати окремим елементам\(Y\). Це дозволяє різні елементи, які\(X\) повинні бути призначені одному елементу\(Y\) однак. Важливо для вашого розуміння функцій, що ви уважно розглядаєте цей момент. Наведені нижче приклади можуть допомогти проілюструвати це.

    ПРИКЛАД 1.9. \(f: \mathbb{Z} \rightarrow \mathbb{R}\)Дозволяти\[f(x)=x^{2} .\] be\(f\) ged by Then - функція, в якій елемент\(\mathbb{R}\) присвоюється елементу\(x\)\(\mathbb{Z}\) of задається виразом\(x^{2}\). Наприклад,\(f\) присвоює 9 цілому числу 3. Ми виражаємо це написанням\[f(3)=9 \text {. }\] Спостерігайте, що не кожне дійсне число присвоюється числу від\(\mathbb{Z}\). Крім того, зауважте, що 4 призначається як 2, так і\(-2\). Перевірте, що\(f\) задовольняє визначенню функції.

    Приклад 1.10. Дозвольте\(g: \mathbb{R} \rightarrow \mathbb{R}\) визначитися з\(g(x)=\tan (x)\). Тоді\(g\) це не функція, тому що вона не визначена, коли\(x=\pi / 2\) (або щоразу, коли\(x-\pi / 2\) є цілим кратним\(\pi\)). Це можна виправити, визначивши\[X=\mathbb{R} \backslash\{\pi / 2+k \pi \mid k \in \mathbb{Z}\} .\] Then\(\tan : X \rightarrow \mathbb{R}\) є функцією from\(X\) to\(\mathbb{R}\). Приклад 1.11. Розглянемо два правила\(f, g: \mathbb{R} \rightarrow \mathbb{R}\), визначені\ [\ begin {масив} {ll} f (x) =y &\ text {if} 3 x=2-y\\ g (x) =y &\ text {якщо} x=y^ {4}. \ end {array}\] Тоді\(f\) є функцією, і може бути вказана явно як\(f(x)=2-3 x\). Але\(g\) не визначає функцію, т\(e . g\). к. коли\(x=16\), то\(g(x)\) може бути або 2 або\(-2\).

    ВИЗНАЧЕННЯ. Зображення нехай\(f: X \rightarrow Y\). Якщо\(a \in X\), то елемент,\(Y\) який\(f\) присвоює,\(a\) позначається\(f(a)\), і називається зображенням\(a\) під\(f\).

    Позначення\(f: X \rightarrow Y\) - це твердження, яке\(f\) є функцією від\(X\) до\(Y\). Це твердження має, як наслідок, що для кожного\(a \in X\),\(f(a)\) є певним елементом\(Y\). Наведено альтернативну характеристику функцій на основі декартових добутків.

    ВИЗНАЧЕННЯ. Графік функції Let\(f: X \rightarrow Y\). Графік\(f, \operatorname{graph}(f)\), є\[\{(x, y) \mid x \in X \text { and } f(x)=y\} .\] прикладом 1.12. \(X \subseteq \mathbb{R}\)\(f: X \rightarrow \mathbb{R}\)Дозволяти і визначитися\(f(x)=\)\(-x\). Тоді графік\(f\) є\[\{(x,-x) \mid x \in X\} .\] прикладом 1.13. Пуста функція\(f\) - це функція з порожнім графом (тобто графіком\(f\) є порожня множина). Це означає\(f: \emptyset \rightarrow Y\) для деякого набору\(Y\).

    Якщо\(f: X \rightarrow Y\), то,\[\operatorname{graph}(f) \subseteq X \times Y \text {. }\] нехай\(Z \subseteq X \times Y\). Потім\(Z\) - графік функції від\(X\) до\(Y\) if

    (i) для будь-якого\(x \in X\), є деякі\(y\) в\(Y\) таких, що\((x, y) \in Z\)

    (ii) якщо\((x, y)\) знаходиться\(Z\) і\((x, z)\) знаходиться в\(Z\), то\(y=z\). Припустимо\(Y\),\(X\) і є підмножинами\(\mathbb{R}\). Тоді Condition (i) - умова, що кожна вертикальна лінія через точку\(X\) розрізає графік хоча б один раз. Умова (ii) - умова, що кожна вертикальна лінія через точку\(X\) розрізає графік не більше одного разу.

    Визначення. Домен, кодомен Let\(f: X \rightarrow Y\). Набір\(X\) називається доменом\(f\), і пишеться\(\operatorname{Dom}(f)\). \(Y\)Множина називається кодоменом\(f\).

    Область функції є необхідною складовою визначення функції. Кодомен трохи тонший. Якщо ви думаєте про функції як набори впорядкованих пар, тобто якщо ви ідентифікували функцію з її графіком, то кожна функція матиме багато можливих кодоменів (візьміть будь-яку надмножину вихідного кодомену). Теоретики множин думають про функції таким чином, і якщо функції розглядаються як множини, розширення вимагає, щоб функції з однаковим графіком були ідентичними. Однак ця конвенція зробила б обговорення відмовок незграбним (див. Нижче), тому ми не будемо її приймати.

    Коли ви\[f: X \rightarrow Y\] пишете, ви явно називаєте призначений codomain, і це робить codomain вирішальною частиною визначення функції. Ви вказуєте читачеві, що ваше визначення включає більше, ніж просто графік функції. Визначення функції включає три частини: домен, кодомен та графік.

    ПРИКЛАД 1.14. \(f: \mathbb{N} \rightarrow \mathbb{N}\)Дозволяти\(g: \mathbb{N} \rightarrow \mathbb{R}\) визначатися\[f(n)=n^{2} .\] Дозволяти визначати\[g(x)=x^{2} .\] потім\(\operatorname{graph}(f)=\operatorname{graph}(g)\). Якщо\(h: \mathbb{R} \rightarrow \mathbb{R}\) визначається тим\[h(x)=x^{2}\]\(\operatorname{graph}(f) \subsetneq \operatorname{graph}(h)\), так\(f \neq h\) і\(g \neq h\). Хоча\(\operatorname{graph}(f)=\)\(\operatorname{graph}(g)\), ми вважаємо\(f\) і\(g\) бути різними функціями, оскільки вони мають різні кодомени.

    ВИЗНАЧЕННЯ. Діапазон нехай\(f: X \rightarrow Y\). Діапазон\(f, \operatorname{Ran}(f)\),\[\{y \in Y \mid \text { for some } x \in X, f(x)=y\} \text {. }\] так якщо\(f: X \rightarrow Y\), то\(\operatorname{Ran}(f) \subseteq Y\), і є саме набором зображень під\(f\) елементів в\(X\). Тобто\[\operatorname{Ran}(f)=\{f(x) \mid x \in X\} .\] Жодна належна підмножина не\(\operatorname{Ran}(f)\) може служити кодоменом для функції, яка має такий же графік, як\(f\).

    Приклад 1.15. З тими ж позначеннями, що і в прикладі 1.14, ми маємо\(\operatorname{Ran}(f)=\operatorname{Ran}(g)=\left\{n \in \mathbb{N} \mid n=k^{2}\right.\) для деяких\(\left.k \in \mathbb{N}\right\}\). В асортименті\(h\) є\([0, \infty)\).

    ВИЗНАЧЕННЯ. Реальна функція, Реальна функція Let\(f: X \rightarrow Y\). Якщо\(\operatorname{Ran}(f) \subseteq \mathbb{R}\), ми говоримо, що\(f\) реально цінується. Якщо\(X \subseteq \mathbb{R}\) і\(f\) є дійсною функцією, то викликаємо\(f\) реальну функцію.

    Іноді кажуть, що функція - це правило, яке присвоює кожному елементу заданого множини якийсь елемент з іншого набору. Якщо, як правило, мається на увазі якусь інструкцію, ви побачите в главі 6, що є «більше» функцій, які не можуть бути охарактеризовані правилами, ніж є функції, які можуть бути. Однак на практиці більшість функцій, які ми використовуємо, визначаються правилами.

    Якщо функція задана правилом, її прийнято записувати у вигляді\ [\ begin {aligned} f: X &\ rightarrow Y\\ x &\ mapsto f (x). \ end {aligned}\] Символ\(\mapsto\) читається «зіставлено на». Наприклад, функцію\(g\) в попередньому прикладі можна визначити за допомогою\ [\ begin {aligned} g:\ mathbb {N} &\ rightarrow\ mathbb {R}\\ n &\ mapsto n^ {2}. \ end {вирівняний}\] Приклад 1.16. Функція\ [\ begin {вирівняна} f:\ mathbb {R} &\ rightarrow\ mathbb {R}\\ x &\ mapsto\ begin {cases} 0 & x<0\ x+1 & x\ geq 0\ end {cases}\ end {aligned}\] визначається правилом, хоча для застосування правила до заданого\(x\) вам потрібно спочатку перевірити, де в домені\(x\) лежить.

    Коли реальна функція визначається правилом, а домен явно не вказаний, вона вважається найбільшою множиною, для якої визначено правило. Це звичайна угода в численні: реальні функції визначаються математичними виразами, і розуміється, що неявна область функції є найбільшою підмножиною,\(\mathbb{R}\) для якої вираз має сенс. Кодомен реальної функції вважається,\(\mathbb{R}\) якщо явно не вказано інше.

    ПРИКЛАД 1.17. \(f(x)=\sqrt{x}\)Дозволяти бути реальною функцією. Домен функції приймається як\[\{x \in \mathbb{R} \mid x \geq 0\} .\] DEFINITION. Операція\(X\) Дозволяти бути набором, і\(n \in \mathbb{N}^{+}\). Операція на\(X\) - це функція від\(X^{n}\) до\(X\).

    Операції можуть розглядатися як засіб об'єднання елементів набору для отримання нових елементів набору. Найпоширенішими операціями є бінарні операції (коли\(n=2\)).

    Приклад\(1.18 .+\) і\(\cdot\) є бінарними операціями на\(\mathbb{N}\).

    • і не\(\div\) є операціями на\(\mathbb{N}\).

    Приклад 1.19. Нехай\(X=\mathbb{R}^{3}\), думав, як набір з 3 -векторів. Функція\(x \mapsto-x\) - це унарна операція on\(X\), функція\((x, y) \mapsto x+y\) - двійкова операція, а функція\((x, y, z) \mapsto x \times y \times z\) - потрійна операція. Якщо\(f: X \rightarrow Y, g: X \rightarrow Y\), і\(\star\) є двійковою операцією\(Y\), то є природний спосіб визначити нову функцію\(X\) при використанні\(\star\). Визначити\(f \star g\) за допомогою\ [\ begin {вирівняні} f\ зірка g: X &\ rightarrow Y\\ (f\ зірка g) (x) &= f (x)\ зірка g (x). \ end {вирівняний}\] Приклад 1.20. Припустимо,\(f\) це реальна функція\(f(x)=x^{3}\), і\(g\) є реальною функцією\(g(x)=3 x^{2}-1\). Тоді\(f+g\) є реальною функцією\(x \mapsto x^{3}+3 x^{2}-1\), і\(f \cdot g\) є реальною функцією\(x \mapsto x^{3}\left(3 x^{2}-1\right)\).

    Ще один спосіб побудови нових функцій - за складом.

    ВИЗНАЧЕННЯ. Композиція,\(\circ\) нехай\(f: X \rightarrow Y\) і\(g: Y \rightarrow Z\). Тоді композицією\(g\) with\(f\) є функція,\ [\ begin {aligned} g\ circ f: X &\ rightarrow Z\\ x &\ mapsto g (f (x)). \ end {вирівняний}\] Приклад 1.21. \(f\)Дозволяти бути реальною функцією\[f(x)=x^{2} .\]\(g\) Дозволяти бути реальною функцією\[g(x)=\sqrt{x} .\] Тоді\[(g \circ f)(x)=|x| .\] Що таке\(f \circ g\)? (Будьте уважні до домену).

    ПРИКЛАД 1.22. Нехай\ [\ почати {вирівняний} f:\ mathbb {R} &\ стрілка вправо\ mathbb {R}\\ x &\ mapsto 2 x+1 \ кінець {вирівняний}\] і нехай\ [\ почати {вирівняний} г:\ mathbb {R} ^ {2} &\ праворуч\ mathbb {R}\\ (x, y) &\ mapsto ^ {2} +3 y^ {2}. \ end {вирівняний}\] Потім\ [\ почати {вирівняний} f\ circ g:\ mathbb {R} ^ {2} &\ стрілка вправо\ mathbb {R}\\ (x, y) &\ mapsto 2 x^ {2} +6 y^ {2} +1. \ end {aligned}\]\(g \circ f\) Функція не визначена (чому?).

    Ін'єкції, Відхилення, Відхилення

    Найбільш основними серед характеристик, які функція може мати, є властивості ін'єкційності, сприйнятливості та двооб'єктивності.

    ВИЗНАЧЕННЯ. Ін'єкція, один до одного нехай\(f: X \rightarrow Y\). Функція\(f\) називається ін'єкцією, якщо, всякий раз\(x\) і\(y\) є окремими елементами\(X\), ми маємо\(f(x) \neq f(y)\). Ін'єкції також називають функціями один-на-один.

    Інший спосіб заявити визначення (контрапозитив) полягає в тому, що якщо\(f(x)=f(y)\) тоді\(x=y\).

    Приклад 1.23. Реальна функція\(f(x)=x^{3}\) - ін'єкція. Щоб побачити це, нехай\(x\) і\(y\) бути дійсними числами, і припустимо, що\[f(x)=x^{3}=y^{3}=f(y) .\] Тоді\[x=\left(x^{3}\right)^{1 / 3}=\left(y^{3}\right)^{1 / 3}=y .\] Так\(x, y \in X\),\[f(x)=f(y) \text { only if } x=y .\] наприклад 1.24. Реальна функція не\(f(x)=x^{2}\) є ін'єкцією, тому що\[f(2)=4=f(-2) .\] зауважте, що достатньо одного прикладу, щоб показати, що\(f\) не ін'єкція.

    Приклад 1.25. Припустимо\(f: X \rightarrow Y\), і\(g: Y \rightarrow Z\). Доведіть, що якщо\(f\) і\(g\) є ін'єкційними, так і є\(g \circ f\).

    ProOF. Припустимо, що\(g \circ f(x)=g \circ f(y)\). Оскільки\(g\) є ін'єкційним, це означає, що\(f(x)=f(y)\). Оскільки\(f\) є ін'єкційним, це, в свою чергу, означає, що\(x=y\). Тому\(g \circ f\) є ін'єкційним, за бажанням. (Див. вправу\(1.20\) нижче).

    Визначення. Відсмоктування, на впустити\(f: X \rightarrow Y\). Ми говоримо\(f\), що це відмова від\(X\) до\(Y\) якщо\(\operatorname{Ran}(f)=Y\). Ми також описуємо це, кажучи,\(f\) що на\(Y\).

    Приклад 1.26. Функція,\(f: \mathbb{R} \rightarrow \mathbb{R}\)\(f(x)=x^{2}\) визначена не є surjection. Наприклад,\(-1\) знаходиться в кодомені\(f\), але\(-1 \notin \operatorname{Ran}(f)\). Тому,\(\operatorname{Ran}(f) \subsetneq \mathbb{R}\).

    Приклад 1.27. Нехай\(Y=\{x \in \mathbb{R} \mid x \geq 0\}\), і\(f: \mathbb{R} \rightarrow Y\) буде дано\(f(x)=x^{2}\). Потім\(f\) відбувається відсмоктування. Щоб довести це, нам потрібно це показати\(Y=\operatorname{Ran}(f)\). Ми це знаємо\(\operatorname{Ran}(f) \subseteq Y\), тому ми повинні показати\(Y \subseteq \operatorname{Ran}(f)\). Нехай\(y \in Y\), так\(y\) це невід'ємне дійсне число. Потім\(\sqrt{y} \in \mathbb{R}\), і\(f(\sqrt{y})=y\). Отже\(y \in \operatorname{Ran}(f)\). Так як\(y\) був довільним елементом\(Y, Y \subseteq \operatorname{Ran}(f)\). Звідси\(Y=\operatorname{Ran}(f)\) і\(f\) є вигнання.

    Чи є функція surjection, залежить від вибору кодомену. Функція завжди знаходиться на своєму діапазоні. Ви можете задатися питанням, чому б не просто визначити кодомен як діапазон функції (гарантуючи, що функція є surjection). Однією з причин є те, що ми можемо бути більше зацікавлені у зв'язку двох множин за допомогою функцій, ніж ми знаходимося в будь-якій конкретній функції між множинами. Вивчається важливе застосування функцій до пов'язаних множин в главі 6, де ми використовуємо функції для порівняння розмірів множин. Це викликає особливий інтерес при порівнянні нескінченних множин, і призвело до глибокого розуміння основ математики.

    Якщо ми об'єднаємо ідеї ін'єкції та відриву, ми дійдемо до ключової ідеї біекції.

    Визначення. Біекція,\(\mapsto\) Нехай\(f: X \rightarrow Y\). Якщо\(f\) ін'єкція і ін'єкція, то\(f\) це біекція. Це написано як\(f: X \mapsto Y\).

    Чому біекції так важливі? З теоретичної точки зору функції можуть використовуватися для зв'язку області та кодомена функції. Якщо ви знайомі з одним набором, ви можете розвинути уявлення про інший набір, знайшовши функцію між множинами, яка зберігає деякі ключові характеристики множин. Наприклад, ін'єкція може «інтерпретувати» один набір в інший набір. Якщо ін'єкція зберігає критичну інформацію з домену, ми можемо вести себе так, ніби область функції є практично підмножиною кодомена, використовуючи функцію для «перейменування» елементів домену. Якщо функція є біекцією, і вона зберігає ключові структурні особливості домену, ми можемо розглядати домен і кодомен як практично однакову множину. Які ключові структурні особливості залежить від області математики, яку ви вивчаєте. Наприклад, якщо ви вивчаєте алгебраїчні структури, ви, мабуть, найбільше зацікавлені в збереженні операцій структури. Якщо ви вивчаєте геометрію, вас цікавлять функції, що зберігають форму. Збереження ключових структурних особливостей домену або кодомена часто дозволяє перевести знання однієї множини в еквівалентні знання іншої множини.

    ВИЗНАЧЕННЯ. Перестановка\(X\) Дозволяти бути набором. Перестановка\(X\) - це біекція\(f: X \mapsto X\).

    Приклад 1.28. \(f: \mathbb{Z} \rightarrow \mathbb{Z}\)Дозволяти визначатися\[f(x)=x+1 .\] Тоді\(f\) є перестановкою\(\mathbb{Z}\).

    Приклад 1.29. Нехай\(X=\{0,1,-1\}\). Тоді\(f: X \rightarrow X\) задано\(f(x)=-x\) це перестановка\(X\).

    Зображення та інверси

    Функції можуть бути використані для визначення підмножин заданих множин.

    Визначення. Зображення,\(f[]\) Нехай\(f: X \rightarrow Y\) і\(W \subseteq X\). Зображення\(W\) під\(f\), написане\(f[W]\), є безліччю\[\{f(x) \mid x \in W\} .\] Так якщо\(f: X \rightarrow Y\), то\[\operatorname{Ran}(f)=f[X] .\] ПРИКЛАД 1.30. Припустимо,\(f\) це реальна функція\(f(x)=x^{2}+3\). Нехай\(W=\{-2,2,3\}\), і\(Z=(-1,2)\). Потім\(f[W]=\{7,12\}\), і\(f[Z]=[3,7)\).

    У додатках математики функції часто описують числові зв'язки між вимірними спостереженнями. Так що якщо\(f: X \rightarrow Y\) і\(a \in X\), то\(f(a)\) це прогнозоване або фактичне вимірювання, пов'язане з\(a\). У цьому контексті часто цікавить визначення того, які елементи\(X\) пов'язані зі значенням\(b\), в кодомені\(f\).

    Визначення 1.31. Зворотне зображення, Pre-зображення,\(f^{-1}(\)) Нехай\(f: X \rightarrow Y\) і\(b \in Y\). Тоді зворотне зображення\(b\) під\(f, f^{-1}(b)\), є множиною\[\{x \in X \mid f(x)=b\} .\] Цей набір також називається попереднім зображенням\(b\) під\(f\).

    Зверніть увагу, що якщо\(b \notin \operatorname{Ran}(f)\), то\(f^{-1}(b)=\emptyset\). Якщо\(f\) це ін'єкція, то для будь-якої\(b \in \operatorname{Ran}(f), f^{-1}(b)\) є єдиний елемент.

    Визначення. Зворотне зображення, Pre-зображення,\(f^{-1}[]\) Нехай\(f: X \rightarrow Y\) і\(Z \subseteq Y\). Обернене зображення\(Z\) under\(f\), або попереднє зображення\(Z\) under\(f\), є множиною\[f^{-1}[Z]=\{x \in X \quad \mid f(x) \in Z\}\] Ми використовуємо\(f^{-1}[]\) для означення зворотного зображення підмножини кодомену, і\(f^{-1}\) () для зворотного зображення елемента кодомена - обидва є підмножинами області\(f\). Якщо\(Z \cap \operatorname{Ran}(f)=\emptyset\), то\[f^{-1}[Z]=\emptyset .\] приклад 1.32. \(f\)Дозволяти бути як на малюнку\(1.33\) тоді\(f[\{b, c\}]=\{1,3\}\), і\(f^{-1}[\{1,3\}]=\{a, b, c, d\}\).

    зображення

    МАЛЮНОК 1.33. Зображення\(f\)

    Приклад 1.34. \(g\)Дозволяти бути реальною функцією\(g(x)=x^{2}+3\). Якщо\(b \in \mathbb{R}\) і\(b>3\), то\[g^{-1}(b)=\{\sqrt{b-3},-\sqrt{b-3}\} .\] якщо\(b=3\), то\(g^{-1}(3)=\{0\}\). Якщо\(b<3\), то\(g^{-1}(b)\) порожній.

    ПРИКЛАД 1.35. \(h\)Дозволяти бути реальною функцією\(h(x)=e^{x}\). Якщо\(b \in \mathbb{R}\) і\(b>0\), то\[h^{-1}(b)=\left\{\log _{e}(b)\right\} .\] Наприклад,\[h^{-1}(1)=\{0\} .\]\(h\) тому що суворо збільшується, зворотне зображення будь-якого елемента codomain\((\mathbb{R})\) є або множиною з одним елементом або порожнім набором.

    Нехай\(I=(a, b)\), де\(a, b \in \mathbb{R}\) і\(0<a<b\) (\(I\)тобто відкритий інтервал з кінцевими точками\(a\) і\(b\)). Потім\[h^{-1}[I]=\left(\log _{e}(a), \log _{e}(b)\right) .\] ми обговорили побудову нових функцій з існуючих функцій з використанням алгебраїчних операцій та складу функцій. Ще одним інструментом побудови нових функцій з відомих функцій є зворотна функція.

    Визначення 1.36. Зворотна функція\(f: X \mapsto Y\) Дозволяти бути bijection. Тоді обернена функція\(f, f^{-1}: Y \rightarrow X\), є функцією з графіком\[\{(b, a) \in Y \times X \mid(a, b) \in \operatorname{graph}(f)\} .\] Функція\(f^{-1}\) визначається «реверсом стрілок». Щоб це мало сенс, має\(f: X \rightarrow Y\) бути двооб'єктивним. Дійсно, якби не\(f\) були суб'єктивними, то був би елемент\(y\)\(Y\), який не знаходиться в діапазоні\(f\), тому не може бути відображений назад ні до чого в\(X\). \(f\)Якби не ін'єкційні, були б елементи\(z\)\(Y\), які були зображенням різних елементів\(x_{1}\) і\(x_{2}\) в\(X\). Не можна було визначити,\(f^{-1}(z)\) не вказавши, як вибрати той чи інший попередній образ. Обидві ці проблеми можна виправити. Якщо\(f\) є ін'єкційним, але не\(g: X \mapsto \operatorname{Ran}(f)\) суб'єктивним, можна визначити\[g(x)=f(x)\] для всіх\(x \in X\). Потім\(g^{-1}: \operatorname{Ran}(f) \mapsto X\). Якщо\(f\) не ін'єкційний, проблема складніша; але якщо ми можемо знайти деяку підмножину,\(X\) на якій\(f\) є ін'єкційним, ми могли б обмежити нашу увагу цим набором.

    ПРИКЛАД 1.37. \(f\)Дозволяти бути реальною функцією\(f(x)=x^{2}\). Функція не\(f\) є біекцією, тому вона не має зворотної функції. Однак функція\ [\ begin {вирівняна} g: [0,\ infty) &\ rightarrow [0,\ infty)\\ x &\ mapsto x^ {2} \ end {aligned}\] є бієкцією. У цьому випадку\[g^{-1}(y)=\sqrt{y} .\]зображення

    МАЛЮНОК 1.38. Зображення\(g\)

    Приклад 1.39. \(f\)Дозволяти бути реальною функцією,\(f(x)=e^{x}\). Ви знаєте з обчислення, що\(f\) це ін'єкція, і що\(\operatorname{Ran}(f)=\mathbb{R}^{+}\). Отже,\(f\) це не сприйняття, оскільки неявним кодоменом реальної функції є\(\mathbb{R}\). Функція\ [\ begin {вирівняна} g:\ mathbb {R} &\ rightarrow\ mathbb {R} ^ {+}\ x &\ mapsto e^ {x} \ end {aligned}\] є біекцією і\[g^{-1}(x)=\log _{e}(x)\] попередженням: Для\(f: X \mapsto Y\) біекції ми призначили два різних значення\(f^{-1}(b)\). У Визначенні 1.31 це означає набір точок\(X\), у яких відображаються\(b\). У визначенні 1.36 це означає обернену функцію біекції\(f^{-1}\),\(f\) застосованої до точки\(b \in Y\). Однак якщо\(f\) це біекція, так що друге визначення має сенс, то ці визначення тісно пов'язані між собою. Припустимо\(a \in \operatorname{Dom}(f)\), і\(f(a)=b\). Відповідно до визначення 1.31,\(f^{-1}(b)=\{a\}\) і за визначенням\(1.36\)\(f^{-1}(b)=a\). На практиці контекст дасть зрозуміти, яке визначення призначене. ВИЗНАЧЕННЯ. Функція ідентичності, id\(\left.\right|_{X}\)\(X\) Дозволяти бути набором. Функція ідентичності on\(X\), id\(\left.\right|_{X}: X \mapsto X\), - це функція, визначена\[\left.\operatorname{id}\right|_{X}(x)=x .\] If\(f: X \rightarrow Y\) є біекцією, то\(f^{-1}\) є унікальною функцією такої,\[f \circ f^{-1}=\left.\mathrm{id}\right|_{Y} .\] що\[f^{-1} \circ f=\left.\operatorname{id}\right|_{X}\] і Because \(f(x)=x^{2}\)не є ін'єкцією, вона не має зворотного, навіть після обмеження кодомену бути діапазоном. Тому для того, щоб «інвертувати»\(f\), ми розглянули іншу функцію\(g(x)\), яка дорівнювала\(f\) на підмножині області\(f\), і була ін'єкцією. У прикладі 1.37 ми досягли цього шляхом визначення функції\(g(x)=x^{2}\) з доменом\(\{x \in \mathbb{R} \mid x \geq 0\}\). Багато функцій, які нам потрібно інвертувати з практичних та теоретичних причин, трапляються не ін'єкціями, а отже, не мають зворотних функцій. Один із способів вирішення цієї перешкоди - розглянути функцію на меншому домені.

    Враховуючи функцію,\(f: X \rightarrow Y\) ми можемо визначити «обернене»\(f\) на деякій підмножині,\(W \subseteq X\) для якої обмеження\(f\) to\(W\) є ін'єкцією.

    ВИЗНАЧЕННЯ. Обмежений домен,\(\left.f\right|_{W}\) нехай\(f: X \rightarrow Y\) і\(W \subseteq X\). Обмеження\(f\) до\(W\), записаного\(\left.f\right|_{W}\), є функція\ [\ begin {aligned} \ left.f\ right|_ {W}: W &\ rightarrow Y\\ x &\ mapsto f (x). \ end {вирівняний}\] Отже, якщо\(f: X \rightarrow Y\) і\(W \subseteq X\), то\[\operatorname{graph}\left(\left.f\right|_{W}\right)=[W \times Y] \cap[\operatorname{graph}(f)] .\] ПРИКЛАД 1.40. Нехай\(f(x)=(x-2)^{4}\). Нехай\(W=[2, \infty)\). Потім\[\left.f\right|_{W}: W \rightarrow[0, \infty)\] йде біекція. Приклад 1.41. \(f\)Дозволяти бути реальною функцією,\(f(x)=\tan (x)\). Потім\[\operatorname{Dom}(f)=\{x \in \mathbb{R} \mid x \neq \pi / 2+k \pi, k \in \mathbb{Z}\},\] і\[\operatorname{Ran}(f)=\mathbb{R} .\] Функція\(f\) періодична з періодом\(\pi\), і тому не є ін'єкцією. Тим не менш, важливо відповісти на питання,

    «Під яким кутом (s)\(x\),\(\tan (x)\) дорівнює певному значенню,\(a \in \mathbb{R}\) «».

    Це математично еквівалентно питанню,\[\text { "What is } \arctan (a) \text { ?". }\] в обчисленні ця потреба була задоволена обмеженням домену найбільшим інтервалом,\(I\) таким, що\[\left.f\right|_{I}: I \mapsto \mathbb{R}\] Для будь-якого\(k \in \mathbb{Z}\),\[\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right)\] є такий інтервал. Для того, щоб визначити конкретну функцію, вибирається найпростіший з цих інтервалів, і ми визначаємо\[\operatorname{Tan}:=\left.\tan \right|_{(-\pi / 2, \pi / 2)} .\] Спостерігати, що\[\text { Tan : }(-\pi / 2, \pi / 2) \mapsto \mathbb{R} .\] Так функція є оборотною, тобто Тан має зворотну функцію,\[\operatorname{Arctan}=\operatorname{Tan}^{-1} \text {. }\]

    Послідовності

    У обчисленні ми думаємо про послідовність як (можливо, нескінченний) список об'єктів. Ми трохи розширимо цю ідею і висловимо її мовою функцій.

    ВИЗНАЧЕННЯ. скінченна послідовність,\(\left\langle a_{n} \mid n<N\right\rangle\) скінченна послідовність - це функція\(f\) з\(\ulcorner N\urcorner\) областю, де\(N \in \mathbb{N}\). Ми часто ототожнюємо послідовність з упорядкованим скінченним множиною\(\left\langle a_{n} \mid n<N\right\rangle\)\(a_{n}=f(n)\), де, для\(0 \leq n<N\).

    Ця інтерпретація послідовності як типу функції легко поширюється на нескінченні послідовності.

    ВИЗНАЧЕННЯ. Нескінченна послідовність,\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) нескінченна послідовність - це функція\(f\) з доменом\(\mathbb{N}\). Ми часто ототожнюємо послідовність з упорядкованим нескінченним набором\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\)\(a_{n}=f(n)\), де, для\(n \in \mathbb{N}\).

    ЗАУВАЖЕННЯ. Інтервал in\(\mathbb{Z}\) Насправді послідовність слів зазвичай використовується для означення будь-якої функції, область якої є інтервалом в\(\mathbb{Z}\), де інтервал в\(\mathbb{Z}\) є перетином деякого реального інтервалу с\(\mathbb{Z}\). Для зручності в цій книзі ми зазвичай вважаємо, що перший елемент будь-якої послідовності індексується 0 або 1.

    Приклад 1.42. \(\langle 0,1,4,9, \ldots\rangle\)Послідовність задається функцією\(f(n)=n^{2} .\)

    Послідовність\(\langle 1,-1,2,-2,3,-3, \ldots\rangle\) задається функцією\[f(n)= \begin{cases}\frac{n}{2}+1, & n \text { even } \\ -\frac{n+1}{2}, & n \text { odd. }\end{cases}\] Sequencies може приймати значення в будь-якому множині (кодомен функції\(f\), що визначає послідовність). Ми говоримо про реальну послідовність, якщо значення є дійсними числами, цілої послідовності, якщо вони всі цілі числа і т.д. пізніше з'ясується, що послідовності зі значеннями в наборі двох елементів\(\{0,1\}\) зустрічаються досить часто, тому у нас є спеціальна назва для них: ми називаємо їх двійковими послідовностями.

    ВИЗНАЧЕННЯ. Двійкова послідовність Скінченна двійкова послідовність є функцією\(f:\ulcorner N\urcorner \rightarrow\ulcorner 2\urcorner\), для деяких\(N \in \mathbb{N}\). Нескінченна двійкова послідовність - це функція,\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner\).

    Ми часто використовуємо вираз\(\left\langle a_{n}\right\rangle\) для послідовності\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\).

    Функції також використовуються для «індексування» множин з метою побудови більш складних множин з узагальненими операціями множини. Ми обговорили об'єднання (або перетин) більш ніж двох множин. Ви можете запитати, чи можна утворювати об'єднання або перетину великої (нескінченної) колекції множин. Є дві проблеми, які слід вирішити, відповідаючи на це питання. Ми повинні бути впевнені, що визначення об'єднання нескінченно багатьох множин є точним; тобто воно однозначно характеризує об'єкт у математичному всесвіті. Нам також потрібні позначення для управління цією ідеєю - як ми вказуємо множини, над якими ми приймаємо союз?

    ВИЗНАЧЕННЯ. Нескінченне об'єднання, індекс набір\(n \in \mathbb{N}^{+}\),\(\bigcup_{n=1}^{\infty} X_{n} \quad\) For, нехай\(X_{n}\) бути безліч. Тоді\[\bigcup_{n=1}^{\infty} X_{n}=\left\{x \mid \text { for some } n \in \mathbb{N}^{+}, x \in X_{n}\right\} \text {. }\]\(\mathbb{N}^{+}\) множиною називається набір індексу для об'єднання.

    Це може бути написано кількома різними способами.

    Позначення. \(\bigcup_{n \in \mathbb{N}^{+}} X_{n}\)Наступні три вирази однакові:

    зображення

    Ми можемо використовувати набори індексів, крім\(\mathbb{N}^{+}\).

    ВИЗНАЧЕННЯ. Сімейство наборів, Проіндексований союз,\(\bigcup_{\alpha \in A} X_{\alpha} \quad\) Нехай\(A\) буде набір, а для\(\alpha \in A\), нехай\(X_{\alpha}\) буде набір. \[\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\]Множиною називається сімейство множин, індексованих по\(A\). Потім\[\bigcup_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for some } \alpha \in A\right\} \text {. }\]\(\bigcup_{\alpha \in A} X_{\alpha}\) читається позначення «об'єднання над альфою в A множин X sub alpha». Отже,\[x \in \bigcup_{\alpha \in A} X_{\alpha} \text { if } x \in X_{\alpha} \text { for some } \alpha \in A \text {. }\] загальні перетину над сімейством множин визначаються аналогічно:\[\bigcap_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for all } \alpha \in A\right\} .\] приклад 1.43. Нехай\(X_{n}=\{n+1, n+2, \ldots, 2 n\}\) для кожного\(n \in \mathbb{N}^{+}\). Потім\ [\ почати {вирівняний} &\ bigcup_ {n=1} ^ {\ infty} X_ {n} =\ {k\ in\ mathbb {N}\ середина k\ geq 2\}\\ &\ bigcap_ {n=1} ^ {\ infty} X_ {n} =\ порожня множина. \ end {вирівняний}\] Приклад 1.44. Для кожного позитивного дійсного числа\(t\), нехай\(Y_{t}=[11 / t, t]\). Потім\ [\ почати {вирівняний} \ bigcup_ {t\ in (\ sqrt {11},\ infty)} Y_ {t} &=\ mathbb {R} ^ {+}\ \ bigcap_ {t\ in [\ sqrt {11},\ intty)} Y_ {t} &=\ {\ sqrt {11}\}. \ end {вирівняний}\] Приклад 1.45. Нехай\(f: X \rightarrow Y, A \subseteq X\) і\(B \subseteq Y\). Потім\[\bigcup_{a \in A}\{f(a)\}=f[A] .\] і\[\bigcup_{b \in B} f^{-1}(b)=f^{-1}[B] .\]

    Парадокс Рассела

    У міру вивчення ідей теорії множин були спроби якомога ширше визначити множини. Було сподіватися, що будь-яка колекція математичних об'єктів, яка може бути визначена за формулою, буде кваліфікуватися як набір. Ця віра була відома як Загальний принцип розуміння (GCP). На жаль, GCP породила висновки, які були неприйнятні для математики. Розглянемо колекцію, визначену за такою простою формулою:\[V=\{x \mid x \text { is a set and } x=x\} .\] Якщо\(V\) розглядається як безліч, то з тих пір\(V=V\),\[V \in V \text {. }\] якщо це не невідповідність, то це як мінімум тривожно. На жаль, стає гірше. Розглянемо збірку\[X=\{x \mid x \notin x\} .\] Тоді\[X \in X \text { if and only if } X \notin X \text {. }\] Цей останній приклад називається парадокс Рассела, і показав, що GCP помилковий. Зрозуміло, що повинен бути певний контроль над тим, які визначення породжують множини. Аксіоматична теорія множин була розроблена для забезпечення правил суворого визначення множин. Наведемо коротку дискусію в додатку Б.

    Вправи

    Вправа 1.1. Покажіть, що

    \(\{n \in \mathbb{N} \mid n\)є непарним і\(n=k(k+1)\) для деяких\(k \in \mathbb{N}\}\)

    порожній.

    Вправа 1.2. Дозволяти\(X\) і\(Y\) бути підмножинами деякої множини\(U\). Доведіть закони де Моргана:\ [\ почати {вирівняний} & (X\ чашка Y) ^ {c} =X^ {c}\ cap Y^ {c}\\ & (X\ cap Y) ^ {c} =X^ {c}\ чашка Y^ {c} \ кінець {вирівняний}\] Вправа 1.3. Нехай\(X, Y\) і\(Z\) будуть набори. Доведіть\ [\ begin {вирівняний} &X\ cap (Y\ чашка Z) =( X\ cap Y)\ чашка (X\ cap Z)\\ &X\ чашка (Y\ cap Z) = (X\ чашка Y)\ кришка (X\ чашка Z). \ end {вирівняний}\] ВПРАВА 1.4. Нехай\(X=\ulcorner 2\urcorner, Y=\ulcorner 3\urcorner\), і\(Z=\ulcorner 1\urcorner\). Які бувають наступні набори:

    (i)\(X \times Y\).

    (ii)\(X \times Y \times Z\).

    (iii)\(X \times Y \times Z \times \emptyset\).

    (iv)\(X \times X\).

    (v)\(X^{n}\).

    ВПРАВА 1.5. Припустимо,\(X\) це набір з\(m\) елементами, і\(Y\) являє собою набір з\(n\) елементами. Скільки елементів\(X \times Y\) має? Відповідь однакова, якщо один або обидва набори порожні?

    Вправа 1.6. Скільки елементів\(\emptyset \times \mathbb{N}\) має?

    ВПРАВА 1.7. Опишіть всі можливі інтервали в\(\mathbb{Z}\).

    Вправа 1.8. \(X\)\(Y\)Дозволяти і бути кінцевими непорожніми множинами, з\(m\) і\(n\) елементами відповідно. Скільки функцій є від\(X\) до\(Y\)? Скільки уколів? Скільки припущень? Скільки упереджень?

    Вправа 1.9. Що відбувається у Вправі,\(1.8\) якщо\(m\) або\(n\) дорівнює нулю?

    Вправа 1.10. Для кожного з наступних множин, які з операцій додавання, віднімання, множення, ділення і зведення в ступінь є операціями над множиною:

    (i)\(\mathbb{N}\)

    (ii)\(\mathbb{Z}\)

    (iii)\(\mathbb{Q}\)

    (iv)\(\mathbb{R}\)

    (v)\(\mathbb{R}^{+}\).

    ВПРАВА 1.11. Нехай\(f\) і\(g\) будуть реальні функції,\(f(x)=3 x+8\),\(g(x)=x^{2}-5 x\). Що таке\(f \circ g\) і\(g \circ f\)? Є\((f \circ g) \circ f=f \circ(g \circ f)\)?

    ВПРАВА 1.12. Запишіть всі перестановки\(\{a, b, c\}\).

    Вправа 1.13. Що таке природне узагальнення вправи\(1.2\) на довільну кількість множин? Перевірте свої узагальнені закони. Вправа 1.14. Що таке природне узагальнення вправи\(1.3\) на довільну кількість множин? Перевірте свої узагальнені закони.

    ВПРАВА 1.15. \(X\)Дозволяти бути безліч всіх трикутників в площині,\(Y\) безліч всіх прямокутних трикутників, і\(Z\) безліч всіх нерівнобедрені трикутники. Для будь-якого трикутника\(T\), нехай\(f(T)\)\(g(T)\) буде найдовша сторона\(T\), і бути максимум довжини сторін\(T\). На якому з множин\(X, Y, Z\) знаходиться\(f\) функція? На якій знаходиться\(g\) функція?

    Що є доповненням\(Z\) в\(X\)? Що таке\(Y \cap Z^{c}\)?

    Вправа 1.16. Для кожного позитиву реальний\(t\), нехай\(X_{t}=(-t, t)\) і\(Y_{t}=\)\([-t, t]\). Опишіть

    (i)\(\bigcup_{t>0} X_{t}\) і\(\bigcup_{t>0} Y_{t}\).

    (ii)\(\bigcup_{0<t<10} X_{t}\) і\(\bigcup_{0<t<10} Y_{t}\).

    (iii)\(\bigcup_{0<t \leq 10}^{0<t<10} X_{t}\) і\(\bigcup_{0<t \leq 10}^{0<t<10} Y_{t}\).

    (iv)\(\bigcap_{t>10}^{0<t \leq 10} X_{t}\) і\(\bigcap_{t>10}^{0<t \leq 10} Y_{t}\).

    \((\mathrm{v}) \bigcap_{t>10}^{t \geq 10} X_{t}\)і\(\bigcap_{t>10}^{t \geq 10} Y_{t}\)

    (vi)\(\bigcap_{t>0}^{t>10} X_{t}\) і\(\bigcap_{t>0}^{t>10} Y_{t}\).

    Вправа 1.17. \(f\)Дозволяти бути реальна функція косинус, і нехай\(g\) бути реальна функція\(g(x)=\frac{x^{2}+1}{x^{2}-1}\).

    (i) Що таке\(f \circ g, g \circ f, f \circ f, g \circ g\) і\(g \circ g \circ f\)?

    (ii) Які області та діапазони\(f, g, f \circ g\) реальних функцій\(g \circ f\)?

    ВПРАВА 1.18. \(X\)Дозволяти множина вершин квадрата в площині. Скільки перестановок\(X\) є? Скільки з них походить від обертань? Скільки виходить від роздумів у рядках? Скільки виходить з композиції обертання і відображення?

    Вправа 1.19. Які з наступних реальних функцій є ін'єкційними, а які - сюрктивними:

    (i)\(f_{1}(x)=x^{3}-x+2\).

    (ii)\(f_{2}(x)=x^{3}+x+2\). (iii)\(f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}\).

    (iv)\(f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}\)

    Вправа 1.20. Припустимо\(f: X \rightarrow Y\), і\(g: Y \rightarrow Z\). Доведіть,\(g \circ f\) що якщо ін'єкційний,\(f\) то ін'єкційний.

    Наведіть приклад, щоб показати, що не\(g\) потрібно бути ін'єкційним.

    ВПРАВА 1.21. Припустимо\(f: X \rightarrow Y\), і\(g: Y \rightarrow Z\).

    (i) Показати, що якщо\(f\) і\(g\) є суб'єктивними, так і є\(g \circ f\).

    (ii) Показати, що якщо\(g \circ f\) є суб'єктивним, то одна з двох функцій\(f, g\) повинна бути суб'єктивною (яка?). Наведіть приклад, щоб показати, що інша функція не повинна бути суб'єктивною.

    ВПРАВА 1.22. Для чого\(n \in \mathbb{N}\) призначена функція\(f(x)=x^{n}\) ін'єкції.

    ВПРАВА 1.23. \(f: \mathbb{R} \rightarrow \mathbb{R}\)Дозволяти поліном ступеня\(n \in \mathbb{N}\). Для яких значень\(n\) має\(f\) бути surjection, а для яких значень це не surjection?

    ВПРАВА 1.24. Записуйте біекцію\((X \times Y)\) час\(Z\) від\(X \times(Y\) часу\(Z)\). Доведіть, що це один до одного і на.

    Вправа 1.25. \(X\)Дозволяти бути набір з\(n\) елементами. Скільки перестановок\(X\) є?

    Вправа 1.26. \(f: \mathbb{R} \rightarrow \mathbb{R}\)Дозволяти функція побудована з використанням тільки натуральних чисел і додавання, множення і зведення в ступінь (наприклад,\(f\) може бути визначена як\(\left.x \mapsto(x+3)^{x^{2}}\right)\). Що ви можете сказати про\(f[\mathbb{N}] ?\) що ви можете сказати, якщо ми включимо віднімання або ділення?

    Вправа 1.27. Нехай\(f(x)=x^{3}-x .\) Знайти\(X\) множини і\(Y\) такі, що\(f: X \rightarrow Y\) є біекцією. Чи існує максимальний вибір\(X ?\) Якщо є, чи є він унікальним? Чи є максимальний вибір\(y\)? Якщо є, чи унікальна вона?

    Вправа 1.28. Нехай\(f(x)=\tan (x)\). Використовуйте set notation для визначення домену та діапазону\(f\). Що таке\(f^{-1}(1)\)? Що таке\(f^{-1}\left[\mathbb{R}^{+}\right] ?\) ВПРАВА 1.29. Для кожної з наступних реальних функцій знайдіть інтервал,\(X\) який містить більше однієї точки і такий, що функція є біекцією від\(X\) до\(f[X]\). Знайдіть формулу для оберненої функції.

    (i)\(f_{1}(x)=x^{2}+5 x+6\).

    (ii)\(f_{2}(x)=x^{3}-x+2\).

    (iii)\(f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}\).

    (iv)\(f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}\)

    ВПРАВА 1.30. Знайдіть формули для наступних послідовностей:

    (i)\(\langle 1,2,9,28,65,126, \ldots\rangle\).

    (ii)\(\langle 1,-1,1,-1,1,-1, \ldots\rangle\).

    (iii)\(\langle 2,1,10,27,66,125,218, \ldots\rangle\).

    (iv)\(\langle 1,1,2,3,5,8,13,21, \ldots\rangle\).

    ВПРАВА 1.31. Нехай реальна функція\(f\) буде строго збільшуватися. Показати, що для будь-якого\(b \in \mathbb{R}, f^{-1}(b)\) є або порожнім, або складається з одного елемента, і\(f\) це, отже, ін'єкція. Якщо\(f\) це також біекція, чи є зворотна функція\(f\) також суворо збільшується?

    ВПРАВА 1.32. \(f\)Дозволяти бути реальною функцією, яка є біекцією. Показати, що графік\(f^{-1}\) є відображенням графіка\(f\) в рядку\(y=x\).

    Вправа 1.33. Нехай\(X_{n}=\{n+1, n+2, \ldots, 2 n\}\) для кожного\(n \in \mathbb{N}^{+}\), як у прикладі 1.43. Які бувають

    (i)\(\cup_{n=1}^{5} X_{n}\).

    (ii)\(\cap_{n=4}^{6} X_{n}\).

    (iii)\(\cap_{k=1}^{5}\left[\cup_{n=1}^{k} X_{n}\right]\).

    (iv)\(\cap_{k=5}^{\infty}\left[\cup_{n=3}^{k} X_{n}\right]\).

    Вправа 1.34. Перевірте твердження Приклад 1.44.

    ВПРАВА 1.35. Нехай\(f: X \rightarrow Y\), і припустимо, що\(U_{\alpha} \subseteq X\) для кожного\(\alpha \in A\), і\(V_{\beta} \subseteq Y\) для кожного\(\beta \in B\). Доведіть:\ [\ почати {вирівняний} &\ текст {(i)} f\ лівий (\ bigcup_ {\ альфа\ в A} U_ {\ альфа}\ праворуч) =\ bigcup_ {\ альфа\ в A} f\ ліворуч (U_ {\ альфа}\ праворуч)\\ &\ текст {(ii)} f\ лівий (\ bigcap_ {\ альфа\ в A} U_\ альфа}\ праворуч)\ підмножина\ bigcap_ {\ альфа\ в A} f\ ліворуч (U_ {\ альфа}\ справа)\\ &\ text {( iii)} f^ {-1}\ ліворуч (\ bigcup_ {\ beta\ in B} V_ {\ beta}\ праворуч) =\ bigcup_ {\ бета\ in B} f^ {-1}\ ліворуч (V_ {\ бета}\ праворуч)\\ &\ текст {(iv)} f^ {-1}\ ліворуч (\ bigcap_ {\ бета\ в B} V_ {\ beta\}\ праворуч) =\ bigcap_ {\ beta\ in B} f^ {-1}\ left (V_ {\ beta}\ праворуч)\ text {.} \ end {вирівняний}\] Зауважте, що (ii) замість цього має стримування рівності. Наведіть приклад належного стримування в частині (ii). Знайдіть умову\(f\), яка б забезпечила рівність у (ii).

    Підказки, щоб почати роботу над деякими вправами

    Вправа 1.2. Ви можете зробити це за допомогою діаграми Венна. Однак, як тільки буде більше трьох сетів (див. Вправа 1.13), такий підхід буде складним. Алгебраїчне доказ узагальнить легше, тому спробуйте знайти його тут. Аргументуйте два включення\ [\ begin {вирівняні} (X\ чашка Y) ^ {c} &\ subseteq X ^ {c}\ cap Y^ {c}\ cap Y^ {c}\ cap Y^ {c} &\ subseteq (X\ чашка Y) ^ {c} \ кінець {вирівняний}\] окремо. У першому, наприклад, припустимо, що\(x \in(X \cup Y)^{c}\) і показати, що воно повинно бути в обох\(X^{c}\) і\(Y^{c}\).

    Вправа 1.13. Частиною проблеми тут є позначення - що робити, якщо у вас більше наборів, ніж букв? Почніть з кінцевої кількості наборів, що містяться в\(U\), і називайте їх\(X_{1}, \ldots, X_{n}\). Як ви думаєте, що доповнення їх союзу? Доведіть це, як ви робили, коли\(n=2\) у вправі 1.2. (Побачити перевагу наявності доказів у Вправі\(1.2\), які не використовували діаграми Венна? Однією з причин, чому математики люблять мати кілька доказів однієї теореми, полягає в тому, що кожен доказ, ймовірно, узагальнить по-іншому). Чи можете ви змусити той самий аргумент працювати, якщо ваші набори індексуються деяким нескінченним набором індексів?

    Тепер виконайте те ж саме з доповненням перехрестя.

    Вправа 1.14. Знову є нотаційна проблема, але поки\(Y\) і\(Z\) грають ту ж роль у вправі 1.3,\(X\) грає іншу роль. Отже, перепишіть рівняння як\ [\ почати {вирівняний} &X\ cap\ лівий (Y_ {1}\ cup Y_ {2}\ правий) =\ лівий (X\ cap Y_ {1}\ праворуч)\ чашка\ лівий (X\ cap Y_ {2}\ правий)\\ &X\ чашка\ лівий (Y_ {1}\ шапка Y_ {2}\ правий)\\ лівий (Y_ {1} cap\ Y_ {2}\ правий)\\ лівий (Y_ {1} cap X\ чашка Y_ {1}\ праворуч)\ cap\ left (X\ cup Y_ {2}\ праворуч), \ end {вирівняний}\] і подивитися, чи можете ви узагальнити ці.

    Вправа 1.35. (i) Знову ж таки, це зводиться до доказу двох захисних оболонок. Якщо\(y\) знаходиться в лівій частині, то має бути деякі\(x_{0}\) в якомусь\(U_{\alpha_{0}}\) такому, що\(f(x)=y\). Але потім\(y\) знаходиться в\(f\left(U_{\alpha_{0}}\right)\), так\(y\) знаходиться в правій частині.

    І навпаки, якщо\(y\) знаходиться в правій частині, то він повинен бути в\(f\left(U_{\alpha_{0}}\right)\) для деяких\(\alpha_{0} \in A\). Але потім\(y\) знаходиться в\(f\left(\cup_{\alpha \in A} U_{\alpha}\right)\), і так знаходиться в лівій стороні.
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    зображення

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2)

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2)

    • 2

    2

    (

    р.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    зображення

    зображення

    (1)

    • ГЛАВА 2

    Відносини

    Визначення

    ВИЗНАЧЕННЯ. Відношення Дозволяти\(X\) і\(Y\) бути множини. Відношення від\(X\) до\(Y\) є підмножиною\(X \times Y\).

    Крім того, будь-який набір впорядкованих пар є співвідношенням. Якщо\(Y=X\), ми говоримо, що\(R\) це відношення на\(X\).

    Позначення. \(x\)Ry Нехай\(X\) і\(Y\) бути встановлює і\(R\) бути відношення на\(X \times Y\). Якщо\(x \in X\) і\(y \in Y\), то ми можемо висловити, що\(x\) несе відношення\(R\) до\(y\) (тобто\((x, y) \in R\)) шляхом написання\(x R y\).

    Так для\(X\) і\(Y\) встановлює\(x \in X, y \in Y\), і відношення\(R\) на\(X \times Y\),\(x R y\) якщо і тільки якщо\((x, y) \in R\).

    Приклад 2.1. Дозвольте\(\leq\) бути звичайним замовленням на\(\mathbb{Q}\). Тоді\(\leq\) це відношення на\(\mathbb{Q}\). Ми пишемо\[1 / 2 \leq 2\] висловити, що\(1 / 2\) несе відношення\(\leq\) до 2.

    ПРИКЛАД 2.2. Визначте відношення\(R\) від\(\mathbb{Z}\) до\(\mathbb{R}\) за\(x R y\) if\(x>y+3\). Тоді ми могли б\((7, \sqrt{2}) \in R\) написати\(7 R \sqrt{2}\) або сказати, що\((7, \sqrt{2})\) є у відношенні.

    ПРИКЛАД 2.3. Нехай\(X=\{2,7,17,27,35,72\}\). Визначте відношення\(R\) по\(x R y\)\(x \neq y\) if\(x\) і і\(y\) мати спільну цифру. Тоді

    \(R=\{(2,27),(2,72),(7,17),(7,27),(7,72),(17,7),(17,27),(17,72),\),\((27,2),(27,7),(27,17),(27,72),(72,2),(72,7),(72,17),(72,27)\}\). Приклад 2.4. \(P\)Дозволяти множина всіх багатокутників у площині. Визначте відношення\(E\), сказавши,\((x, y) \in E\) якщо\(x\) і\(y\) мають однакову кількість сторін.

    Як математики використовують відносини? Відношення на множині може бути використано для накладання структури. У прикладі 2.1 звичайне впорядкування відношення\(\leq\) на\(\mathbb{Q}\) дозволяє нам думати про раціональні числа як лежать на числовій лінії, що забезпечує додаткове розуміння раціональних чисел. У прикладі 2.4 ми можемо використовувати відношення для розбиття багатокутників на множини трикутників, чотирикутників, п'ятикутників тощо.

    Функція\(f: X \rightarrow Y\) може розглядатися як дуже особливий вид відношення від\(X\) до\(Y\). Дійсно, графік функції являє собою набір впорядкованих пар в\(X \times Y\), але він має додаткову властивість, що кожен\(x\) in\(X\) відбувається рівно один раз як перший елемент пари у відношенні. Як ми обговорювали в розділі 1.3, функції є корисним способом зв'язати множини.

    \(X\)Дозволяти бути безліч,\(R\) і відношення на\(X\). Ось деякі важливі властивості, які відношення може мати, а може і не мати.

    ВИЗНАЧЕННЯ. \(R\)Рефлексивний є рефлексивним, якщо для кожного\(x \in X\),\[x R x .\]\(R\) Симетричний симетричний, якщо для будь-якого\(x, y \in X\),\[x R y \text { implies } y R x \text {. }\]\(R\) Антисиметричний антисиметричний, якщо для будь-якого\(x, y \in X\), \[[(x, y) \in R \text { and }(y, x) \in R] \text { implies } x=y \text {. }\]Транзитивний\(R\) є перехідним, якщо для будь-якого\(x, y, z \in X\),\[[x R y \text { and } y R z] \text { implies }[x R z] \text {. }\] Які з цих чотирьох властивостей застосовуються до відносин, наведених у прикладах 2.1-2.4 (Вправа 2.1)?

    Замовлення

    Відношення на множині може розглядатися як частина структури, накладеної на набір. Серед найважливіших відносин на безлічі - порядкові відносини.

    ВИЗНАЧЕННЯ. Часткове впорядкування\(X\) Дозволяти бути\(R\) множиною і відношення на\(X\). Ми говоримо, що\(R\) це часткове впорядкування, якщо:
    (1)\(R\) є рефлексивним
    (2)\(R\) є антисиметричним
    (3)\(R\) є перехідним.

    ПРИКЛАД 2.5. Нехай\(X\) буде сімейство наборів. Відношення\(\subseteq\) є частковим впорядкуванням на\(X\). Кожен набір є підмножиною себе, тому відношення є рефлексивним. Якщо\(Y \subseteq Z\) і\(Z \subseteq Y\), то\(Y=Z\), так відношення антисиметричне. Нарешті, якщо\(Y \subseteq Z\) і\(Z \subseteq W\) тоді\(Y \subseteq W\), так відношення є перехідним.

    Приклад 2.6. \(R\)Дозволяти відношення на\(\mathbb{N}^{+}\) визначається\(x R y\) якщо і тільки якщо є\(z \in \mathbb{N}^{+}\) таке, що\[x z=y .\] Тоді\(R\) є часткове впорядкування\(\mathbb{N}^{+}\). (Доведіть це: Вправа 2.2).

    ВИЗНАЧЕННЯ. Лінійне впорядкування\(X\) Дозволяти бути набором і\(R\) бути частковим упорядкуванням\(X\). Ми говоримо, що\(R\) це лінійне впорядкування, яке також називається загальним замовленням, за умови, що для будь-якого\(x, y \in X\), або\(x R y\) або\(y R x\).

    Зверніть увагу, що оскільки лінійне впорядкування є антисиметричним, для будь-якого\(x\) чіткого і\(y\), точно одного з\(x R y\) і\(y R x\) утримує.

    Приклад 2.7. Порядок\(\leq\) на\(\mathbb{N}\) (або\(\mathbb{R}\)) є лінійним упорядкуванням. Так само і ставлення\(\geq\). \(<\)Відносини немає (чому?).

    Приклад 2.8. Нехай\(X=\mathbb{R}^{n}\). Ми можемо визначити рефлексивне відношення\(X\) наступним чином. \(x=\left(a_{1}, \ldots, a_{n}\right)\)\(y=\left(b_{1}, \ldots, b_{n}\right)\)Дозволяти і бути відмінними членами\(X\). \(k \in \mathbb{N}^{+}\)Дозволяти бути найменшим числом таких, що\(a_{k} \neq b_{k}\). Тоді ми визначаємо\[x R y \text { if and only if } a_{k}<b_{k} .\] Тоді\(R\) лінійне впорядкування\(X\). Він називається словниковим упорядкуванням.

    Поняття лінійного впорядкування, ймовірно, є природним для вас, і ви використовували його інтуїтивно з тих пір, як ви почали вивчати арифметику. \(\leq\)Відношення допомагає візуалізувати множину у вигляді лінії, в якій відносне розташування двох елементів множини визначається лінійним упорядкуванням. Якщо ви розглядаєте набір з операціями, це, в свою чергу, може допомогти у візуалізації того, як поводяться операції. Наприклад, подумайте про використання числового рядка для візуалізації додавання, віднімання та множення цілих чисел.

    Часткові впорядкування є узагальненням лінійних порядків і\(\leq\) є найбільш очевидним прикладом лінійного впорядкування. Через це нормальним символом для часткового впорядкування є\(\preceq\) (він також нагадує символ\(\subseteq\), який є прикладом більшості математиків, думаючи про часткове впорядкування).

    ПРИКЛАД 2.9. Нехай\(X\) буде набір всіх колекцій яблук і апельсинів. Якщо\(x, y\) знаходяться в\(X\), то скажіть,\(x \preceq y\) якщо кількість яблук в\(x\) менше або дорівнює кількості яблук в\(y\), а кількість апельсинів в\(x\) менше або дорівнює кількості апельсини в\(y\). Це часткове впорядкування. Можливо, ви не зможете порівняти яблука з апельсинами, але можна сказати, що 2 яблука і 5 апельсинів поступаються 4 яблукам і 6 апельсинам!

    Один із способів візуалізації часткового порядку\(\preceq\) на скінченній множині\(X\) полягає в тому, щоб уявити стрілки, що з'єднують різні елементи\(X, x\) і\(y\), якщо\(x \preceq y\) і немає третьої чіткої точки, що\(z\) задовольняє \(x \preceq z \preceq y\). Тоді два елементи\(a\) і\(b\) в\(X\) задовольнить,\(a \preceq b\) якщо і тільки якщо ви можете дістатися від\(a\) до,\(b\) слідуючи шляху стрілок.

    Приклад 2.10. Розглянемо графік на множині\(X=\{a, b, c, d, e, f\}\) даємо на малюнку 2.11.

    зображення

    МАЛЮНОК 2.11. Зображення часткового замовлення

    Він ілюструє частковий порядок, який можна охарактеризувати як найменший рефлексивний, перехідний зв'язок\(\preceq\),\(X\) який задовольняє\(a \preceq b, a \preceq c, b \preceq\)\(d, b \preceq e, c \preceq e, e \preceq f .\)

    Відносини еквівалентності

    ВИЗНАЧЕННЯ. Співвідношення еквівалентності\(X\) Дозволяти бути\(R\) множиною і відношення на\(X\). Ми говоримо\(R\), що це відношення еквівалентності, якщо

    (1)\(R\) є рефлексивним

    (2)\(R\) симетричний

    (3)\(R\) є перехідним.

    Приклад 2.12. Визначте відношення\(R\)\(\mathbb{R}\) на\(x R y\) якщо і тільки якщо\(x^{2}=\)\(y^{2}\). Тоді\(R\) - відношення еквівалентності.

    Приклад 2.13. \(R\)Дозволяти відношення визначено\(\mathbb{Z} \times \mathbb{Z}\) наступним чином. Якщо\(a, b, c, d \in \mathbb{Z}\),\[(a, b) R(c, d) \text { if and only if } a+d=b+c \text {. }\] То\(R\) є відношення еквівалентності. Дійсно, давайте перевіримо три властивості.

    Рефлексивний: За (2.14) ми маємо\((a, b) R(a, b)\) if\(a+b=a+b\), який чітко тримає. Симетричний: Припустимо\((a, b) R(c, d)\), так\(a+d=b+c\). Щоб побачити\((c, d) R(a, b)\), чи, ми повинні перевірити, чи\(c+b=d+a\); але це дотримується комутативності додавання.

    Перехідний: Припустимо\((a, b) R(c, d)\) і\((c, d) R(e, f)\). Ми повинні перевірити\((a, b) R(e, f)\), що, іншими словами, що\[a+f=b+e .\] Ми маємо\(a+d=b+c\) і\(c+f=d+e\), і, додаючи ці два рівняння, ми отримуємо\[a+d+c+f=b+c+d+e .\] Скасування\(c+d\) з кожного боку (2.16), ми отримуємо (2.15) за бажанням.

    Приклад 2.17. \(R\)Дозволяти відношення на\(X=\mathbb{Z} \times \mathbb{N}^{+}\) визначеному\[(a, b) R(c, d) \text { if and only if } a d=b c \text {. }\] Тоді\(R\) є відношення еквівалентності на\(X\). (Доведіть це; Вправа 2.4).

    Приклад 2.18. Нехай\(f: X \rightarrow Y\). Визначте відношення\(R_{f}\)\(X\) по\[x R_{f} y \text { if and only if } f(x)=f(y) .\] Тоді\(R_{f}\) - це відношення еквівалентності. Перевіряємо умови співвідношення еквівалентності:

    \(R_{f}\)явно рефлексивний, так як, для будь-якого\(x \in X\),\[f(x)=f(x) .\]\(R_{f}\) симетричний так як, для будь-якого\(x \in X\) і\(y \in X\),\[f(x)=f(y) \text { if and only if } f(y)=f(x) .\] щоб показати\(R_{f}\) є перехідним, нехай \(x, y, z \in X\). Якщо\(f(x)=f(y)\) і\(f(y)=\)\(f(z)\) тоді\(f(x)=f(z)\).

    Відносини еквівалентності мають три ключові властивості ідентичності. Вони дозволяють нам пов'язати об'єкти в наборі, який ми хочемо розглядати як «однакові» в даному контексті. Це дозволяє зосередитися на тому, які відмінності між математичними об'єктами мають відношення до дискусії, а які ні. З цієї причини загальним символом відношення еквівалентності є\(\sim\).

    ВИЗНАЧЕННЯ. Клас еквівалентності,\([x]_{R}\)\(R\) Дозволяти відношення еквівалентності на множині\(X\). Якщо\(x \in X\) тоді клас еквівалентності по\(x\) модулю\(R\), позначається\([x]_{R}\), є\[[x]_{R}=\{y \in X \mid x R y\} .\] If\(y \in[x]_{R}\) ми називаємо\(y\) репрезентативним елементом\([x]_{R}\). Записується набір всіх класів\(\left\{[x]_{R} \mid x \in X\right\}\) еквівалентності\(X / R\). Його називають частковим простором\(X\) по\(R\).

    Ми можемо використовувати\([x]\) для класу еквівалентності, за умови\(x\), що відношення еквівалентності є чітким.

    Позначення. Еквівалентність мод\(R, \equiv_{R}, \sim\)\(R\) Дозволяти бути відношення еквівалентності на множині\(X\). Ми можемо висловити це\(x R y\)\[x \equiv y \bmod R\] письмово\[x \equiv_{R} y\] або\[x \sim y .\] Пропозиція 2.19. Припустимо, що\(\sim\) це відношення еквівалентності на\(X\). Нехай\(x, y \in X\). Якщо\(x \sim y\), то\[[x]=[y] .\] Якщо\(x\) не еквівалентно\(y(x \nsim y)\), то\[[x] \cap[y]=\emptyset .\] Доказ. (i) Припустимо\(x \sim y\). Давайте покажемо це\([x] \subseteq[y]\). Нехай\(z \in[x]\). Це означає, що\(x \sim z\). Так\(\sim\) як симетричний, і\(x \sim y\), у нас є\(y \sim x\). Як\(y \sim x\) і\(x \sim z\), шляхом транзитивності\(\sim\) ми отримуємо це\(y \sim z\). Тому\(z \in[y]\). Оскільки\(z\) є довільним елементом\([x]\), ми показали, що\([x] \subseteq[y]\). Як\(y \sim x\), той же аргумент з\(x\) і\(y\) поміняти місцями дає\([y] \subseteq[x]\), а значить\([x]=[y]\).

    (ii) Тепер припустимо, що\(x\) і не\(y\) є рівнозначними. Треба показати, що немає\(z\) такого, що\(z \in[x]\) і\(z \in[y]\). Ми будемо сперечатися протиріччям. Припустимо, були такі\(z\). Тоді ми мали б\[x \sim z \quad \text { and } \quad y \sim z .\] За симетрією, ми також маємо це\(z \sim y\), і за транзитивністю ми маємо це\(x \sim y\). Це суперечить припущенню, яке не\(x\) є рівнозначним\(y\). Так що якщо\(x\) і не\(y\) є рівнозначними, не\(z\) може існувати, що одночасно в обох\([x]\) і\([y]\). Тому\([x]\) і\([y]\) розмежовуються набори, в міру необхідності.

    Отже, що ми показали? Ми не показали, що будь-яке конкретне відношення є співвідношенням еквівалентності. Швидше ми показали, що будь-яке відношення еквівалентності на множині розділяє множину на нез'єднані класи еквівалентності.

    Як ми побачимо у цій книзі, і ви побачите протягом усіх своїх математичних досліджень, це дивно потужний інструмент.

    Визначення. Попарно розрізнені Нехай\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) буде сімейство наборів. Сім'я попарно розмежовується, якщо для будь-якого\(\alpha, \beta \in A, \alpha \neq \beta\),\[X_{\alpha} \cap X_{\beta}=\emptyset .\] ВИЗНАЧЕННЯ. Розділ\(Y\) Дозволяти бути набором і\(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\) бути сімейством непорожніх множин. Колекція\(\mathcal{F}\) являє собою поділ\(Y\)\(\mathcal{F}\) if попарно нез'єднаний і\[Y=\bigcup_{\alpha \in A} X_{\alpha} .\] Задано відношення еквівалентності\(\sim\) на\(X\) множині, класи еквівалентності щодо \(\sim\)дати перегородку з\(X\). І навпаки, розділи породжують відносини еквівалентності.

    ТЕОРЕМА 2.21. (i)\(X\) Дозволяти бути множиною, і відношення\(\sim\) еквівалентності на\(X\). Потім\(X / \sim\) йде перегородка з\(X\). (ii) І навпаки, нехай\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) бути розділом\(X\). \(\sim\)Дозволяти відношення на\(X\) визначені\(x \sim y\)\(x\)\(y\) whever і є членами одного і того ж набору в розділі. Тоді\(\sim\) - відношення еквівалентності.

    ДОКАЗ. Частина (i) теореми є Пропозиція\(2.19\) повторена, і ми дали докази вище. Щоб довести зворотне, ми повинні показати, що відношення,\(\sim\) визначене як у частині (ii) теореми, є еквівалентністю.

    Рефлексивність: Нехай\(x \in X\). Тоді\(x\) є в деяких\(X_{\alpha_{0}}\), як об'єднання всіх цих наборів є все\(X\). Тому\(x \sim x\).

    Симетрія: Припустимо\(x \sim y\). Тоді є деякі\(X_{\alpha_{0}}\) такі, що\(x \in X_{\alpha_{0}}\) і\(y \in X_{\alpha_{0}}\). Це означає, що\(y \sim x\).

    Транзитивність: Припустимо\(x \sim y\) і\(y \sim z\). Потім є\(X_{\alpha_{0}}\) набори і\(X_{\alpha_{1}}\) такі, що обидва\(x\) і\(y\) знаходяться в\(X_{\alpha_{0}}\), і обидва\(y\) і\(z\) знаходяться в\(X_{\alpha_{1}}\). Але так як набори\(X_{\alpha}\) утворюють розділ, і\(y\) є в обох\(X_{\alpha_{0}}\) і\(X_{\alpha_{1}}\), ми повинні мати, що\(X_{\alpha_{0}}=X_{\alpha_{1}}\). Це означає, що\(x\) і\(z\) знаходяться в одному і тому ж члені перегородки, і так\(x \sim z\).

    Побудова бієкцій

    Розглянемо особливо цікаве і важливе абстрактне застосування класів еквівалентності. Нехай\(f: X \rightarrow Y\). Функція не\(f\) повинна бути ін'єкцією або відсмоктування. Однак ми вже обговорювали доцільність знаходження «зворотного» для\(f\), навіть коли він не відповідає необхідним умовам існування зворотного. У розділі\(1.3\) ми розглянули функцію\(\left.f\right|_{D}\), де\(D \subseteq X\) і\(\left.f\right|_{D}\) знаходиться ін'єкція. Інший підхід полягає у використанні функції\(f\) для створення нової функції на окремій області, яка зберігає більшу частину інформації\(f\).

    Ми використовуємо\(f\), щоб викликати відношення еквівалентності на\(X\). Визначте відношення\(\sim\)\(X\) по\[x \sim y \text { if and only if } f(x)=f(y) .\] Ми показали в прикладі\(2.18\), що\(\sim\) це відношення еквівалентності; це відношення еквівалентності на\(X\) індукованому\(f\). Співвідношення еквівалентності\(\sim\) індукує поділ\(X\), а саме,\(X / \sim(\) який є\(\{[x] \mid x \in X\}\) множиною всіх класів еквівалентності). Позначення. \(X / f\)\(f: X \rightarrow Y\)\(\sim\)Дозволяти і бути відношення еквівалентності на\(X\) індукованих\(f\). Ми пишемо\(X / f\) для множини класів еквівалентності, індукованих\(\sim\) on\(X\).

    Клас еквівалентності in\(X / f\) - це зворотне зображення елемента в\(\operatorname{Ran}(f)\). Тобто, якщо\(x \in X\) і\(f(x)=y\),\[[x]=f^{-1}(y) .\] так\[X / f=\left\{f^{-1}(y) \mid y \in \operatorname{Ran}(f)\right\} .\] елементи\(X / f\) називаються набори рівнів\(f\). Натхнення для цього походить від мислення топографічної карти. Криві на топографічній карті, що відповідають фіксованим висотам, називаються кривими рівня. Розглянемо функцію від точки на карті до висоти фізичного розташування, представленого точкою на карті. Криві рівня на карті є підмножинами наборів рівнів цієї функції.

    Позначення. \(\Pi_{f}\)Нехай\(f: X \rightarrow Y\). Функція\(\Pi_{f}: X \rightarrow X / f\) визначається тим\(\Pi_{f}(x)=[x]_{f}\), де\([x]_{f}\) - клас еквівалентності щодо\(x\) відношення еквівалентності, індукованого\(f\).

    \(Z \subseteq Y\)Дозволяти діапазон\(f\). Ми визначаємо нову функцію,\(\widehat{f}: X / f \rightarrow Z\) по\[\widehat{f}([x])=f(x) .\] Функція тісно\(\widehat{f}\) пов'язана з\(f\); насправді, для кожного\(x \in X\),\[f(x)=\widehat{f} \circ \Pi_{f}(x) .\] Це іноді ілюструється діаграмою, як на малюнку \(2.22\).

    Функція\(\hat{f}\) - біекція. У цьому сенсі кожна функція може бути канонічно пов'язана з біекцією. Розглянемо функцію, яку ми розглянули в розділі 1.3.

    зображення

    МАЛЮНОК 2.22. Внесення функції в біекцію

    Приклад 2.23. Нехай\(f(x)=\tan (x)\). Як ми вже обговорювали раніше, ми можемо «інвертувати» цю функцію, розглядаючи функцію Tan:\((-\pi / 2, \pi / 2) \rightarrow\)\(\mathbb{R}\) by\[\operatorname{Tan}=\left.\tan \right|_{(-\pi / 2, \pi / 2)}\] Функція Тан є біекцією, і має зворотне,\[\operatorname{Arctan}: \mathbb{R} \rightarrow(-\pi / 2, \pi / 2)\] Для будь-якого\(k \in \mathbb{Z}\) існує відповідне обмеження засмаги,\[\tan \mid\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right)\] який є біекцією, і тому має зворотну функцію.

    Інша біекція може бути побудована на класах еквівалентності, індукованих\(f(x)=\tan (x)\). Рівень набір\(f\) є\([x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\}\). \(X\)Дозволяти бути доменом засмаги. Тоді\[X / f=\left\{[x]_{f} \mid x \in X\right\}\] Ми можемо інтерпретувати клас еквівалентності\([x]_{f}\) щодо кутів у стандартному положенні в декартовій площині. Класом еквівалентності\(x\) є набір кутів в стандартному положенні, які мають кінцеву сторону колінеарну з кінцевою стороною кута\(x\) - див. Рис.

    зображення

    МАЛЮНОК 2.24. Колінеарні кути

    Після побудови, викладеної вище, функція\(\Pi_{f}: X \rightarrow\)\(X / f\) - це функція\[\Pi_{f}(x)=[x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\} .\] Функція,\(\widehat{f}: X / f \rightarrow \mathbb{R}\) задана\[\widehat{f}\left([x]_{f}\right)=f(x)\], є біекцією. Крім того,\[\tan =\widehat{f} \circ \Pi_{f} .\] якщо\(x \in X\), то\(\Pi_{f}(x)\) це набір всіх кутів, які мають кінцеву сторону колінеарної з кінцевою стороною кута\(x\) в стандартному положенні. Таким чином\(\Pi_{f}\) говорить нам про те, що\(\tan\) можна розрізнити тільки нахил кінцевої сторони кута - не квадрант кута або скільки обертів підтягнутий кут.

    Модульна арифметика

    Ми визначаємо співвідношення еквівалентності, яке допоможе нам отримати уявлення про теорію чисел. ВИЗНАЧЕННЯ. Ділить,\(a \mid b\)\(b\) Дозволяти\(a\) і бути цілими числами. Потім\(a\) ділить\(b\), написано\(a \mid b\), якщо є\(c \in \mathbb{Z}\) таке, що\[a \cdot c=b .\] ВИЗНАЧЕННЯ. Конгруентність,\(x \equiv y \bmod n, \equiv_{n}\) Нехай\(x, y, n \in \mathbb{Z}\) і\(n>1\). Тоді\[x \equiv y \bmod n\] (або\(x \equiv_{n} y\)) якщо\[n \mid(x-y) .\] Відношення\(\equiv_{n}\) на\(\mathbb{Z}\) називається конгруентністю\(\bmod n\).

    ТЕОРЕМА\(2.25\). Модуль конгруентності\(n\) - це відношення еквівалентності на\(\mathbb{Z}\).

    Вправа 2.5: Доведіть теорему 2.25.

    ВИЗНАЧЕННЯ. Клас конгруентності Класи еквівалентності відношення\(\equiv_{n}\) називаються класами конгруентності, класами залишку або класами залишку\(\bmod n\). Набір класів конгруентності\(\bmod n\) може бути записаний\(\mathbb{Z}_{n}\) або\(\mathbb{Z} / n \mathbb{Z}\).

    Звичайно ж\(\mathbb{Z}_{n}\), це перегородка\(\mathbb{Z}\). Коли\(n=2\), залишкові класи називаються парними і непарними числами. Багато фактів, які ви знаєте про парні та непарні числа, узагальнюють, якщо ви думаєте про них як залишкові класи. Для чого потрібні класи залишку\(n=3\)?

    Ми залишаємо це як вправу (Вправа 2.6), щоб довести, що два цілих числа знаходяться в одному класі залишку за\(\bmod n\) умови, що вони мають однаковий залишок при діленні на\(n\).

    Позначення. [a] Виправте натуральне число\(n \geq 2\). Дозвольте бути в\(\mathbb{Z}\). Представляємо клас еквівалентності a щодо відношення\(\equiv_{n}\) по\([a]\).

    Пропозиція 2.26. Якщо\(a \equiv r \bmod n\) і\(b \equiv s \bmod n\), то\[\text { (i) } \quad a+b \equiv r+s \bmod n\] і\[\text { (ii) } a b \equiv r s \quad \bmod n .\] Доказ. (i) Припустимо, що\(a \equiv r \bmod n\) і\(b \equiv s \bmod n\). Потім\(n \mid(a-r)\) і\(n \mid(b-s)\). \[n \mid(a+b-(r+s))\]Отже,\[a+b \equiv r+s \quad \bmod n\] доводячи (i).

    Щоб довести (ii), зауважте, що є\(i, j \in \mathbb{Z}\) такі, що\[a=n i+r\] і\[b=n j+s\] Тоді\[a b=n^{2} j i+r n j+s n i+r s=n(n j i+r j+s i)+r s\] Тому\[n \mid(a b-r s)\] і\[a b \equiv r s \quad \bmod n\] Звідси алгебраїчні операції, які\(\mathbb{Z}_{n}\) «успадковуються» від \(\mathbb{Z}\)чітко визначені. Тобто ми можемо визначити\(+\) і далі\(\cdot\)\(\mathbb{Z}_{n}\) по\[[a]+[b]=[a+b]\] і\[[a] \cdot[b]=[a \cdot b]\] в математиці, коли ви запитуєте, чи щось «чітко визначене», ви маєте на увазі, що десь у визначенні був зроблений вибір, і ви хочете знати чи призвів би інший вибір до того ж кінцевого результату. Наприклад, нехай\(X_{1}=\{-2,2\}\) і нехай\(X_{2}=\{-1,2\}\). Визначте\(y_{1}\) за: «Виберіть\(x\)\(X_{1}\) і нехай»\(y_{1}=x^{2}\). Визначте\(y_{2}\) за: «Виберіть\(x\)\(X_{2}\) і нехай»\(y_{2}=x^{2}\). Тоді\(y_{1}\) чітко визначено, і це число 4; але\(y_{2}\) не чітко визначено, оскільки різні варіанти\(x\) породжують різні числа.

    У (2.27) і (2.28) праві сторони апріорі залежать від конкретного вибору елементів з класів еквівалентності\([a]\) і\([b]\). Але пропозиція\(2.26\) гарантує, що сума і добуток, визначені таким чином, не залежать від вибору представників класів еквівалентності.

    Приклад 2.29. \(Z_{2}\)Крім того, і множення визначаються наступним чином:

    (1)\([0]+[0]=[0]\)

    (2)\([0]+[1]=[1]+[0]=[1]\)

    (3)\([1]+[1]=[0]\)

    (4)\([0] \cdot[0]=[0] \cdot[1]=[1] \cdot[0]=[0]\)

    (5)\([1] \cdot[1]=[1]\).

    Зверніть увагу, що якщо ви читаєте\([0]\) як «парні» і [1] як «непарні», це правила, які ви дізналися давно.

    При роботі з модульною арифметикою ми можемо вибрати представників інших класів, які найкраще відповідають нашим потребам. Наприклад,\[79 \cdot 23 \equiv 2 \cdot 2 \equiv 4 \bmod 7 .\] Іншими словами\[[79 \cdot 23]=[79] \cdot[23]=[2] \cdot[2]=[4] .\] приклад 2.30. Ви можете згадати з раннього впливу таблиць множення, що множення на дев'ять призвело до продукту, чиї цифри підсумовуються до дев'яти. Це добре узагальнює з модульною арифметикою. Зокрема, якщо\(a_{n} \in\ulcorner 10\urcorner\) для\(0 \leq n \leq N\) тоді\[\sum_{n=0}^{N} a_{n} 10^{n} \equiv \sum_{n=0}^{N} a_{n} \bmod 9 .\] Залишок будь-якого цілого числа, поділеного на 9, дорівнює залишку суми цифр цього цілого числа при діленні на 9. Доказ. Ключовим спостереженням є те, що\[10 \equiv 1 \bmod 9 .\] тому\ [\ begin {масив} {lll} 10^ {2}\ equiv 1\ cdot 1\ equiv 1\\ bmod 9\\ 10^ {3}\ equiv 1\ cdot 1\ equiv 1 &\ bmod 9, \ end {масив}\] і так далі для будь-якої потужності 10:\[10^{n} \equiv 1 \bmod 9 \text { for all } n \in \mathbb{N} \text {. }\] (Ця індукція для всіх повноваження 10 прямолінійні, але для того, щоб довести це формально, нам знадобиться поняття математичної індукції з глави 4). Тому на лівій стороні (2.31), що працює мод 9, ми можемо замінити всі повноваження 10 на 1, і це дає нам праву сторону.

    Приклад 2.32. Спостереження, що залишок числа мод 9 такий же, як і сума цифр, може бути використано в техніці, яка називається «викидання дев'яток» для перевірки арифметики.

    Наприклад, розглянемо наступну (неправильну) суму. Число в передостанньому стовпці - це сума цифр, а число в останньому стовпці - це повторювана сума цифр до досягнення числа між 0 і 9.

    1588 22 4
    \(+1805\) 14 5
    3493 19 1

    Якби додавання було правильно виконано, залишок mod 9 суми дорівнював би сумі залишків; тому ми знаємо, що була допущена помилка.

    Приклад\(2.33\). Що таке остання цифра\(7^{7}\)?

    Ми хочемо знати\(7^{7} \bmod 10\). Зверніть увагу, що, по модулю\(10,7^{0} \equiv 1,7^{1} \equiv\)\(7,7^{2} \equiv 9,7^{3} \equiv 3,7^{4} \equiv 1\). Отже\(7^{7}=7^{4} 7^{3} \equiv 1 \cdot 3 \equiv 3\), і так 3 є останньою цифрою\(7^{7}\). ПРИКЛАД 2.34. Що таке остання цифра\(7^{7^{7}}\)?

    За прикладом 2.33 ми бачимо, що залишки\(7^{n} \bmod 10\) повторюються кожен раз\(n\) збільшуються на 4. Тому якщо\(m \equiv n \bmod 4\), то\(7^{m} \equiv 7^{n} \bmod 10\).

    Що таке\(7^{7} \bmod 4\)? Ну\(7^{1} \equiv 3 \bmod 4,7^{2} \equiv 1 \bmod 4\), так\(7^{7} \equiv\)\(\left(7^{2}\right)^{3} \cdot 7 \equiv 3 \bmod 4\). Тому\[7^{7^{7}} \equiv 7^{3} \equiv 3 \quad \bmod 10 .\]

    Вправи

    ВПРАВА 2.1. Які з властивостей рефлексивності, симетрії, антисиметрії та транзитивності відносяться до відносин, наведених у прикладах 2.1-2.4?

    Вправа 2.2. Доведіть, що відношення в прикладі\(2.6\) є частковим впорядкуванням.

    ВПРАВА 2.3. Перерахуйте кожну пару у відношенні, наданому в прикладі 2.10.

    Вправа 2.4. Доведіть, що відношення в прикладі\(2.17\) є еквівалентність.

    ВПРАВА 2.5. Доведіть, що конгруентність\(\bmod n\) є еквівалентність відношення на\(\mathbb{Z}\).

    ВПРАВА 2.6. Доведіть, що два цілих числа знаходяться в одному класі конгруентності,\(\bmod n\) якщо і тільки якщо вони мають однаковий залишок при діленні на\(n\).

    ВПРАВА 2.7. Припустимо,\(R\) це відношення на\(X\). Що означає, якщо\(R\) це і частковий порядок, і еквівалентність?

    ВПРАВА 2.8. Розглянемо відносини на людей «є братом», «є рідним братом», «є батьком», «одружений на», «є нащадком». Які з властивостей рефлексивності, симетрії, антисиметрії та транзитивності має кожне з цих відносин? ВПРАВА 2.9. Нехай\(X=\{k \in \mathbb{N}: k \geq 2\}\). Розглянемо наступні відносини на\(X\):

    (i)\(j R_{1} k\) якщо і тільки якщо\(\operatorname{gcd}(j, k)>1(\operatorname{gcd}\) означає найбільший спільний дільник).

    (ii)\(j R_{2} k\) якщо і тільки якщо\(j\) і\(k\) є coprime (тобто\(\operatorname{gcd}(j, k)=1\)).

    (iii)\(j R_{3} k\) якщо і тільки якщо\(j \mid k\).

    (iv)\(j R_{4} k\) якщо і тільки якщо\[\{p: p \text { is prime and } p \mid j\}=\{q: q \text { is prime and } q \mid k\} .\] Для кожного відношення скажіть, які властивості рефлексивності, симетрії, антисиметрії, транзитивності він має.

    Вправа 2.10. Для\(j, k\) в\(\mathbb{N}^{+}\), визначити два відносини\(R_{1}\) і\(R_{2}\) по\(j R_{1} k\) якщо\(j\) і\(k\) мати цифру в загальному (але не обов'язково в одному і тому ж місці) і\(j R_{2} k\) якщо \(j\)і\(k\) мати загальну цифру в одному і тому ж місці (так, наприклад\(108 R_{1} 82\), але\((108,82) \notin R_{2}\)).

    (i) Якщо\(j=\sum_{m=0}^{M} a_{m} 10^{m}\) і\(k=\sum_{n=0}^{N} b_{n} 10^{n}\), з\(a_{M} \neq 0\) і\(b_{N} \neq 0\), як математично визначити\(R_{1}\) і з\(R_{2}\) точки зору коефіцієнтів\(a_{m}\) і\(b_{n}\)?

    (ii) Які з чотирьох властивостей рефлексивності, симетрії, антисиметрії та транзитивності мають\(R_{1}\) і\(R_{2}\) мають?

    ВПРАВА 2.11. Нехай\(X=\{a, b\}\). Перерахуйте всі можливі відносини на\(X\), і скажіть, які є рефлексивними, які симетричними, які є антисиметричними, а які є перехідними.

    ВПРАВА 2.12. Скільки відносин на множині з 3 елементами? Скільки з них є рефлекторними? Скільки симетричних? Скільки антисиметричних?

    ВПРАВА 2.13. Повторіть вправу\(2.12\) для набору з\(N\) елементами.

    Вправа 2.14. Сума двох парних цілих чисел парна, сума парного і непарного цілих - непарна, а сума двох непарних цілих чисел парна. У чому полягає узагальнення цього твердження до класів залишку\(\bmod 3\)? ВПРАВА 2.15. Що таке остання цифра\(3^{5^{7}}\)? З\(7^{5^{3}}\)? З\(11^{10^{6}}\)? З\(8^{5^{4}}\)?

    Вправа 2.16. Що таке\(2^{1000000} \bmod 17\)? Що таке\(17^{77} \bmod 14\)?

    ВПРАВА 2.17. Показати, що залишок числа\(\bmod 3\) збігається з сумою його цифр.

    Вправа 2.18. Показати, що твердження вправи\(2.17\) не вірно\(\bmod n\) для будь-якого значення,\(n\) крім 3 і 9.

    ВПРАВА 2.19. Доведіть, що існує нескінченна кількість натуральних чисел, які не можуть бути записані як сума трьох квадратів. (Підказка: Подивіться на можливі залишки мод 8).

    ВПРАВА 2.20. Нехай\(f: X \rightarrow Y\) і\(g: Y \rightarrow Z\). Що можна сказати про відносини між\(X / f\) і\(X /(g \circ f)\)?

    Вправа 2.21. \(R\)Дозволяти відношення на\(X=\mathbb{Z} \times \mathbb{N}^{+}\) визначені в прикладі 2.17. Визначити\(\star\) операцію за\(X / R\) наступним чином: для\(x=(a, b)\) і\(y=(c, d)\),\[[x] \star[y]=[(a d+b c, c d)] .\] Чи\(\star\) добре визначена?

    ВПРАВА 2.22. \(X\)Дозволяти множина функцій з скінченних підмножин\(\mathbb{N}\) to\(\ulcorner 2\urcorner\) (тобто\(f \in X\) якщо існує скінченна множина\(D \subseteq \mathbb{N}\) така, що\(f: D \rightarrow\ulcorner 2\urcorner\)). Визначити відношення\(R\) можна\(X\) наступним чином: якщо\(f, g \in X, f R g\) iff\(\operatorname{Dom}(g) \subseteq \operatorname{Dom}(f)\) і\(g=\left.f\right|_{\operatorname{Dom}(g)}\). Це\(R\) часткове замовлення? Чи\(R\) є відношення еквівалентності?

    Вправа\(2.23\). \(X\)Дозволяти бути множиною всіх нескінченних двійкових послідовностей. \(R\)Визначте відношення\(X\) наступним чином: Для будь-якого\(f, g \in X, f R g\) iff\(f^{-1}(1) \subseteq\)\(g^{-1}(1)\). Це\(R\) часткове замовлення? Чи\(R\) є відношення еквівалентності?

    ВПРАВА 2.24. Нехай\(X=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\}\). \(R\)Дозволяти відношення на\(X\) визначено\(x, y \in R\) iff\(x \subseteq y\). Доведіть, що\(R\) це лінійне впорядкування. Вправа 2.25. Нехай\(X=\{f: \mathbb{R} \rightarrow \mathbb{R} \mid f\) це відмова\(\}\). Визначте відношення\(R\)\(X\) по\(f R g\) iff\(f(0)=g(0)\). Доведіть, що\(R\) це відношення еквівалентності. Дозвольте\(F: X \rightarrow \mathbb{R}\) визначитися з\(F(f)=f(0)\). Показати, що набори рівнів\(F\) є класами еквівалентності\(X / R\). Тобто показати, що\[X / R=X / F .\] ВПРАВА 2.26. Нехай\(f: X \rightarrow Y\). Показати,\(X / f\) що складається з синглтонів (наборів з точно одним елементом) iff\(f\) є ін'єкцією. ГЛАВА 3

    Докази

    Математика та докази

    Першочерговим напрямком діяльності дослідницьких математиків є доведення математичних претензій. Залежно від глибини позову, зв'язку претензії з іншими математичними твердженнями і різними іншими факторами, доведене математичне твердження прийнято називати теоремою, судженням, наслідком або лемою. Математичне твердження, яке не було доведено, але, як очікується, буде правдою, прийнято називати здогадкою. Твердження, яке приймається як відправна точка для аргументів без доведення, називається аксіомою.

    Деякі математичні результати настільки фундаментальні, глибокі, складні, дивовижні або іншим чином примітні, що вони названі. Частина вашої ініціації як члена спільноти математиків знайомиться з деякими з цих названих тверджень - і ми доведемо деякі з них у цій книзі.

    Цілком ймовірно, що більша частина вивченої вами математики була застосуванням теорем для виведення рішень відносно конкретних проблем. Тут ми починаємо вчитися доводити теореми. Більшість студентів вважають перехід від обчислювальної математики до математичних доказів дуже складним.

    Що таке математичний доказ?

    Характер математичного доказу залежить від контексту. Існує формальне поняття математичного доказу:

    Кінцева послідовність формальних математичних тверджень така, що кожен твердження або

    • є аксіомою або припущенням, або

    • слідує формальним правилам логічного вирахування з попередніх тверджень в послідовності.

    Більшість математиків не сприймають математичні докази як формальні математичні докази, і практично жоден математик не пише формальних математичних доказів. Це тому, що формальний доказ є безнадійно громіздкою річчю і, як правило, виходить за рамки людських можливостей, навіть для самих елементарних математичних тверджень. Швидше за все, математики пишуть докази, які є послідовностями тверджень у поєднанні природної мови та формальних математичних символів (з вкрапленням діаграм, питань, посилань та інших пристроїв, які покликані допомогти читачеві зрозуміти докази), які можна розглядати як представляють чисто формальний аргумент. Хорошим практичним визначенням математичного доказу є:

    Аргумент на користь математичного твердження, який переконає перевагу знаючих математиків в істинності математичного твердження.

    Це визначення є дещо неточним, і математики можуть не погодитися з тим, чи є аргумент доказом, особливо для надзвичайно складних або глибоких аргументів. Однак практично для всіх математичних аргументів через деякий час для ретельного розгляду математичне співтовариство досягає одностайного консенсусу щодо того, чи є це доказом.

    Поняття математичного доказу для учня схоже із загальною ідеєю математичного доказу. Відмінності обумовлені типом заяви, що студент доводить, і причини для запиту, що студент довести заяву. Твердження, які ви будете доводити, відомі професійним математикам або можуть бути доведені з відносно невеликими зусиллями ваших інструкторів. Очевидно, що твердження, які ви будете доводити, вимагають різних умов для задовільного доказу, ніж ті, що зазначені вище для професійного математика. Визначимо успішний аргумент студентом наступним чином: Аргумент для математичного твердження, який

    • інструктор може зрозуміти

    • інструктор не може спростувати

    • використовує тільки припущення, які інструктор вважає допустимими.

    Зверніть увагу, що спростування аргументу - це не те саме, що спростування початкового позову. Речення «Квадрат кожного дійсного числа є невід'ємним, оскільки всі дійсні числа невід'ємні» є помилковим доказом істинного твердження. Речення «Квадрат кожного дійсного числа є невід'ємним, тому що всі трикутники мають три сторони.» не вдалося виконати перший тест: хоча обидва твердження вірні, ваш інструктор не побачить, як перше випливає з другого.

    У цій книзі рішеннями проблем буде експозиція природною мовою, посилена математичними виразами. Очікується, що студент вивчить умовності математичної граматики та аргументу та використовувати їх. Як і більшість умовностей, вони часто визначаються традицією або прецедентом. Спочатку може бути досить складно визначити, чи відповідає ваша математична експозиція стандартам вашого інструктора. Практика, з відгуками читача, досвідченого в читанні математики, є найкращим способом розвинути хороші навички коректури. Пам'ятайте, читачі математики досить нетерплячі, намагаючись розшифрувати, що означає сказати автор - математика досить складна, коли автор пише саме те, що він має намір. Велика частина тягаря спілкування лягає на автора математичного доказу, а не читача. Доказ може бути логічно правильним, але настільки складним для наслідування, що це неприпустимо для вашого інструктора.

    Чому докази?

    Чому докази є первинним середовищем математики? Математики залежать від доказів для визначеності та пояснення. Після того, як математичне співтовариство приймає доказ, практично нечувано, що результат згодом спростовується. Так було не завжди: в\(19^{\text {th }}\) столітті виникали серйозні суперечки щодо того, чи дійсно результати були доведені чи ні (див. Розділ\(5.3\) для прикладу, а в книзі [4] про дуже широке трактування розвитку строгості в математичних міркуваннях). Це призвело до нашого сучасного уявлення про «суворий» математичний аргумент. Хоча можна стверджувати, що можливо, що в цьому\(21^{\text {st }}\) столітті новий стандарт строгості відкине те, що ми зараз вважаємо доказом, наші нинішні ідеї стабільні вже більше століття, і більшість математиків (включаючи авторів цієї книги) не очікують, що буде філософський зрушення.

    Для дуже складних результатів написання докладного доказу допомагає автору переконати себе в правдивості позову. Після того, як математик потрапив на ключову ідею, що стоїть за аргументом, залишається багато важкої роботи, розробляючи деталі аргументу. Багато перспективні ідеї зазнають невдачі, оскільки автор намагається написати детальний аргумент на основі ідеї. Нарешті, докази часто дають більш глибоке розуміння результату та математичних об'єктів, які є предметом доказу. Дійсно, навіть дуже розумні докази, які не дають математичного розуміння, деякі дотримуються нижчого ставлення, ніж аргументи, які з'ясовують тему.

    Математичні докази тісно пов'язані з формальними доказами в чисто логічному сенсі. Передбачається, що наявність неформального математичного доказу є переважним доказом існування формального математичного доказу. Якщо незрозуміло, чи неформальний доказ може бути витлумачений як формальний аргумент, сумнівно, що неформальний аргумент буде прийнятий математичною спільнотою. Отже, математичні аргументи мають прозору базову логічну структуру.

    З цієї причини ми розпочнемо наше обговорення математичних доказів з короткого обговорення логіки пропозиції. Незважаючи на свою абстрактність, тема проста, і більшість тверджень цього розділу можуть бути підтверджені якимось ретельним, терплячим мисленням.

    Пропозиційна логіка

    Пропозиційна логіка вивчає, як істина чи брехня складних тверджень визначається істиною чи неправдою складових тверджень. Це дає нам спосіб достовірно отримувати справжні висновки з справжніх припущень.

    ВИЗНАЧЕННЯ. Істинне значення Якщо\(P\) є твердженням, яке є істинним, то\(P\) має значення істинності 1. If\(P\) є твердженням, який є помилковим,\(P\) має значення істинності 0. Пишемо\(T(P)\) для істинної цінності\(P\).

    Значення істинності можна розглядати як функцію\(T: S \rightarrow\ulcorner 2\urcorner\), де\(S\) знаходиться безліч всіх тверджень. При дослідженні абстрактних принципів пропозіційної логіки розглядаються можливі присвоєння значень істинності змінним, що представляють твердження. Нас цікавлять претензії, які не залежать від будь-якого конкретного присвоєння значень істинності пропозиційним змінним. Ми використовуємо цілі числа 0 та 1 для представлення істинних значень, оскільки це дозволяє нам використовувати арифметичні операції в логіці пропозицій. Інші автори вважають за краще\(F\) і\(T\).

    ВИЗНАЧЕННЯ. Пропозиційні зв'язки Символи\(\wedge, \vee, \neg\) і\(\Rightarrow\) є пропозиційними зв'язками. Вони визначаються наступним чином для заяв\(P\) і\(Q\).

    сполучна Ім'я Визначення
    \(\neg\) заперечення \(T(\neg P)=1-T(P)\)
    \(\hat{\vee}\) сполучник \(T(P \wedge Q)=T(P) \cdot T(Q)\)
    \(\Rightarrow\) диз'юнкція \(T(P \vee Q)=T(P)+T(Q)-T(P) \cdot T(Q)\)
    \(\Rightarrow\) підтекст \(T(P \Rightarrow Q)=1-T(P)+T(P) \cdot T(Q)\)

    У виразі "\(P \Rightarrow Q\)«твердження\(P\) називається попередником або гіпотезою і\(Q\) називається наслідком або висновком.

    Пропозиційні зв'язки є формальними еквівалентами природничих мовних зв'язків.

    сполучна Еквівалент природної мови
    \(\neg\) не
    \(\wedge\) і
    \(\vee\) або
    \(\Rightarrow\) мається на увазі

    Переконайтеся, що формули, що визначають пропозиційні зв'язки, дають значення, яке ви передбачаєте. Наприклад, перевірте, чи визначення значення істинності для\(P \wedge Q\) означає, що\(P \wedge Q\) істинно тоді і тільки тоді, коли обидва\(P\) і\(Q\) є істинними.

    Пропозиційні зв'язки наближені природничі мовні зв'язки. Пропозиційні зв'язки є формальними та точними, тоді як природні мовні зв'язки неточні та дещо виразніші - отже, наближення недосконале. Ми бачили приклад цього, коли математики протиставляли використання сполучного «або» з його використанням у повсякденній мові. Для точності в математиці ми інтерпретуємо зв'язки формально - навіть при використанні натуральних мовних виразів.

    Ми можемо побудувати дуже складні складні твердження за допомогою логічних зв'язків. Природно, існують правила побудови правильних висловлювань зі зв'язками.

    ВИЗНАЧЕННЯ. Атомний твердження Атомне твердження - це твердження без явних пропозиційних зв'язків.

    Атомне твердження зазвичай представлено великою літерою.

    Визначення. Добре сформований твердження Ми визначаємо правильно сформований супровід рекурсивно наступним чином.

    Атомні заяви добре сформовані.

    Якщо\(P\) і\(Q\) є добре сформованими висловлюваннями, то добре сформовані висловлювання наступні:

    • \((\neg P)\)

    • \((P \wedge Q)\)

    • \((P \vee Q)\)

    • \((P \Rightarrow Q)\). На практиці дужки скидаються, якщо немає можливості неоднозначності. Крім того, «[» і «]» можуть бути замінені дужками в інтересах читабельності. Для будь-якого присвоєння значень істинності атомним твердженням у добре сформованому твердженні складне твердження матиме чітко визначене значення істини.

    ВИЗНАЧЕННЯ. Складене твердження Складене твердження - це добре сформоване твердження, що складається з атомних тверджень та пропозиційних зв'язків.

    3.2.1. Пропозиційна еквівалентність. Однією з цілей логіки пропозицій є надання інструментів для оцінки істинності складного твердження без необхідності розуміти конкретний сенс атомних тверджень. Тобто деякі твердження є демонстративно вірними або помилковими в силу своєї форми. Центральним у цьому розумінні є ідея пропозиційної еквівалентності.

    ВИЗНАЧЕННЯ. Пропозиційна еквівалентність\(Q\) Дозволяти\(P\) і бути добре сформованими твердженнями, побудованими з атомних тверджень. Ми говоримо, що\(P\) і\(Q\) є пропозиційно еквівалентними за умови, що\(T(P)=T(Q)\) для будь-якого присвоєння істинних значень складових атомних тверджень.

    Якщо\(P\) і\(Q\) є пропозиційно еквівалентними, ми можемо написати\[P \equiv Q .\] ПРИКЛАД 3.1. \[[P \Rightarrow Q] \equiv[(\neg Q) \Rightarrow(\neg P)]\]Це дуже важливий приклад пропозиційної еквівалентності. Ми покажемо це, розглянувши всі можливі призначення істинних цінностей до\(P\) і\(Q\). Давайте налаштуємо це в тому, що в народі називається таблицею істинності. Розглянуто всі можливі призначення істинних цінностей до\(P\) і\(Q\), і порівняємо істинні значення розглянутих складних тверджень:

    \(\begin{array}{cccc}\frac{T(P)}{0} & \frac{T(Q)}{0} & \frac{T(P \Rightarrow Q)}{1} & \frac{T((\neg Q) \Rightarrow(\neg(P)))}{1} \\ 0 & 1 & 1 & 1 \\ 1 & 0 & 0 & 0 \\ 1 & 1 & 1 & 1\end{array}\)

    Кожен рядок таблиці істинності представляє певне присвоєння істинних значень атомним твердженням\(P\) і\(Q\). Чотири можливі завдання вичерпуються рядками таблиці істинності. Значення істинності складних тверджень узгоджуються в кожному рядку таблиці істинності, тому твердження еквівалентні.

    ПРИКЛАД 3.2. \ [\ почати {вирівняний} & {[\ neg (P\ клин Q)]\ equiv [(\ neg P)\ vee (\ neg Q)]}\\ & {[\ neg (P\ vee Q)]\ equiv [(\ neg P)\ клин (\ neg Q)]} \ кінець {вирівняний}\] Відомі заяви (3.3) та 3.4 (3.4) як закони де Моргана. (Як вони пов'язані з вправою 1.2?)

    За двома можливими винятками, як тільки ви уважно вивчите, що означають ці зв'язки, ви повинні зрозуміти їх інтуїтивно. Одним з винятків є те, що логічне і математичне «або»,\(\vee\), є інклюзивним. Ми обговорювали це на початку глави 2. Іншим винятком є логічна сполучна "\(\Rightarrow\)».

    3.2.2. Імплікація. Студенти часто вважають заплутаним, що підтекст\(P \Rightarrow Q\) може бути правдою, коли наслідок\(Q\), є помилковим. Це зрозуміло, якщо врахувати, що наслідки зазвичай використовуються в аргументі в наступному силогізмі:\ [\ begin {зібраний} P\\ P\ Rightarrow Q \ end {grawed}\] отже, (\(P\)тобто якщо істинно, і\(P \Rightarrow Q\), то\(Q\) вірно). Цей силогізм є найважливішим правилом логічного дедукції (називається Modus Ponens). Логічний підтекст настільки часто використовується для демонстрації істини наслідку, що легко зрозуміти, чому можна помилково подумати, що наслідок має випливати з підтексту, а не слідувати з попередника. Розглянемо наступне твердження:

    Якщо ви король Франції, то я дядько мавпи.

    Чи вірно це твердження? Імовірно, ви не король Франції, і я не вірю, що я дядько мавпи. Тож і попередник, і наслідок є помилковими. Однак твердження вірно. Насправді це твердження логічно еквівалентно твердженню:

    Якщо я не дядько мавпи, то ви не король Франції.

    Визначення логічного імплікації говорить про те, що підтекст, в якому попередник є помилковим, не дає жодної інформації про наслідок. Отже, будь-який логічний підтекст з попередником «Ти король Франції» буде правдою.

    Існує додаткове занепокоєння з логічним підтекстом. У природній мові (і інтуїтивно в математиці) твердження\[P \Rightarrow Q\] передбачає зв'язок між висловлюваннями\(P\) і\(Q\) - а саме, що істина\(P\) якось змушує істину\(Q\). Як сукупний сполучний, цей зв'язок між\(P\) і не\(Q\) вимагається для логічного підтексту. Істина\(P \Rightarrow Q\) - це функція істинних цінностей\(P\) і\(Q\), а не їх значень. У математичному письмі розуміється, що не тільки підтекст логічно вірний, але й пов'язаний і що правда\(P\) дійсно змушує правду\(Q\).\(P\)\(Q\) Наприклад, розглянути твердження\[\mathbb{N} \subset \mathbb{Q} \Rightarrow 3>2 .\] Це твердження вірно за формальним визначенням\(\Rightarrow\). Насправді, як пропозиційне твердження, ми могли б замінити попереднє будь-яким іншим твердженням, істинним або хибним, і умовний оператор буде істинним. Однак подібне твердження математично неприпустимо, так як попередник і наслідок не мають ніякого відношення один до одного. Нас турбують не випадкові значення істинності атомних тверджень, а математичні зв'язки між цими твердженнями, які відповідають, поки що виходять за рамки формального визначення логічних зв'язків.

    3.2.3. Конверс і Контрапозитив. Більшість математичних тверджень мають форму імплікації. Тому потрібно бути знайомим з умовною номенклатурою оточуючих логічним підтекстом. Припустимо, нас цікавить конкретний логічний підтекст,\[P \Rightarrow Q \text {. }\] Є два інших логічних наслідків, які природно пов'язані з\(P \Rightarrow Q\). Одним з них є\[\neg Q \Rightarrow \neg P .\] контрапозитивний, Імплікація та його контрапозитив є пропозиційно еквівалентними.

    ПРИКЛАД 3.5. Заява,

    «Якщо це комаха, то у нього шість ніг».

    є пропозиційно еквівалентним твердженню

    «Якщо у цього немає шести ніг, це не комаха».

    ПРИКЛАД 3.6. Контрапозитивний

    «Кит - риба»

    є

    «Якщо це не риба, то це не кит».

    Останній приклад ілюструє, що твердження не повинно бути істинним, щоб мати контрапозитив (що, звичайно, все ще пропозиційно еквівалентно оригінальному умовному твердженню). Це також ілюструє, що умовні твердження природною мовою не повинні включати слово «if» або «then», а також не бути написаними в певній формі, щоб бути умовним твердженням. Зворотний умовний оператор,\[P \Rightarrow Q\] є умовним оператором,\[Q \Rightarrow P .\] умовний оператор і його зворотне не є пропозиційно еквівалентними. Ви можете легко перевірити це\(P \Rightarrow Q\) і\(Q \Rightarrow P\) мати різні значення істини, якщо\(T(P)=1\) і\(T(Q)=0\).

    ПРИКЛАД 3.7. Що таке зворотне твердження

    «Всі риби живуть у воді»?

    Так як це написано природною мовою, єдиної відповіді немає.

    Очевидним зворотним є

    «Якщо щось живе у воді, то це риба».

    Якщо зібрати імплікацію та його зворотне, ми отримаємо біумовну сполучну.

    ВИЗНАЧЕННЯ. Біумовні,\(\Longleftrightarrow\)\(Q\) Дозволяти\(P\) і бути твердження. Біумовне, написане\(\Longleftrightarrow\), визначається наступним чином.

    сполучна Ім'я Визначення
    \(\Longleftrightarrow\) двоумовний \(T(P \Longleftrightarrow Q)=T(P \Rightarrow Q) \cdot T(Q \Rightarrow P)\)

    Біумовна сполучна - це формальне тлумачення «якщо і тільки якщо». Ця фраза настільки часто використовується в математиці, що має свою абревіатуру: iff.

    Інші слова природної мови, які можна перекласти на пропозіційні зв'язки, є «необхідними» та «достатніми». Заява

    «Для того,\(P\) щоб провести, необхідно, що\(Q\) тримає» рівнозначно\(P \Rightarrow Q\). Заява

    «Для того,\(P\) щоб провести, достатньо, що\(Q\) тримає»

    еквівалентний\(Q \Rightarrow P\). Поєднуючи ці два, ми отримуємо, що твердження «\(P\)Для того, щоб тримати, необхідно і достатньо, що\(Q\) тримає» еквівалентно\(P \Longleftrightarrow Q\).

    Формули

    Вільно кажучи, формула - це математичний вираз зі змінними. Відповідна кожній змінній\(x_{i}\), з'являється у формулі всесвіт\(U_{i}\), з якого ця змінна може бути замінена.

    ВИЗНАЧЕННЯ. Відкрита формула Відкрита математична формула в змінних\(x_{1}, \ldots, x_{n}\) - це математичний вираз, в якому заміна\(x_{i}(1 \leq i \leq n)\) на конкретні елементи з\(U_{i}\) дає математичне твердження.

    ПРИКЛАД 3.8. Розглянемо формулу,\[x^{2}+y^{2}=z^{2}\] в змінних\(x, y\) і\(z\), все з Всесвітом\(\mathbb{N}\). Будь-яка заміна змінних натуральними числами призводить до отримання твердження. Наприклад,\[3^{2}+4^{2}=5^{2}\] або\[1^{2}+1^{2}=2^{2} .\] Звичайно, твердження можуть бути істинними або хибними, тому деякі заміни дають істинні твердження, а інші видаватимуть помилкові твердження.

    Обговорюючи загальну формулу в\(n\) змінних, ми можемо використовувати позначення\(P\left(x_{1}, \ldots, x_{n}\right)\). Бо\(1 \leq i \leq n\), нехай\(U_{i}\) буде Всесвіт змінної\(x_{i}\), і\(a_{i} \in U_{i}\). Заява, яке є результатом підміни\(a_{i}\) for\(x_{i}, 1 \leq i \leq n\), написано\(P\left(a_{1}, \ldots, a_{n}\right)\).

    Якщо\(P\left(x_{1}, \ldots, x_{n}\right)\) є формулою в змінних\(x_{1}, \ldots, x_{n}\), а for\(1 \leq i \leq\)\(n, U_{i}\) є Всесвіт\(x_{i}\), то ми можемо думати\(\left(x_{1}, \ldots, x_{n}\right)\) як про єдину змінну з Всесвітом\(U=\prod_{1 \leq i \leq n} U_{i}\).

    Формули можуть виконувати багато цілей в математиці:

    (1) Охарактеризувати відносини між величинами

    (2) Визначте обчислення (3) Визначте набори

    (4) Визначте функції.

    Приклад 3.9. Розглянемо відкриту формулу\(P(x, y)\), у двох змінних,\[x^{2}+y^{2}=1,\] з Всесвітом\(\mathbb{R}^{2}\). Тобто Всесвіт\(x\) є\(\mathbb{R}\) і Всесвіт\(y\) є\(\mathbb{R}\). Один із способів думати про\(P(x, y)\) це як засіб\(\mathbb{R}^{2}\) розділення на два набори:

    (1) підмножина декартової площини, для якої рівняння є істинним, а саме одиничне коло;

    (2) підмножина декартової площини, для якої рівняння є хибним, доповнення одиничного кола в\(\mathbb{R}^{2}\).

    ВИЗНАЧЕННЯ. Характеристика\(\chi_{P}\)\(P(x)\) множини, Нехай буде формула, і\(U\) всесвіт змінної\(x\). Записується підмножина,\(U\) для якої\(P\) утримується формула\(\chi_{P}\). Набір\(\chi_{P}\) називається характерним набором\(P(x)\).

    Отже,\[\chi_{\neg P}=U \backslash \chi_{P} .\] 3.3.1. Формули та Пропозиційні зв'язки. Пропозиційна логіка легко поширюється на формули. \(Q(x)\)Дозволяти\(P(x)\) і бути формули в змінній\(x\), з Всесвіту\(U\). Нехай\[R(x)=P(x) \wedge Q(x) .\] Тоді характерний набір\(R(x)\) дається\[\chi_{R}=\{a \in U \mid T(P(a) \wedge Q(a))=1\}\] звідси\[\chi_{R}=\chi_{P} \cap \chi_{Q} .\] Пропозиційна сполучна сильно\(\wedge\) пов'язана з операцією набору\(\cap\). Аналогічно\(\vee\) можуть бути пов'язані і\(\cup, \neg\) з комплементом (в\(U\)), і\(\Rightarrow\) з\(\subseteq\).

    Кількісні показники

    \(P(x)\)Дозволяти формулою в одній змінній. Якщо ми підставимо\(a \in U\) константу, бо\(x\) ми приходимо до заяви\(P(a)\). Однак припустимо, що нас цікавить\(P(x)\) щодо якогось набору\(X \subseteq U\), а не конкретного елемента\(U\). Зокрема, ми запитуємо, чи\(P(a)\) є справжнім твердженням для всіх\(a \in X\). Нагадаємо, що одна з ролей формули полягає у визначенні множин. Для будь-якої формули\(P(x)\), всесвіт\(U\) і\(X \subseteq U, P(x)\)\(X\) розділи на дві множини - ті елементи,\(X\) для яких\(P\) істинно, і ті, для яких\(P\) помилково. У цьому сенсі, запитуючи, чи\(P\) тримає для всіх\(x \in X\), чи він тримає для деяких\(x \in X\) (що доповнює питання, чи\(\neg P\) тримає для всіх\(x \in X)\), запитує, чи\(P\) визначає новий або цікавий підмножина\(X\).

    Подібно до того, як були введені пропозиційні зв'язки для формалізації мовної поведінки певних широко використовуваних природних мовних зв'язків (і, або, мається на увазі, ні), ми також формалізуємо «кількісну оцінку» над множинами.

    Визначення. Універсальний квантор,\((\forall x \in X) P(x)\)\(P(x)\) Дозволяти бути формулою в одній змінній, з Всесвітом\(U\). Нехай\(X \subseteq U\). \(Q\)Дозволяти бути твердженням\[(\forall x \in X) P(x)\] Тоді\(Q\) вірно, якщо для кожного\(a \in X, P(a)\) вірно. В іншому випадку\(Q\) це false.

    Позначення\[(\forall x \in X) P(x)\] є скороченням для «\[(\forall x)([x \in X] \Rightarrow[P(x)])\]твердження»\((\forall x \in X) P(x) "\) читається «для всіх\(x\) в\(X, P(x) "\). У нас є\[(\forall x \in X) P(x) \Longleftrightarrow X \subseteq \chi_{P}\] визначення. Екзистенціальний квантор,\((\exists x \in X) P(x)\)\(P(x)\) Дозволяти формулу в одній змінній з Всесвіту\(U .\) Let\(X \subseteq U, X \neq \emptyset\). \(Q\)Дозволяти бути твердженням\[(\exists x \in X) P(x) .\] Тоді\(Q\) вірно, якщо є деякі\(a \in X\), для яких\(P(a)\) вірно. В іншому випадку\(Q\) це false.

    Вираз\[(\exists x \in X) P(x)\] є скороченням для\[(\exists x)[(x \in X) \wedge P(x)] \text {. }\] «твердження\((\exists x \in X) P(x)\)" "читається «існує\(x\) в\(X\), таке що\(P(x)\)». Квантор "\(\nabla\)" є формальним еквівалентом виразу природної мови «для всіх» або «кожен». Квантор "\(\exists\)" є формальним еквівалентом «для деяких» або «існує... таке, що...».

    За умови, що всесвіт змінної зрозумілий, або не має відношення до обговорення, загальним є придушення Всесвіту в вираженні твердження. Наприклад, якщо\(P(x)\) це формула з всесвітом\(U\), ми можемо написати\[(\forall x) P(x)\] замість\[(\forall x \in U) P(x) .\] 3.4.1. Кілька кількісних показників. \(P\left(x_{1}, \ldots, x_{n}\right)\)Дозволяти формулу в\(n \geq 2\) змінних. Тоді формула\[\left(\forall x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right)\] являє собою формулу в\(n-1\) змінних\(x_{2}, \ldots, x_{n}\). Аналогічно формула\[\left(\exists x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right)\] являє собою формулу в\(n-1\) змінних.

    ПРИКЛАД 3.10. Розглянемо формулу в п'яти змінних\[P\left(x, x_{0}, L, \varepsilon, \delta\right):=\left(0<\left|x-x_{0}\right|<\delta\right) \Rightarrow(|\sin (x)-L|<\varepsilon)\] з усіма змінними, що мають всесвіт\(\mathbb{R}\). Потім\(\left(\forall x_{0}\right) P\left(x, x_{0}, L, \varepsilon, \delta\right)\) є формула в чотирьох змінних,\(\left(\forall x_{0}\right)(\exists L) P\left(x, x_{0}, L, \varepsilon, \delta\right)\) є формулою в трьох змінних, і\[\left(\forall x_{0}\right)(\exists L)(\forall \varepsilon) P\left(x, x_{0}, L, \varepsilon, \delta\right)\] є формулою в двох змінних.

    Визначення. Відкрита змінна, Зв'язана змінна У формулі\(P(x)\),\(x\) є відкритою змінною. У формулах\[(\forall x) P(x), \quad(\exists x) P(x), \quad(\forall x) Q(x, y), \quad(\exists x) Q(x, y)\]\(x\) знаходиться зв'язана або кількісно визначена змінна, а в останніх двох\(y\) - відкрита змінна.

    3.4.2. Квантор Порядок. Під час обговорення нижче нам потрібно обговорити квантифікатори загально, тобто без урахування того, чи є обговорюваний квантор універсальним чи екзистенційним. Тож ми введемо деякі зручні позначення саме для цього розділу.

    Позначення. \((\mathcal{Q} x) P(x)\)Ми використовуємо позначення\[\text { (Q } \mathcal{Q} x) P(x)\] для загального представлення\[(\forall x) P(x)\] і\[(\exists x) P(x) \text {. }\] Дозволяти\(\mathcal{Q}_{1}, \ldots, \mathcal{Q}_{n}\) бути логічними квантифікаторами і\(P\left(x_{1}, \ldots, x_{n}\right)\) бути формулою з відкритими змінними\(x_{1}, \ldots, x_{n}\). Потім\[\left(\mathcal{Q}_{1} x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] - заява.

    Приклад 3.11. Розглянемо твердження\(S\) у формі\[S=(\forall x \in X)(\exists y \in Y) P(x, y) .\]\(S\) істинно, якщо для кожного\(a \in X\),\[(\exists y \in Y) P(a, y)\] вірно. Це задовольняється за умови\(a \in X\), що для кожного, є елемент\(Y\) (назвемо його,\(b_{a}\) щоб нагадати нам, що саме цей елемент\(Y\) пов'язаний з попереднім вибором, а) такий,\[P\left(a, b_{a}\right)\] що істинний. Так\(b_{a}\) підбирається з\(a\) урахуванням. Висловлювання в цій формі особливо важливі в математиці, оскільки визначення межі в обчисленні є твердженням у вигляді цього прикладу.

    Повернемося до твердження\[\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] Порядок квантіфікаторів значний. Якщо\(1 \leq i<j \leq n, x_{i}\) поводиться як параметр з точки зору\(x_{j}\) (\(x_{i}\)тобто фіксується з точки зору\(x_{j}\)). Іншим способом,\(x_{j}\) вибирається щодо замін\(x_{1}, \ldots, x_{j-1}\), але без розгляду\(x_{j+1}, \ldots, x_{n}\).

    Один завжди читає зліва. Твердження\[\left(\forall x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] таке ж, як\[\left(\forall x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, }\] або, іншими словами, для кожного вибору\(x_{1}\) твердження\[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] вірно. Аналогічно, твердження\[\left(\exists x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] таке ж, як\[\left(\exists x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, }\] або іншими словами, що існує певний вибір,\(x_{1}\) для якого твердження\[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] про\(n-1\) змінні\(x_{2}, \ldots, x_{n}\) вірно.

    Приклад 3.12. Порядок кванторів важливий, як ви можете бачити з наступного:\[(\forall x \in X)(\exists y \in Y) P(x, y)\] не еквівалентний\[(\exists y \in Y)(\forall x \in X) P(x, y) .\] Наприклад, твердження\[(\forall x \in \mathbb{R})(\exists y \in \mathbb{R})\left(y=x^{2}\right)\] є істинним. Але\[(\exists y \in \mathbb{R})(\forall x \in \mathbb{R})\left(y=x^{2}\right)\] є помилковим. Твердження\[[(\exists y \in Y)(\forall x \in X) P(x, y)] \Rightarrow[(\forall x \in X)(\exists y \in Y) P(x, y)]\] вірне. Зворотне явно зазнає невдачі.

    3.4.3. Заперечення кванторів. У важливому сенсі\(\wedge\) і\(\vee\) є взаємодоповнюючими. За ідентичностями де Моргана (3.3) і (3.4) заперечення простої кон'юнкції є диз'юнкцією заперечень. Точно так само заперечення простої диз'юнкції є сукупністю заперечень. Універсальні та екзистенційні квантори також взаємодоповнюють. Ми спостерігаємо, що\[[\neg(\forall x) P(x)] \equiv[(\exists x) \neg P(x)]\] для будь-якої формули,\(P(x)\). Аналогічно\[[\neg(\exists x) P(x)] \equiv[(\forall x) \neg P(x)] .\] Звичайно,\(P(x)\) сама по собі може бути формула, яка має численні кількісні показники та пов'язані змінні. Припустимо, що\[P(x)=(\exists y) Q(x, y) .\] тоді наступні твердження еквівалентні (для будь-якого вибору\(P\) і\(Q\) задовольняє ідентичності (3.13)):\ [\ begin {зібрано} \ neg (\ forall x) P (x)\\ (\ exists x)\ neg P (x)\ \ neg (\ forall x) (\ exists y ) Q (x, y)\\ (\ існує x)\ neg (\ існує y) Q (x, y)\\ (\ існує x) (\ для всіх y)\ neg Q (x, y). \ end {graeded}\] Цей приклад говорить про те, що допустимо перемикати заперечення і квантор шляхом зміни типу квантора, і справді це так.

    \(\mathcal{Q}_{i}\)Дозволяти бути квантор, для\(1 \leq i \leq n\). Для кожного\(\mathcal{Q}_{i}\), нехай\(\mathcal{Q}_{i}^{*}\) буде додатковим кількісним показником. Тобто, якщо\(\mathcal{Q}_{i}=\forall\), то нехай\(\mathcal{Q}_{i}^{*}=\exists\); якщо\(\mathcal{Q}_{i}=\exists\), то нехай\(\mathcal{Q}_{i}^{*}=\forall\). Потім,\[\neg\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P(\bar{x}) \equiv\left(\mathcal{Q}_{1}^{*} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n}^{*} x_{n}\right) \neg P(\bar{x}) .\]

    Стратегії доказування

    Є дві елементарні логічні форми, які так часто зустрічаються в математичних твердженнях, що вони вимагають деякого загального обговорення.

    3.5.1. Універсальні заяви. Логічна форма, з якою ви, швидше за все, зіткнетеся дуже часто\[(\forall x)[H(x) \Rightarrow P(x)] \text {, }\], - це де\(H(x)\) і\(P(x)\) є формулами в одній змінній. Висловлювання в такому вигляді називаються універсальними твердженнями. Формули\(H\) і\(P\) використовуються для характеристики властивостей математичних об'єктів, так що претензії в такому вигляді можуть розглядатися як твердження:

    Якщо математичний об'єкт має властивість\(H\), то він\(P\) також має властивість.

    Це особливо корисно, якщо ми багато знаємо про математичні об'єкти, які мають властивість\(P\). Оскільки твердження, яке ми прагнемо довести, є універсальним, прикладів недостатньо, щоб довести такі претензії - приклад, який ви наведете, може випадково мати властивості\(H\) і\(P\). Швидше, універсальні претензії повинні бути доведені абстрактно, стверджуючи, що задоволення визначення або набору властивостей має на увазі задоволення інших властивостей. Це, як правило, вимагає ретельної оцінки визначень. На практиці ми часто робимо це, припускаючи, що у нас є довільний елемент, який задовольняє визначенню або явним припущенням, і логічно виводимо додаткові висновки про цей об'єкт. Під довільним ми маємо на увазі, що нам не дозволяється пред'являти будь-які претензії щодо елемента, крім тих, які негайно випливають з визначень, явних припущень або логічно походять від визначень та явних припущень. Оскільки об'єкт був довільним (за винятком явних припущень, які ви робите на початку аргументу), висновки, які ви зробите щодо об'єкта, будуть істинними універсально для всіх об'єктів, які задовольняють припущенням.

    ПРИКЛАД 3.15. \(F(x)\)Припустимо, формула:\[\text { " } x \in \mathbb{N} \text { and } x \text { is a multiple of } 4 . "\] Нехай\(E(x)\) буде формула:\[\text { " } x \text { is even." }\] Тоді\[(\forall x)[F(x) \Rightarrow E(x)] .\] Недостатньо спостерігати, що 4,8 і 12 все парні. Для того, щоб сперечатися за твердження безпосередньо, ви б абстрактно стверджували, що будь-який об'єкт, який задовольняє,\(F(x)\) обов'язково задовольняє\(E(x)\).

    Є кілька підходів, які зазвичай розглядають при доведенні умовних тверджень. Вибір підходу - це вибір стратегії для доказу. Зазвичай можна змусити працювати більше однієї стратегії, але часто одна може бути простішою за інші.

    Претензії форми (3.14), як правило, підходять одним із таких способів:

    (1) Пряме доказ. \(x\)Дозволяти бути об'єктом, для якого\(H\) тримає. Розшифруючи властивість\(H\), ви можете показати безпосередньо, що\(P\) утримує, а\(x\) також. Оскільки\(x\) був довільним об'єктом задовольняє\(P\), універсальна претензія буде доведена.

    ПРИКЛАД 3.17. Доведіть (3.16) безпосередньо.

    \(x \in \mathbb{N}\)Дозволяти (ми розглядаємо\(x\) як фіксований, але довільний елемент натуральних чисел). Якщо\(x=4 n\), то\[x=2 \cdot(2 n),\] і тому рівний.

    ПРИКЛАД 3.18. Доведіть, що будь-які 3 точки в площині або колінеарні або лежать на колі.

    Доказ. Позначте точки\(A, B, C\). \(L\)Дозволяти бути перпендикулярна бісектриса\(A B\). Кожна точка\(L\) знаходиться на рівновіддаленому від\(A\) і\(B\).

    \(M\)Дозволяти бути перпендикулярна бісектриса\(B C\). Кожна точка\(M\) знаходиться на рівновіддаленому від\(B\) і\(C\).

    Якщо\(A, B\) і\(C\) не колінеарні, то лінії\(L\) і\(M\) не паралельні, тому вони перетинаються в якійсь точці\(D\). Точка\(D\) рівновіддалена від\(A, B\) і\(C\), тому ці точки лежать на колі з центром\(D\).

    ПРИКЛАД 3.19. Теорему Піфагора можна викласти у вигляді (3.14). (Які бувають\(H\) і\(P\) в даному випадку?) Доказ Евкліда теореми Піфагора є прямим доказом (Елементи Евкліда I.47).

    (2) Контрапозитивний доказ.

    Іноді простіше показати, що відмова має на\(P\) увазі вихід з ладу\(H\). Припустімо, що у вас є об'єкт, для якого\(P\) не вдається (\(\neg P\)тобто припустимо утримання об'єкта). Виведіть, що\(H\) має вийти з ладу для об'єкта, а також. У цьому випадку ви продемонструєте, що\[(\forall x)[\neg P(x) \Rightarrow \neg H(x)] .\] Це еквівалентно претензії\[(\forall x)[H(x) \Rightarrow P(x)] .\] ПРИКЛАД 3.20. Доведіть (3.16), доводячи контрапозитив.

    Нехай\(x \in \mathbb{N}\), і припустимо\(\neg E(x)\), так\(x\) непарно. Як\(x\) непарно, то\(x\) ділиться на 4 має залишок 1 або 3. Тоді,\[x \neq 4 n \text {. }\] Так\(x\) не кратна 4.

    ПРИКЛАД 3.21. Доведіть,\(x\) що якщо ціле число і\(x^{2}\) парний,\(x\) то парний.

    Контрапозитивним є твердження, що якщо\(x\) непарне ціле число, то\(x^{2}\) непарне. Доведемо це.

    Припустимо,\(x\) непарний, так\(x=2 n+1\) для деякого цілого числа\(n\). Тоді\(x^{2}=\)\(4 n^{2}+4 n+1\), так\(x^{2} \equiv 1 \bmod 2\), і\(x^{2}\) тому непарно.

    (3) Протиріччя.

    Це доказ, в якому ми показуємо,\(H \wedge \neg P\) що обов'язково помилково. Тобто припустити, що\(H\) тримає для довільного об'єкта і\(P\) не вдається для цього об'єкта, і показати, що це породжує протиріччя. Оскільки протиріччя логічно неможливі, логічно необхідно те,\[\neg(H \wedge \neg P)\] що є пропозиційно еквівалентним\[\neg H \vee P\] або, альтернативно,\[H \Rightarrow P \text {. }\] Оскільки ми повинні показати, що для будь-якої підміни\(x\), твердження \(H \Rightarrow P\)тримає, ми повинні показати універсальну претензію.

    ПРИКЛАД 3.22. Довести (3.16) протиріччям.

    Припустімо,\(x\) що кратне 4, і\(x\) це непарно. \(r\)Дозволяти бути залишок по\(x\) модулю 2. Оскільки\(x\) є кратним\(4=2 \cdot 2\), у нас є що\(r \equiv 0 \bmod 2\). Оскільки\(r\) це непарно, ми маємо це\(r \equiv 1 \bmod 2\). Це має на увазі\(0 \equiv 1 \bmod 2\), протиріччя. Тому припущення про те,\(x\) що існувало і кратне 4, і непарне, є помилковим, і тому (3.16) має бути істинним. ПРИКЛАД 3.23. Доведіть, що\(\sqrt{2}\) це нераціонально.

    Доказ. Ми повторюємо це як імплікацію: Якщо число є раціональним, це квадрат не може дорівнювати 2. Почнемо з розгляду логічної структури позову. Тут гіпотеза\(H(x)\) полягає в тому, що\(x\) є раціональним числом, і висновок\(P(x)\) такий\(x^{2} \neq 2\). Ми хочемо довести\[(\forall x) H(x) \Rightarrow P(x) .\] Ми дамо докази протиріччям. Тобто ми припускаємо, що твердження є помилковим і виводимо протиріччя. Отже, ми припускаємо, що\[\neg((\forall x) H(x) \Rightarrow P(x)) .\] це логічно еквівалентно\[(\exists x) H(x) \wedge \neg(P(x)) .\] Давайте повернемося до математичної прози тепер, коли ми боролися через логіку. Припустимо, що\(x\) це раціональне число, і припустимо, що\(x^{2}=2\); ми хочемо вивести логічне протиріччя. Запишіть\(x=m / n\), де\(m\) і\(n\) є ненульовими цілими числами, які не мають спільних факторів. Тоді\[x^{2}=m^{2} / n^{2}=2,\] так\(m^{2}=2 n^{2}\). \(m^{2}\)Тому навіть, так за прикладом 3.21\(m\), навіть. Тому\(m=2 k\) для деякого цілого числа\(k\), і так\[m^{2}=4 k^{2}=2 n^{2} .\] Тому\(n^{2}=2 k^{2}\) парний, так і\(n\) парний. Але тоді обидва\(m\) і\(n\) парні, і так мають 2 як загальний фактор, що суперечить припущенню, що\(m / n\) було зменшеною формою раціонального числа\(x\).

    Контрапозитивні докази і докази протиріччя дуже схожі. Дійсно, будь-який контрапозитивний доказ\(\neg P \Rightarrow \neg H\), що, автоматично дає, що\((H \wedge \neg P)\) неможливо. Відмінність є скоріше лінгвістичною, ніж логічною. Причина наявності імен для різних стратегій доказів полягає в наданні вказівок читачеві, щоб полегшити дотримання доказів. У розділі 4 ми побачимо ще один потужний метод доведення універсальних тверджень\(\mathbb{N}\), а саме Принцип індукції.

    3.5.2. Докази існування. Другою поширеною формою для математичного твердження є екзистенціальне твердження, тобто твердження у формі.\[(\exists x) P(x) \text {. }\] Існує три загальних підходи до доведення екзистенціальних висловлювань.

    (1) Будівництво.

    Очевидно, що найбільш прямим способом показати, що щось існує з певними властивостями, є введення або побудова об'єкта з властивістю\(P\). Для претензій в такому вигляді приклад є доказом, хоча потрібно буде показати, що об'єкт задовольняє\(P\), якщо він не очевидний.

    Приклад 3.25. Доведіть, що існує реальна функція, перша похідна якої скрізь позитивна, і чия друга похідна всюди негативна.

    ProOF. Найпростіший спосіб зробити це - записати функцію з цими властивостями. Однією з таких функцій є\(f(x)=1-e^{-x}\). Похідна є\(e^{-x}\), яка всюди позитивна, а друга похідна є\(-e^{-x}\), яка всюди негативна.

    (2) Підрахунок.

    Іноді можна встановити існування об'єкта за допомогою підрахунку аргументу.

    Приклад 3.26. Припустимо, в класі 30 учнів. Показати, що принаймні два з них мають однаковий останній початковий.

    ДОКАЗ. Для кожної літери\(A, B, \ldots\) згрупуйте всіх учнів з цією літерою як їх останнім початковим. Оскільки існує лише 26 груп та\(30>26\) студентів, принаймні одна група повинна мати більше, ніж один студент у ній.

    Аргумент, який ми щойно привели, називається «принципом голубиної діри», заснованим на аналогії введення букв в голубині нори. Якщо букв більше, ніж голубиних отворів, то якась голуб'яна нора повинна мати більше однієї літери. Зверніть увагу, що на відміну від конструктивного доказу, підрахунок доказів не говорить вам, яка група має більше одного елемента в ньому.

    Вражаюче узагальнення Кантора принципу голубиної діри до нескінченних множин див. Розділ 6.

    (3) Протиріччя.

    Довести екзистенційні твердження конструкцією може бути важко. Альтернативою є припущення, що екзистенціальне твердження є помилковим (що немає об'єкта, який задовольняє\(P(x)\)). Якщо неможливо, щоб жоден об'єкт не мав властивості\(P\), то якийсь об'єкт повинен. Знову ж таки, такий підхід може не дати нам великого розуміння об'єктів, які мають властивість\(P\). Див., наприклад, вправу 3.27.

    ПРИКЛАД 3.27. Припустимо, всі точки на площині пофарбовані або червоним, або синім кольором. Доведіть, що повинні бути дві точки одного кольору рівно на одну одиницю один від одного.

    Доказ. Припустимо, що їх немає. Намалюйте рівносторонній трикутник сторони 1. Позначте його вершини\(A, B\) і\(C\). Тоді\(A\) і\(B\) повинні бути різних кольорів,\(B\) і\(C\) повинні бути різних кольорів,\(C\) і\(A\) повинні бути різних кольорів. Це неможливо лише з двома кольорами на вибір.

    Зверніть увагу, що ми не сказали, чи є червоно-червона пара, яка є одиницею відстані один від одного, або синьо-синя пара, яка є одиницею відстані один від одного, тільки одна така пара повинна існувати.

    Вправи

    Вправа 3.1. Доведіть закони де Моргана, (3.3) і (3.4). (Підказка: Існує чотири можливі призначення істинних значень 0 і 1 для двох тверджень\(P\) і\(Q\). Для кожного такого призначення оцініть істинні значення лівої та правої сторін (3.3) і покажіть, що вони завжди однакові.)

    ВПРАВА 3.2. Доведіть, що складні твердження\(P\) і\(Q\) є пропозиційно еквівалентними iff\(P \Longleftrightarrow Q\).

    ВПРАВА 3.3. Наведіть приклад істинного умовного твердження, в якому наслідок помилково. Вправа 3.4. Якщо\(P, Q\) і\(R\) є твердженнями, доведіть, що дійсні наступні:
    а)\(P \wedge \neg P \Rightarrow Q\)
    б\([(P \Rightarrow Q) \wedge(Q \Rightarrow R)] \Rightarrow(P \Rightarrow R)\)
    ) в)\([P \Rightarrow(Q \wedge \neg Q)] \Rightarrow \neg P\)
    г)\([P \wedge(P \Rightarrow Q)] \Rightarrow Q\)
    е) \(P \Rightarrow(Q \vee \neg Q)\).

    ВПРАВА 3.5. Нехай\(P\) і\(Q\) бути твердженнями. Доведіть, що існують твердження, використовуючи тільки\(P, Q, \neg\) і\(\wedge\) які є пропозиційно еквівалентні
    а)\(P \wedge Q\)
    б\(P \vee Q\)
    ) в)\(P \Rightarrow Q\).

    Доведіть, що існують твердження, використовуючи тільки\(P, Q, \neg\) і\(\vee\) які еквівалентні вищезазначеним.

    ВПРАВА 3.6. Доведіть розподільні закони для логіки пропозиції: Якщо\(P, Q\) і\(R\) є твердженнями, то
    а)\(P \vee(Q \wedge R) \equiv(P \vee Q) \wedge(P \vee R)\)
    б)\(P \wedge(Q \vee R) \equiv(P \wedge Q) \vee(P \wedge R)\).

    ВПРАВА 3.7. Доведіть розподільний закон для множин: Якщо\(X, Y\) і\(Z\) є множинами, то
    а)\(X \cup(Y \cap Z)=(X \cup Y) \cap(X \cup Z)\)
    б)\(X \cap(Y \cup Z)=(X \cap Y) \cup(X \cap Z)\).

    ВПРАВА 3.8. Нехай\(X, Y\) множини і\(Z\) бути характерними множинами формул\(P(x), Q(x)\) і\(R(x)\) відповідно. Для кожної можливої області діаграми Венна\(X, Y\) і\(Z\) дайте складну формулу (з атомними формулами\(P, Q\) і\(R\)), яка має цю область як свою характеристичну множину.

    ВПРАВА 3.9. Запишіть формулу в одну змінну, яка визначає парні цілі числа.

    ВПРАВА 3.10. Напишіть формулу, яка визначає ідеальні квадрати. ВПРАВА 3.11. Напишіть формулу в двох змінних, яка визначає точки\(\mathbb{R}^{2}\), які мають відстань 1 від точки\((\pi, e)\).

    ВПРАВА 3.12. Чи можете ви написати формулу в одній змінній, використовуючи тільки додавання, множення, ступінь, цілі числа і рівність, щоб визначити множину всіх коренів заданого многочлена з цілими коефіцієнтами? Як щодо множини коренів усіх многочленів з цілими коефіцієнтами?

    ВПРАВА 3.13. Які з наведених нижче тверджень відповідають дійсності?
    а)\((\forall x \in \mathbb{R}) x+1>x\)
    б\((\forall x \in \mathbb{Z}) x^{2}>x\)
    ) в)\((\exists x \in \mathbb{Z})(\forall y \in \mathbb{Z}) x \leq y\)
    г)\((\forall y \in \mathbb{Z})(\exists x \in \mathbb{Z}) x \leq y\)
    е)\((\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \mathbb{R})[0<|x-1|<\delta] \Rightarrow\left[\left|x^{2}-1\right|<\varepsilon\right]\).

    ВПРАВА 3.14. Що таке заперечення кожного твердження у вправі 3.13? Які з заперечень вірні?

    ВПРАВА 3.15. \(f\)Дозволяти\(a, L \in \mathbb{R}\) і бути реальною функцією. Доведіть, що твердження\[(\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon]\] і не\[(\exists \delta>0)(\forall \varepsilon>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon]\] рівнозначні. Яке твердження є наслідком іншого?

    ВПРАВА 3.16. \(P(x, y)\)Дозволяти формулу в двох змінних. Покажіть, що взагалі не\((\forall x)(\exists y) P(x, y)\) потрібно рівноцінно\((\exists y)(\forall x) P(x, y)\). Показати,\((\forall x)(\forall y) P(x, y)\) що еквівалентно\((\forall y)(\forall x) P(x, y)\). А як щодо\((\exists x)(\exists y) P(x, y)\) і\((\exists y)(\exists x) P(x, y)\)?

    ВПРАВА 3.17. Розглянемо наступні твердження. Запишіть контрапозитивний і зворотний до кожного з них.

    (i) Всі люди смертні.

    (ii) Я маю на увазі те, що я кажу. (iii) Кожна безперервна функція на інтервалі\([0,1]\) досягає свого максимуму

    (iv) Сума кутів трикутника дорівнює\(180^{\circ}\).

    ВПРАВА 3.18. Доведіть, що число ділиться на 4, якщо і тільки якщо його останні дві цифри.

    ВПРАВА 3.19. Доведіть, що число ділиться на 8, якщо його останні три цифри є.

    ВПРАВА 3.20. Доведіть, що число ділиться на\(2^{n}\) iff його останні\(n\) цифри.

    ВПРАВА 3.21. Припустимо,\(m\) це число з властивістю, на яке будь-яке натуральне число\(m\) ділиться, якщо його останні три цифри є. Про що це говорить\(m\)? Доведіть своє твердження.

    Вправа 3.22. Доведіть, що ціле число ділиться на 11, якщо сума дивно розміщених цифр мінус сума рівномірно розміщених цифр ділиться на 11. (Так,\(11 \mid 823493\) якщо 11 ділить\((2+4+3)-(8+3+9)\).)

    ВПРАВА 3.23. Показати, що кожен інтервал містить раціональні та ірраціональні числа.

    ВПРАВА 3.24. Доведіть, що\(\sqrt{3}\) це нераціонально.

    Вправа 3.25. Доведіть, що\(\sqrt{10}\) це нераціонально.

    ВПРАВА 3.26. Доведіть, що квадратний корінь будь-якого натурального числа або ціле або ірраціональне.

    ВПРАВА 3.27. Доведіть, що існують ірраціональні числа\(x\) і\(y\) так,\(x^{y}\) що раціонально. (Підказка: розглянемо\(\sqrt{2}^{\sqrt{2}}\) і\(\left(\sqrt{2}^{\sqrt{2}}\right)^{\sqrt{2}}\).)

    ВПРАВА 3.28. Доведіть або спростуйте наступне твердження: Будь-які 4 точки в площині, жодні три з яких не є колінеарними, лежать на колі.

    ВПРАВА 3.29. Доведіть, що існує нескінченна кількість простих чисел. Вправа 3.30. Для\(k=0,1,2\), нехай\(P_{k}\) буде набір простих чисел, які є конгруентними до\(k \bmod 3\). За вправою 3.29,\(P_{0} \cup P_{1} \cup P_{2}\) нескінченно. Чи можете ви сказати, які з множин\(P_{0}, P_{1}\) і\(P_{2}\) є нескінченними?

    (Зауваження: Для двох з трьох наборів ця проблема не надто складна. Для третього це вкрай складно, і є окремим випадком відомої теореми Діріхле. Див\(e . g\). [8] для лікування теореми Діріхле.)

    ВПРАВА 3.31. Нехай точки в\(\mathbb{R}^{2}\) будуть пофарбовані червоним, зеленим і синім кольором. Доведіть, що або є дві точки одного кольору відстань 1 один від одного, або є рівносторонній трикутник довжини сторони\(\sqrt{3}\) всі вершини якого одного кольору.

    Вправа 3.32. Доведіть, що\[e=\sum_{n=0}^{\infty} \frac{1}{n !}\] це нераціонально. (Підказка: Сперечатися протиріччям. Припустимо\(e=\frac{p}{q}\), і помножте обидві сторони на\(q !\) Перевпорядкування рівняння, щоб отримати ціле число, рівне нескінченній сумі раціональних чисел, що сходиться до числа в\((0,1)\).)
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    зображення

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2)

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2)

    • 2

    2

    (

    р.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    зображення

    зображення

    (1)

    • ГЛАВА 4

    Принцип індукції

    Добре замовлень

    У цьому розділі ми обговоримо принцип математичної індукції. Майте на увазі, що слово індукція має інше значення в математиці, ніж в решті науки. Принцип математичної індукції залежить від порядкової структури натуральних чисел і дає нам потужний метод доведення універсальних математичних тверджень.

    ВИЗНАЧЕННЯ. Добре впорядкування\(X\) Дозволяти бути набором, і\(\preceq\) лінійним впорядкуванням на\(X\). Ми говоримо,\(X\) що добре впорядкований щодо\(\preceq\) (або\(\preceq\) є wellordering\(X\)), якщо кожен непорожній\(X\) підмножина має найменший елемент по відношенню до\(\preceq\). Тобто, для будь-якої непорожньої\(Y\)\(X\)\[(\exists a \in Y)(\forall y \in Y) a \preceq y .\] підмножини Загалом, лінійні упорядкування не повинні бути порядками. Добре впорядкування є універсальною властивістю - набір\(X\) з\(\preceq\) упорядкуванням добре впорядкований, якщо кожна непорожня підмножина\(X\) має найменший елемент щодо\(\preceq\). Якщо є якась непорожня підмножина, яка не має найменшого елемента, то\(\preceq\) не добре впорядковується\(X\).

    ПРИКЛАД 4.1. \(\mathbb{Z}\)не добре впорядкований\(\leq\). Цілі числа не мають найменшого елемента, якого достатньо, щоб продемонструвати,\(\mathbb{Z}\) що не впорядковано\(\leq\).

    ПРИКЛАД 4.2. Нехай\(X=\{x \in \mathbb{R} \mid x \geq 2\}\). \(\leq\)Нехай звичайне замовлення на\(\mathbb{R} . X\) лінійно впорядковано\(\leq\), але не\(X\) добре впорядковано\(\leq\). У цьому прикладі\(X\) має найменший елемент, але будь-який відкритий інтервал, що міститься в, не\(X\) матиме найменшого елемента. Ключовими властивостями порядку\(\mathbb{N}\) є те, що він добре впорядкований і кожен елемент\(\mathbb{N}\), крім 0, є наступником натурального числа:

    ПРИНЦИП УПОРЯДКУВАННЯ ДЛЯ НАТУРАЛЬНИХ ЧИСЕЛ: Набір\(\mathbb{N}\) добре впорядкований\(\leq\).

    НАСТУПНИК ВЛАСТИВОСТІ ДЛЯ НАТУРАЛЬНИХ ЧИСЕЛ: Якщо\(n \in \mathbb{N}\) і\(n \neq 0\), то є\(m \in \mathbb{N}\) таке, що\(n=m+1\).

    Якщо хтось приймає інтуїтивне розуміння натуральних чисел, ці принципи більш-менш очевидні. Дійсно, нехай\(Y\) буде будь-який непорожній підмножина\(\mathbb{N}\). Оскільки він не порожній, є деякі\(m\) в\(Y\). Тепер розглянемо кожне з скінченно багатьох чисел\(0,1,2, \ldots, m\) по черзі. Якщо\(0 \in Y\), то 0 є найменшим елементом. Якщо 0 немає в\(Y\), перейдіть до 1. Якщо це в\(Y\), він повинен бути найменшим елементом; інакше перейдіть до 2. Продовжуйте таким чином, і ви знайдете деяке число менше або рівне\(m\), що є найменшим елементом\(Y\).

    Цей аргумент, хоча і переконливий, покладатися на те, що ми маємо уявлення про те, що\(\mathbb{N}\) «є». Якщо ми хочемо визначити з\(\mathbb{N}\) точки зору множинних операцій, як ми робимо в розділі 8, ми, по суті, повинні включити принцип упорядкування натуральних чисел як аксіому.

    Принцип індукції

    Почнемо з доведення теореми, еквівалентної принципу індукції.

    ТЕОРЕМА 4.3. Якщо
    (1)\(X \subseteq \mathbb{N}\)
    (2)\(0 \in X\)
    (3)\((\forall n \in \mathbb{N}) n \in X \Rightarrow(n+1) \in X\),

    потім\[X=\mathbb{N}\] обговорення. Ми будемо сперечатися протиріччям. Ми припускаємо, що\(X \neq \mathbb{N}\). Дозвольте\(Y\) бути доповненням\(X\) в\(\mathbb{N}\). Оскільки\(Y\) не порожній, він матиме найменший елемент. Третя гіпотеза теореми не допускає найменшого елемента в\(Y\), крім 0, і це неможливо за допомогою другої гіпотези. Тому\(Y\) обов'язково порожній.

    Доказ. Дозвольте\(X\) задовольнити гіпотези теореми. Нехай\[Y=\mathbb{N} \backslash X .\] Ми припускаємо\(Y\), що це не порожній. Так як\(Y \subseteq \mathbb{N}, Y\) добре впорядкований\(\leq\). \(a \in Y\)Дозволяти бути найменшим елементом\(Y\). Зауважимо, що\(a\) це не 0, так як\(0 \in X\). Тому\(a \geq 1\) і є наступником, так\(a-1\) є в,\(\mathbb{N}\) а не в\(Y\). Звідси\(a-1\) є в\(X\). Але потім гіпотезою (3) теореми,\(a-1+1 \in X\). Це протиріччя,\(Y\) тому порожній і\(X=\mathbb{N}\).

    ЗАУВАЖЕННЯ. Ми іноді включаємо неформальні обговорення з маркуванням у наші докази, щоб допомогти вам у читанні. Це не звичайна практика. Ви не повинні включати такі обговорення у свої докази, якщо ваш інструктор не вимагає цього.

    \(4.3\)Теорема легше застосовується в наступному вигляді.

    НАСЛІДОК 4.4. Принцип індукції\(P(x)\) Дозволяти формулу в одній змінній. Якщо

    (1)\(P(0)\)

    (2)\((\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1)\),

    потім\[(\forall x \in \mathbb{N}) P(x) .\] Доказ. Нехай\[\chi_{P}=\{x \in \mathbb{N} \mid P(x)\} .\] Ми хочемо показати це\(\chi_{P}=\mathbb{N}\). За припущенням (1)\(P(0)\), так\(0 \in \chi_{P}\). Припустимо, що\(n \in \chi_{P}\). Потім\(P(n)\). За припущенням (2)\[P(n) \Rightarrow P(n+1) .\] Тому\(P(n+1)\) і\(n+1 \in \chi_{P}\). Оскільки\(n\) є довільним,\[(\forall n \in \mathbb{N}) n \in \chi_{P} \Rightarrow n+1 \in \chi_{P} .\] За теоремою 4.3,\(\chi_{P}=\mathbb{N}\) і\[(\forall x \in \mathbb{N}) P(x)\] Припустимо, що ви хочете показати, що формула\(P(x)\) тримає для всіх натуральних чисел. Аргументуючи індукцією, автор повинен показати, що гіпотези для теореми задоволені. Як правило, автор спочатку це доводить\(P(0)\). Це називається базовим випадком доказу індукцією. Це дуже часто легкий, навіть тривіальний висновок. Тим не менш, необхідно довести базовий випадок, щоб аргументувати індукцією (чи можете ви це продемонструвати?). Довівши базовий випадок, автор потім доведе другу гіпотезу, а саме, що твердження істинне для довільного натурального числа означає, що воно істинне у наступника цього натурального числа. Це крок індукції. Етап індукції вимагає доведення умовного твердження, яке часто доведено безпосередньо. Важливо розуміти, що автор не стверджує, що\(P\) тримає довільне натуральне число, інакше аргумент був би круговим і недійсним. Швидше автор продемонструє, що якби результат був істинним при довільному натуральному числі, то це було б вірно для подальшого натурального числа. Припущення, яке\(P\) тримається при фіксованому і довільному натуральному числі, називається індукційною гіпотезою. Якщо автор успішно доводить базовий випадок і крок індукції, то припущення Слідство\(4.4\) задовольняються, і\(P\) утримує на всіх натуральних числах.

    Пропозиція 4.5. Нехай\(N \in \mathbb{N}\). Потім\[\sum_{n=0}^{N} n=\frac{N(N+1)}{2} .\] обговорення. Це хороший перший приклад доказу шляхом індукції. Аргумент - це прямолінійне застосування методики, а результат представляє історичний та практичний інтерес. Аргументуємо індукцією на верхньому показнику суми. Тобто формула, яку ми доводимо для всіх натуральних чисел, є\[P(x): \sum_{n=0}^{x} n=\frac{x(x+1)}{2} .\] Важливо визначити величину, над якою ви застосовуєте принцип індукції, але деякі автори, які пишуть аргумент для читачів, які знайомі з індукцією, можуть явно не вказати формулу.

    Доведено базовий випадок\(N=0\), який відповідає сумі з єдиним числом 0. Потім ми аргументуємо крок індукції. Це наш перший аргумент з використанням принципу індукції. Зверніть пильну увагу на структуру цього доказу. Ви повинні прагнути слідувати умовам про докази шляхом індукції, які ми встановлюємо в цій книзі.

    Доказ. Базовий корпус:\(N=0\).

    Обговорення. Зверніть увагу, що базовим випадком є твердження\(P(0)\).

    Так як\[\sum_{n=0}^{0} n=0=\frac{(0)(1)}{2},\]\(P(0)\) тримає.

    Індукційний крок:

    Обговорення. Доведено універсальне твердження,\[(\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1) .\] показавши, що для довільного натурального числа\(N\)\[P(N) \Rightarrow P(N+1) .\] Таким чином ми зводимо доведення універсального твердження до доведення абстрактного умовного твердження. Доведемо отриманий умовний оператор безпосередньо. Тобто припускаємо\(P(N)\) і виводимо\(P(N+1)\). Нагадуємо читачеві, що ми не стверджуємо, що результат тримається на\(N\) - тобто ми не претендуємо\(P(N)\). Швидше, ми доводимо умовне твердження, припускаючи попередню гіпотезу, індукційну гіпотезу та виводячи наслідок. Якщо ви не використовуєте індукційну гіпотезу, ви не сперечаєтеся індукцією. Звичайно, в тілі аргументу це прозоро, без прив'язки до лежать в основі логічних принципів.

    Нехай\(N \in \mathbb{N}\) і припустимо, що\[\sum_{n=0}^{N} n=\frac{N(N+1)}{2} .\] Тоді\ [\ почати {вирівняний} \ sum_ {n=0} ^ {N+1} n &=\ лівий (\ sum_ {n=0} ^ {N} n\ праворуч) +N+1\\ &= {} _ {I H}\ frac {N (N+1)} {2} +N+1 \ кінець {вирівняний}\] гіпотезою індукції.

    Обговорення. Це хороша звичка і міркування для вашого читача, щоб визначити, коли ви посилаєтеся на індукційну гіпотезу. Ми будемо використовувати індекс,\({ }_{I H}\) щоб вказати, де ми викликаємо гіпотезу індукції.

    Так\ [\ почати {вирівняний} \ sum_ {n=0} ^ {N+1} n &=\ гідророзрив {N (N+1)} {2} +N+1\ &=\ гідророзриву {N (N+1)} {2} +\ гідророзриву {2}\\ &=\ гідророзриву {N^ {2} +3 N+2} {2}\ &=\ гідророзрив {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] Тому\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) .\] за принципом індукції випливає пропозиція.

    Пропозиція 4.6. Нехай\(N \in \mathbb{N}\). Тоді\[\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6} .\] Доказ. Твердження\(P(N)\) полягає в тому, що рівняння (4.7) має місце. Базовий випадок\(N=0\) очевидний: крок\[\sum_{n=0}^{0} n^{2}=\frac{0(0+1)(2 \cdot 0+1)}{6} .\] індукції:

    Припустимо, що\(N \in \mathbb{N}\) і\[\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6}\] ми доведемо, що\[\sum_{n=0}^{N+1} n^{2}=\frac{(N+1)(N+2)(2 N+3)}{6}\] дійсно\ [ \ почати {вирівняний}\ sum_ {n=0} ^ {N+1} n^ {2} &=\ лівий (\ sum_ {n=0} ^ {N} n^ {2}\ правий) + (N+1) ^ {2}\ &= I H\\ &=\ frac {N (N+1)} {6} + (N+1) ^ {2}. \\ &=\ гідророзриву {N (N+1) (2 N+1)} {6} + (N+1) ^ {2}\\ &=\ гідророзриву {2 N^ {3} +9 N^ {2} +13 N+6} {6}\\ &\ frac {(N+1) (N+2) (2 (N+1) +1)} {6}. \ end {aligned}\] Пропозиція випливає з принципу індукції.

    Обговорення. Доказ пропозиції\(4.6\) дуже схожий на доказ Пропозиції 4.5. Ви можете підтвердити алгебраїчні ідентичності в останній частині доказу, оскільки вони не очевидні. Включено достатньо деталей, щоб провести вас через доказ наслідків. Автор доказу по індукції буде вважати, що вам комфортно з технікою, і тим самим може надати менше деталей, ніж вам подобається.

    ЗАУВАЖЕННЯ. Є більше Пропозицій\(4.6\),\(4.5\) а не просто доказів. Існують і формули. Дійсно, одне використання індукції полягає в тому, що якщо ви вгадаєте формулу, ви можете використовувати індукцію, щоб довести, що ваша формула правильна. Див. Вправи\(4.12\) та 4.16.

    Навіщо потрібен базовий кейс? Розглянемо наступний аргумент для помилкового позову\(\sum_{n=0}^{N} n<\frac{N(N+1)}{2}\). Нехай\(N \in \mathbb{N}\) і припустимо\(P(N)\), де\(P(N)\) знаходиться оператор\[\sum_{n=0}^{N} n<\frac{N(N+1)}{2} .\] Тоді\ [\ begin {вирівняний} \ sum_ {n=0} ^ {N+1} n &=\ лівий (\ sum_ {n=0} ^ {N} n\ праворуч) +N+1\\ <_ {I H} &\ frac {N (N+1)} {2} +N+1\ &=\ frac {N ^ {2} +3 +2} {2}\ \ &=\ гідророзриву {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] Отже,\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) .\] Звичайно, нерівність легко\(P(N)\) демонструється як помилкова. Що пішло не так? Без базового випадку доведення\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1)\] недостатньо для доведення\((\forall N \in \mathbb{N}) P(N)\). \(P(0)\)Якби були правдою, то\(P(1)\) було б правдою, а\(P(1)\) якби правдою, то\(P(2)\) було б і так далі. Дійсно, якщо ми здатні довести\(P(N)\) для будь-якого\(N \in \mathbb{N}\), то ми знаємо\(P(M)\) для будь-якого натурального числа\(M>N\). Але послідовність висловлювань\(\langle P(0), P(1), P(2), \ldots\rangle\) ніколи не запускається. \(P(N)\)зазнає невдачі для всіх\(N\).

    Ще один спосіб думати про індукцію - з точки зору гарантій. Припустимо, ви вирішили купити автомобіль. Спочатку ви йдете до чесного Боба. боб гарантує, що будь-яка машина, яку він продає, піде принаймні на одну милю. Ви купуєте автомобіль, виганяєте його з ділянки, і через 3 милі він ламається і не може бути виправлений. Ви йдете назад сердито, але Боб не дасть вам ваші гроші назад, тому що машина дожила до гарантії.

    Тоді ви перетинаєте дорогу до Чесного Джона. Джон гарантує, що якщо він продасть вам машину, як тільки вона почнеться, вона ніколи не зупиниться. Звучить це досить непогано, тому ви купуєте машину, ставите ключі в запалювання, і... нічого. Машина не заводиться. Джон також не поверне вам ваші гроші, тому що машина не зазнала того, що він стверджував.

    Відчуваючи відчай, ви потрапляєте в Honest Stewart's Автомобілі Стюарта поставляються з двома гарантіями:

    (1) Автомобіль запуститься і проїде хоча б одну милю.

    (2) Незалежно від того, наскільки далеко зайшов автомобіль, його завжди можна прогнати зайву милю.

    Ви обмірковуєте це, і врешті-решт вирішуєте, що машина поїде назавжди. Найкраще, що оренда становить всього\(\$ 1\) місяць на перші два місяці. Ви підписуєте договір оренди, і їдете додому досить задоволені собою. \({ }^{1}\)

    Існує безліч зручних узагальнень принципу індукції. Перший, який ми обговорюємо, називається сильною індукцією. Це так названо, тому що індукційна гіпотеза сильніша, ніж гіпотеза індукції в стандартній індукції, і, отже, крок індукції іноді легше довести в аргументі сильною індукцією.

    НАСЛІДОК 4.8. Сильна індукція Нехай\(P(x)\) буде формула така, що

    \({ }^{1}\)Ви маєте рацію, що Принцип індукції гарантує, що ваш автомобіль буде їздити назавжди. Однак, як зазначає ваша мати, коли ви показуєте їй оренду, після перших двох місяців ваш платіж кожного місяця є сумою ваших платежів за попередні два місяці. Скільки ви будете платити через 5 років? (1)\(P(0)\)

    (2) Для кожного\(n \in \mathbb{N}\),\[[(\forall x<n) P(x)] \Rightarrow[P(n)]\] то\[(\forall x \in \mathbb{N}) P(x)\] інтуїтивно це не сильно відрізняється від базової індукції. Ви починаєте з базового випадку, і після початку ви можете продовжити через решту натуральних чисел. Різниця полягає лише в кількості припущень, які ви використовуєте, коли доводячи щось сильною індукцією. На практиці це дає перевагу, що на етапі індукції можна звести випадок\(N\) до будь-якого попереднього випадку, а не безпосередньо до попереднього випадку\(N-1\). Зокрема, це спрощує аргументи щодо подільності та цілих чисел.

    Обговорення. Зводимо принцип сильної індукції до принципу індукції. Ми досягаємо цього, вводячи формулу\(Q(x)\), яка говорить: «P (y) вірно для всіх\(y<x "\). Сильна індукція\(P(x)\) включена еквівалентна основній індукції на\(Q(x) .\)

    ДОКАЗ. Припустимо, що\(P(x)\) задовольняє гіпотези слідства. Дозвольте\(Q(x)\) формулі,\[(\forall y \leq x) P(y)\] де\(y\) знаходиться Всесвіт\(\mathbb{N}\). Тоді\(Q(0) \equiv P(0)\), так і правда. Нехай\(N \in \mathbb{N}\)\(N \geq 1\), і припустимо\(Q(N)\). Так\[(\forall y \leq N) P(y)\] і тому\(P(N+1)\). Звідси\[(\forall n \leq N+1) P(y)\] і таким чином\(Q(N+1)\). Тому\[(\forall x \in \mathbb{N}) Q(x) \Rightarrow Q(x+1)\] за принципом індукції,\[(\forall x \in \mathbb{N}) Q(x) .\] Однак для будь-якого\(N \in \mathbb{N}, Q(N) \Rightarrow P(N)\), тому\[(\forall x \in \mathbb{N}) P(x) .\] сильна індукція особливо корисна при доведенні претензій про поділ. Є приклади техніки по всій главі 7. Результати в главі 7 не потребують глави 5 та глави 6, тому ви можете легко пропустити вперед. Дивіться, наприклад, розділ 7.1, де фундаментальна теорема аритметики доведена за допомогою сильної індукції. Індукція не повинна починатися з 0, а то і з натурального числа.

    Слідство 4.9. Дозволяти\(k \in \mathbb{Z}\), і\(P(x)\) бути формулою в одній змінній такий, що

    (1)\(P(k)\)

    (2)\((\forall x \geq k) P(x) \Rightarrow P(x+1)\).

    Потім\[(\forall x \in \mathbb{Z}) x \geq k \Rightarrow P(x)\] обговорення. Це можна довести шляхом визначення нової формули, яка може бути доведена стандартною індукцією. Чи можете ви визначити формулу?

    Поліноми

    Зараз ми використовуємо техніку, розроблену в розділі,\(4.2\) для виконання скромної математичної програми. Як ми вказали в першому розділі цієї книги, більшість з вас до цих пір використовували математичні результати для вирішення задач обчислень. Тут нам цікаво довести результат, з яким ви можете бути знайомі.

    Цей результат стосується поліномів з дійсними коефіцієнтами (тобто коефіцієнтами, які є дійсними числами). Ви витратили багато свого математичного життя, досліджуючи поліноми, і, безсумнівно, можете зробити багато цікавих і правдивих тверджень про них. Але наскільки ви впевнені, що ці твердження правдиві? Цілком можливо, що ваша віра в ці претензії - це, за великим рахунком, просто довіра до претензій і переконань експертів у цій галузі. На практиці можна зробити гірше, ніж змиритися з твердженнями фахівців, а практичні обмеження взагалі змушують нас приймати багато претензій на віру. Звичайно, така практика несе в собі ризики. Протягом сотень років твердження Аристотеля були широко прийняті, часто незважаючи на емпіричні докази зворотного. Природно, ми продовжуємо приймати багато претензій на віру. У випадку сучасної науки ми взагалі не маємо доступу з перших рук до первинних доказів, на яких ґрунтуються сучасні наукові теорії. Математика відрізняється від будь-якої іншої галузі інтелектуальних зусиль, тому що у вас є можливість перевірити практично кожну математичну претензію, з якою ви стикаєтеся. Ви зараз перебуваєте в точці своєї математичної кар'єри, на якій ви можете безпосередньо підтвердити математичні результати.

    Теорема, яку ми хочемо довести, полягає в тому, що кількість дійсних коренів дійсного многочлена є максимально ступенем многочлена. Ви можете бути знайомі з цим твердженням, але не впевнені, чому вона тримається. Цей результат цікавий, частково, тому що він гарантує, що графік многочлена перетинає будь-яку горизонтальну лінію лише скінченно багато разів. Іншим чином, рівні множини многочленів не можуть мати більше елементів, ніж ступінь многочлена.

    Позначення. \(\mathbb{R}[x] \mathbb{R}[x]\)множина многочленів з дійсними коефіцієнтами в змінній\(x\).

    ТЕОРЕМА 4.10. Нехай\(N \in \mathbb{N}\) і\(p \in \mathbb{R}[x]\) є ступінь\(N \geq 1\). Тоді\(p\) має в більшій мірі\(N\) справжні коріння.

    Обговорення. Цей результат досить складний, що доведеться довести три попередні результати. Ці\({ }^{2}\) леми доведені в аргументі теореми. Протягом усього аргументу ми будемо досліджувати загальний\(p\) многочлен ступеня\(N\).

    \({ }^{2}\)Лема - це допоміжний результат, який використовується в доведенні теореми - ніби як підпрограма. У німецькій мові теорема називається «Satz», а лема називається «Hilfsatz», «теорема помічника». Доказ. Спочатку доведено, що розподільна властивість узагальнюється на довільну кількість доданих.

    ЛЕМА 4.11. Нехай\(N \in \mathbb{N}^{+}\) і, для\(0 \leq n \leq N, a_{n} \in \mathbb{R}\). Якщо\(c \in \mathbb{R}\), то\[\sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) .\] Обговорення. Цей результат узагальнює розподільну властивість до більш ніж двох доданих. Ми припускаємо розподільну властивість дійсних чисел: для\(a, b, c \in \mathbb{R}\),\[c \cdot(a+b)=c a+c b\] Доводимо лему шляхом індукції. Дивно, що твердження, яке здається настільки очевидним, використовує потужну техніку індукції. Але пам'ятайте, що ми доводимо це для всіх кінцевих сум довільно багатьох доводів. Звичайно, ви можете відчути, що лема зовсім очевидна. Якщо так, вам слід спробувати створити власний доказ або прочитати це для практики математичної індукції в контексті, де математичний зміст простий.

    Ми будемо міркувати індукцією про кількість членів в сумі. Базовий випадок призначений для сум з двома сумами - це всього лише розподільна властивість. На індукційному кроці доведено умовний результат, що якщо лема тримається для всіх сум з\(N\) термінами, то вона тримається для всіх сум з\(N+1\) термінами. На кожному кроці аргументу (базові та індукційні кроки) ми сперечаємося за нескінченно багато конкретних претензій, аргументуючи одну абстрактну претензію.

    Доказ. Сперечаємося індукцією далі\(N\).

    Базовий випадок:\(N=1\) Нехай\(c, a_{0}, a_{1} \in \mathbb{R}\). За розподільною властивістю\ [\ begin {вирівняний} \ sum_ {n=0} ^ {1} c a_ {n} &=c a_ {0} +c a_ {1}\ &=c\ ліворуч (a_ {0} +a_ {1}\ праворуч)\\ &=c\ ліворуч (\ sum_ {n=0} ^ {1} a_ {n}\\ праворуч)\\ &=c\ ліворуч (\ sum_ {n=0} ^ {1} a_ {n}\ праворуч). \ end {вирівняний}\] Крок індукції:

    Нехай\(c \in \mathbb{R}\) і\(a_{n} \in \mathbb{R}\), для\(0 \leq n \leq N+1\). \[\sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) .\]Ми припускаємо, що ми маємо\ [ \ почати {вирівняний}\ sum_ {n=0} ^ {N+1} c a_ {n} &=\ лівий (\ sum_ {n=0} ^ {N} c a_ {n}\ правий) +c a_ {N+1}\ &= {} _ {I H}\ quad c\ ліворуч (\ sum_ {n = 0} ^ {N} ^ {N} _ {n}\ право) +c a_ {N+1} \ end {вирівняний}\] За законом розподілу (для двох доданих)\ [\ begin { вирівняний} c\ ліворуч (\ sum_ {n=0} ^ {N} a_ {n}\ праворуч) +c a_ {N+1} &=c\ ліворуч (\ sum_ {n=0} ^ {N} a_ {n} +a_ {N+1}\ праворуч)\\ &=c\ ліворуч (\ sum_ {n = 0} ^ {N+1} a_ {n}\\ праворуч). \ end {aligned}\] Отже,\[\sum_{n=0}^{N+1} c a_{n}=c\left(\sum_{n=0}^{N+1} a_{n}\right) .\] за принципом індукції результат тримається для всіх\(N \in \mathbb{N}\). ЛЕМА 4.12. Якщо\(x, y \in \mathbb{R}\) і\(n \in \mathbb{N}^{+}\), то\ [\ почати {вирівняний} x^ {n} -y^ {n} & =( x-y)\ лівий (x^ {n-1} +x^ {n-2} y+\ cdots+x y^ {n-2} +y^ {n-1}\ праворуч)\\ & =( x-y)\ ліворуч (\ sum_ {\ substack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ праворуч). \ end {вирівняний}\] Обговорення. Позначення в останньому рядку леми означає, що сума береться над усіма натуральними числами\(i\) і\(j\) мають властивість що\(i+j=n-1\).

    ДОКАЗ. За лема 4.11,\ [\ почати {вирівняний} (x-y)\ лівий (\ sum_ {\ підстек {i, j\ в\ mathbb {N}\ i+j=n-1}} x^ {i} y^ {j}\ праворуч) &= х\ ліворуч (\ sum_ {\ підстек {i, j\ in\ mathbb {N}\ i+j =n-1}} x^ {i} y^ {j}\ праворуч) -y\ ліворуч (\ sum_ {\ підстек {i, j\ в\ mathbb {N}\ i+j=n-1}} x^ {i} y^ {j}\ праворуч)\\ &=\ sum_ {\ підстек {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i+1} y^ {j} -\ сума {\ підстек {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j+1}\\ &=x^ {n} -y^ {n}. \ end {aligned}\] Наступна лема пов'язує коріння поліномів і лінійних множників.

    ЛЕМА 4.13. \(p\)Дозволяти поліном ступеня\(N\). Справжнє число\(c\),, є корінь\(p\) iff,\[p(x)=(x-c) q(x),\] де\(q(x)\) многочлен ступеня\(N-1\).

    Обговорення. Ця лема є двозастережним твердженням. Тобто лема супротивно еквівалентна сполученню двох умовних тверджень. Доводимо умовні твердження самостійно. Один з умовних тверджень очевидний (чи можете ви визначити який?). Більш складний умовний оператор буде використовувати Lemma 4.12. При доведенні двозастережного\(P \Longleftrightarrow Q\), шляхом доведення умовних тверджень\(P \Rightarrow Q\) і\(Q \Rightarrow P\), ми часто використовуємо\((\Rightarrow)\) і\((\Leftarrow)\) для ідентифікації розглянутого умовного твердження. Доказ. \(p\)Дозволяти поліном ступеня\(N\). Тоді є\(a_{0}, a_{1}, \ldots, a_{N} \in\)\(\mathbb{R}, a_{N} \neq 0\), такі, що,\[p(x)=\sum_{n=0}^{N} a_{n} x^{n} .\] (\(\Leftarrow\)) Припустимо, що є\(c \in \mathbb{R}\) і поліном\(q\) ступеня\(N-1\) такий, що\[p(x)=(x-c) q(x) .\] Тоді \[p(c)=(c-c) q(c)=0 .\]Так\(c\) і корінь\(p\).

    \((\Rightarrow)\)Нехай\(c \in \mathbb{R}\) буде корінь\(p\). Потім\ [\ почати {вирівнювання} p (x) &=p (x) -p (c)\\ &=a_ {0} -a_ {0} +\ sum_ {n=1} ^ {N} a_ {n}\ ліворуч (x^ {n} -c^ {n}\ праворуч)\\ &=\ sum_ {n=1} ^ {N} a_ {n}\ ліворуч (x^ {n} -c^ {n}\ праворуч). \ end {вирівняний}\] За лемою 4.12\(n \geq 1\), для,\[x^{n}-c^{n}=(x-c) q_{n}(x)\] де\[q_{n}(x)=x^{n-1}+c x^{n-2}+\cdots+c^{n-2} x+c^{n-1}=\sum_{\substack{i, j \in \mathbb{N} \\ i+j=n-1}} x^{i} c^{j} .\] Лемма 4.11,\[p(x)=\sum_{n=1}^{N} a_{n}\left(x^{n}-c^{n}\right)=(x-c) \sum_{n=1}^{N} a_{n} q_{n}(x) .\] Нехай\[q(x)=\sum_{n=1}^{N} a_{n} q_{n}(x) .\] для всіх\(n\) між 1 і\(N, q_{n}(x)\) має ступінь\((n-1)\). Так що ступінь\(q(x)\) менше, ніж\(N\). Однак коефіцієнт\(x^{N-1}\) in\(q(x)\) є\(a_{N}\), і\(a_{N} \neq 0\) за припущенням. Отже, ступінь\(q(x)\) є\(N-1\), і\[p(x)=(x-c) q(x) .\] Ми завершуємо доказ теореми. \(p\)Дозволяти поліном ступеня\(N\). Аргументуємо індукцією про ступінь\(p\).

    Базовий корпус:\(N=1\).

    Якщо\(p\) многочлен ступеня 1, то він має форму\[p(x)=a_{1} x+a_{0},\] і єдиний корінь -\(-a_{0} / a_{1}\).

    Індукційний крок:

    Припустимо, що теорема тримає для\(N \in \mathbb{N}^{+}\). Нехай\(p\) є ступінь\(N+1\). Якщо не\(p\) має коренів, теорема тримає за\(p\). Отже, припустимо, що\(p\) має справжній корінь,\(c \in \mathbb{R}\). За Лемма\(4.13\),\[p(x)=(x-c) q(x),\] де\(q\) знаходиться ступінь\(N\). За індукційною гіпотезою,\(q\) має в більшості\(N\) реальні корені. Якщо\(x\) є коренем\(p\), то по (4.14) або\(x\) є корінь\(q\) або\(x=c\). Тому\(p\) має в більшості\(N+1\) коренів, доводячи крок індукції.

    Як функція, многочлен в тій чи іншій змінній такий же, як многочлен з однаковими коефіцієнтами в іншій змінній. \(p \in \mathbb{R}[x]\)Дозволяти бути\[p(x)=\sum_{n=0}^{N} a_{n} x^{n},\] і\(q \in \mathbb{R}[y]\) бути\[q(y)=\sum_{n=0}^{N} a_{n} y^{n} .\] Тоді як реальні функції\(p\) і\(q\) є однією і тією ж функцією. Тобто,\[\operatorname{graph}(p)=\operatorname{graph}(q) .\] як алгебраїчні об'єкти, однак, іноді можна хотіти розрізняти многочлени в різних змінних.

    Ми закінчуємо цей розділ доведенням того, що поліноми рівні як функції тоді і тільки тоді, коли вони мають однакові коефіцієнти.

    НАСЛІДОК 4.15. Нехай\(p, q \in \mathbb{R}[x]\). \(q\)Коефіцієнти\(p\) та рівні iff\[(\forall x \in \mathbb{R}) \quad p(x)=q(x) .\] Proof. \((\Rightarrow)\)Якщо\(q\) коефіцієнти\(p\) і всі рівні, то, даючи\(a_{n}\) позначити\(n^{\text {th }}\) коефіцієнт, маємо\[(\forall x \in \mathbb{R}) p(x)=\sum_{n=0}^{N} a_{n} x^{n}=q(x) .\] (\(\Leftarrow\)) Припустимо\((\forall x \in \mathbb{R}) p(x)=q(x)\). Потім\(p-q\) - многочлен з нескінченно великою кількістю коренів. Якщо\(p\) і не\(q\) згодні з яким-небудь коефіцієнтом, то\(p-q\) це ненульовий многочлен, має ступінь, а по теоремі 4.10, скінченно багато коренів. Тому\(p\) і\(q\) треба узгодити всі коефіцієнти.

    Арифметико-геометрична нерівність

    Наведено скромні узагальнення базової математичної індукції (Слідство\(4.8\) і Слідство 4.9). Формальність нашого підходу може припустити, що індукція - це жорстка техніка, яка повинна застосовуватися негнучко певним нормативним чином. Математику індукція керується двома ідеями:

    (1) Індукція використовує порядок свердловини натуральних чисел або, загалом, будь-який добре впорядкований набір, щоб довести універсальні твердження, кількісно визначені над множиною.

    (2) Кожен елемент набору, над яким ви кількісно оцінюєте, повинен враховуватися індукцією.

    Формальні характеристики індукції в Розділі\(4.2\) є достатніми, але необхідними для досягнення цілей доказу шляхом індукції. Теорема в цьому розділі дасть вам сенс про те, як можна розширити техніку індукції. ВИЗНАЧЕННЯ. Середнє арифметичне\(a_{1}, \ldots, a_{N}\) Дозволяти дійсними числами. Середнє\(a_{1}, \ldots, a_{N}\) арифметичне\[\frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) .\] визначення. Середнє геометричне\(a_{1}, \ldots, a_{N}\) Дозволяти бути додатними дійсними числами. Середнє геометричне\(a_{1}, \ldots, a_{N}\) є\[\sqrt[N]{a_{1} \cdots a_{N}} .\] ТЕОРЕМА 4.16. Середнє арифметико-геометричне нерівність Let\(a_{1}, \ldots, a_{N} \in\)\(\mathbb{R}^{+}\). Потім\[\sqrt[N]{a_{1} \cdots a_{n}} \leq \frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) .\] обговорення. Ми доводимо це цікавим аргументом, обумовленим спочатку Коші; наше звернення - з книги [1]. Аргументуємо індукцією про розмір зразка, над яким ми обчислюємо кошти. Після аргументації базового випадку ми покажемо, що якщо нерівність тримається за арифметичні та геометричні\(N\) середні чисел, вона обов'язково тримає за середні\(2 N\) числа. З цього випливає, що теорема тримається за середні\(2^{N}\) числа для будь-якого\(N \in \mathbb{N}\) (за стандартним індукційним аргументом).

    Потім ми покажемо, що результат проведення\(N\) чисел означає, що він тримається для\(N-1\) чисел. Це означає, що якщо результат тримається в натуральному\(N\) числі, нерівність тримається для всіх засобів менше\(N\) чисел. Враховуючи будь-який,\(k \in \mathbb{N}, 2^{k}>k\) а оскільки теорема має значення для середніх\(2^{k}\) чисел, вона призначена для середніх\(k\) термінів.

    Доказ. Аргументуємо індукцією про кількість членів з кожного боку нерівності.

    Базовий випадок:\((N=2)\)

    Нехай\(a_{1}, a_{2} \in \mathbb{R}^{+}\). Потім\[\left(a_{1}-a_{2}\right)^{2}=a_{1}^{2}-2 a_{1} a_{2}+a_{2}^{2} \geq 0 .\]\[2 a_{1} a_{2} \leq a_{1}^{2}+a_{2}^{2},\] і\ [\ почати {вирівняний} 4 a_ {1} a_ {2} &\ leq a_ {1} ^ {2} +2 a_ {1} a_ {2} +a_ {2} ^ {2}\ &=\ ліворуч (a_ {1} +a_ {2}\ праворуч) ^ {2}. \ end {aligned}\]\[2 \sqrt{a_{1} a_{2}} \leq a_{1}+a_{2} .\] Таким чином, нерівність тримає два члени.

    Індукційний крок:

    \(P(N)\)Дозволяти твердження, яке (4.17) тримає для всіх\(a_{1}, \ldots, a_{N}>0\). Ми показуємо це\(P(N) \Rightarrow P(2 N)\). Нехай\[G_{N}=\prod_{n=1}^{N} a_{n}\] і\[A_{N}=\left(\frac{\sum_{n=1}^{N} a_{n}}{N}\right) .\] так\ [\ почати {вирівняний} G_ {2 N} &=\ prod_ {n=1} ^ {2 N} a_ {n}\ &=\ ліворуч (\ prod_ {n=1} ^ {N} a_ {n}\ праворуч)\ ліворуч (\ prod_ {n=n+1} ^ {2 N} a_ {n}\ праворуч)\\\ leq_ {I H}\ ліворуч (\ sum_ {n=1} ^ {N}\ розрив {a_ {n}}} {N}\ праворуч) ^ {N}\ ліворуч (\ sum_ {n=N+1} ^ {2 N}\ frac {a_ {n}} {N}\ праворуч) ^ {N} \ кінець {вирівняний}\] Нехай\[B=\sum_{n=N+1}^{2 N} \frac{a_{n}}{N} .\] по базовому регістру\ [\ почати {вирівняний} A_ {N} B &\ leq\ ліворуч (\ frac {A_ {N} +B} {2}\ праворуч) ^ {2}\ &=\ ліворуч (A_ {2 N}\ праворуч) ^ {2}\ &=\ ліворуч (A_ {2 N} \ праворуч) ^ {2}\ кінець {вирівняний}\] Отже\ [ \ почати {вирівняний}\ лівий (A_ {N}\ праворуч) ^ {N} B^ {N} & ; =\ ліворуч (A_ {N} B\ праворуч) ^ {N}\\ &\ leq\ ліворуч (\ ліворуч (A_ {2 N}\ праворуч) ^ {2}\ праворуч) ^ {N}\ &=\ left (A_ {2 N}\ справа) ^ {2 N} \ кінець {вирівняний}\]\[G_{2 N} \leq\left(A_{2 N}\right)^{2 N} .\] Таким чином, для будь-якого\(N \in \mathbb{N}^{+}\)\[P(N) \Rightarrow P(2 N) .\] обговорення. \(Q(N)\)Дозволяти бути твердженням\(P\left(2^{N}\right)\). Тоді аргумент поки є стандартним доказом індукції\(\left(\forall N \in \mathbb{N}^{+}\right) Q(N)\). Звичайно, ми хочемо показати\((\forall N \in \mathbb{N}) P(N)\). Робимо це, доводячи\[\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) .\] Let\(N>2\). Доводимо, що\[P(N+1) \Rightarrow P(N) .\] Припустимо\(P(N+1)\). Потім\[\left(G_{N}\right)\left(A_{N}\right) \leq\left(\frac{\left(\sum_{n=1}^{N} a_{n}\right)+A_{N}}{N+1}\right)^{N+1} .\] обговорення. Нагадаємо,\(G_{N}\) що це продукт\(a_{1}, \ldots, a_{N}\). Ми розглядаємо суму\(A_{N}\) як\(N+1^{\text {st }}\) фактор\(a_{N+1}\), і застосовуємо нерівність\(P(N+1)\).

    Як\ [\ почати {вирівняний} \ лівий (\ розрив {\ ліворуч (\ sum_ {n=1} ^ {N} a_ {n}\ праворуч) +A_ {N}} {N+1}\ праворуч) ^ {N+1} &=\ лівий (\ frac {N} +A_ {N}}} {N+1}\ праворуч) ^ {N+1}\\ =\ ліворуч (A_ {N}\ праворуч) ^ {N+1} \ end {вирівняний}\] Нерівність\(4.18\) дає\[G_{N} A_{N} \leq A_{N}^{N+1}\] і так\[G_{N} \leq\left(A_{N}\right)^{N}\] який є твердженням\(P(N)\). \[\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) .\]Отже, для всіх\(N \geq 2, P(N)\).

    Середнє арифметичне і середнє геометричне - різні способи розуміння середніх. Вони пов'язані середнім арифметичним геометричним нерівністю (називається нерівністю AGM). Чи можемо ми застосувати нерівність? Розглянемо легке геометричне застосування корпусу\(N=2\). Розглянемо прямокутник зі сторонами довжиною\(a\) і\(b\). Периметр прямокутника є,\[P=2 a+2 b\] а площа -\[A=a b .\]зображення

    У обчисленні ви довели, що прямокутник фіксованого периметра з найбільшою площею є квадратом. Це також можна довести безпосередньо з нерівності AGM:\ [\ begin {вирівняний} P &=2 a+2 b\\ &=\ frac {4 a+4 b} {2}\\ &\ geq\ sqrt {16 a b}\\ &=4\ sqrt {a b}. \ end {aligned}\] Отже,\[\frac{P^{2}}{16} \geq a b=A .\] нагадаємо, що\(P\) фіксовано\(\frac{P^{2}}{16}\), і тому так і є, і ми показали, що це верхня межа для площі прямокутника.

    Чи досягається ця верхня межа? Площа\(A\) прямокутника змінюється залежно від розмірів прямокутника і якщо\(a=b\)\[\frac{P^{2}}{16}=\frac{(4 a)^{2}}{16}=A .\] Таким чином максимальна площа прямокутника досягається при\(a=b\). Цей результат можна узагальнити до більш високих розмірів - без необхідності багатоваріантного обчислення.

    Доведення теорем - це не просто питання техніки, хоча це потрібно освоїти. Це також вимагає творчості і проникливості. Прекрасна колекція доказів міститься в книзі [1] Мартіна Айгнера і Гюнтера Циглера.

    Вправи

    Вправа 4.1. Доведіть індукцією, що 3 ділить\(7^{n}-4\) для кожного\(n \in \mathbb{N}^{+}\).

    ВПРАВА 4.2. Доведіть шляхом індукції, що\[(\forall n \in \mathbb{N}) 2^{n}>n .\] ВПРАВА 4.3. Доведіть, що будь-яка підмножина добре впорядкованої множини добре впорядкований. Вправа 4.4. Доведіть, що\((1+x)^{n} \geq 1+n x\) для кожного\(n \in \mathbb{N}^{+}\) і кожного\(x \in(-1, \infty)\).

    ВПРАВА 4.5. Доведіть шляхом індукції, що кожен скінченний набір дійсних чисел має найбільший елемент.

    Вправа 4.6. Дозволяти\(X\) і\(Y\) бути набори з\(n\) елементами кожен. Скільки біекцій від\(X\) до\(Y\) є? Що це говорить вам про кількість перестановок\(\ulcorner n\urcorner\)? Доведіть свою претензію.

    ВПРАВА 4.7. Біноміальні коефіцієнти\(\left(\begin{array}{l}n \\ k\end{array}\right)\) можна визначити з трикутника Паскаля:

    (i)\(\forall n \in \mathbb{N},\left(\begin{array}{l}n \\ 0\end{array}\right)=\left(\begin{array}{l}n \\ n\end{array}\right)=1\).

    (ii)\(\forall 2 \leq n \in \mathbb{N}, \forall 1 \leq k \leq n-1,\left(\begin{array}{l}n \\ k\end{array}\right)=\left(\begin{array}{c}n-1 \\ k\end{array}\right)+\left(\begin{array}{c}n-1 \\ k-1\end{array}\right)\).

    Доведіть шляхом індукції, що\ [\ left (\ begin {масив} {l} n \ k\ end {масив}\ право) =\ frac {n!} {(н-к)! k!} .\] Вправа 4.8. Доведіть біноміальну теорему: з\(\left(\begin{array}{l}n \\ k\end{array}\right)\) визначеною вправою 4.7\(n \in \mathbb{N}\), для будь-якого, наступна ідентичність тримає\ [(x+y) ^ {n} =\ sum_ {k=0} ^ {n}\ left (\ begin {масив} {l} n \ k\ end {масив}\ правий) x^ {n-k} y^ {k}. Доведіть\(\sum_{k=0}^{n}\left(\begin{array}{l}n \\ k\end{array}\right)=2^{n}\).

    Вправа 4.10. Доведіть, для всіх\(n \in \mathbb{N}^{+}\),\ [\ left (\ begin {масив} {c} 2 n\\ n \ end {масив}\ право)\ geq\ frac {2^ {2 n-1}} {\ sqrt {n}}\] Вправа 4.11. Принцип спуску говорить, що не існує строго зменшується нескінченної послідовності натуральних чисел. Доведіть принцип спуску.

    ВПРАВА 4.12. Числа Фібоначчі визначаються рекурсивно\(F_{1}=1, F_{2}=1\), і for\(n \geq 3, F_{n}=F_{n-1}+F_{n-2}\). Доведіть, що числа Фібоначчі задаються рівнянням\[F_{n}=\frac{(1+\sqrt{5})^{n}-(1-\sqrt{5})^{n}}{2^{n} \sqrt{5}} .\] Це приклад формули, яку важко здогадатися, але легко перевірити. Пояснення того, як виникає формула, див. Вправа 5.29.

    ВПРАВА 4.13. \(X\)Дозволяти бути набір добре впорядкований за співвідношенням\(\preceq\). Ми говоримо, що послідовність елементів в\(X,\left\langle x_{n} \mid n \in \mathbb{N}\right\rangle\), строго зменшується (по відношенню до\(\preceq\)) якщо для всіх\(m, n \in \mathbb{N}\)\[[m<n] \Rightarrow\left[x_{n} \preceq x_{m} \wedge x_{n} \neq x_{m}\right] .\] Доведіть, що немає строго зменшується послідовність елементів в\(X\).

    ВПРАВА 4.14. Доведіть, що остання\(7^{7} \underbrace{7}\) цифра 3 для будь-якої вежі сімок висотою більше 1.

    ВПРАВА 4.15. Наведіть ще один приклад, який ілюструє необхідність базового випадку в дійсному доказі шляхом індукції.

    Вправа 4.16. Припустимо, що існує многочлен ступеня 4 в\(N\) тому, що дає\(\sum_{n=0}^{N} n^{3}\). Знайдіть многочлен, а потім доведіть, що формула правильна шляхом індукції.

    Скористайтеся методом Архімеда, щоб довести, що

    ВПРАВА 4.17. \(\mathbb{N}[x]\)Дозволяти множина многочленів з натуральними числовими коефіцієнтами. Визначте відношення\(\preceq\)\(\mathbb{N}[x]\) по:

    Нехай\(p(x)=\sum_{n=0}^{N} a_{n} x^{n}\), і\(q(x)=\sum_{n=0}^{M} b_{n} x^{n}\). Скажіть, що\(p \preceq q\) якщо, якщо\(k\) коефіцієнт найвищого ступеня, при якому\(p\) і\(q\) відрізняються, то\(a_{k} \leq b_{k}\). Це\(\preceq\) лінійне впорядкування? Це добре впорядкування\(\mathbb{N}[x]\)?

    ВПРАВА 4.18. Припустимо, що існує многочлен\(p\) ступеня 5 такий, що\[\sum_{n=0}^{N} n^{4}=p(N) .\] Знайти\(p\) і довести, що формула, яку ви пропонуєте, є правильною.

    ВПРАВА 4.19. Визначте множину натуральних натуральних чисел\(n\) таким чином, щоб сума кожного\(n\) послідовного натурального числа ділилася на\(n\). ВПРАВА 4.20. \(f\)Дозволяти реальна функція така, що, для\(x, y \in \mathbb{R}\),\[f(x+y)=f(x)+f(y) .\] Доведіть, що

    а)\(f(0)=0\)

    б)\(f(n)=n f(1)\).

    ВПРАВА 4.21. Доведіть наслідок 4.9.

    ВПРАВА 4.22. Розглянемо коробки з розмірами\(a, b\) і\(c\) в яких зафіксована сума розмірів (тобто\(a+b+c\)). Доведіть, що коробка з максимально можливим об'ємом має розміри, які задовольняють\(a=b=c\).

    ВПРАВА 4.23. Доведіть шляхом індукції, що будь-яке добре сформоване висловлювання має чітко визначену істинну цінність.

    ВПРАВА 4.24. Доведіть шляхом індукції на кількість пропозиційних зв'язків, що кожне складене пропозиційне твердження еквівалентно твердженню, використовуючи тільки\(\neg\) і\(\vee\).

    Вправа 4.25. Доведіть шляхом індукції на кількість пропозиційних зв'язків, що кожне складене пропозиційне твердження еквівалентно твердженню, використовуючи тільки\(\neg\) і\(\wedge\).

    ВПРАВА 4.26. \(Q_{i}\)Дозволяти бути квантор, для\(1 \leq i \leq n\). Для кожного\(Q_{i}\), нехай\(Q_{i}^{*}\) буде додатковим кількісним показником. Тобто, якщо\(Q_{i}=\forall\), то\(Q_{i}^{*}=\exists\); якщо\(Q_{i}=\exists\), то нехай\(Q_{i}^{*}=\forall\). Довести шляхом індукції на кількість кількісних показників,\(\neg\left(Q_{1} x_{1}\right)(\ldots)\left(Q_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) \equiv\left(Q_{1}^{*} x_{1}\right)(\ldots)\left(Q_{n}^{*} x_{n}\right) \neg P\left(x_{1}, \ldots, x_{n}\right) .\)

    Вправа 4.27. Визначте число\(n^{\text {th }}\) Ферма, яке має бути\[F_{n}:=2^{2^{n}}+1, \quad n \in \mathbb{N} .\] (i) Показати, що числа Ферма задовольняють\[\prod_{k=0}^{n} F_{k}=F_{n+1}-2 .\] (ii) Зробіть висновок, що будь-які два різних числа Ферма є копростими. ВПРАВА 4.28. \(\left\langle a_{n}: n \in \mathbb{N}\right\rangle\)Дозволяти послідовність позитивних чисел. Припустимо\(a_{0} \leq 1\), що, і що для всіх\(N \in \mathbb{N}\),\[a_{N+1} \leq \sum_{n=0}^{N} a_{n} .\] Доведіть\[(\forall N \in \mathbb{N}) a_{n} \leq 2^{N}\] ВПРАВА 4.29. \(\left\langle a_{n}: n \in \mathbb{N}\right\rangle\)Дозволяти послідовність позитивних чисел, що задовольняють (4.21), і\(a_{0} \leq C\). Який правильний аналог (4.22)? Доведіть своє твердження.

    Вправа 4.30. \(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\)Дозволяти бути індексоване сімейство попарно нез'єднаних множин. Припустимо,\(X_{\alpha}\) що кожен добре впорядкований\(\preceq_{\alpha}\) і що\(A\) добре впорядковано\(\preceq\). Визначте відношення\(R\) на об'єднання всіх множин у\(\mathcal{F}\) by: for all\(a, b \in \bigcup_{\alpha \in A} X_{\alpha}, a R b\) iff (a)\(a \in X_{\alpha_{1}}, b \in X_{\alpha_{2}}\) і\(\alpha_{1} \preceq \alpha_{2}\),

    або

    (б)\((\exists \alpha \in A) a, b \in X_{\alpha}\) і\(a \preceq_{\alpha} b\).

    Доведіть, що\(R\) це добре впорядкування\(\bigcup_{\alpha \in A} X_{\alpha}\).

    Вправа 4.31. \(X\)Дозволяти бути кінцевий набір і\(f: X \rightarrow X\). Доведіть, що\(f\) це ін'єкція, якщо\(f\) це відсмоктування.
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    зображення

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2

    • 2

    2

    (

    р.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    зображення

    зображення

    (1)

    • ГЛАВА 5

    Обмеження

    Ідея межі є наріжним каменем обчислення. Це дещо тонко, тому, хоча це було неявним у роботі Архімеда\(^{1}\) і важливо для правильного розуміння парадоксів Зенона, знадобилося дві тисячі років, щоб повністю зрозуміти. Обчислення було розроблено в\(17^{\text {th }}\) столітті Ньютоном і Лейбніцем з дещо кавалерським підходом до меж; лише у\(19^{\text {th }}\) столітті Коші було дано суворе визначення межі.

    У розділі\(5.1\) ми визначаємо межі та доводимо деякі елементарні властивості. У розділі\(5.2\) ми обговорюємо неперервні функції, а в розділі\(5.3\) розглядаємо межі послідовностей функцій.

    Обмеження

    З огляду на реальну функцію\(f: X \rightarrow \mathbb{R}\), інтуїтивне уявлення про твердження\[\lim _{x \rightarrow a} f(x)=L\] полягає в тому, що, як\(x\) стає все ближче і ближче до\(a\), значення\(f(x)\) стають все ближче і ближче до\(L\). Зробити це поняття точним непросто - спробуйте записати математичне визначення зараз, перш ніж читати далі.

    Ідея визначення полягає в тому, щоб дати послідовність гарантій. Уявіть себе адвокатом, який намагається відстояти позов (5.1). Для конкретності зафіксуємо\(g(x)=\frac{\sin (x)}{x}\), і спробуємо відстояти твердження про те, що\[\lim _{x \rightarrow 0} g(x)=1\]\({ }^{1}\) Архімед (287-212 рр. До н.е.) обчислив площу під параболу (що ми б зараз назвали\(\int_{0}^{1} x^{2} d x\)), обчисливши площу прямокутників ширини \(1 / N\)під параболу і пускаючи\(N\) прагнуть до нескінченності. Це ідентично сучасному підходу пошуку інтеграла шляхом взяття межі сум Рімана.

    зображення

    МАЛЮНОК 5.3. Сюжет\(\sin (x) / x\)

    Скептичний суддя запитує: «Чи можете ви гарантувати, що\(g(x)\) це в межах 1 з 1?»

    «Так, ваша честь, за умови, що»\(|x|<.7\).

    «Хм, ну ви можете гарантувати, що\(g(x)\) це в межах\(.01\) 1?»

    «Так, ваша честь, за умови, що\(|x|<.2 . "\)

    І так йде. Якщо при кожному можливому допуску судді можна знайти точність (тобто допустиме відхилення\(x\) від\(a\)), яка гарантує, що різниця між значенням функції і межею знаходиться в межах допустимого допуску, то можна успішно відстояти претензія.

    ВПРАВА. Тепер спробуємо дати математичне визначення межі, не читаючи далі.

    Почнемо з того випадку, що функція визначається на відкритому інтервалі.

    ВИЗНАЧЕННЯ. Обмеження,\(\lim _{x \rightarrow a} f(x)\)\(I\) Дозволяти бути відкритим інтервалом і\(a\) деякою точкою в\(I\). \(f\)Дозволяти бути реальною функцією, визначеною на\(I \backslash\{a\}\). (Не має значення,\(f\) визначається в\(a\) чи ні). Потім ми говоримо\[\lim _{x \rightarrow a} f(x)=L\] (словами, «межа, як\(x\) прагне до\(a\)\(f(x)\) є\(L\) «) якщо для кожного існує\(\varepsilon>0\)\(\delta>0\), так що\[0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon\]зображення

    МАЛЮНОК 5.5. Один вибір\(\delta\) для даного\(\varepsilon\)

    Умова\(0<|x-a|<\delta\) означає виключити\(x=a\) з розгляду. Межі стосуються поведінки функції поблизу точки, а не в точці. Для такої функції\(g(x)=\sin (x) / x\), як, значення 0 не визначено; проте\(\lim _{x \rightarrow 0} g(x)\) існує і є таким же, як\(\lim _{x \rightarrow 0}\) у функції\ [h (x) =\ left\ {\ begin {array} {cc} \ sin (x)/x & x\ neq 0\\ 5 & x=0. \ end {масив}\ право.\] ЗАУВАЖЕННЯ. Використання\(\varepsilon\) для допустимої похибки і\(\delta\) для відповідної необхідної точності відзначається тривалим використанням. Математикам потрібні всі зручні символи, які вони можуть знайти. Грецький алфавіт здавна використовується як доповнення до латинського алфавіту в західній математиці, і з ним потрібно бути знайомим (див. Додаток А для грецького алфавіту). Основним моментом, який слід зазначити у визначенні, є порядок кількісних показників:\(\forall \varepsilon, \exists \delta\). Що означало б сказати\[(\exists \delta>0)(\forall \varepsilon>0) \quad[0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon] ?\] Щоб зручно говорити про межі, це допомагає мати деякі слова, що описують нерівності (5.4). Скажімо, що\(\varepsilon\) -сусідство\(L\) - це множина\(\varepsilon\) точок в межах\(L\), тобто інтервал\((L-\varepsilon, L+\varepsilon)\). Проколота\(\delta\) -околиця\(a\) - це множина точок всередині\(a\),\(\delta\) виключаючи\(a\) себе, тобто\((a-\delta, a) \cup(a, a+\delta)\). Коли ми говоримо про\(\varepsilon\) -околиці та проколоті\(\delta\) -квартали, ми завжди припускаємо, що\(\varepsilon\) і\(\delta\) є позитивними, так що квартали не порожні.

    Тоді визначення межі можна сформулювати як «кожен\(\varepsilon\) -сусідство\(L\) має зворотне зображення під\(f\) яким містить деяку проколоту\(\delta\) околицю\(a\)».

    ЗАУВАЖЕННЯ. Ми можемо переглянути нашу аналогію в судовому залі, і сказати, що для того, щоб довести, що\(f\) має обмеження\(L\) на\(a\), нам потрібна стратегія, яка виробляє працездатну\(\delta\) для будь-якого\(\varepsilon\). Таким чином, доказ - це по суті функція\(F\), яка приймає будь-який позитивний\(\varepsilon\) і випльовує позитивне,\(\delta=F(\varepsilon)\) для якого (5.4) працює.

    ПРИКЛАД 5.6. Нехай\(f(x)=5 x+2\). Доведіть\(\lim _{x \rightarrow 3} f(x)=17\).

    Нехай\(\varepsilon>0\). Ми хочемо знайти\(\delta>0\) так, щоб проколота\(\delta\) околиця 3 відображалася в\(\varepsilon\) -околиці 17.

    зображення

    МАЛЮНОК 5.7. Відносини між\(\delta\) і\(\varepsilon\)\(\delta=\varepsilon / 5\) Taking буде працювати, як і будь-який менший вибір\(\delta\). Дійсно, якщо\(0<|x-3|<\delta\), то\(|f(x)-17|<5 \delta=\varepsilon\).

    ПРИКЛАД 5.8. Цього разу нехай\(g(x)=55 x+2\). Щоб довести\(\lim _{x \rightarrow 3} g(x)=\) 167, треба взяти\(\delta \leq \varepsilon / 55\).

    Якщо дві функції\(f\) і\(g\) обидві мають межі в точці\(a\), то так роблять всі алгебраїчні комбінації\(f+g, f-g, f \cdot g\) і\(c f\) для\(c\) константи. Частка\(f / g\) також має ліміт при\(a\), передбачено\(\lim _{x \rightarrow a} g(x) \neq 0\). Більше того, ці обмеження - це те, що ви очікуєте.

    ТЕОРЕМА 5.9. Припустимо\(f\) і\(g\) є функціями на відкритому інтервалі\(I\), а в точці\(a\) в\(I\) обох\(\lim _{x \rightarrow a} f(x)\) і\(\lim _{x \rightarrow a} g(x)\) існують. \(c\)Дозволяти бути будь-яке дійсне число. Потім\ [\ почати {вирівняний} \ текст {(i)}\ lim _ {x\ стрілка вправо a} [f (x) +g (x)] &=\ lim _ {x\ rightarrow a} f (x) +\ lim _ {x\ стрілка вправо a} g (x)\ \ текст {(ii)}\ lim _ {x\ rightarrow a} [f)) -g (x)] &=\ lim _ {х\ стрілка вправо a} f (x) -\ lim _ {х\ стрілка вправо a} g (x)\ \ текст {(iii)}\ quad\ lim _ {x\ стрілка вправо a} c f (x) &= c\ ліворуч [\ lim _ {x\ rightarrow a} f (x)\ праворуч]\\ (i v)\ quad\ lim _ {x\ rightarrow a} [f (x) g (x) g (x) g (x) g (x) g (x) g (x) g (x) (x) g (x)\ ліворуч [\ lim _ {x\ rightarrow a} f (x)\ праворуч]\ cdot\ ліворуч [\ lim _ {х\ стрілка вправо а} г (х) \ праворуч]\\ текст {(v)}\ quad\ lim _ {x\ rightarrow a}\ frac {f (x)} {g (x)} &=\ frac {\ lim _ {x\ стрілка вправо a} f (x)} {\ lim _ {x\ rightarrow a} g (x)},\ квад\ текст {надається}\ lim _ {x\ rightarrow a} g (x)\ neq 0. \ end {вирівняний}\] Обговорення. Як ми йдемо про доведення такої теореми? Ну, для початку не лякайтеся його довжини. Почнемо з частини (i). У нас є лише визначення ліміту для роботи, тому у нас є лише один стратегічний варіант: довести безпосередньо, що визначення задоволене.

    ДОКАЗ З (i). Дозволяти\(L_{1}\) і\(L_{2}\) бути межі\(f\) і\(g\) відповідно в\(a\). \(\varepsilon\)Дозволяти довільне додатне число. Ми повинні знайти\(\delta>0\) так, що\[0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right|<\varepsilon .\] Ключова ідея, загальна для багатьох граничних аргументів, полягає у використанні спостереження, що\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| .\] Це застосування так званої нерівності трикутника, яку вас попросять пізніше довести (Лемма 5.14). Це твердження, що для будь-яких дійсних чисел\(c\) і\(d\), у нас є\[|c+d| \leq|c|+|d| .\] (Які значення\(c\) і\(d\) вихід (5.10)?) Отже, якщо ми можемо зробити обидва\(\left|f(x)-L_{1}\right|\) і\(\left|g(x)-L_{2}\right|\) малі, то нерівність (5.10)\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right|\] змушує бути малим теж, що ми хочемо.

    Оскільки\(f\) і\(g\) мають обмеження\(L_{1}\) і\(L_{2}\) в\(a\), ми знаємо, що існують позитивні числа\(\delta_{1}\) і\(\delta_{2}\) такі, що\ [\ begin {array} {lll} 0<|x-a|<\ дельта_ {1} &\ Довга права стрілка &\ ліворуч | f (x) -L_ {1}\ праворуч |<\ varepsilon\\ 0<|x-a|<\ delta_ {2} &\ Longrightarrow &\\ left|g (x) -L_ {2}\ right|<\ varepsilon \ end {масив}\] Якщо\(|x-a|\) менше ніж обидва\(\delta_{1}\) і\(\delta_{2}\), то і те й інше нерівності задовольняються, і ми отримуємо\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| \leq \varepsilon+\varepsilon .\] Це недостатньо добре; ми хочемо, щоб ліва сторона (5.11) була обмежена\(\varepsilon\), а не\(2 \varepsilon\). Нас рятує, однак, вимога, що для будь-якого позитивного числа ми можемо гарантувати\(\eta\), що\(f\) і\(g\) знаходяться в\(\eta\) -сусідстві\(L_{1}\) і\(L_{2}\), відповідно. Зокрема, нехай\(\eta\) буде\(\varepsilon / 2\). Оскільки\(f\) і\(g\) мають обмеження на\(a\), є позитивні числа\(\delta_{3}\) і\(\delta_{4}\) так що\ [\ begin {масив} {lll} 0<|x-a|<\ delta_ {3} &\ Longrightarrow &\ left|f (x) -L_ {1}\ right|<\ frac {\ varepsilon} {2}\\ 0<|x-a|<\ дельта_ {4} &\ Довга стрілка &\ ліворуч | g (x) -L_ {2}\ право|<\ frac {\ varepsilon} {2}. \ end {масив}\] Таким чином, ми ставимо\(\delta\) рівне менше\(\delta_{3}\) і\(\delta_{4}\), і отримуємо\ [\ begin {вирівняний} &0<|x-a|<\ дельта\ LongrightRow\\ &\ quad\ left|f (x) +g (x) -\ left (L_ {1} +L_ {2}\ праворуч)\ право|\ leq\ left|f (x) -x) -L_ {1}\ праворуч |+\ ліво|g (x) -L_ {2}\ right|<\ varepsilon, \ end {вирівняний}\] за потребою. Вправа. Поясніть словами, як працював попередній доказ. Коротше кажучи, можна сказати, що якщо\(F_{1}\) і\(F_{2}\) є стратегіями доведення\(\lim _{x \rightarrow a} f(x)=L_{1}\) і\(\lim _{x \rightarrow a} g(x)=L_{2}\) відповідно, то\[F=\min \left\{F_{1}\left(\frac{\varepsilon}{2}\right), F_{2}\left(\frac{\varepsilon}{2}\right)\right\}\] це стратегія доведення\(\lim _{x \rightarrow a} f(x)+g(x)=L_{1}+L_{2}\).

    Обговорення. Що далі? Ми могли б довести (ii) подібним чином, але математикам подобаються ярлики. Зверніть увагу, що якщо ми доведемо (iii) і нехай\(c=-1\), то ми можемо застосувати (i) до\(f+(-g)\) і отримати (ii) таким чином. Більше того, (iii) - це лише особливий випадок (iv), якщо ми знаємо, що постійна функція\(g(x)=c\) має\(c\) межу в кожній точці. Отже, давайте доведемо (iv) далі.

    ДОКАЗ З (iv). Знову ж таки, нехай\(\varepsilon\) буде довільне додатне число. Ми повинні знайти\(\delta>0\) так, що\[0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x) g(x)-\left(L_{1} L_{2}\right)\right|<\varepsilon .\] Не зовсім зрозуміло, наскільки близько\(f\) і\(g\) потрібно бути,\(L_{1}\) і\(L_{2}\) щоб отримати, що їхній продукт досить близький до\(L_{1} L_{2}\), тому давайте пограємо в нього безпечний, не вибираючи ще. Для кожного\(\varepsilon_{1}, \varepsilon_{2}>0\), ми знаємо, існує\(\delta_{1}, \delta_{2}>0\) таке, що\ [\ begin {масив} {lll} 0<|x-a|<\ delta_ {1} &\ Longrightarrow &\ left|f (x) -L_ {1}\ varepsilon_ {1}\\ 0<|x-a|<\ delta_ {2} &\ Longrightarrow &\ left ft|g (x) -L_ {2}\ праворуч |<\ varepsilon_ {2} \ end {array}\] Тепер ми використовуємо другий загальний трюк в доведенні існування лімітів: додаємо і віднімаємо однакову величину, щоб можна було множник. \ [\ почати {вирівняний} \ ліво|f (x) g (x) -L_ {1} L_ {2}\ праворуч | &=\ ліво|f (x) г (x) -L_ {1} г (x) +L_ {1} г (x) -L_ {1} L_ {2}\ праворуч |\\ &\ leq\ leq\ ліво|f (x)) g (x) -L_ {1} г (x)\ праворуч |+\ ліво|L_ {1} г (x) -L_ {1} L_ {2}\ праворуч |\\ &\ leq\ ліво|f (x) -L_ {1}\ право||г (х) |+\ ліво|г (х) -L_ {2}\ право||г (х) -L_ {2}\ праворуч | вліво|L_ {1}\ право|\ крапка\ quad (5.1 \ end {aligned}\] Тепер, якщо обидві суми на останньому рядку можна зробити менше\(\varepsilon / 2\), ми виграємо. Другий термін простий: вибираємо\[\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|+1} .\] Тоді є\(\delta_{2}\) так, що\ [\ begin {вирівняний} 0<|x-a|<\ delta_ {2} &\ Longrightarrow\ quad\ left|g (x) -L_ {2}\ право| &<\ varepsilon_ {2}\ &\ Longrightarrow\ quad\ left|g (x) -L_ {2}\ праворуч |\ ліворуч |L_ {1}\ праворуч | &<\ frac {\ varepsilon\ left|L_ {1}\ right|} {2\ left|L_ {1}\ right|+1} <\ frac {\ varepsilon} {2} \ end {вирівняний}\] (Якби\(L_{1} \neq 0\), ми могли б вибрати\(\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|}\); ми додали 1 до знаменника просто так, щоб нам не довелося розглядати два випадки окремо).

    Як щодо першого виклику в (5.12), термін\(\left|f(x)-L_{1}\right||g(x)|\)? Спочатку давайте трохи прив'язані до того, наскільки великим\(|g|\) може бути. Ми знаємо, що якщо\(0<|x-a|<\delta_{2}\), то\(\left|g(x)-L_{2}\right|<\varepsilon /\left(2\left|L_{1}\right|+1\right)\), так що\[|g(x)|<\left|L_{2}\right|+\frac{\varepsilon}{2\left|L_{1}\right|+1}=: M .\] якщо ми дозволимо\(\varepsilon_{1}=\varepsilon /(2 M)\), ми знаємо, що існує\(\delta_{1}>0\) так, що\[0<|x-a|<\delta_{1} \quad \Longrightarrow \quad\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)| .\] Нарешті, ми дозволяємо\(\delta=\min \left(\delta_{1}, \delta_{2}\right)\). Бо\(0<|x-a|<\delta\), обидва доведені в (5.12) менше, ніж\(\varepsilon / 2\): друга сума тому, і перша тому\(\delta \leq \delta_{2}\), що коли\(0<|x-a|<\delta\), Нерівність\(5.13\) посилюється до\[\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)|<\varepsilon_{1} M=\varepsilon / 2 .\] Отже, для \(0<|x-a|<\delta\), у нас\(\left|f(x) g(x)-L_{1} L_{2}\right|<\varepsilon\), за бажанням.

    ДОКАЗ (iii). Це особливий випадок (iv), як тільки ми знаємо, що постійні функції мають межі. Зазначимо це як лему. З огляду на Лемма 5.15, (iii) доведено, а отже, так і (ii).

    ДОКАЗ (v). Вправа.

    ЛЕМА 5.14. Нерівність трикутника\(c, d\) Дозволяти дійсними числами. Тоді\(|c+d| \leq|c|+|d| .\)

    ДОКАЗ. Вправа.

    ЛЕМА 5.15. \(g(x) \equiv c\)Дозволяти бути постійна функція c Потім,\[(\forall a \in \mathbb{R}) \lim _{x \rightarrow a} g(x)=c .\] PROOF. Вправа.

    ПРИКЛАД 5.16. Функція Heaviside\(H(t)\) визначається\[H(t)= \begin{cases}0 & t<0 \\ 1 & t \geq 0\end{cases}\] Show, яка\(H\) не має обмеження на 0.

    Обговорення. Щоб довести, що обмеження не існує, ми повинні довести протилежне\(\forall \varepsilon \exists \delta\), тобто що\(\exists \varepsilon \nexists \delta\). Оскільки проміжок між функцією\([0, \infty)\) увімкнено та\((-\infty, 0)\) дорівнює 1, зрозуміло, що будь-яка смуга ширини\(<1\) не може бути достатньо широкою, щоб містити значення\(H(t)\)\(t\) for з обох сторін 0. Так що виберемо деякі\(\varepsilon<.5\), і сперечатися протиріччям.

    Припустимо, межа існує і дорівнює\(L\). Нехай\(\varepsilon=\frac{1}{4}\). За гіпотезою існує\(\delta>0\) таке, що\[0<|t|<\delta \Longrightarrow|H(t)-L|<\frac{1}{4} .\] Але для\(t\) негативних це означає\(|L|<\frac{1}{4}\); а для\(t\) позитивних це означає\(|L-1|<\frac{1}{4}\). Таким чином ми отримуємо протиріччя.

    Якщо функція визначена на замкнутому інтервалі\([c, d]\), ми все одно можемо запитати, чи має вона граничне значення в\(c\); якщо так, однак, ми хочемо розглянути лише точки поблизу\(c\), які знаходяться в області визначення. Більш загально, нас призводять до наступного визначення обмеженого ліміту.

    ВИЗНАЧЕННЯ. Обмежений ліміт,\(\lim _{X \ni x \rightarrow a} f(x)\) Припустимо,\(f\) є реальною функцією і\(X \subseteq \operatorname{Dom}(f)\). Нехай\(a \in \mathbb{R}\). Ми говоримо, що\(\lim _{X \ni x \rightarrow a} f(x)=L\) якщо\((\forall \varepsilon>0)(\exists \delta>0)(\forall x \in X) \quad[0<|x-a|<\delta] \Longrightarrow|f(x)-L|<\varepsilon .\)

    Ми читаємо\(\lim _{X \ni x \rightarrow a} f(x)=L\) "" як «межа, як\(x\) правило,\(a\) всередині\(X\)\(f(x)\) є\(L . "\) Важливим особливим випадком обмежених обмежень є наступні:

    Визначення. Праворуч межа,\(\lim _{x \rightarrow a^{+}} f(x)\)\(f\) Дозволяти\(a, b, L \in \mathbb{R}, a<b\) і бути реальною функцією, визначеною на\((a, b)\). Ми говоримо,\[(\forall \varepsilon>0)(\exists \delta>0)[x \in(a, a+\delta)] \Rightarrow[|f(x)-L|<\varepsilon]\] що\[\lim _{x \rightarrow a^{+}} f(x)=L\] якщо число\(L\) праворуч межа\(f(x)\) at\(a\). Ліва межа визначається аналогічно. Якщо\(a, c, L \in \mathbb{R}, c<a\) і\(f\) є реальною функцією,\((c, a)\) визначеною на, ми говоримо, що\(\lim _{x \rightarrow a^{-}} f(x)=L\) якщо\[(\forall \varepsilon>0)(\exists \delta>0)[x \in(a-\delta, a)] \Rightarrow[|f(x)-L|<\varepsilon]\] праві межі і ліві межі називаються односторонніми межами. Односторонні межі є прикладами обмежених обмежень.

    ПРИКЛАД 5.17. \(H(t)\)Дозволяти буде функція Хевісайд. Потім\ [\ почати {вирівняний} &\ lim _ {t\ rightarrow 0^ {+}} H (t) =1\ &\ lim _ {t\ rightarrow 0^ {-}} H (t) =0 \ кінець {вирівняний}\]

    Безперервність

    Більшість функцій, з якими ви зіткнулися, мають властивість, що в (майже) кожній точці функції має обмеження, яке узгоджується з її значенням там. Це дуже корисна функція функції, і вона називається безперервністю.

    ВИЗНАЧЕННЯ. Безперервний\(f\) Дозволяти бути реальною функцією з доменом\(X \subseteq \mathbb{R} .\) Let\(a \in X\). Тоді ми говоримо\(f\), що безперервно,\(a\) якщо\(\lim _{X \ni x \rightarrow a} f(x)=\)\(f(a)\). Ми говоримо\(f\), що є безперервним,\(X\) якщо він безперервний в кожній точці\(X\)

    Інтуїтивно ідея безперервної функції на інтервалі полягає в тому, що вона не має стрибків. Ми зробимо це точним у розділі 8, коли ми доведемо теорему про проміжні значення 8.10, яка стверджує, що якщо безперервна функція на інтервалі набуває двох різних значень\(c\) і\(d\), вона також повинна приймати кожне значення між\(c\) і \(d\).

    ПРИКЛАД 5.18. Доведіть, що функція\(f(x)=x^{2}\) є безперервним на\(\mathbb{R}\). Обговорення. Як би ми це зробили з перших принципів? Ми повинні показати, що для кожного\(a \in \mathbb{R}\), для кожного\(\varepsilon>0\), ми завжди можемо знайти\(\delta>0\) таке, що для будь-якого\(x \in \mathbb{R}\)\[|x-a|<\delta \quad \Longrightarrow \quad\left|x^{2}-a^{2}\right|<\varepsilon .\] (Чому нам не потрібно додати гіпотезу\(0<|x-a|\)?) Найпростіший спосіб зробити це - записати формулу, яка, дана\(a\) і\(\varepsilon\), виробляє\(\delta\) задовольняє (5.19).

    Як\(x^{2}-a^{2}=(x-a)(x+a)\), якщо\(|x-a|\) менше деякого числа\(\delta\) (все ще не вказано),\(\left|x^{2}-a^{2}\right|\) то менше ніж\(\delta|x+a|\). Тож ми хочемо\[\delta|x+a| \leq \varepsilon\] Ми не можемо вибирати\(\delta=\varepsilon /|x+a|\), тому що\(\delta\) не можемо залежати\(x\). Але якщо\(|x-a|<\delta\), то\ [\ begin {вирівняний} |x+a| &\ leq|x|+|a|\\ &<|a|+\ delta+|a|=2|a|+\ дельта, \ end {вирівняний}\] Отже,\[\left|x^{2}-a^{2}\right|<\delta(2|a|+\delta) \stackrel{?}{\leq} \varepsilon .\] ми повинні вибрати\(\delta\) так, щоб остання нерівність трималася. За квадратичною формулою,\[\delta(2|a|+\delta) \leq \varepsilon \quad \Longleftrightarrow \delta \leq \sqrt{|a|^{2}+\varepsilon}-|a| .\] Так вибираємо\(\delta=\sqrt{|a|^{2}+\varepsilon}-|a|\) і (5.19) тримає.

    ЗАУВАЖЕННЯ. Формально правильний доказ можна було б звести до:

    ДОКАЗ. Нехай\(a \in \mathbb{R}\) і\(\varepsilon>0\). Тоді дозволяючи\(\delta=\sqrt{|a|^{2}+\varepsilon}-|a|\) нам\(|x-a|<\delta \Longrightarrow\left|x^{2}-a^{2}\right|<\varepsilon\). Q.E.D.

    Однак, хоча старанний читач міг переконатися, що цей доказ є правильним,\(\delta\) витягування з такого капелюха не дає читачеві розуміння, яке робить наш набагато довший доказ. Пам'ятайте, що доказ має більше однієї функції: він не тільки повинен переконати читача в тому, що заявлений результат є істинним, але він також повинен допомогти читачеві зрозуміти, чому результат істинний. Хороший доказ повинен бути описаний у кількох англійських реченнях, щоб знаючий слухач міг записати більш детальний доказ досить легко.

    ЗАУВАЖЕННЯ. Не потрібно вибирати найбільше значення,\(\delta\) щоб нерівність\(\stackrel{?}{\leq}\) в (5.21) тримала - будь-який позитив\(\delta\), який задовольняє нерівність, спрацює. Це дозволяє спростити алгебру. Наприклад, нехай\(\delta_{1}\) бути таким, що\[|x-a|<\delta_{1} \Rightarrow|x+a|<2|a|+1 .\] (Таке\(\delta_{1}\) існує з безперервності простішої функції\(x \mapsto x\)). Потім нехай\[\delta=\min \left(\delta_{1}, \frac{\varepsilon}{2|a|+1}\right)\] і (5.20) тримає.

    Можна уявити повторювані докази, як вище, щоб показати\(x^{3}\)\(x^{4}\), що, і так далі безперервні, але ми хочемо зробити великі кроки. Чи можемо ми показати, що всі многочлени є безперервними?

    Спочатку зауважте, що оскільки межі поводяться добре по відношенню до алгебраїчних операцій (теорема 5.9), а неперервність визначається через межі, то алгебраїчні комбінації неперервних функцій є неперервними.

    Пропозиція 5.22. Припустимо\(f: X \rightarrow \mathbb{R}\) і\(g: X \rightarrow \mathbb{R}\) є реальними функціями, які є безперервними в\(a \in X\). \(d\)Дозволяти\(c\) і бути скалярами\({ }^{2}\). Тоді\(c f+d g\) і\(f g\) обидва безперервні в а, і так\(f / g\) якщо\(g(a) \neq 0\).

    ДОКАЗ. Вправа.

    Постійні функції є безперервними (Lemma 5.15), а функція\(f(x)=x\) безперервна (Вправа 5.16). Таким чином, можна довести шляхом індукції на ступінь полінома, використовуючи Пропозиція 5.22, що всі поліноми є безперервними (Вправа 5.27). Після того, як ви довели, що всі многочлени є неперервними, ви можете довести, що раціональні функції є безперервними всюди, де знаменник не зникає.

    Цей результат використовується так часто, що ми будемо висловлювати його формально.

    \({ }^{2}\)Скаляр - це просто вигадливе слово для числа. ПРОПОЗИЦІЯ 5.23. Кожен многочлен є безперервним\(\mathbb{R}\). Кожна раціональна функція є безперервною всюди, де знаменник не дорівнює нулю.

    Як щодо експоненціальної функції\[e^{x}:=\sum_{n=0}^{\infty} \frac{x^{n}}{n !} ?\] Кожна часткова сума є поліномом, а отже, безперервним; так що якби ми знали, що межа послідовності неперервних функцій були неперервними, ми б зробили. Однак це виявляється тонкою проблемою, яку ми розглядаємо в наступному розділі.

    Послідовності функцій

    Нескінченна послідовність чисел\(\left\langle a_{n}\right\rangle\) прагне до межі,\(L\) якщо\(a_{n}\)\(L\) наближається\(n\) до нескінченності. Спробуйте записати формальне визначення цього, перш ніж читати далі.

    Обговорення. Підказка. Ми вже бачили, як закодувати твердження «підходи\(L\)». Складність полягає в тому, щоб кодувати «як\(n\) прагне до нескінченності». Як ви могли б це зробити?

    ВИЗНАЧЕННЯ. \(\lim _{n \rightarrow \infty} a_{n}\), сходяться, розходяться Послідовність\(\left\langle a_{n}\right\rangle\) прагне до межі,\(L\) як\(n\) прагне до нескінченності, написана\[\lim _{n \rightarrow \infty} a_{n}=L,\] якщо для кожного\(\varepsilon>0\) існує\(N \in \mathbb{N}\) така, що \[(\forall n \in \mathbb{N}) n>N \quad \Longrightarrow \quad\left|a_{n}-L\right|<\varepsilon .\]Ми говоримо, що послідовність\(\left\langle a_{n}\right\rangle\) сходиться до\(L\). Якщо послідовність не сходиться, ми говоримо, що вона розходиться.

    ПРИКЛАД 5.24. Доведіть, що послідовність\[\left\langle\sin ^{2}(n) / n \mid n \in \mathbb{N}\right\rangle\] сходиться. Обговорення. Як правило, найпростіше довести, що послідовність сходиться, якщо ми маємо уявлення про її межі. Для доведення збіжності послідовностей без кандидата на межу зазвичай передбачається використання найменшої верхньої межі властивості\(\mathbb{R}\) (яка розглядається в главі 8). Звичайно, здається, що терміни в послідовності наближаються до 0, тому ми намагаємося показати це строго.

    Ми спостерігаємо, що\[(\forall n \in \mathbb{N})\left|\sin ^{2}(n)\right| \leq 1\] Звідси\[(\forall n \in \mathbb{N})\left|\sin ^{2}(n) / n\right| \leq|1 / n| .\] нехай\(\varepsilon>0\) і\(N \in \mathbb{N}\) бути таким, що\(1 / N \leq \varepsilon\). Тоді для будь-якого\(n \geq N\),\[\left|\sin ^{2}(n) / n-0\right| \leq 1 / n \leq \varepsilon\] Тому\[\lim _{n \rightarrow \infty} \frac{\sin ^{2}(n)}{n}=0 .\] приклад 5.25. Для будь-якого\(n \in \mathbb{N}\), нехай\(a_{n}=(-1)^{n}\). Покажіть, що послідовність\(\left\langle a_{n}\right\rangle\) розходиться.

    Обговорення. Оскільки послідовність чергується між 1\(-1\) і 1, інтуїтивно зрозуміло, що послідовність не схильна до якогось конкретного числа. Ми хочемо показати, що твердження у формі\[(\exists L \in \mathbb{R})(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall n>N)(\ldots)\] є помилковим. Тому ми повинні показати, що заперечення твердження вірно. Тобто\[(\forall L \in \mathbb{R})(\exists \varepsilon>0)(\forall N \in \mathbb{N})(\exists n>N) \neg(\ldots) .\] для будь-якого\(L \in \mathbb{R}\), якщо ми\(\varepsilon<1\) виберемо, ми не зможемо захопити обидва\(-1\) і 1 в\(\varepsilon\) -кварталах L. Це доведе, що послідовність розходиться.

    Нехай\(L \in \mathbb{R}\) і\(\varepsilon<1\). Ми показуємо, що для будь-якого\(N \in \mathbb{N}\), є\(n>N\) таке, що\[\left|(-1)^{n}-L\right| \geq \varepsilon\] Нехай\(N \in \mathbb{N}^{+}\). Ми сперечаємося випадками.

    Припустимо\(L<0\). Тоді\[\left|(-1)^{2 N}-L\right| \geq 1>\varepsilon\] припустимо\(L \geq 0\). Тоді\[\left|(-1)^{(2 N+1)}-L\right| \geq 1>\varepsilon .\] Тому послідовність\(\left\langle a_{n}\right\rangle\) розходиться.

    Приклад 5.26. Для всіх\(n \in \mathbb{N}\) нехай\(a_{n}=\sum_{k=0}^{n}\left(\frac{k}{n}\right)^{2} \frac{1}{n}\). Що таке межа послідовності\(\left\langle a_{n}\right\rangle\)?

    Обговорення. Терміни послідовності можуть бути знайомі вам як суми Рімана, пов'язані з площею під параболою\(f(x)=x^{2}\) між\(x=0\) і\(x=1\). Ми будемо використовувати комбінаторний результат, який ми довели індукцією в останньому розділі.

    За пропозицією 4.6,\ [\ почати {вирівняний} \ lim _ {n\ rightarrow\ infty}\ sum_ {k=0} ^ {n}\ ліворуч (\ frac {k} {n}\ праворуч) ^ {2}\ frac {1} {n} &=\ lim _ {n\ праворуч\ infty}\ ліворуч (\ frac {1} {n} {n} {3}}\ праворуч)\ sum_ {k=0} ^ {n} k^ {2}\ &=\ lim _ {n\ праворуч\ infty}\ ліворуч (\ frac {1} {n^ {3}}\ праворуч)\ frac {(n) (n+1) (2 n+1)} {6 }\\ &=1/3. \ end {aligned}\] Перевірка останньої рівності залишається читачеві як вправа.

    У наступному розділі нас особливо цікавлять нескінченні суми.

    Визначення. Нескінченна сума, часткова сума,\(\sum_{k=0}^{\infty} a_{k}\)\(\left\langle a_{k} \mid k \in \mathbb{N}\right\rangle\) Дозволяти бути послідовністю чисел. \(n^{\text {th }}\)Часткова сума послідовності -\[s_{n}=\sum_{k=0}^{n} a_{k} .\] Нескінченна сума послідовності дорівнює\[\sum_{k=0}^{\infty} a_{k}:=\lim _{n \rightarrow \infty} s_{n} .\] Нескінченна сума - межа послідовності часткових сум,\(\left\langle s_{n}\right\rangle\). Приклад 5.27. Показати, що\[\sum_{k=0}^{\infty} \frac{1}{2^{k}}=2 .\]\(s_{n}\) Дозволяти\(n^{\text {th }}\) часткова сума. Нам потрібно показати, що\[\lim _{n \rightarrow \infty} s_{n}=2 .\] нехай\(\varepsilon>0\) і\(N \in \mathbb{N}\) бути таким, що\(\frac{1}{2^{N}}<\varepsilon\). Ми показуємо\(n \geq N\), що якщо, то\[\left|s_{n}-2\right|<\varepsilon\] Оскільки ряд\(\sum_{k=0}^{\infty} \frac{1}{2^{k}}\) є геометричним, ми знаємо\(n \geq N\), що\[s_{n}=\frac{1-2^{-(n+1)}}{1-1 / 2}=2-2^{-n} .\] так якщо, то\[\left|s_{n}-2\right|=2^{-n}<\varepsilon .\] в аналізі, один часто стосується послідовності функцій \(f_{n}\). Наприклад,\(f_{n}\) може бути поліном Тейлора\(n^{\text {th }}\) -порядку деякої функції\(f\), і хтось хоче знати, чи\(f_{n}\) збігається ця послідовність\(f\); або послідовність\(f_{n}\) може представляти функції, графи яких мають фіксовану граничну криву в\(\mathbb{R}^{3}\) і мають спадні області, і потрібно знати, чи сходиться послідовність до графіка функції з мінімальною площею для цієї межі. Така проблема настільки важлива, що математики вивчають різні способи, за допомогою яких послідовність функцій може сходитися. Найбільш очевидний спосіб точково:

    ВИЗНАЧЕННЯ. Точкова збіжність Послідовність функцій\(f_{n}\) на\(X\) множині точково збігається з функцією,\(f\) якщо для всіх\(x\) в\(X\) послідовність чисел\(\left\langle f_{n}(x)\right\rangle\) сходиться до \(f(x)\).

    Для того, щоб визначення мало сенс, ми вимагаємо\(a \in X\), що\[X \subseteq \bigcap_{n \in \mathbb{N}} \operatorname{Dom}\left(f_{n}\right) .\] Якщо, точкова збіжність послідовності функцій\(\left\langle f_{n}\right\rangle\), в точці\(a\) залежить від збіжності послідовності чисел,\(\left\langle f_{n}(a)\right\rangle\). Якщо ви не розумієте збіжності послідовності чисел, ви не можете зрозуміти збіжність послідовності функцій.

    ПРИКЛАД 5.28. Розглянемо функції\(f_{n}(x)=x^{n}\). На відкритому\((-1,1)\) інтервалі ці функції сходяться точково до 0. У точці 1 функції сходяться до 1; в\(-1\) точці функції не сходяться, тому що значення коливаються між\(+1\) і\(-1\). Поза\((-1,1]\) множиною послідовність функцій розходиться.

    Попередній приклад ілюструє основну задачу з точковою збіжністю: послідовність неперервних функцій\(x^{n}\) на множині\([0,1]\) сходиться, але функція, до якої вона сходиться, не є безперервною. Навіть Коші зробив цю помилку: він заявив як теорему у своїй книзі Courd'analyse 1821 року, що якщо послідовність неперервних функцій сходиться точково, то її межа є безперервною\({ }^{3}\). Щоб обійти цю проблему, введемо поняття рівномірної конвергенції.

    ВИЗНАЧЕННЯ. Рівномірна збіжність Послідовність дійсних функцій,\(f_{n}\) визначених на\(X \subseteq \mathbb{R}\) множині, як кажуть, рівномірно збігається з функцією\(f\)\(\varepsilon>0\),\(X\) якщо для кожного існує\(N \in \mathbb{N}\) така, що для кожного \(x\)в\(X\), коли б\(n>N\) то не було\(\left|f_{n}(x)-f(x)\right|<\varepsilon\). У логічному позначенні:\[(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall x \in X)(\forall n>N) \quad\left|f_{n}(x)-f(x)\right|<\varepsilon\] Зверніть увагу на велику різницю між точковою та рівномірною збіжністю: у точковій збіжності\(N\) може залежати\(x\); при рівномірній збіжності це не може. Важливість рівномірної збіжності випливає з наступної теореми.

    ТЕОРЕМА 5.29. \(f_{n}\)Дозволяти послідовність неперервних функцій на\(X\) що збігається рівномірно до\(f\) на\(X\). Потім\(f\) безперервно ввімкнено\(X\).

    Обговорення. Ми повинні показати\(|f(x)-f(a)|\) малий, коли\(x\) близький до a. Ми знаємо, що\(\left|f_{n}(x)-f(x)\right|\) це мало для всіх\(x\); тому ми уточнюємо

    \({ }^{3}\)Дивіться книгу [4] Імре Лакатоса для цікавого історичного обговорення помилки Коші та відкриття рівномірної конвергенції, Зайделем і Стоксом самостійно в 1847 році. трюк з стор. 133, і додати і відняти одне і те ж двічі, пише\(f(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] .\) Тоді ми намагаємося зробити кожну з трьох згрупованих пар маленькою, тому їх сума невелика. Це іноді називають\(\varepsilon / 3\) аргументом, тому що якщо ми робимо кожен член менше ніж\(\varepsilon / 3\), то їх сума менше, ніж\(\varepsilon\).

    Доказ. Виправте якусь точку\(a \in X\), і нехай\(\varepsilon>0\). Ми повинні знайти\(\delta>0\) так, що\[|x-a|<\delta \quad \Longrightarrow \quad|f(x)-f(a)|<\varepsilon .\] Для цього ми\(f(x)-f(a)\) розділимо на три частини:\[f(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] .\] Виберіть\(N\) так, що\(n \geq N\) означає\(\left|f_{n}(x)-f(x)\right|<\varepsilon / 3\) для всіх\(x\). Вибирайте\(\delta>0\) так, щоб\(\left|f_{N}(x)-f_{N}(a)\right|<\varepsilon / 3\) коли завгодно\(|x-a|<\delta\). Тоді за нерівністю трикутника, бо\(|x-a|<\delta\), ми маємо\ [\ begin {вирівняний} |f (x) -f (a) | &\ leq\ ліво|f (x) -f_ {N} (x)\ right|+\ left|f_ {N} (x) -f_ {N} (a)\ right|+\ left|f_ {N} (a) -f (a))\ праворуч |\\ &\ leq\ frac {\ варепсилон} {3} +\ frac {\ varepsilon} {3} +\ frac {\ varepsilon} {3} =\ varepsilon. \ end {вирівняний}\] Питання. Де ми використовували гіпотезу про те, що конвергенція була рівномірною?

    Ми можемо використати теорему\(5.29\), наприклад, щоб довести, що експоненціальна функція є неперервною. Експоненціальна функція розглядається як її ряд Тейлора.\[e^{x}=\sum_{k=0}^{\infty} \frac{x^{k}}{k !} .\] Нагадаємо, що вираз\(\sum_{k=0}^{\infty} \frac{x^{k}}{k !}\) є скороченням для «\[\lim _{n \rightarrow \infty} \sum_{k=0}^{n} \frac{x^{k}}{k !} .\]Для будь-якого дійсного числа»\(a, \sum_{k=0}^{\infty} \frac{a^{k}}{k !}\) є нескінченною сумою, яка сходиться, якщо збігається відповідна послідовність часткових сум. За тестом співвідношення експоненціальний ряд сходиться для всіх реальних\(a\). (Для формального підтвердження тесту співвідношення див Теорема 8.9).

    Пропозиція 5.31. Експоненціальна функція є безперервною\(\mathbb{R}\).

    Доказ. \[p_{n}(x):=\sum_{k=0}^{n} \frac{x^{k}}{k !}\]Дозволяти бути поліном Тейлора\(n^{\text {th }}\) -порядку. Ми знаємо, що кожен\(p_{n}\) є безперервним, за пропозицією\(5.23\). Якби ми знали, що\(p_{n}(x)\) сходилися рівномірно\(e^{x}\), ми б зробили Теорема\(5.29\).

    Неправда, що\(p_{n}\) сходиться рівномірно\(\mathbb{R}\) (чому?). Однак послідовність сходяться рівномірно на кожному інтервалі\([-R, R]\), і це досить добре, щоб зробити висновок, що\(e^{x}\) є безперервним\(\mathbb{R}\) (чому?).

    Щоб побачити це останнє твердження, виправте\(R>0\) і\(\varepsilon>0\). Ми повинні знайти\(N\) так, щоб, для всіх\(n>N\) і всіх\(x \in[-R, R]\), у нас є\(\left|e^{x}-p_{n}(x)\right|<\varepsilon\). Зверніть увагу\(n\), що\[\left|e^{x}-p_{n}(x)\right|=\left|\frac{x^{n+1}}{(n+1) !}+\frac{x^{n+2}}{(n+2) !}+\ldots\right| .\] для кожного, права сторона максимізується\([-R, R]\) за його значенням на\(R\) (чому?) ; і зі\(n\) збільшенням цей залишок зменшується монотонно (тому що ви втрачаєте все більше позитивних умов). Як ми знаємо експоненціальний ряд для\(e^{R}\) сходжень, вибирайте\(N\) так,\(e^{R}-p_{N}(R)\) що менше\(\varepsilon\). Тоді для всіх\(x\)\([-R, R]\) і всіх\(n \geq N\), у нас є\(\left|e^{x}-p_{n}(x)\right|<\varepsilon\), за бажанням.

    Функції синуса та косинуса також можуть бути визначені через їх ряди Тейлора:\ [\ begin {вирівняні} &\ sin (x)\ quad: =\ sum_ {n=0} ^ {\ infty} (-1) ^ {n}\ frac {x^ {2 n+1}} {(2 n+1)!} \\ &\ cos (x)\ квад: =\ sum_ {n=0} ^ {\ infty} (-1) ^ {n}\ розрив {x^ {2 n}} {(2 n)!} . \ end {aligned}\] Вони можуть бути доведені як неперервні подібними аргументами. ЗАУВАЖЕННЯ. Зверніть увагу, що в наших визначеннях меж та безперервності ми використовуємо абсолютне значення лише для вимірювання відстаней. Іншими словами, ми говоримо,\(f\) що безперервно,\(a\) якщо, для всіх\(\varepsilon>0\), ми можемо знайти\(\delta>0\), такий, що всякий раз,\(a\) коли відстань від\(x\) до менше\(\delta\), то відстань від\(f(x)\)\(f(a)\) до менше\(\varepsilon\). Це визначення має цілком хороший сенс, коли у вас є спосіб вимірювання відстаней на домені та кодомені. Наприклад, якщо функція відображає\(\mathbb{R}^{m}\)\(\mathbb{R}^{n}\), можна виміряти відстані звичайним евклідовим способом. У ще більшій загальності математики використовують щось, що називається метриками, для вимірювання відстаней, і як тільки у одного є метрики, можна обговорити безперервність функцій аналогічно нашому обговоренню реальних функцій.

    Математика цієї глави - уважний погляд на поведінку реальних функцій - називається Аналіз. Це включає одну з трьох основних дисциплін чистої математики; інші дві - геометрія та алгебра. Хорошим вступом до аналізу є книга Вальтера Рудіна [?].

    Вправи

    ВПРАВА 5.1. Доведіть, що визначення ліміту на сторінках 129 і 130 однакові.

    ВПРАВА 5.2. Доведіть Лемма 5.14, і пов'язане з цим твердження\(|c|-|d| \leq|c+d|\).

    ВПРАВА 5.3. Для\(n \in \mathbb{N}^{+}, a_{i} \in \mathbb{R}(1 \leq i \leq n)\), довести, що\[\left|\sum_{i=1}^{n} a_{i}\right| \leq \sum_{i=1}^{n}\left|a_{i}\right| .\] вправа 5.4. Доведіть Лемма\(5.15\).

    ВПРАВА 5.5. Доведіть частину (v) теореми 5.9.

    Вправа 5.6. Наведіть приклад двох функцій\(f\) і\(g\) які не мають обмежень в точці,\(a\) але такі, що\(f+g\) робить. Для тієї ж пари функцій,\(f-g\) також може мати обмеження на\(a\)? ВПРАВА 5.7. Припустимо, що\(f\) це реальна функція і\(\lim _{x \rightarrow a} f(x)=\)\(L\). Доведіть, що якщо\(X \subseteq \operatorname{Dom}(f)\), то\[\lim _{X \ni x \rightarrow a} f(x)=L .\] ВПРАВА 5.8. Скористайтеся методом Архімеда (метод сум Рімана), щоб довести це\[\int_{0}^{1} x^{2} d x=\frac{1}{3}\] (Вам потрібно буде знати формулу для\(\sum_{k=0}^{n} k^{2}\) - див. Пропозиція 4.6).

    Вправа 5.9. Скористайтеся методом Архімеда, щоб довести це\[\int_{0}^{1} x^{3} d x=\frac{1}{4} .\] (Див. Вправа 4.16).

    ВПРАВА 5.10. Доведіть, що функція Хевісайд має як ліву, так і праву межі на\(0 .\)

    ВПРАВА 5.11. Доведіть, що функція має межу в точці, якщо і тільки якщо вона має як ліву, так і праву межі в цій точці і їх значення збігаються.

    ВПРАВА 5.12. Доведіть, що теорема\(5.9\) застосовується до обмежених меж.

    Вправа 5.13. Точка\(a\) є граничною точкою\(X\) множини, якщо для кожного\(\delta>0\) існує точка\(x\) в\(X \backslash\{a\}\) с\(|x-a|<\delta\). \(f\)Дозволяти бути реальною функцією на\(X \subseteq \mathbb{R}\). Доведіть, що якщо\(a\) є граничною точкою\(X\), то якщо\(f\) має обмежений ліміт на\(a\) це є унікальним. Доведіть, що якщо не\(a\) є граничною точкою\(X\), то кожне дійсне число є обмеженою межею\(f\) в\(a\).

    Вправа 5.14. Доведіть, що\(\lim _{x \rightarrow 0} \sin (x) / x=1\).

    Вправа 5.15. Доведіть пропозицію 5.22.

    Вправа 5.16. Доведіть, що функція\(f(x)=x\) безперервна всюди на\(\mathbb{R}\). Вправа 5.17. Формула чисел Фібоначчі наведена у вправі 4.12. Оцінити\(\lim _{n \rightarrow \infty} F_{n+1} / F_{n}\).

    ВПРАВА 5.18. Наскільки великим має\(n\) бути, щоб переконатися, що\(F_{n+1} / F_{n}\) знаходиться в межах\(10^{-1}\) межі у Вправі 5.17? В межах\(10^{-2}\)? В межах\(10^{-k}\)?

    Вправа 5.19. Визначте функцію\(\psi: \mathbb{R} \rightarrow \mathbb{R}\)\[\psi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ 1 & x \in \mathbb{Q} .\end{cases}\] Доведіть, що\(\psi\) є переривчастим скрізь.

    Вправа\(5.20\). Визначте функцію\(\phi: \mathbb{R} \rightarrow \mathbb{R}\)\[\phi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ \frac{1}{n} & x \in \mathbb{Q} \backslash\{0\}, x=\frac{m}{n}, \operatorname{gcd}(m, n)=1, n>0 \\ 1 & x=0 .\end{cases}\] Доведіть, що\(\phi\) є безперервним у кожному ірраціональному числі та переривчастим у кожному раціональному числі.

    ВПРАВА 5.21. Довести, що реальна функція\(f\) на відкритому інтервалі\(I\) є безперервним в будь-якій точці, де існує її похідна, тобто де\[\lim _{x \rightarrow a} \frac{f(x)-f(a)}{x-a}\] існує. У чому зворотне це твердження? Доведіть, що зворотне не відповідає дійсності.

    ВПРАВА 5.22. Доведіть, що якщо функція\(f\) має межу\(L\) від правого на\(a\), то послідовність\(f\left(a+\frac{1}{n}\right)\) має межу\(L\) як\(n \rightarrow \infty\). Покажіть, що зворотне є помилковим загалом.

    ВПРАВА 5.23. \(g\)Дозволяти\(f\) і бути реальними функціями. Нехай\(a \in \mathbb{R}\) і припустимо, що\[\lim _{x \rightarrow a} g(x)=L_{1}\] і\[\lim _{x \rightarrow L_{1}} f(x)=L_{2} .\] довести,\(g\) що\[\lim _{x \rightarrow a} f \circ g=L_{2} .\] якщо безперервний в\(a\) і\(f\) безперервно в\(g(a)\), є\(f \circ g\) безперервний при\(a\)?

    Вправа 5.24. \(f\)Дозволяти бути реальною функцією,\(a \in \mathbb{R}\) і\(\lim _{x \rightarrow a} f(x)=\)\(L\). Якщо\(\left\langle a_{n}\right\rangle\) сходиться до\(a\), довести, що\(\left\langle f\left(a_{n}\right)\right\rangle\) сходиться до\(L\).

    Вправа 5.25. Повний приклад 5.26. Тобто довести, що\[\lim _{n \rightarrow \infty}\left(\frac{1}{n^{3}}\right) \frac{(n)(n+1)(2 n+1)}{6}=1 / 3 .\] ВПРАВА 5.26. Оцініть\[\lim _{n \rightarrow \infty} \sum_{k=0}^{n}\left(\frac{k}{n}\right) \frac{1}{n} .\] Чи можете ви дати геометричну інтерпретацію цієї межі?

    ВПРАВА 5.27. Використовуйте індукцію, щоб довести, що кожен многочлен є безперервним при кожному дійсному числі.

    ВПРАВА 5.28. Нехай\(-1<x<1\). Доведіть, що геометричний ряд зі співвідношенням\(x, \sum_{k=0}^{\infty} x^{k}\), сходиться до\(\frac{1}{1-x}\).

    ВПРАВА 5.29. Нехай числа Фібоначчі\(F_{n}\) будуть визначені як у вправі 4.12. Розглянемо силові ряди\(F(x)=\sum_{n=1}^{\infty} F_{n} x^{n}\). Доведіть, що степеневий ряд задовольняє\[F(x)=x^{2} F(x)+x F(x)+x .\] Розв'язати (5.32) для\(F(x)\), розкласти його на часткові дроби, і\(5.28\) використовувати Вправа для отримання Формули\(4.20\). Ця методика знайти формулу для\(F_{n}\) вивчення функції часто\(F\) є плідною. Функція\(F\) називається генеруючою функцією для послідовності.

    ВПРАВА 5.30. Припустимо, один визначає послідовність з таким же співвідношенням повторення, що і числа Фібоначчі\(F_{n+2}=F_{n+1}+F_{n}\), але з різними початковими значеннями для\(F_{1}\) і\(F_{2}\). Знайти генеруючу функцію для нової послідовності і, отже, обчислити формулу для загального члена. Чи\(\lim _{n \rightarrow \infty} F_{n+1} / F_{n}\) завжди одне і те ж?

    ВПРАВА 5.31. Доведіть, що синус і косинус є безперервними функціями на всіх\(\mathbb{R}\).

    ГЛАВА 6

    Кардинальність

    У цьому розділі ми використовуємо функції для вивчення ідеї розміру набору. Результати, які ми отримуємо, є глибокими та дуже цікавими, особливо якщо врахувати простоту інструментів, які ми використовуємо. Звичайно, нам доведеться використовувати ці інструменти дещо спритно.

    Теорія набору поставляється в різних смаках. Найскладнішою є аксіоматична теорія множин. Багато цікавих результатів було отримано в формальній теорії аксіоматичних множин, але тема просунута і не підходить для вступу у вищу математику. Замість цього ми вивчимо те, що називається теорією наївних множин. Вживання слова «наївний» не є зневажливим, але покликане диференціювати цей підхід від аксіоматичної теорії множин. Більшість математиків вивчали теорію наївних множин, але відносно небагато працювали з безліччю аксіом.

    Кардинальність

    Бажаємо порівняти розміри наборів. Фундаментальним інструментом нашого дослідження є біекція. У випадку з кінцевими множинами, які можна вичерпно перерахувати, це легко. З огляду на будь-які два кінцевих\(X\) множини, і\(Y\), ми могли б перерахувати елементи і підрахувати їх. За умови, що наші списки не мають надмірностей, більший набір - це той, з більшим числом. Акт перерахування елементів у множині, де це можливо, також визначає біекцію від натурального числа (інтерпретується як множина) до підрахованої множини. Ідея використання функцій для порівняння розмірів множин може бути узагальнена до довільних множин.

    Коли справа доходить до порівняння розміру нескінченних множин, є конкуруючі інтуїції. З одного боку, у нас є інтуїція, що якщо один набір є належним підмножиною іншого набору, він повинен бути меншим. З іншого боку, якщо дві множини нескінченні, як один може бути більшим за інший? Використання біекцій, ін'єкцій та відмовок для визначення відносного розміру множин дозволяє нам побачити наш шлях через цей парадокс.

    Визначення. Рівнодення, кардинальність Нехай\(X\) і\(Y\) бути множин. Ми говоримо, що\(X\) і\(Y\) мають таку ж кардинальність, якщо є біекція\(f: X \mapsto Y\). Ми можемо висловити, що два набори мають однакову кардинальність по\[|X|=|Y| .\] Якщо\(|X|=|Y|\), то ми говоримо, що\(X\) і\(Y\) рівноправні.

    ПРЕТЕНЗІЯ. Рівноцінність - це відношення еквівалентності.

    (Доведіть це: Вправа 6.2).

    Хоча ми використовували ідеї скінченних і нескінченних раніше, ми будемо визначати ідеї з точки зору двобікцій.

    ВИЗНАЧЕННЯ. Кінцевий, нескінченний\(X\) Дозволяти бути множиною. \(X\)є кінцевим, якщо існує деякі\(n \in \mathbb{N}\) і біекція\(f:\ulcorner n\urcorner \mapsto X\). У тому випадку\(X=\emptyset\), ми говоримо, що\(X\) є двооб'єктивним з\(\ulcorner 0\urcorner\) через порожню функцію. Якщо не\(X\) кінцевий, ми говоримо, що\(X\) нескінченно.

    Таким чином, множина є кінцевим, якщо він є двооб'єктивним з набором\(\ulcorner n\urcorner\) для деяких\(n \in \mathbb{N}\). Напевно, не дивно, що множина не може бути двооб'єктивною з різними натуральними числами.

    ПРОПОЗИЦІЯ 6.1. Нехай\(m, n \in \mathbb{N}\). Потім\[(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Longleftrightarrow(m=n) .\] обговорення. Нетривіальний напрямок цього біумовного доведено шляхом індукції на одне з цілих чисел у твердженні.

    ДОКАЗ. \(\Leftarrow\)

    Нехай\(m=n\). Тоді очевидно, що\[|\ulcorner m\urcorner|=|\ulcorner n\urcorner| .\]\(\Rightarrow\)

    Сперечаємося індукцією далі\(m\).

    Базовий випадок:

    Якщо\(m=0\) і\(\left|\left\ulcorner^{n}\right\urcorner\right|=\mid\left\ulcorner_{m}||\right.\) то чітко\(n=0\).

    Індукційний крок:

    Нехай\(m \in \mathbb{N}\) і припустимо, що\[(\forall n \in \mathbb{N})\left[\left|\left\ulcorner^{\prime}\right\urcorner\right|=|\ulcorner\urcorner|\right] \Rightarrow[m=n]\] Ми показуємо, що\[(\forall n \in \mathbb{N})[|\ulcorner m+1\urcorner|=|\ulcorner n\urcorner|] \Rightarrow[m+1=n]\]\[\left|\left\ulcorner^{m}+1\right\urcorner\right|=\left|\left\ulcorner^{\urcorner} n\right\rangle\right|\] Припустимо, що нехай\[f:\ulcorner m+1\urcorner \longmapsto\ulcorner n\urcorner\] обговорення. Природним способом продовжити цей аргумент є обмеження області\(f\) до\(\ulcorner m\urcorner\) і використання індукційної гіпотези. На жаль, якщо\(f(m) \neq n-1\) тоді\(\left.\left.f\right|_{\ulcorner m}\right\urcorner\) не біекція від\(\ulcorner m\urcorner\) до\(\ulcorner n-1\urcorner\), і індукційна гіпотеза безпосередньо не застосовуватиметься. Щоб вирішити цю проблему, ми визначимо перестановку,\(g:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner\) яка переставляє елементи\(\ulcorner m+1\urcorner\) так, що\(f \circ g\) буде задовольняє біекція\[(f \circ g)(m)=n-1\] Визначимо\(g:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner\) наступним чином:\ [g (x) =\ left\ {\ begin {array} {clc} f^ {-1} (n-1) &\ text {якщо} & x = m\\ m &\ text {якщо}\ quad x=f^ {-1} (n-1)\\ x &\ text {інакше.} \ end {масив}\ право.\] Нехай\(h=f \circ g\). Потім\(h\) йде біекція і\[h(m)=(f \circ g)(m)=n-1\]зображення

    МАЛЮНОК 6.2. Зображення перестановки\(g\)

    Тому\[\left.h\right|_{\left\ulcorner_{m}\right\urcorner}:\ulcorner m\urcorner \mapsto\ulcorner n-1\urcorner .\] За індукційною гіпотезою\[m=n-1 .\] Тому\[m+1=n .\] За принципом\[(\forall m \in \mathbb{N})(\forall n \in \mathbb{N})(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Rightarrow(m=n) .\] індукції НАСЛІДКИ 6.3. Якщо\(X\) є скінченною множиною, є точно один\(n \in \mathbb{N}\) такий, що\(\ulcorner n\urcorner\) є біктивним з\(X\).

    Обговорення. Це стандартний аргумент унікальності. Ми припускаємо, що множина є двооб'єктивною з натуральними числами\(\ulcorner n\urcorner\) і\(\ulcorner m\urcorner\), і ми використовуємо, що композиція біекцій є біекцією, щоб показати, що\(m=n\). Це не є доказом протиріччя. Швидше ми доказуємо, що будь-які два імена для натуральних чисел, які є двооб'єктивними з\(X\) повинні називати одне і те ж натуральне число. Доказ. \(X\)є кінцевим, так є\(n \in \mathbb{N}\) таке, що\[|X|=|\ulcorner n\urcorner| .\] нехай\(m \in \mathbb{N}\) і\[|X|=|\ulcorner m\urcorner| .\] нехай\(f: X \mapsto\ulcorner n\urcorner\) і\(g: X \mapsto\ulcorner m\urcorner\). Потім\(g^{-1}:\ulcorner m\urcorner \mapsto X\). Склад біекцій - це біекція, тому\[f \circ g^{-1}:\ulcorner m\urcorner \mapsto\ulcorner n\urcorner .\] за пропозицією 6.1,\[m=n .\] ВИЗНАЧЕННЯ. Кінцева кардинальність Якщо\(X\) є кінцевою множиною, ми говоримо, що вона має кінцеву кардинальність. \(n \in \mathbb{N}\)Дозволяти унікальне натуральне число таке, що\(\ulcorner n\urcorner\) є двооб'єктивним с\(X\). Тоді ми говоримо, що\(X\) має кардинальність\(n\), або\[|X|=n \text {. }\] Слідство\(6.3\) гарантує, що кардинальність скінченної множини чітко визначена.

    Нескінченні набори

    Нескінченні набори загадкові. Багато класичних парадоксів звертаються до історичних плутанини щодо ідеї нескінченності. У той же час математики з давніх греків далі вважали неможливим розвиток математичного мислення без використання нескінченності. Чому це так? З метафізичної точки зору ідея нескінченності, мабуть, не потрібна. З фізичної точки зору доказів нескінченності немає. Тобто Всесвіт, як ми її розуміємо, кінцева. Навіть з богословської точки зору нескінченність в якійсь мірі є доповненням скінченного - і відповідно породжує власні парадокси.

    Нескінченність занепокоїла деяких математиків і філософів, і деякі намагалися обійтися без неї. Прихильників цієї школи не так багато. Ідея нескінченності настільки корисна, що студенту-математику доведеться розвинути певний комфорт з ідеєю - і її логічними наслідками. У будь-якому випадку, нескінченність явно існує в математичному всесвіті, незалежно від того, існує вона в природному світі чи ні, і використання нескінченності має вирішальне значення для розвитку математичного розуміння природного світу. У цьому розділі ми починаємо дослідження нескінченних множин.

    Ми будемо використовувати ін'єкції та відмови, щоб побудувати деякі аналітичні машини для порівняння наборів.

    ПОЗНАЧЕННЯ. \(\preceq\)Нехай\(X\) і\(Y\) будуть набори. Ми пишемо,\(X \preceq Y\) якщо є ін'єкція\[f: X \rightarrow Y \text {. }\] Це позначення говорить про те, що в умовах визначення ми думаємо про те\(X\), що «не більше» ніж\(Y\). Це має сенс, оскільки ми здатні асоціювати з будь-яким елементом\(X\) окремого елемента\(Y\). Якщо\(f\) у визначенні є відсмоктування, то\(f\) це також біекція і\(|X|=|Y|\). В іншому випадку,\(f\) це функція, яка пов'язує з кожним елементом діапазону\(f\) (який є належним підмножиною\(Y\)) унікального елемента\(X\), і\(Y\) все ще має деякі елементи, які не враховуються \(f\). Тож\(Y\) може бути «більшим»\(X\), ніж, але це, звичайно, не буде «меншим». Ви можете розглянути це визначення в окремому випадку скінченних множин\(X\) і\(Y\). Ви помітите, що\[X \preceq Y \Longleftrightarrow|X| \leq|Y| .\] У вправі 6.3 вас просять довести, що\(\preceq\) це перехідний і рефлексивний.

    ЗАУВАЖЕННЯ. Чи можна порівняти будь-які два набори по відношенню до\(\preceq\)? Досить дивно, що це вимагає більш просунутого припущення, званого Аксіомою вибору (див. Додаток B), щоб гарантувати порівнянність всіх пар множин. Практично всі математики приймають Аксіому Вибору. Ми припустимо аксіому вибору в цьому тексті.

    Якщо\(X \preceq Y\) і\(Y \preceq X\), то ми б сподівалися, що\(X\) і\(Y\) мають однаковий розмір. Це дійсно правда, хоча доказ трохи складний. Результат дуже корисний, адже часто набагато простіше записати дві ін'єкції, ніж одну біін'єкцію. ТЕОРЕМА 6.4. Теорема Шредера-Бернштейна Нехай\(X\) і\(Y\) бути множинами. Якщо\(X \preceq Y\) і\(Y \preceq X\), то\(|X|=|Y|\).

    Обговорення. Ідея цього доказу полягає в наступному. Ми показуємо, що\(|X|=|Y|\) шляхом побудови біекції\(F: X \nrightarrow Y\). Нам дають уколи\(f: X \rightarrow Y\) і\(g: Y \rightarrow X\). Будуємо\(F\) з використанням уколів\(f\) і в\(g\) якості напрямних. Тобто ми хочемо визначити\(F\) так, щоб для кожного\(x \in X\), або\(F(x)=f(x)\) або\(F(x)=g^{-1}(x)\). Очевидно, що цього не можна зробити наосліп. Наприклад, якщо\(x \in X \backslash g[Y]\), наша рука змушена, і\(F(x)=f(x)\). Аналогічно\(y \in Y \backslash f[X]\), якщо, наш єдиний шанс досягти нашої мети - це для\(F(g(y))=y\). Якщо ми зробимо неправильний вибір для\(F(x)\), ми втратимо використання\(f\) і\(g\) як напрямні. Ми можемо вважати, що\(F\) не визначилися\(x\) з так\(f\) і\(g^{-1}\) не згодні. Рішення полягає в тому, щоб використовувати\(f\) і\(g\) рухатися вперед і назад між\(X\) і\(Y\) поки ми не виявимо, що наша рука змушена.

    Доказ. Нехай\[f: X \rightarrow Y\] і\[g: Y \rightarrow X\] будуть ін'єкції. Можна припустити, що\(X\) і\(Y\) є неспільними.

    Обговорення. Якщо\(X\) і\(Y\) не роз'єднані, ми можемо замінити на\(X \times\{0\}\) і\(X\)\(Y\) з\(Y \times\{1\}\). Існування біекції\[g: X \times\{0\} \mapsto Y \times\{1\}\] явно передбачає існування біекції від\(X\) до\(Y\).

    Якщо\(x \in X\) ми говоримо\(y \in Y\), це попередник\(x\) if\(g(y)=x\). Аналогічно, якщо\(y \in Y\) говорити, що\(x \in X\) це попередник\(y\) if\(f(x)=y\). Можна, щоб елемент не мав попередника. Наприклад, якщо\(x \in X \backslash g[Y]\), то не\(x\) має попередника. Однак, якщо елемент має попередника, цей попередник є унікальним (оскільки\(f\) і\(g\) є обома ін'єкціями). Задано елемент\(w\),\(m(w)\) нехай дорівнює 0, якщо\(w\) не має попередника. В іншому випадку, нехай\(m(w)\) буде максимальне число\(N \geq 1\) таке, що існує кінцева послідовність\(\left\langle z_{n} \mid 0 \leq n \leq N\right\rangle\) для деяких\(N \geq 1\) задовольняє

    (1)\(w=z_{N}\)

    (2) For\(n<N, z_{n}\) є попередником\(z_{n+1}\), якщо максимум існує. Якщо максимум не існує (тобто якщо можна зробити довільно довгі ланцюжки попередників), нехай\(m(w)=\infty\).

    Тепер визначте\ [\ почати {вирівняний} X_ {e} &=\ {x\ in X\ середина м (x)\ текст {парний}\\ X_ {o} &=\ {x\ in X\ середина m (x)\ текст {непарний}\\ X {i} &=\ {x\ in X\ середина m (x) =\ infty\}\ Y_ {e} &=\ {y\ in Y\ середина m (y)\ текст {парний}\\ Y_ {o} &=\ {y\ in Y\ середина m (y)\ text {непарний }\\ Y_ {i} &=\ {y\ in Y\ mid m (y) =\ infty\} \ end {aligned}\] Колекція, очевидно,\[\left\{X_{e}, X_{o}, X_{i}\right\}\] є розділом\(X\). Аналогічним чином\[\left\{Y_{o}, Y_{e}, Y_{i}\right\}\] відбувається перегородка з\(Y\).

    Зараз ми в змозі визначити біекцію між\(X\) і\(Y\). Нехай\ [F (x) =\ лівий\ {\ begin {масив} {ccc} f (x) &\ text {якщо} & x\ in X_ {i}\\ f (x) &\ text {якщо} & x\ in X_ {e}\ g^ {-1} (x) &\ text {якщо} & x\ in X_ {o}. \ end {масив}\ право.\] Обговорення. У нас залишилася певна робота в цьому доказі. Нам потрібно перевірити, що\(F\) це біекція від\(X\) до\(Y\). Ідея визначення\(F\) може бути не очевидною, тому давайте досліджуємо мотивацію для визначення. Припустимо,\(g\) що\(f\) і не можуть бути припущеннями (якщо будь-яка з функцій є surjection, не було б нічого, щоб довести, оскільки це також буде біекція). Нехай\(x \in X \backslash g[Y]\) і\(y \in Y \backslash f[X]\). Так як\(x \notin g[Y]\), єдиний можливий вибір для\(F(x)\) є\(f(x)\). Аналогічно\(y \notin f[X]\), і єдино можливе значення\(F^{-1}(y)\) є\(g(y)\). Але це не вирішує всіх наших проблем. Набір\(X \backslash g[Y]\) складається з тих членів\(X\), які не мають попередників, і\(Y \backslash f[X]\) складається\(Y\) з членів без попередників. Якщо ми хочемо визначити,\(F\) зібравши разом\(f\) і\(g\), ми виявили, що наші руки були змушені цими наборами. Тепер припустимо, що\(x \in X\) має рівно один попередник. Тоді не\(g^{-1}(x)\) має попередника. Як ми спостерігали раніше, нам потрібно задовольнити,\[F^{-1}\left(g^{-1}(x)\right)=g\left(g^{-1}(x)\right)=x\] і тому ми повинні задовольнити\[F(x)=g^{-1}(x) .\] Аналогічно, якщо\(y \in Y\) має рівно один попередник, ми повинні задовольнити\[F^{-1}(y)=f^{-1}(y) .\] Якщо елемент\(w\)\(X \cup Y\) має скінченно багато попередників,\(\left.F\right|_{A(w)}\) буде визначатися обмеженням, накладене попередником без попередника.

    Ми стверджуємо, що\[F: X \mapsto Y .\] Це легко помітити,\(F\) що чітко визначено. Оскільки\(X_{o} \subseteq g[Y]\) і\(g\) є ін'єкцією,\(\left.F\right|_{X_{o}}=\left.g^{-1}\right|_{X_{o}}\) чітко визначена. \(F\)Це чітко визначено\(X_{e}\) і\(X_{i}\) очевидно. Крім того\ [\ почати {зібрано} F\ ліворуч [X_ {e}\ праворуч] =f\ ліворуч [X_ {e}\ праворуч] =Y_ {o}\ F\ ліворуч [X_ {o}\ праворуч] =g^ {-1}\ left [X_ {o}\ право] =Y_ {e} \ end {зібрано}\] і\[F\left[X_{i}\right]=f\left[X_{i}\right]=Y_{i} .\] обговорення. Хоча у нас не було вибору у визначенні\(F\) на\(X_{e}\) і\(X_{o}\), ми могли б\(F\) так визначити\(\left.F\right|_{X_{i}}=\left.g^{-1}\right|_{X_{i}}\).

    Тому,

    \(F[X]=F\left[X_{e} \cup X_{o} \cup X_{i}\right]=f\left[X_{e}\right] \cup g^{-1}\left[X_{o}\right] \cup f\left[X_{i}\right]=Y_{o} \cup Y_{e} \cup Y_{i}=Y .\)Так\(F\) само і відсторонення. Ми показуємо, що\(F\) це ін'єкція. Нехай\(x, z \in X\), і припустимо\(F(x)=F(z)\). Якщо\(x \in X_{e}\), то\(F(x) \in Y_{o}\) і\(z \in X_{e}\). Звідси\[F(x)=f(x)=f(z)=F(z) .\] Оскільки\(f\) це ін'єкція, так і є\(\left.f\right|_{X_{e}}\). Тому\(x=z\).

    Якщо\(x \in X_{o}\), то\(F(x) \in Y_{e}\) і\(z \in X_{o}\). Отже\[F(x)=g^{-1}(x)=g^{-1}(z)=F(z) .\] Функція\(g\) - це ін'єкція, тому\(\left.g^{-1}\right|_{X_{o}}\) є ін'єкцією і так\(x=z\).

    Нарешті, якщо\(x \in X_{i}\), то\(F(x) \in X_{i}\) і\(z \in X_{i}\). Так\[F(x)=f(x)=f(z)=F(z) .\] Так\(f\) що це ін'єкція,\(x=z\).

    Тому\(F\) проводиться ін'єкція. Звідси\[F: X \mapsto Y\] і\[|X|=|Y| .\] ТЕОРЕМА 6.5. \(\mathbb{N}\)є нескінченним набором.

    Обговорення. Ми показуємо, що будь-яка функція з доменом\(\ulcorner n\urcorner\), для\(n \in\)\(\mathbb{N}\), не може бути surjection. Тому не\(\mathbb{N}\) є кінцевим.

    Доказ. Припустимо\(n \in \mathbb{N}\), і\[f:\ulcorner n\urcorner \longrightarrow \mathbb{N} .\] нехай\[a=1+\sum_{i=0}^{n-1} f(i) \in \mathbb{N} .\] ясно\(a \notin f[\ulcorner n\urcorner]\), так\(f\) це не відмова. Отже, немає того,\(n \in \mathbb{N}\) що може бути нанесено на екстрактивно\(\mathbb{N}\). Тому не\(\mathbb{N}\) є кінцевим. Мало того, що це\(\mathbb{N}\) нескінченна безліч, це в деякому сенсі «найменший» нескінченний набір.

    ТЕОРЕМА 6.6. Якщо\(X\) нескінченно, то\(\mathbb{N} \preceq X\).

    Обговорення. Ми визначимо ін'єкцію\(f: \mathbb{N} \rightarrow X\) індуктивно, нарощуючи його по одному кроку за раз.

    ProOF. Як\(X\) нескінченно, він не порожній, тому повинен містити якийсь елемент\(x_{0}\). Визначте\(f(0)=x_{0}\).

    Тепер припустимо,\(x_{0}=f(0), x_{1}=f(1), \ldots, x_{n}=f(n)\) що все було вибрано, так що\[\left.f\right|_{\{0,1, \ldots, n\}}=\left.f\right|_{n+1\urcorner}: k \mapsto x_{k}\] це ін'єкційно. Як\(X\) нескінченно, функція,\(\left.f\right|_{\left.{ }_{n+1}\right\urcorner}\) яку ми визначили, не може бути суб'єктивною. Таким чином, існує деякі\(x_{n+1}\) в\(X \backslash\left\{x_{0}, \ldots, x_{n}\right\}\). Визначте\(f(n+1)=x_{n+1}\). Продовжуючи таким чином, ми досягаємо ін'єкції,\(f\) визначеної на всіх з\(\mathbb{N}\).

    ЗАУВАЖЕННЯ. Проникливий читач, можливо, помітив, що в попередньому доказі ми в кінцевому підсумку робимо нескінченну кількість варіантів елементів\(X\).

    ВИЗНАЧЕННЯ. Кардинальність,\(\aleph_{0}\) Використовуємо вираз\(\aleph_{0}\) (читаємо «aleph nought» 1) для розміру\(\mathbb{N}\). Тобто\[\aleph_{0}:=|\mathbb{N}| \text {. }\] Розмір набору називається кардинальністю набору. Будь-яка множина, яка є двооб'єктивною з,\(\mathbb{N}\) має кардинальність\(\aleph_{0}\). Кінцева множина має кардинальність, рівну унікальному натуральному числу, з яким воно є двооб'єктивним.

    ВИЗНАЧЕННЯ. Підрахувальний Набір, який є кінцевим або має кардинальність\(\aleph_{0}\), називається обчислювальним набором.

    Ми формально не розвиваємо ідею кардинальності. Це вимагало б роботи з порядковими номерами, які б відволікали нас від більш безпосередніх математичних інтересів. Однак ми будемо використовувати мову

    \({ }^{1} \aleph\)це перша буква єврейського алфавіту. і умовності кардиналів, де вона інтуїтивно зрозуміла і не заважає нашій програмі.

    незліченні набори

    У цьому розділі ми доводимо один з найбільш чудових результатів сучасної математики. Є набори, які не підлягають підрахунку. Коли цей результат був вперше повідомлений в 1878 році Георгом Кантором, він здивував математичний світ. З цього результату випливає, що в найбільш значущому сенсі існують різні розміри нескінченності. Припустимо,\(X\) це не лічильний набір. За теоремою 6.6,\(\mathbb{N} \preceq X\). За теоремою Шредера-Бернштейна, якщо\(X \preceq \mathbb{N}\), то\(|\mathbb{N}|=|X|\), і\(X\) буде підраховано. Так\(X\) що якщо не злічити\(X \npreceq \mathbb{N}\), і\(\mathbb{N} \prec X\). Тобто\[\aleph_{0}<|X| \text {. }\] ВИЗНАЧЕННЯ. Незліченні Набір, який не підлягає зліку, називається незліченним.

    Звичайно, нам ще належить показати, що є якісь незліченні набори.

    ПОЗНАЧЕННЯ. \(\prec\)Нехай\(X\) і\(Y\) будуть набори. Тоді\(X \prec Y\) за умови, що\[X \preceq Y\] і\[|X| \neq|Y| .\] Ми пишемо\(|X| \leq|Y|\) якщо\(X \preceq Y\), і\(|X|<|Y|\) якщо\(X \prec Y\).

    Визначення. Потужність набір,\(P(X)\) нехай\(X\) буде набір. Потім\[P(X)=\{Y \mid Y \subseteq X\} .\]\(P(X)\) називається силовий набір\(X\). Це множина всіх підмножин\(X\).

    Наступна теорема, завдяки Г.Кантору, є одним з найбільш примітних результатів математики. Це не тільки доводить існування незліченної множини, це означає, що силовий набір обов'язково генерує набори більшої кардинальності і тим самим забезпечує засіб побудови нескінченно багатьох різних нескінченних кардинальностей. ТЕОРЕМА 6.7. Нехай\(X\) буде набір. Потім\[|X|<|P(X)| .\] обговорення. Щоб довести цей результат, нам потрібно показати, що біджекція між множиною та її силовим набором неможлива. Як же показувати неможливість такої функції? Можна припустити, що таке біекція існує і вивести протиріччя. Крім того, ми можемо показати, що будь-яка функція від набору до її набору потужності обов'язково не може бути surjection - що майже те ж саме, і більш елегантне. Потрібно показати, що будь-яка функція від безлічі до її набору потужності «пропускає» деякі елементи набору потужності. Ми будемо використовувати техніку, відому як діагональний аргумент, щоб побудувати елемент набору потужності, який не знаходиться в діапазоні функції. Домен діє як індекс\(X\), щоб відстежувати елементи діапазону функції (це ще одне використання для функцій). Побудуємо елемент\(Y \in P(X)\) не в діапазоні функції шляхом додавання\(x \in X\) до\(Y\) iff\(x\) не в елементі\(P(X)\) індексованого по\(x\) (тобто не\(x\) знаходиться в зображення\(x\) під функцією). Легко показати, що ця підмножина\(Y\) не\(X\) знаходиться в діапазоні функції, і тому функція не може бути surjection на\(P(X)\).

    Доказ. Ми спостерігаємо, що функція,\(g: X \rightarrow P(X)\)\[g(x)=\{x\}\] визначена, є ін'єкцією. У випадку\(X=\emptyset, g\) це порожня функція, тобто функція, графік якої є\(\emptyset\). (Ви повинні перевірити, що порожня функція є ін'єкцією.) Тому\[|X| \leq|P(X)| \text {. }\] давайте\[f: X \rightarrow P(X)\] визначимо\[Y:=\{x \in X \mid x \notin f(x)\} .\] Дискусію. Нагадаємо, що для кожного\(x \in X, f(x)\) це підмножина\(X\). При цьому має сенс розглянути, чи\(x\) є елементом\(f(x)\). Самореферентний аромат цього аргументу робить його складним у першому читанні!

    Зрозуміло,\[Y \subseteq X\] є\(Y \in f[X]\)? Припустимо, це було, так\(Y=f\left(x_{0}\right)\) для деяких\(x_{0}\) в\(X\). Але тоді,\(x_{0}\) було б,\(Y\) якби не\(x_{0}\) були в\(f\left(x_{0}\right)=Y\). Це неможливо, суперечивши припущенню, що\(Y\) є в\(f[X]\).

    Ви можете спробувати відремонтувати,\(f\) змінивши його, щоб включити в свій діапазон діагональний набір, який ми побудували. Застосування діагонального аргументу знову визначить новий елемент, відсутній у діапазоні модифікованої функції. Насправді більшість елементів кодомену відсутні з діапазону функції, хоча це не відразу очевидно з доказу.

    Ви все ще можете бути збентежені тим, чому це називається діагональним аргументом. Це буде очевидно, коли ми застосуємо техніку до нескінченних двійкових послідовностей.

    Якщо\(X\) скінченна, теорема очевидна. Дійсно, якщо є\(n \in \mathbb{N}\) таке\(|X|=n\), то\(|P(X)|=2^{n}\). Теорема\(6.7\) має на увазі, що будь-яка множина, в тому числі і нескінченна множина, строго менше його набору потужності. Насправді, повторюючи застосування функції набору потужності до\(\mathbb{N}\), легко помітити, що існує нескінченно багато нескінченних множин виразної кардинальності в послідовності множин\[\langle\mathbb{N}, P(\mathbb{N}), P(P(\mathbb{N})), \ldots\rangle\] (Яка кардинальність об'єднання над цією послідовністю? Яка кардинальність набору влади цього союзу?)

    Доведемо, що ще два набори є незліченними. Обидва ці набори представляють математичний інтерес. Спочатку ми покажемо, що нескінченні двійкові послідовності є незліченними. Нескінченні двійкові послідовності є функціями від\(\mathbb{N}\) до\(\ulcorner 2\urcorner\). Як ми побачимо, існує дуже тісний зв'язок між нескінченними двійковими послідовностями та набором потужності\(\mathbb{N}\). Більш загально, колекція всіх функцій з однієї множини в іншу може представляти математичний інтерес. Вводимо позначення для таких збірок.

    ПОЗНАЧЕННЯ. \(Y^{X}\)Нехай\(X\) і\(Y\) будуть набори. Записується набір всіх функцій з доменом\(X\) і\(Y\) кодоменом\(Y^{X}\).

    Не плутайте це з зведенням до степеня. Однак якщо\(X\) і\(Y\) є кінцевими,\[\left|Y^{X}\right|=|Y|^{|X|} .\] множина всіх функцій з деякого набору\(X\) в\(\ulcorner 2\urcorner\) знаходиться в двооб'єктивному відповідності з\(P(X)\):

    Пропозиція 6.8. \(X\)Дозволяти бути безліч, і визначити\(F:\ulcorner 2\urcorner X \rightarrow P(X)\) по: для\(\chi \in\ulcorner 2\urcorner X\),\[F(\chi)=\chi^{-1}(1) .\] Тобто\(F(\chi)=\{x \in X \mid \chi(x)=1\}\). Потім\(F:\ulcorner 2\urcorner^{X} \rightarrow P(X)\) йде біекція.

    ДОКАЗ. Доказ залишають як вправу.

    Існування цієї біекції дозволяє легко довести наступну теорему.

    ТЕОРЕМА 6.9. Безліч нескінченних двійкових послідовностей є двооб'єктивним з\(P(\mathbb{N})\) і тому є незліченним.

    ДОКАЗ. За пропозицією\(6.8\)\[\left|\ulcorner 2\urcorner^{\mathbb{N}}\right|=|P(\mathbb{N})| .\] За теоремою 6.7,\[|\mathbb{N}| \prec|P(\mathbb{N})| .\] Тому\(\ulcorner 2\urcorner^{\mathbb{N}}\) не можна злічити.

    Позначення. \(2^{\mathbb{N}_{0}}\)Використовуємо\(2^{\mathbb{N}_{0}}\) для кардинальності\(\left\ulcorner 22^{\mathbb{N}}\right.\). Варто проілюструвати додатком до нескінченних двійкових послідовностей, чому метод, який використовується для доведення теореми,\(6.7\) називається діагональним аргументом (іноді його називають другим діагональним аргументом, щоб відрізнити від «першого діагонального аргументу» в розділі 6.4). Нехай\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner \mathbb{N}\). Доведено, що\(f\) це не виверження шляхом прямого застосування діагонального аргументу у доведенні теореми 6.7. Перерахуємо всі елементи в діапазоні\(f\); кожен з них є послідовністю 0 і 1.\ [\ begin {вирівняні} & f (0) =a_ {00}\ quad a_ {01}\ quad a_ {02}\ quad a_ {03}\ quad\ ldots\ quad a_ {0 j}\ ldots\\\ & f (1) =a_ {10}\ quad a_ {11}\ квадратний a_ {12}\ квадратний a_ {13}\ квадратний\ ldots \ квадрад a_ {1 j}\ квадрад\ ldots\\ & f (2) =a_ {20}\ квад a_ {21}\ квад a_ {22}\ квад a_ {23}\ квадрад\ ldots\ квад a_ {2 j}\ квадрад\ ldots\\\\\ f (3) =a_ {30}\ квад a_ {31}\ квад a_ {32}\ квад a_ {33}\ quad\ ldots\ quad a_ {3 j}\ quad\ ldots \ end {вирівняний}\] Тепер ми створюємо послідовність шляхом зміни діагоналі елементи цього нескінченного масиву. Дозволяти\(s\) бути послідовність діагональних елементів\[\left\langle 1-a_{00}, 1-a_{11}, \ldots, 1-a_{i i}, \ldots\right\rangle .\]зображення\ [\ begin {вирівняні} & f (1) =a_ {10}\ лівий\ ланкут\ лівий\ лангл 1-a_ {11}\ правий\ діапазон\ quad a_ {12}\ quad a_ {13}\ quad\ ldots\ quad a_ {1 i}\ quad\ ldots\ право. \\ & f (2) =a_ {20}\ quad a_ {21}\ лівий\ лангол\ почати {масив} {lllllll}\ лівий\ лангль 1-a_ {22}\ правий\ діапазон & a_ {23} &\ ldots & a_ {2 i} &\ ldots\ кінець {масив}\ праворуч. \\ & f (3) =a_ {30}\ quad a_ {31}\ quad a_ {32}\ лівий\ лангіт\ лівий\ лангл 1-a_ {33}\ правий\ діапазон\ квад\ ldots\ quad a_ {3 i}\ quad\ ldots\ право. \\ & f (i) = a_ {i 0}\ квад a_ {i 1}\ квад a_ {i 2}\ квадрад a_ {i 3}\ квадрад\ ldots,\ лівий\ ланкут 1-a_ {i}\ праворуч\ діапазон^ {s_ {i}}\ ldots \ кінець {вирівняний}\] РИСУНОК 6.10. Другий діагональний аргумент

    Послідовність\(s\) є елементом\(\ulcorner 2\urcorner^{\mathbb{N}}\), і відрізняється від кожного елемента в діапазоні\(f\): дійсно,\(s\) відрізняється від\(f(i)\) хоча б\(i^{\text {th }}\) слота. Значить,\[s \notin f[\mathbb{N}],\] і так не\(f\) є сюрпризом. Ми залишаємо це як вправу, щоб показати,\(s\) що діагональний набір\(Y\) побудований в доказі Теореми 6.7, де\(X=\mathbb{N}\). Точніше,\(s\) це зображення\(Y\) під природним біекцією від\(P(\mathbb{N})\) до\(\ulcorner 2\urcorner^{\mathbb{N}}\) Пропозиції 6.8.

    Розглядається ще один набір математичного інтересу, множина всіх нескінченних десяткових послідовностей. Цей набір має тісний зв'язок із замкнутим інтервалом\([0,1]\). Розуміння цих відносин вимагає більш глибокого, більш формального розуміння реальних чисел, ніж більшість студентів піддавалися обчисленню, і ми відкладаємо детальне обговорення цих відносин до розділу 8.9. З деякими модифікаціями наступна теорема доведе, що\([0,1]\) є незліченною, а тому\(\mathbb{R}\) є незліченною (див. Розділ 8.9).

    ТЕОРЕМА 6.11. Безліч нескінченних десяткових розширень є незліченним. Фактично,\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\] ОБГОВОРЕННЯ. Функція ідентичності на нескінченних двійкових послідовностях у нескінченні десяткові послідовності явно є ін'єкцією. Побудуємо ін'єкцію від нескінченних десяткових послідовностей до нескінченних двійкових послідовностей. Теорема випливатиме з теореми Шредера-Бернштейна.

    ProOf. Очевидно, що\[\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| \leq\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| .\] (Чому?) Визначимо ін'єкцію\[f:\ulcorner 10\urcorner^{\mathbb{N}} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}} .\] Нехай\(x \in\ulcorner 10\urcorner^{\mathbb{N}}\). Так\[x=\left\langle x_{j} \mid j \in \mathbb{N}\right\rangle\] де\(x_{j}\) є\(j^{t h}\) членом послідовності\(x\) і\[0 \leq x_{j} \leq 9 .\] ми хочемо визначити двійкову послідовність\(s(x)\), яка «кодує»\(x\). Існує безліч способів зробити це. Один - подивитися на блоки по 10 біт (скорочення від «двійкових цифр»), і, в\(j^{\text {th }}\) такому блоці, мати дев'ять бітів 0, і поставити 1 в\(x_{j}^{\text {th }}\) слот. Формально, задано нескінченну десяткову послідовність\(x\), ми визначаємо двійкову послідовність\[f(x)=\left\langle y_{i} \mid i \in \mathbb{N}\right\rangle\] так, що\(y_{i}=1\) якщо є\(j \in \mathbb{N}\) таке, що в\[i=10 j+x_{j} .\] іншому випадку\(y_{i}=0\). Ми тим самим визначаємо функцію\[f:\ulcorner 10\urcorner \rightarrow\ulcorner 2\urcorner .\] Ми показуємо, що\(f\) це ін'єкція. \(x\)\(y\)Дозволяти і бути окремими елементами\(\ulcorner 10\urcorner^{\mathbb{N}}\). Тоді є\(j \in \mathbb{N}\) такі, що\[x_{j} \neq y_{j} .\] Тоді\[10 j+x_{j} \neq 10 j+y_{j} .\] нехай\(i=10 j+x_{j}\). Потім\(f(x)\) і\(f(y)\) розрізняються за\(i^{\text {th }}\) складовою. Тобто,\[(f(x))_{i}=1 \neq 0=(f(y))_{i} .\] Отже\(f\), ін'єкція і\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| \preceq\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| .\] За теоремою Шредера-Бернштейна, (6.12) і (6.13) Вихід\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\] Ми доводимо в розділі\(8.9\), що\[|[0,1]|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|,\] по суті шляхом ідентифікації реального число з його десятковим розширенням. Якщо припустити цей результат, ми можемо легко довести, що дійсні числа є незліченними. НАСЛІДОК 6.14. \(\mathbb{R}\)незліченна.

    Підрахувальні набори

    Незліченні множини, які ми визначили до цих пір, мають певну спільну структурну характеристику. Показано, що множина всіх функцій від фіксованого нескінченного домену до фіксованого кодомена щонайменше двох елементів є незліченною. Теорему Кантора про те, що множина потужності нескінченного лічильного множини є незліченною, також може бути інтерпретована таким чином. Якщо\(X\) це безліч, то\(P(X)\) можна розуміти як\(\ulcorner 2\urcorner X\), набір всіх функцій від\(X\) до\(\ulcorner 2\urcorner\). У випадку скінченних множин,\(X\) і\(Y\), множина всіх функцій від\(X\) до\(Y, Y^{X}\), має кардинальність\(|Y|^{|X|}\). Тобто, кардинальність\[\{f \subseteq X \times Y \mid f \text { is a function }\}\] є експоненціальною функцією\(|X|\). Звичайно, експоненціальні функції ростуть відносно швидко. Для скінченних множин кардинальність об'єднання нероз'єднаних множин - це сума кардинальностей множин. Кардинальність прямого добутку двох скінченних множин є добутком кардинальностей. Що відбувається з союзом або прямим добутком незліченних нескінченних множин? Чи можуть множинні операції об'єднання та прямого продукту генерувати незліченні множини з підрахункових множин? Відповідаємо на питання для профспілок (додавання) в першу чергу.

    Наступна пропозиція спростить деякі технічні деталі в наступних аргументах.

    ПРОПОЗИЦІЯ 6.15. Нехай\(X\) і\(Y\) будуть набори. Потім відбувається відсмоктування,\(f: X \rightarrow Y\) якщо\(|Y| \leq|X| .\)

    Обговорення. Ми будемо використовувати набори рівнів surjection\(f\) для визначення ін'єкції від\(Y\) до\(X\). Це використовує механізм відносин еквівалентності, розроблений у розділі 2 з Аксіомою вибору.

    Доказ. \((\Rightarrow)\)

    Нехай\(X, Y\) і\(f\) бути, як у твердженні пропозиції. \[\widehat{f}: X / f \rightarrow Y\]Дозволяти бути канонічна біекція, пов'язана з тим\(f\), що було визначено в розділі 2.3. Запитуємо, чи є укол\(g: X / f \rightarrow X\) де\(g([x]) \in[x]\). Нагадаємо, що\(X / f\) це колекція підмножин рівня\(X\), щодо\(f\), і є розділом\(X\). Чому б просто не вибрати елемент з кожного класу еквівалентності та визначити\(g\) функцію від\(X / f\) до,\(X\) визначену цими варіантами?

    ОБГОВОРЕННЯ. Аксіомою вибору є твердження про те, що такі функції «вибору» існують.

    \(g\)Функція явно ін'єкція, так\[g \circ \widehat{f}^{-1}: Y \rightarrow X\] і ін'єкція. Тому якщо відбувається відрив\(f: X \rightarrow Y\), то\(|Y| \leq|X|\).

    \((\Leftarrow)\)

    Доказ цього підтексту залишають як вправу.

    ТЕОРЕМА 6.16. Теорема Кантора Дозволяти\(\left\{X_{n} \mid n \in \mathbb{N}\right\}\) бути сімейством множин таких, що\(X_{n}\) підраховується для всіх\(n \in \mathbb{N}\), і\(X=\bigcup_{n \in \mathbb{N}} X_{n}\). Потім\[|X| \leq \aleph_{0}\] обговорення. Ця теорема, також завдяки Г.Кантору, є ключовим результатом для доведення того, що множини підлягають підрахунку. Це доведено технікою, яка також називається діагональним аргументом (іноді його називають першим діагональним аргументом). Ми використовуємо набір індексів\(\mathbb{N}\) для побудови нескінченного масиву, і використовувати цей масив, щоб проілюструвати перерахування об'єднання. Це перерахування є відхиленням від\(\mathbb{N}\) до\(X\).

    ДОКАЗ. Для\(n \in \mathbb{N}, X_{n}\) підрахунку і за пропозицією\(6.15\) є surjection\[f_{n}: \mathbb{N} \rightarrow X_{n}\] Використовуйте функції\(f_{n}\) для побудови нескінченного масиву. У\(0^{\text {th }}\) стовпці будуть міститися всі елементи\(X_{0}\), в порядку\(f_{0}(0), f_{0}(1), f_{0}(2), \ldots\) (Не має значення, якщо один і той же елемент перерахований кілька разів). Наступний стовпець містить елементи\(X_{1}\) в порядку і\(f_{1}(0), f_{1}(1), f_{1}(2)\) т.д. ми визначаємо функцію\(g: \mathbb{N} \rightarrow X\) шляхом обходу цього масиву уздовж північного сходу на південний захід діагоналей, а саме.\(g(0)=f_{0}(0), g(1)=f_{1}(0), g(2)=\)\(f_{0}(1), g(3)=f_{2}(0), g(4)=f_{1}(1), g(5)=f_{0}(2), g(6)=f_{3}(0)\), і так далі.

    зображення

    МАЛЮНОК 6.17. Перший діагональний аргумент

    Потім\(g\) є surjection, тому що кожен елемент\(\bigcup X_{n}\) відбувається в масиві, і, отже, знаходиться в діапазоні\(g\). За пропозицією 6.15\[|X| \leq \aleph_{0} .\], наслідком 6.18. \(A\)Дозволяти бути обчислювальним набором і\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) бути сім'єю лічильних наборів, індексованих A. потім\[\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} \text {. }\] доказ. Оскільки\(A\) є підрахунковим, існує відхилення\[f: \mathbb{N} \rightarrow A .\] Тому\[\bigcup_{\alpha \in A} X_{\alpha}=\bigcup_{n \in \mathbb{N}} X_{f(n)}\] Теоремою Кантора 6.16,\[\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} .\] НАСЛІДКИ 6.19. \(\mathbb{Z}\)піддається зліченню.

    Обговорення. Без особливих зусиль ми могли б визначити біекцію від\(\mathbb{N}\) до\(\mathbb{Z}\). Натомість ми доведемо існування біекції без явного визначення біекції.

    Доказ. Нехай\(f: \mathbb{N} \rightarrow \mathbb{Z}\) буде таким, що\[f(n)=-n .\] Тоді\(f[\mathbb{N}]\) піддається зліченню. За теоремою Кантора\[\mathbb{Z}=\mathbb{N} \cup f[\mathbb{N}]\] є зліченою.

    Звертаємо свою увагу на прямі продукти.

    ТЕОРЕМА 6.20. Якщо\(n \in \mathbb{N}\), і\(X_{1}, X_{2}, \ldots, X_{n}\) є підрахунковими множинами, то\[X_{1} \times X_{2} \times \cdots X_{n}\] підраховується.

    Доказ. Ми припускаємо, що всі фактори,\(X_{1}, \ldots, X_{n}\) є непорожніми. Аргументуємо індукцією про кількість факторів.

    Базовий корпус:\(n=2\). \[X_{1} \times X_{2}=\bigcup_{x \in X_{2}} X_{1} \times\{x\}\]Для кожного\(x \in X_{2}\),\[\left|X_{1}\right|=\left|X_{1} \times\{x\}\right| .\] За наслідками 6.18,\(X_{1} \times X_{2}\) підраховується.

    Крок індукції: Припустимо\(X_{1}, \ldots X_{n}\), що для будь-якої\(n\) колекції лічильних наборів продукт\(X_{1} \times \cdots \times X_{n}\) підлягає підрахунку. \(X_{1}, \ldots, X_{n+1}\)Дозволяти підраховувати непорожні множини. Тоді\[X_{1} \times \cdots \times X_{n+1}=\left(X_{1} \times \cdots \times X_{n}\right) \times X_{n+1}\] За індукційною гіпотезою,\(X_{1} \times \cdots \times X_{n}\) підраховується, а за базовим випадком прямий добуток двох лічильних множин підраховується. Тому піддається\(X_{1} \times \cdots \times X_{n+1}\) зліченню.

    НАСЛІДОК 6.21. \(\mathbb{Q}\)піддається зліченню.

    Доказ. \(f: \mathbb{Z} \times \mathbb{Z} \rightarrow \mathbb{Q}\)Дозволяти визначатися\ [f (a, b) =\ left\ {\ begin {масив} {ccc} a/b &\ text {if} & b\ neq 0\\ 0 &\ text {інакше.} \ end {масив}\ право.\] Тоді\(f\) є відхиленням, і за пропозицією\(6.15, \mathbb{Q}\) підраховується.

    Ми оцінили вкладену послідовність множин,\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{R} \text {. }\] Це важливі математичні множини і, за винятком\(\mathbb{R}\), вони підраховуються. Досліджується кардинальність ще одного множини між\(\mathbb{Q}\) і\(\mathbb{R}\).

    ВИЗНАЧЕННЯ. Алгебраїчне дійсне число,\(\mathbb{K}\) дійсне число\(\alpha\) є алгебраїчним, якщо існує многочлен\(p\) (не однаково 0) з цілими коефіцієнтами, такими, що\(p(\alpha)=0\). Позначимо множину всіх алгебраїчних чисел по\(\mathbb{K}\).

    Будь-яке раціональне число\(a / b \in \mathbb{Q}\) є алгебраїчним, тому що\(a / b\) є коренем многочлена.\[p(x)=b x-a .\] Причому в прикладі 3.23 ми показали, що\(\sqrt{2}\) є ірраціональним, і воно явно алгебраїчне, так як є коренем\(x^{2}-2\). Тому ми маємо\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subseteq \mathbb{R} .\] Нарешті ми доведемо, що\(\mathbb{K} \neq \mathbb{R}\) показуючи, що\(\mathbb{K}\) підраховується. ТЕОРЕМА 6.22. \(\mathbb{K}\)піддається зліченню.

    Обговорення. Цей результат доведено тим, що алгебраїчні дійсні числа можуть бути побудовані за рахунковою процедурою. Тобто,\(\mathbb{K}\) може бути побудований шляхом додавання до\(\mathbb{Q}\) незліченно багатьох елементів одночасно незліченно багато разів. Теорема Кантора передбачає, що будь-яка побудована таким чином множина буде підрахунковою.

    ДОКАЗ. Нехай\(n \in \mathbb{N}\) і визначити\(f: \prod_{i=0}^{n} \mathbb{Z} \rightarrow \mathbb{Z}[x]\)\[f\left(a_{0}, \ldots, a_{n}\right)=\sum_{i=0}^{n} a_{i} x^{i} .\] за Слідство 6.19,\(\mathbb{Z}\) піддається підрахунку. За теоремою 6.20,\(\prod_{i=0}^{n} \mathbb{Z}\) підраховується. Діапазон\(f\) - це множина поліномів з цілими коефіцієнтами зі ступенем\(\leq n\) (або многочленом, однаково рівним 0). За пропозицією\(6.15\), діапазон функції з підрахунковим доменом також підраховується. Тому множина поліномів ступеня\(\leq n\) піддається зліченню.

    \(P_{n}\)Дозволяти множина многочленів з цілими коефіцієнтами ступеня\(\leq n\). Тоді\[\mathbb{Z}[x]=\bigcup_{i=0}^{\infty} P_{n} .\] за теоремою 6.16,\(\mathbb{Z}[x]\) піддається підрахунку. За теоремою 4.10, якщо\(p(x)\) є поліномом з дійсними коефіцієнтами ступеня\(n\), він має в більшості\(n\) реальних коренів. Нехай\[Z_{p}=\{\alpha \mid p(\alpha)=0\} .\] So\(Z_{p}\) є кінцевим для кожного многочлена\(p\). Застосування теореми Кантора (теорема 6.16) знову\[\mathbb{K}=\bigcup_{p \in \mathbb{Z}[x]} Z_{p}\] піддається підрахунку.

    НАСЛІДОК 6.23. \(\mathbb{K} \neq \mathbb{R}\)

    Оскільки\(\mathbb{K}\) є\(\mathbb{R}\) підрахунковим і незліченним,\(\mathbb{K}\) є належним підмножиною\(\mathbb{R}\). ВИЗНАЧЕННЯ. Трансцендентне число Реальне число, яке не є алгебраїчним, називається трансцендентним числом.

    Слідство\(6.23\) стверджує, що існують трансцендентні числа. Це позов про існування, в якому не пред'являється жодного свідка позову. Швидше це приклад аргументу підрахунку (на нескінченних множинок). Є занадто багато дійсних чисел, щоб всі вони були алгебраїчними. До кінця дев'ятнадцятого століття було доведено, що\(\pi\) і\(e\) є трансцендентними, але ці докази набагато складніші, ніж докази існування Кантора вище, що, по суті, є дуже розумним застосуванням принципу «голубіна діра».

    НАСЛІДОК 6.24. трансцендентних чисел незліченно багато.

    ДОКАЗ. Нехай\(T\) буде набір трансцендентних чисел. Як\[|\mathbb{R}|=|T \cup \mathbb{K}|>\aleph_{0},\] і\(\mathbb{K}\) підраховується,\(T\) має бути незліченним.

    Таким чином, ми показали, що\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subsetneq \mathbb{R} .\] Однак,\[|\mathbb{N}|=|\mathbb{Z}|=|\mathbb{Q}|=|\mathbb{K}|<|\mathbb{R}|\]

    Функції та обчислюваність

    У розділі\(1.3\) ми зробили коментар про те, що більшість функцій не визначені правилами (під якими ми мали на увазі інструкції для обчислення функції). Ми вважаємо правило інструкцією (деякою мовою) скінченної довжини. Функції, які однозначно визначені правилом скінченної довжини, називаються обчислюваними, або рекурсивними функціями. Природно, існує складне математичне визначення рекурсивних функцій, але обійдемося без формальностей і скажемо, що функція є рекурсивною, або обчислювальною, якщо є інструкція (кінцевої довжини) для знаходження зображення будь-якого елемента в області. Скільки існує обчислювальних функцій?

    Ми обмежимо наше розслідування функціями від\(\mathbb{N}\) до\(\mathbb{N}\). Розглядаються функції як графіки функцій. Тобто кожна підмножина,\(P(\mathbb{N} \times \mathbb{N})\) яка задовольняє визначенню функції, є функцією в\(\mathbb{N}^{\mathbb{N}}\). Чи всі такі функції обчислюються? Очевидно, що\[2^{\aleph_{0}} \leq\left|\mathbb{N}^{\mathbb{N}}\right| \text {. }\] (Чому?) Насправді ви можете показати, що множини є двооб'єктивними. Таким чином, є незліченно багато функцій в\(\mathbb{N}^{\mathbb{N}}\). Скільки існує інструкцій для обчислювальних функцій? Інструкція - це кінцевий рядок, або послідовність символів. Наприклад, інструкція для функції, що квадрати натуральних чисел є\[f(x)=x^{2} .\] Це скінченна послідовність з семи символів. Інструкція дає достатньо інформації для обчислення зображення будь-якого натурального числа. Існує безліч інших правил обчислення цієї функції. Наприклад, правило,\[f(x)=x \cdot x\] визначає ту саму функцію, але інструкція інша - вона містить ще один символ. Розглянемо набір всіх можливих інструкцій для обчислення функцій натуральних чисел. Як формулюються інструкції? Один виробляє скінченну послідовність символів, яка утворює явне керівництво для обчислення зображення будь-якого натурального числа.

    \(X\)Дозволяти бути сукупністю всіх символів, що з'являються в інструкціях для обчислення функцій натуральних чисел. Набір\(X\) буде включати літери, цифри, символи для операцій, символи для відносин і потенційно будь-який інший символ, який ви можете побачити в книзі з математики. Наскільки великий\(X\)? Якщо ви вимагаєте, щоб кожен символ з'являвся в якомусь фактичному словнику, він явно був би кінцевим. Ви, ймовірно, захочете дозволити будь-якому натуральному числу з'являтися в інструкції. Однак, хоча існує нескінченно багато натуральних чисел, нам потрібно лише десять символів, щоб назвати їх усі. Здається, що ми можемо розумно вимагати того, що\(X\) є кінцевим, але, як виявляється, ми можемо дозволити бути незліченно нескінченним, не змінюючи нашого висновку.\(X\)

    Якщо є якась мова з незліченно великою кількістю символів, в яких можна було б записати набір всіх інструкцій для обчислювальних функцій, то ми можемо припустити, що\(X\) це підраховується. Якщо\(F\) це інструкція або правило (а значить, кінцева послідовність символів від\(X\)), то є\(N \in \mathbb{N}\) таке, що\[F \in X^{N} \text {. }\] Так легко видно, що набір всіх можливих інструкцій для елементів\(\mathbb{N}^{\mathbb{N}}, I\), задовольняє \[I \preceq \bigcup_{N \in \mathbb{N}} X^{N} .\]Бо\(N \in \mathbb{N}, X^{N}\) є прямим добутком\(N\) множників\(X\), і за теоремою\(6.20\)\[\left|X^{N}\right| \leq \aleph_{0} .\] множина\(\bigcup_{N \in \mathbb{N}} X^{N}\) є зліченним об'єднанням лічильних множин, і за теоремою \(6.16\)піддається зліченню. Тому існує незліченно багато функцій натуральних чисел, які не визначені правилами.

    Більш ретельне поводження з теорією множин див. Книгу [5] Янніса Мошовакіса.

    Вправи

    Вправа 6.1. Нехай\(f: X \mapsto Y\) і\(g: Y \mapsto Z\). Доведіть, що\[g \circ f: X \rightarrow Z\] це біекція.

    Вправа 6.2. Доведіть, що рівноправність - це відношення еквівалентності.

    Вправа 6.3. Довести, що відношення на\(\preceq\) множини є рефлексивним і перехідним. ВПРАВА 6.4. На доказ теореми Шредера-Бернштейна визначте функцію\ [G (x) =\ left\ {\ begin {масив} {clc} g^ {-1} (x) &\ text {if} & x\ in X_ {i}\ f (x) &\ text {якщо} & x\ in X_ {e}\ g^ {-1} (x)\ text {if} & X_ {o} \ end {масив}\ право.\] Доведіть, що \(G: X \mapsto Y\).

    ВПРАВА 6.5. Нехай\(n \in \mathbb{N}\). Доведіть, що\[|P(\ulcorner n\urcorner)|=2^{n} .\] ВПРАВА 6.6. Нехай\(X=\{0,1,2\}\). Запишіть якусь функцію\(f\):\(X \rightarrow P(X)\). Для цього конкретно\(f\), що таке множина\(Y\) теореми 6.7?

    Вправа 6.7. \(X\)Дозволяти бути множиною і визначити послідовність множин\(\left\langle X_{n} \mid n \in \mathbb{N}\right\rangle\) по\[X_{0}=X\] і\[X_{n+1}=P\left(X_{n}\right) .\] нехай\(Y=\bigcup_{n=0}^{\infty} X_{n}\). Доведіть\[(\forall n \in \mathbb{N})\left|X_{n}\right|<|Y| .\] вправу 6.8. \(Y\)Дозволяти\(X\) і бути скінченними множинами. Доведіть, що\[\left|X^{Y}\right|=|X|^{|Y|} \text {. }\] ВПРАВА 6.9. Доведіть пропозицію 6.8.

    ВПРАВА 6.10. Нехай\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}}\) і for\(i, j \in N^{+}\)\[a_{i j}=(f(i))_{j} .\] (\(a_{i j}\)Тобто\(j^{t h}\) термін\(i^{t h}\) послідовності.) Дозвольте\(s\) бути послідовність «діагональ»\[s=\left\langle 1-a_{n n} \mid n \in N^{+}\right\rangle .\] Ми знаємо, що\(s \notin f[\mathbb{N}]\). Якщо\(F:\ulcorner 2\urcorner^{\mathbb{N}} \mapsto P(\mathbb{N})\) це біекція в Пропозиції 6.8, то\(F \circ f: \mathbb{N} \rightarrow P(\mathbb{N})\). Довести, що\(F(s)\) це «діагональний» множина Теорема\(6.7\) (де\(X=\mathbb{N}\), і\(F \circ f\) є перерахування підмножин\(\mathbb{N})\), і, отже, що\(F(s) \notin(F \circ f)[\mathbb{N}]\). Вправа 6.11. Доведіть, що якщо\(X \subseteq Y\) і\(X\) є незліченним, то\(Y\) є незліченним.

    Вправа 6.12. \(X\)Дозволяти бути незліченним набором,\(Y\) бути лічильним набором і\(f: X \rightarrow Y\). Доведіть, що якийсь елемент\(Y\) має незліченний попередній образ.

    ВПРАВА 6.13. Заповніть доказ Пропозиції 6.15.

    Вправа 6.14. Визначте явне біекція від\(\mathbb{N}\) до\(\mathbb{Z}\).

    Вправа 6.15. Доведіть, що\(|\mathbb{K} \backslash \mathbb{Q}|=\aleph_{0}\).

    ВПРАВА 6.16. Доведіть, що\[e=\sum_{n=0}^{\infty} \frac{1}{n !}\] це нераціонально. (Підказка: Сперечатися протиріччям. Припустимо\(e=\frac{p}{q}\) і помножте обидві сторони на\(q\)!. Перевпорядкуйте рівняння, щоб отримати ціле число, рівне нескінченній сумі раціональних чисел, що сходиться до числа у відкритому інтервалі\((0,1)\).)

    Зауваження: Це була також вправа 3.32. Чи простіше зараз?

    ВПРАВА 6.17. Припустимо, що\(a, b, c, d \in \mathbb{R}, a<b\) і\(c<d\). Довести

    а) Відкритий інтервал\((a, b)\) є двооб'єктивним з відкритим інтервалом\((c, d)\).

    б) Замкнутий інтервал\([a, b]\) є двооб'єктивним із замкнутим інтервалом\([c, d]\).

    в) Відкритий інтервал\((0,1)\) є двооб'єктивним із замкнутим інтервалом\([0,1]\).

    г) Відкритий інтервал\((a, b)\) є двооб'єктивним із замкнутим інтервалом\([c, d]\).

    д)\(|[0,1]|=|\mathbb{R}|\).

    ВПРАВА 6.18. Побудувати явні біекції для кожної з пар множин у Вправі 6.17.

    ВПРАВА 6.19. \(f(x)\)Дозволяти ненульовий многочлен з цілими коефіцієнтами, і припустимо, що\(\alpha \in \mathbb{R}\) є трансцендентним. Доведіть, що\(f(\alpha)\) це трансцендентне. ВПРАВА 6.20. \(F: \mathbb{K} \rightarrow \mathbb{R}\)Дозволяти визначатися: If\(x \in \mathbb{K}, F(x)\) - найнижчий ступінь полінома з цілими коефіцієнтами, для якого\(x\) є корінь. \(F\)Чітко визначено?

    ВПРАВА\(6.21\). \(a \in \mathbb{R}\)Дозволяти корінь многочлена з раціональними коефіцієнтами. Довести, що\(a\) є корінь многочлена з цілими коефіцієнтами, і, отже, алгебраїчне число.

    ВПРАВА 6.22. Для кожного з наступних множин станьте і доведіть, чи є він двооб'єктивним з\(\mathbb{N}, P(\mathbb{N})\) або більше, ніж\(P(\mathbb{N})\) (щодо відношення\(\prec\)):

    а) Множина скінченних підмножин\(\mathbb{N}\)

    б) Множина всіх перестановок скінченних множин натуральних чисел

    в) Множина скінченних послідовностей натуральних чисел

    г) Множина скінченних послідовностей цілих чисел

    д) множина скінченних послідовностей алгебраїчних чисел

    f) Множина скінченних послідовностей дійсних чисел

    g) Безліч нескінченних послідовностей натуральних чисел

    h) Множина нескінченних послідовностей дійсних чисел

    i) Злічувані підмножини\(\mathbb{R}\).

    ч)\(\mathbb{N}^{\mathbb{R}}\)

    к)\(\mathbb{R}^{\mathbb{R}}\).

    Ви можете використовувати той факт, що\(|\mathbb{R}|=2^{\aleph_{0}}\).

    Вправа 6.23. Доведіть, що\(\left|\mathbb{R}^{\mathbb{R}}\right| \geq|P(\mathbb{R})|\).

    ГЛАВА 7

    подільність

    У цьому розділі ми досліджуємо подільність. Може здатися своєрідним, що ми досліджували б тему, яку ви вивчали з початкової школи, але не обманюйте уявну простоту предмета. Вивчення подільності цілих чисел є частиною теорії чисел. Геометрія і теорія чисел є найдавнішими напрямками математичного вивчення, і вони як і раніше є активними сферами математичних досліджень.

    Фундаментальна теорема арифметики

    ВИЗНАЧЕННЯ. Ділить, коефіцієнт Let\(a, b \in \mathbb{Z}\). Ми говоримо, що\(a\) ділить\(b\), або\(a\) є фактором\(b\), якщо\[(\exists c \in \mathbb{Z}) a \cdot c=b .\] Ми пишемо це як\(a \mid b\). Якщо\(a\) не ділиться\(b\) пишемо\(a \nmid b\).

    Подільність є центральною ідеєю теорії чисел. Саме тому, що одне ціле число не повинно бути множником іншого цілого числа, або пара цілих чисел може не мати нетривіальних загальних факторів, що подільність забезпечує розуміння структури цілих чисел. Іншим шляхом, розглянемо визначення подільності, застосоване до раціональних чисел - ви виявите, що воно взагалі не дає ніякого розуміння, оскільки ненульове раціональне число є коефіцієнтом будь-якого іншого раціонального числа. Крім того, багато властивостей цілих чисел щодо подільності узагальнюють багато властивостей цілих чисел щодо подільності узагальнюють це в розділі 7.5.

    ВИЗНАЧЕННЯ. Просте число Нехай\(p \in \mathbb{N}\). Ми говоримо, що\(p\) це просте число якщо\(p>1\) і тільки позитивні фактори\(p\) є\(p\) і 1. ВИЗНАЧЕННЯ. Відносно простий нехай\(a, b \in \mathbb{Z}\). Ми говоримо, що\(a\) і\(b\) є відносно простими, якщо вони не мають загального коефіцієнта більше 1.

    ВИЗНАЧЕННЯ. Цілочисельне поєднання Let\(a, b, c \in \mathbb{Z}\). Тоді\(c\) є цілочисельною комбінацією\(a\) і\(b\) якщо\[(\exists m, n \in \mathbb{Z}) c=m a+n b .\] пропозиція 7.1. Нехай\(a, b \in \mathbb{Z}\). Якщо\(a\) і відносно\(b\) прості, то\(a-b\) і\(b\) є відносно простими.

    Обговорення. Доведемо контрапозитив, показавши, що будь-який загальний фактор\(a-b\) і також\(b\) є фактором\(a\).

    ProOf. \(c>1\)Дозволяти бути загальним фактором\(b\) і\(a-b\). Так\[(\exists m \in \mathbb{Z}) b=c m\] і\[(\exists n \in \mathbb{Z}) a-b=c n .\] тоді\[c(m+n)=a\] і так\(c \mid a\). Тому якщо\(a\) і відносно\(b\) прості, то\(a-b\) і\(b\) є відносно простими.

    ПРОПОЗИЦІЯ 7.2. \(b\)Дозволяти\(a\) і бути цілими числами. Якщо\(a\) і\(b\) є відносно простими, то\[(\exists m, n \in \mathbb{Z}) m a+n b=1 .\] Обговорення. Ми будемо сперечатися за випадок, в якому\(a\) і\(b\) є натуральні числа. Враховуючи пропозицію для всіх пар відносно простих натуральних чисел, ми можемо легко розширити його на довільні пари відносно простих цілих чисел, змінивши знак\(m\) або\(n\) в цілочисельній комбінації. Це припущення дозволяє аргументувати індукцією на суму цілих чисел. Базовим випадком для цього аргументу по індукції буде\(a+b=3\). Якщо\(a=0=b\), то\(a\) і не\(b\) є відносно простими. Якщо\(a+b=1\), то\(a\) і відносно\(b\) прості, а вибір\(m\) і\(n\) очевидний. Якщо\(a=b=1\) тоді\(a\) і відносно\(b\) прості і знову вибір\(m\) і\(n\) очевидний.

    Доказ. Ми можемо припустити, що\(a>b>0\). Сперечаємося індукцією далі\(a+b\).

    Базовий корпус:\(a+b=3\).

    Потім\(a=2\) і\(b=1\). Отже, крок\[a-b=1 .\] індукції:

    Припустімо, що результат тримає для всіх пар відносно простих натуральних чисел із сумою менше\(a+b\).

    За пропозицією 7.1,\(b\) і\(a-b\) є відносно простими. За індукційною гіпотезою існують\(i, j \in \mathbb{Z}\) такі, що\[i(a-b)+j b=1 .\] Дискусія. Якщо\(a-b=b\), ми не в тому випадку, коли у нас є два різних позитивних числа. Як ми справляємося з цією можливістю?

    Нехай\(m=i\) і\(n=j-i\). Тоді\[m a+n b=1 .\] за принципом індукції результат тримається для всіх відносно простих пар натуральних чисел.

    ВИЗНАЧЕННЯ. Найбільший спільний дільник,\(\operatorname{gcd}(a, b)\) Let\(a, b \in \mathbb{Z}\). Найбільший спільний дільник\(a\) і\(b\), записаний\(\operatorname{gcd}(a, b)\), є найбільшим цілим числом, яке ділить обидва\(a\) і\(b\).

    Так\(a\) і\(b\) є відносно простим iff\(\operatorname{gcd}(a, b)=1\).

    Пропозиція 7.3. Нехай\(a, b, c \in \mathbb{Z}\), і припустимо, що\(\operatorname{gcd}(a, b)=1\). Якщо\(a \mid c b\), то\(a \mid c\).

    ДОКАЗ. За Пропозицією\(7.2\) є\(m, n \in \mathbb{Z}\) такі, що\[m a+n b=1 .\] Тому\[c m a+c n b=c .\] Ясно\(a \mid c n b(\) з\(a \mid c b)\) і\(a \mid c m a\). Так\[a \mid(c m a+c n b)\] і тому\(a \mid c\).

    ПРОПОЗИЦІЯ 7.4. Нехай\(a, b, c \in \mathbb{Z} .\) якщо\(\operatorname{gcd}(a, b)=1, a \mid c\) і\(b \mid c\), то\[a b \mid c\] ДОКАЗ. Нехай\(m, n \in \mathbb{Z}\) будуть такі, що\(a m=c\) і\(b n=c\). Потім\[a \mid b n\] за пропозицією\(7.3, a \mid n\). Звідси є\(k \in \mathbb{Z}\) таке, що\[a k=n\] Тому\[a k b=c\] і\[a b \mid c\] ЛЕММА 7.5. Припустімо\(N \geq 1\),\(p \in \mathbb{N}\) що

    (1) є простим (2) і\(a_{1}, \ldots, a_{N} \in \mathbb{Z}\)
    (3)\(p \mid\left(\prod_{n=1}^{N} a_{n}\right)\).

    Тоді є деякі\(n \leq N\) такі, що\(p \mid a_{n}\).

    Доказ. \(p\)Дозволяти просте число. Сперечаємося індукцією далі\(N\).

    Базовий випадок:\(N=1\)

    Базовий випадок очевидний.

    Індукційний крок:

    Нехай\(N>1\) і припустимо, що результат тримається для всіх продуктів менше, ніж\(N\) факторів.

    Нехай\[a=\prod_{n=1}^{N-1} a_{n}\] і припустимо, що\[p \mid\left(\prod_{n=1}^{N} a_{n}\right) .\] тоді\[p \mid a \cdot a_{N} .\] якщо\(p \mid a\), то індукційної гіпотезою,\[(\exists n<N) p \mid a_{n} .\] Припустимо, що\(p\) це не фактор\(a\); оскільки\(p\) є простим, \(\operatorname{gcd}(p, a)=1\). За пропозицією 7.3,\(p \mid a_{N}\).

    ТЕОРЕМА 7.6. Фундаментальна теорема арифметики\(N\) Дозволяти бути натуральним числом, більшим за 1. Потім\(N\) може бути однозначно виражений у вигляді добутку простих чисел (аж до порядку множників).

    ОБГОВОРЕННЯ. Ми дозволяємо «продукт» тільки з одним фактором. Таким чином, будь-яке просте число є власним унікальним простим факторингом.

    ДОКАЗ. Аргументуємо індукцією на натуральних числах, більших\(1 .\)

    Базовий випадок:\((N=2)\)

    За обговоренням, що передує доказу, 2 є власним основним факторингом.

    Індукційний крок:

    Припустімо, що результат містить для всіх натуральних чисел більше 1 і менше\(N\). Якщо\(N\) просте, то результат випливає. Якщо не\(N\) просте, то існують\(a, b \in \mathbb{N}, a<N\) і, такі\(b<N\), що за\[a \cdot b=N \text {. }\] індукційною гіпотезою,\(a\) і\(b\) мають унікальні прості факторинги. Твір факторингу буде основним факторингом\(N\). Чи є факторинг унікальним під замовлення? Припустимо, що\[N=\prod_{i=1}^{m} p_{i}=\prod_{j=1}^{n} q_{j}\] де\(p_{i}\) є простим для\(1 \leq i \leq m\), і\(q_{j}\) є простим для\(1 \leq j \leq n\). Тоді\[p_{1} \mid \prod_{j=1}^{n} q_{j} .\] Лемма 7.5,\[(\exists j \leq n) p_{1} \mid q_{j} .\] Ми можемо змінити порядок факторів\(q_{1}, \ldots, q_{n}\) так, що\(p_{1} \mid q_{1}\). Обидва\(p_{1}\) і\(q_{1}\) є простими,\[p_{1}=q_{1} .\] тому\[\prod_{i=2}^{m} p_{i}=\prod_{j=2}^{n} q_{j}<N .\] За індукційною гіпотезою,\(p_{2}, \ldots, p_{m}\) є унікальним основним факторингом\(\prod_{i=2}^{m} p_{i}\), так\(m=n\) і\(q_{2}, \ldots, q_{n}\) є переупорядкування\(p_{2}, \ldots, p_{m}\). Тому\(q_{1} \cdots q_{n}\) є переупорядкування\(p_{1} \cdots p_{m}\) і основним факторингом\(N\) є унікальним.

    ЗАУВАЖЕННЯ. Чому число 1 не визначено як просте? Адже у нього немає інших факторів, крім себе або 1! Причина полягає в тому, що дуже корисно мати унікальність в фундаментальній теоремі арифметики. Якби 1 вважався простим, його можна було б включати довільно часто в факторинг\(N\).

    Алгоритм поділу

    Алгоритм поділу, теорема 7.11, є результатом, який гарантує, що довге ділення натуральних чисел закінчиться в унікальному частці і залишку з залишком строго меншим, ніж дільник. Тривалий розподіл є важким і виснажливим для молодих студентів. Як правило, це найскладніші обчислення, які, як очікується, освоять учні початкової школи. Можливо, ви знову переглянули алгоритм, коли навчилися ділити поліноми. Тут алгоритм поділу говорить, що частка та залишок є унікальними, а залишок або однаково 0, або має ступінь строго менший за дільник. Ми часто порівнюємо арифметику цілих чисел та арифметику поліномів, і саме Алгоритм поділу робить це порівняння корисним.

    Давайте розширимо зв'язок між цілими комбінаціями та найбільшими спільними дільниками. Відповідно до Лемми 7.2, пара цілих чисел є відносно простими, якщо існує ціла комбінація пари, яка дорівнює 1. Цей результат узагальнює до найбільших спільних дільників, крім\(1 .\)

    ТЕОРЕМА 7.7. Нехай\(a, b \in \mathbb{Z}\). Множина цілочисельних комбінацій a та\(b\) дорівнює множині цілих кратних\(\operatorname{gcd}(a, b)\).

    ProOf. Нехай\(c=\operatorname{gcd}(a, b)\) і\[M=\{k c \mid k \in \mathbb{Z}\} .\] з тих пір\(c\) є дільником\(a\) і\(b\), є\(i, j \in \mathbb{Z}\) такі, що\[a=i c\] і\[b=j c .\] Нехай\[I=\{m a+n b \mid m, n \in \mathbb{Z}\} .\] Ми покажемо спочатку, що \(I \subseteq M\).

    Якщо\(m, n \in \mathbb{Z}\), то\[m a+n b=m i c+n j c=(m i+n j) c .\] звідси кожне ціле поєднання\(a\) і\(b\) є кратним\(c\) і\[I \subseteq M .\] Тепер ми покажемо, що\(M \subseteq I\). Нехай\(k c \in M\) і\[r=\operatorname{gcd}(i, j) .\] тоді є\(m, n \in \mathbb{Z}\) такі, що\[r m c=i c=a\] і\[r n c=j c=b .\] Так\(r c \mid a\) і\(r c \mid b\). Звідси\[\operatorname{gcd}(a, b) \geq r c \geq c .\] Однак\(\operatorname{gcd}(a, b)=c\), і таким чином\(r=1\). Тому\(i\) і\(j\) є відносно простими.

    За пропозицією 7.2, існує ціла комбінація\(i\) і\(j\) що дорівнює 1. \(u, v \in \mathbb{Z}\)Дозволяти бути такими, що\[u i+v j=1 .\] Тоді\[c(u i+v j)=c\] і\[k c=k c(u i+v j)=k(u a+v b)\] рівняннями\(7.14\) і\(7.15\). Отже,\[k c \in I,\] і як\(k\) було довільно,\[M \subseteq I .\] СЛІДСТВО 7.8. Нехай\(a, b \in \mathbb{Z}\). Потім\(\operatorname{gcd}(a, b)\) - найменша натуральна ціла комбінація\(a\) і\(b\).

    Теорема\(7.7\) говорить нам, що цілочисельні комбінації\(a\) і\(b\) є саме цілими кратними\(\operatorname{gcd}(a, b)\) (що трапляється, є найменшою натуральною цілою комбінацією\(a\) і\(b)\). Ми думаємо\(\operatorname{gcd}(a, b)\), як «генеруючий» через множення множення множини цілих комбінацій\(a\) і\(b\). ПРОПОЗИЦІЯ 7.9. Нехай\(a, b, k \in \mathbb{Z}\). Тоді\[\operatorname{gcd}(a, b)=\operatorname{gcd}(a-k b, b) .\] Доказ. Якщо\(c \in \mathbb{Z}, c \mid a\) і\(c \mid b\), то\(c \mid a-k b\). Тому\[\operatorname{gcd}(a, b) \leq \operatorname{gcd}(a-k b, b) .\] Так само, якщо\(c \mid a-k b\) і\(c \mid b\)\(c \mid a\), то, так ми отримуємо зворотну нерівність (7.10), тому дві сторони рівні.

    ТЕОРЕМА 7.11. Алгоритм поділу Нехай\(a, b \in \mathbb{Z}, b \neq 0\). Тоді є унікальні\(q, r \in \mathbb{Z}\) такі, що\[a=q b+r\] де\(0 \leq r<|b|\).

    Обговорення. У Алгоритм поділу\(a\) називається дивідендом,\(b\)\(q\) дільником, часткою та\(r\) залишком.

    Доказ. Нехай\(a, b \in \mathbb{Z}\) і\(b \neq 0\). Визначити\(I \subseteq \mathbb{N}\) по\[I=\{a-k b \mid k \in \mathbb{Z}\} \cap \mathbb{N} .\]\(I\) має найменший елемент\(a-q b\), для деяких\(q \in \mathbb{Z}\).

    Претензія:\(0 \leq a-q b<|b|\).

    Доказ претензії. Ми сперечаємося випадками.

    Випадок 1:\(b>0\)

    Якщо\(a-q b \geq b\) тоді\[a-(q+1) b \geq 0 .\] Звідси\[a-(q+1) b \in I .\] Однак\(a-q b\) мінімальний в\(I\), так що це неможливо. Тому\[a-q b<|b| \text {. }\] випадок 2:\(b<0\)

    Якщо\(a-q b \geq|b|\), то\[a-q b>a-(q-1) b \geq 0 .\] Як і в першому випадку\[a-(q-1) b \in I\] це неможливо, так як за припущенням\(a-q b\) мінімально в\(I\). Тому\[a-q b<|b|\] так, якщо у\[r:=a-q b\] нас є\(a=q b+r\) і\(0 \leq r<|b|\). Залишається показати, що частка і залишок унікальні. Припустимо\[a=m b+r=n b+s\], де\(0 \leq r, s<|b|\). Якщо\(r=s\) тоді\(m b=n b\) і\(m=n\). Таким чином, ми припускаємо, що\(r \neq s\). Без втрати спільності ми припускаємо, що\(r<s\). Потім,\[0 \leq s-r=(m-n) b<|b|\] так\(m-n=0\) і\(r=s\), протиріччя.

    Звичайно,\(q\) і можна\(r\) було знайти довгим діленням - тобто можна віднімати кратні до тих пір,\(b\) поки залишок не стане менше\(|b|\).

    Алгоритм Евкліда

    Як ми знаходимо\(\operatorname{gcd}(a, b)\), для\(a, b \in \mathbb{N}\)? Можна викликати фундаментальну теорему арифметики і порівняти прості розклади\(a\) і\(b\). Припустимо\[a=\prod_{n=1}^{N} p_{n}^{r_{n}}\] і\[b=\prod_{n=1}^{N} p_{n}^{s_{n}}\] куди\(r_{n}, s_{n} \in \mathbb{N}\) за\(1 \leq n \leq N\). Якщо\(t_{n}=\min \left(r_{n}, s_{n}\right)\) for\(1 \leq n \leq N\), то\[\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}}\] Однак знайти просте розкладання цілого числа може бути досить складно. Визначимо операцію над парами цілих чисел, яка після розумної кількості застосувань дасть найбільший спільний дільник цілих чисел.

    Якщо\(a, b \in \mathbb{N}, a>b>0\), визначте\(E: \mathbb{N}^{2} \rightarrow \mathbb{N}^{2}\),\[E(a, b)=(b, r)\] де\(r\) є унікальним залишком (при діленні\(a\) на\(b\)), існування якого було доведено в Алгоритмі поділу. Тобто якщо\[a=q b+r\] з\(0 \leq r<b\), то визначити\[E(a, b):=(b, r) .\] If\(b=0\), то нехай\[E(a, 0)=(a, 0) .\] нехай\((a, b) \in \mathbb{N}^{2}, a>b>0\). Ми визначаємо послідовність елементів в\(\mathbb{N}^{2}\),\(\left\langle E_{i}(a, b) \mid i \in \mathbb{N}\right\rangle\), шляхом рекурсії:\[E_{0}(a, b)=(a, b)\] і якщо\(n>0\)\[E_{n}(a, b)=E\left(E_{n-1}(a, b)\right) .\] Так довго, як\(E_{n}(a, b)\) має ненульові компоненти, послідовність другої складової строго зменшується, тому вона зрозуміло, що послідовність в кінцевому підсумку повинна закріпитися на впорядкованій парі (див. Вправа 4.11). За алгоритмом поділу це відбудеться, коли другий компонент дорівнює 0. \(k\)Дозволяти найменшим цілим числом такі, що\[E_{k}(a, b)=E_{k+1}(a, b) .\] Тоді ми говоримо, що\(\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\) стабілізується на кроці\(k\). Для\(n \geq k\),\[E_{n}(a, b)=E_{n+1}(a, b)=E_{k}(a, b) .\] Якщо\(\left\langle E_{n}(a, b)\right\rangle\) стабілізується на кроці\(k\), очевидно, що\(k \leq b\). Як правило, послідовність стабілізується набагато швидше, ніж це. ТЕОРЕМА 7.12. Нехай\(a, b \in \mathbb{N}, a>b>0\). Ненульова складова, на якій послідовність\[\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\] стабілізується, є\(\operatorname{gcd}(a, b)\).

    Доказ. \(a\)Дозволяти фіксуватися, ми аргументуємо індукцією на меншому з цілих чисел,\(b\).

    Базовий випадок:\(b=1\)

    Потім для будь-якого\(a>1\),\[E(a, 1)=(1,0)\] а послідовність\(\left\langle E_{n}(a, 1)\right\rangle\) стабілізується на кроці 1 з ненульовою складовою\(1 .\)

    Індукційний крок:

    Нехай\(b>1\). Припустимо, що результат тримає для всіх\(c<b\) - тобто для будь-якого\((a, c) \in \mathbb{R}^{2}\), де\(c<b<a\), дорівнює ненульова складова впорядкованої пари, при якій послідовність\(\left\langle E_{n}(a, c)\right\rangle\) стабілізується\(\operatorname{gcd}(a, c)\). Показано, що ненульовою складовою впорядкованої пари, при якій послідовність\(\left\langle E_{n}(a, b)\right\rangle\) стабілізується, є\(\operatorname{gcd}(a, b)\). Якщо\(a>b>0\) тоді\[E(a, b)=(b, a-q b)\] де\(0 \leq a-q b<b\). За індукційною гіпотезою є ненульова складова впорядкованої пари, при якій послідовність\(\left\langle E_{n}(b, a-q b)\right|\)\(n \in \mathbb{N}\rangle\) стабілізується\(\operatorname{gcd}(b, a-q b)\). За пропозицією\(7.9\)\[\operatorname{gcd}(a, b)=\operatorname{gcd}(b, a-q b) .\] Так ненульова складова впорядкованої пари, при якій послідовність\[\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\] стабілізується, є\(\operatorname{gcd}(a, b)\). За принципом індукції результат тримається для всіх впорядкованих пар\((a, b) \in \mathbb{N}^{2}\) де\(a>b>0\).

    Алгоритм являє собою набір виконуваних обчислювальних інструкцій. Алгоритм Евкліда являє собою наступний набір інструкцій:

    Задано пару натуральних чисел\(a>b>0\), обчислити послідовність,\(\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\) поки послідовність не стабілізується. Ненульова складова впорядкованої пари, на якій послідовність стабілізується, дорівнює\(\operatorname{gcd}(a, b)\).

    Приклад 7.13. Нехай\(a=29712375\) і\(b=119119\). Знайдіть\(\operatorname{gcd}(a, b)\). Використовуємо евклідовий алгоритм. Так\ [\ почати {зібрано} E_ {0} (a, b) = (а, б)\\ E_ {1} (а, б) =Е (а, б) =( б, 51744)\\ E_ {2} (а, б) =Е (б, 51744) =( 51744,4851)\\ E_ {3} (a, b) =Е (51744,4851) =( 4851,1078)\\ E_ {4} (а, б) =Е (4851,1078) =( 1078,539)\\ E_ {5} (а, б) =Е (1078,539) =( 539,0). \ end {зібрався}\] Тому\(\operatorname{gcd}(a, b)=539\). Якщо ви використовуєте фундаментальну теорему арифметики, за допомогою певної роботи ви можете визначити, що\[29,712,375=\left(3^{2}\right)\left(5^{3}\right)\left(7^{4}\right)(11)\] і\[119,119=\left(7^{2}\right)(11)(13)(17) .\] так\(\operatorname{gcd}(a, b)=\left(7^{2}\right)(11)=539\).

    Маленька теорема Ферма

    Позначення. \(\mathbb{Z}_{n}^{*}\)Нехай\(n \in \mathbb{N}, n \geq 2\). Тоді\[\mathbb{Z}_{n}^{*}=\mathbb{Z}_{n} \backslash\{[0]\} .\] ЛЕМА 7.14. Нехай\(a, n \in \mathbb{Z}, n \geq 2\), бути таким, що\(\operatorname{gcd}(a, n)=1\). Визначити\(\phi_{a}: \mathbb{Z}_{n}^{*} \rightarrow \mathbb{Z}_{n}^{*}\) по\[\phi_{a}([b])=[a b] .\] Тоді\(\phi_{a}\) є перестановкою\(\mathbb{Z}_{n}^{*}\). Доказ. Ми показуємо, що\([a],[2 a], \ldots,[(n-1) a]\) є окремими елементами\(\mathbb{Z}_{n}^{*}\). Нехай\(0<i \leq j<n\) і припустимо, що\(i a \equiv j a \bmod n\). Тоді\[n \mid j a-i a\] і\[n \mid(j-i) a .\] Ми припускаємо\(\operatorname{gcd}(n, a)=1\), що так за пропозицією\(7.3, n \mid(j-i)\). Втім\(0 \leq j-i<n\), так\(j-i=0\) і\(i=j\). Отже, якщо\(0<i<j<n\),\[[i a] \neq[j a] .\] випливає, що\(\phi_{a}\) це ін'єкція від\(\mathbb{Z}_{n}^{*}\) до\(\mathbb{Z}_{n}^{*}\). Будь-яка ін'єкція від кінцевого набору до себе є surjection, так само\(\phi_{a}\) є перестановкою\(\mathbb{Z}_{n}^{*}\).

    Визначення. Порядок,\(o_{p}(a)\)\(p\) Дозволяти бути простим числом, а\(a \in \mathbb{Z}\) не кратним\(p\). Порядок\(a\) в\(\mathbb{Z}_{p}\) найменший\(k \in \mathbb{N}^{+}\) такий, що\(a^{k} \equiv 1 \bmod p\). Пишемо порядок\(a\) в\(\mathbb{Z}_{p}\) як\(o_{p}(a)\).

    Якщо\(a\) кратне\(p\), то порядок\(a\) in\(\mathbb{Z}_{p}\) не визначено, так як\(a \equiv 0 \bmod p\), і для всіх\(k \in \mathbb{N}^{+}\),\[a^{k} \equiv 0 \quad \bmod p .\] Наступна пропозиція показує, зокрема, що якщо \(a\)не кратний\(p\), то порядок чітко визначено (тобто, що є деякі\(k\) з\(a^{k} \equiv 1\)\(\bmod p)\).

    ПРОПОЗИЦІЯ 7.15. Дозволяти\(a \in \mathbb{Z}\), і\(p\) бути простим числом такий, що\(p \nmid a\). Потім\(o_{p}(a)<p\).

    Доказ. \(p\)Дозволяти бути простим числом і\(a \in \mathbb{Z}\) бути таким,\(a\) що не кратне\(p\). За Леммою 7.5\(p \nmid a\), як, то\(p \nmid a^{n}\), і тому\(\left[a^{n}\right] \in \mathbb{Z}_{p}^{*}\) для будь-якого\(n \in \mathbb{N}\). Так як\(\left|\mathbb{Z}_{p}^{*}\right|=p-1\), кінцева послідовність\[\left\langle\left[a^{n}\right] \mid 1 \leq n \leq p\right\rangle\] повинна мати повторення. Нехай\(1 \leq n<k \leq p\) буде таким, що\[a^{n} \equiv a^{k} \quad \bmod p .\] Тоді\[p \mid a^{k}-a^{n} .\] Звідси\[p \mid a^{n}\left(a^{k-n}-1\right) .\] Однак\(p \nmid a^{n}\) і, таким чином, Пропозиція 7.3,\[p \mid a^{k-n}-1 .\]\[a^{k-n} \equiv 1 \quad \bmod p .\] Таким чином,\[o_{p}(a) \leq k-n<p .\] Пропозиція 7.16. \(a \in \mathbb{Z}\)\(p\)Дозволяти і бути просте число\(a\) таке, що не кратне\(p\). Тоді залишок класів\([1],[a],\left[a^{2}\right], \ldots,\left[a^{o_{p}(a)-1}\right]\) в\(\mathbb{Z}_{p}\) різні.

    ДОКАЗ. Вправа.

    ПОЗНАЧЕННЯ. \(S_{a}(n)\)Зафіксуйте просте значення\(p\) для решти цього розділу. Дозвольте a бути ціле число таке, що\(p \nmid a\). Тоді для будь-якого додатного натурального числа\(n\), ми дозволимо\(S_{a}(n)\) позначити множину класів еквівалентності\(\left\{\left[n \cdot a^{k}\right] \mid k \in \mathbb{N}\right\}\) в\(\mathbb{Z}_{p}\). (Хоча\(S_{a}(n)\) залежить від вибору\(p\), ми пригнічуємо це в позначеннях і припускаємо, що\(p\) зрозуміло).

    ЛЕМА 7.17. Дозвольте\(a \in \mathbb{Z}\) бути таким, що\(p \nmid a\). Якщо\(n \in \mathbb{N}^{+}\) не кратна\(p\), то\[\left|S_{a}(n)\right|=o_{p}(a) .\] Proof. За пропозицією 7.15,\(o_{p}(a)<p\). Нехай\(k=o_{p}(a)\). За\(7.16\) пропозицією інші класи\([1],[a],\left[a^{2}\right], \ldots,\left[a^{k-1}\right]\) відрізняються. Дозвольте\(\phi_{n}\) визначитися, як у Леммі 7.14. Потім\(\phi_{n}\) відбувається перестановка\(\mathbb{Z}_{p}^{*}\). Тому залишок класів\([n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right]\) є різними. Але\[n a^{k} \equiv n \quad \bmod p,\] ТАК\[S_{a}(n)=\left\{[n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right]\right\}\] (Чому?) Тому\[\left|S_{a}(n)\right|=o_{p}(a)\] ЛЕМА 7.18. Нехай\(a \in \mathbb{Z}\) буде таким, що\(p \nmid a\). Тоді для будь-яких,\(m, n \in \mathbb{N}^{+}\) які не кратні множникам\(p\), множини\(S_{a}(m)\) і\(S_{a}(n)\) або рівні, або неспільні.

    ДОКАЗ. Припустимо,\(S_{a}(m) \cap S_{a}(n) \neq \emptyset .\) нехай\(m, n \in \mathbb{N}, \operatorname{gcd}(m, p)=1\)\(\operatorname{gcd}(n, p)=1\) і\[\left[m a^{i}\right] \in S_{a}(n)\] тоді є\(j \in \mathbb{N}\) таке, що\[\left[m a^{i}\right]=\left[n a^{j}\right]\] Ми можемо припустити\(i<j\), що, оскільки існує нескінченно багато\(j \in \mathbb{N}^{+}\), які задовольняють рівняння. Тоді\[[m]=\left[n a^{j-i}\right]\]\[[m] \in S_{a}(n)\] Отже, якщо\(S_{a}(m)\) і не\(S_{a}(n)\) роз'єднані, у нас є\[S_{a}(m) \subseteq S_{a}(n)\] Симетрія, ми також маємо\[S_{a}(n) \subseteq S_{a}(m)\] і так\[S_{a}(m)=S_{a}(n)\] або\[S_{a}(m) \cap S_{a}(n)=\emptyset\] ТЕОРЕМА 7.19 . Маленька теорема Ферма Якщо\(a \in \mathbb{Z}\) і\(p\) є простим числом таким\(p \nmid a\), що, то\[a^{p-1} \equiv 1 \quad \bmod p .\] Доказ. Нехай\(k=o_{p}(a)\). Ми показуємо це\(k \mid(p-1)\). Нехай\(n \in \mathbb{N}\),\(n\) де не кратна\(p\). За Lemma\(7.17\)\[\left|S_{a}(n)\right|=k .\] By Lemma 7.18, набори\[\left\{S_{a}(n) \mid n \in \mathbb{N}^{+}, p \nmid n\right\}\]\(\mathbb{Z}_{p}^{*}\) поділу на набори кардинальності\(k\). Тому\(k\) ділить\(\left|Z_{p}^{*}\right|\). З тих пір\(\left|Z_{p}^{*}\right|=p-1\), у нас\[k \mid(p-1) .\] випливає, що є\(j \in \mathbb{N}\) такий,\[a^{p-1} \equiv\left(a^{k}\right)^{j} \equiv 1^{j} \equiv 1 \quad \bmod p .\] що СЛІДСТВО 7.20. Якщо\(a \in \mathbb{Z}\) і\(p\) є простим числом таким\(p \nmid a\), що, то Маленька теорема\[a^{p} \equiv a \quad \bmod p .\] Ферма є важливим результатом в теоретичному вивченні простих чисел і визначенні первинності. Як може бути використана теорема? Розглянемо проблему вирішення питання про те, чи\(n\) є конкретне натуральне число простим. Для того, щоб визначити, чи\(n\) є простим, ви можете викликати фундаментальну теорему арифметики, і почати перевірку всіх простих чисел аж до того,\(\sqrt{n}\) щоб визначити, чи є будь-які нетривіальні множники\(n\). Ми не повинні перевіряти прості числа більше, ніж\(\sqrt{n}\) оскільки існування такого фактора тягне за собою існування коефіцієнта менше\(\sqrt{n}\), а за фундаментальною теоремою арифметики - простого множника менше\(\sqrt{n}\). Для цього може знадобитися перевірка багатьох кандидатів - крім того, що ви вимагаєте, щоб ви знали всі прості числа менше\(\sqrt{n}\), або готові перевірити фактори, які не є простими. Для великих\(n\) це грізний виклик. Як варіант, можна шукати\(a \in \mathbb{Z}\) такі, що для\(\left[a^{n}\right] \neq[a]\)\(\mathbb{Z}_{n}\) того, щоб визначити, що не\(n\) є простим.

    Наприклад, це 12,871 простий? Ми припускаємо, що у вас є доступ до комп'ютера (робити ці обчислення вручну може бути нудним). Один з підходів полягає в перевірці факторів серед простих чисел менше\(\sqrt{12,871}\), тобто тридцяти простих чисел менше 114. Крім того\(a \in \mathbb{Z}\), для, ми можемо перевірити,\[a^{12,871} \equiv a \quad \bmod 12,871 .\] якщо відповідь ні, то 12,871 не є простим. Спробуємо\(a=2\):\[2^{12,871} \equiv 5732 \bmod 12,871 .\] Тому 12,871 не є основним. Якби ви перевіряли прості числа послідовно, вам доведеться перевірити 18 простих чисел, перш ніж виявити, що 61 - найменший простий, який ділить 12,871.

    Якщо\(a^{12,871} \equiv a \bmod 12,871\) для даного вибору\(a\), то не можна робити ніякого висновку. Насправді існують непрості числа, такі\(n\), що при будь-якому виборі,\[a^{n} \equiv a \bmod n .\] Числа\(a\), які задовольняють висновку теореми 7.19, але не є простими називаються числами Кармайкла. Таким чином, Маленька теорема Ферма може бути використана, щоб показати, що число не є простим, але не для того, щоб довести, що число є простим.

    Подільність і многочлени

    Деякі ідеї подільності, введені в попередніх розділах цієї глави, ми застосовуємо до поліномів з дійсними коефіцієнтами,\(\mathbb{R}[x]\). Це вимагає від нас алгебраїчно ставитися до поліномів. Почнемо з формального визначення операцій на\(\mathbb{R}[x]\). Нехай\(f, g \in \mathbb{R}[x]\),\[f(x)=\sum_{n=0}^{N} a_{n} x^{n}\] і\[g(x)=\sum_{m=0}^{M} b_{m} x^{m} .\] Так\(f\) є многочленом ступеня в максимум\(N\) і\(g\) є поліном ступеня в більшості\(M\). Щоб спростити наші вирази, ми підписуємося на умовність, що для\(f\) многочленів і\(g, a_{n}=0\) для всіх\(n>N\), і\(b_{m}=0\) для всіх\(m>M\). Тобто, ми можемо розглядати поліном як степеневий ряд, в якому всі, але нескінченно багато коефіцієнтів дорівнюють 0.

    ЗАУВАЖЕННЯ. Якщо многочлен однаково дорівнює ненульової константі, ми говоримо, що многочлен має ступінь нуль. Якщо многочлен однаково дорівнює нулю, ми не визначаємо його ступінь. Це нотаційне зручність: многочлен ступеня 0 - ненульова константа.

    Ми визначаємо додавання і множення в\(\mathbb{R}[x]\) на\[f(x)+g(x):=\sum_{i=0}^{\max (M, N)}\left(a_{i}+b_{i}\right) x^{i}\] і\[f(x) \cdot g(x):=\sum_{i=0}^{M+N}\left(\sum_{j=0}^{i} a_{j} \cdot b_{i-j}\right) x^{i} .\] Ви повинні підтвердити, що\(0 \in \mathbb{R}[x]\) це адитивна ідентичність в\(\mathbb{R}[x]\), і\(1 \in \mathbb{R}[x]\) є мультиплікативною ідентичністю в\(\mathbb{R}[x]\). Ви також повинні переконатися, що додавання і множення в\(\mathbb{R}[x]\) є

    (1) асоціативний

    (2) комутативний

    (3) розподільний (тобто множення розподіляє над додаванням).

    Доведено, що версія алгоритму поділу має місце для поліномів. Дійсно, це причина того, що довге ділення многочленів по суті схоже на ділення цілих чисел.

    ТЕОРЕМА 7.21. Алгоритм поділу Якщо\(f, g \in \mathbb{R}[x]\)\(g \neq 0\), і, то існують унікальні поліноми\(q\)\[f=q \cdot g+r\] і\(r\) такі, що і\(r=0\) або або ступінь менше ступеня\(r\) \(g\). Обговорення. Аргументуємо спочатку за існування частки і залишку, що задовольняє твердженню теореми. Дозволяємо\(g\) бути довільним дійсним многочленом і аргументувати індукцією за ступенем\(f\) - для цього конкретного дільника\(g\). Принцип індукції дасть результат для дільника\(g\) і будь-якого дивіденду. Оскільки\(g\) є довільним дійсним многочленом, існування частки та залишку гарантовано для будь-якого дільника та дивідендів. Унікальність доведена безпосередньо.

    Доказ. Нехай\(g \in \mathbb{R}[x]\). Якщо\(g\) константа, то\(q(x)=(1 / g(x))(f(x))\) і\(r=0\) задовольняє твердження теореми. Крім того, будь-який залишок повинен бути нульовим поліномом, оскільки неможливо мати ступінь менше ступеня\(g\). Отже,\(q(x)=(1 / g(x))(f(x))\) є унікальним коефіцієнтом, який задовольняє алгоритм поділу.

    \(g\)Дозволяти поліном ступеня більше 0. Доводимо результат для всіх можливих\(f\) (для цього конкретно\(g\)) шляхом індукції за ступенем\(f\). \(M\)Дозволяти бути ступінь\(g\) і\(N\) бути ступінь\(f\).

    Базовий випадок:\(N<M\)

    Потім\(q=0\) і\(r=f\) задовольняють висновок теореми.

    Індукційний крок: Нехай\(N \geq M\) і припустимо, що результат тримається для всіх поліномів ступеня менше\(N\). Ми показуємо, що вона тримає\(f \in \mathbb{R}[x]\) ступінь\(N\). Припускаємо, що\[f(x)=\sum_{n=0}^{N} a_{n} x^{n}\] де\(a_{n} \in \mathbb{R}\) (для\(\left.0 \leq n \leq N\right)\) і\(a_{N} \neq 0\). Нехай\[g(x)=\sum_{m=0}^{M} b_{m} x^{m}\] де\(b_{m} \in \mathbb{R}\) (для\(0 \leq m \leq M\)) і\(b_{M} \neq 0\). Нехай\[h(x)=\left(\frac{a_{N}}{b_{M}}\right) x^{(N-M)} .\] Тоді ступінь\(f-h \cdot g\) менше\(N\) або\(f-h \cdot g\) однаково 0. Так що є\(s \in \mathbb{R}[x]\) таке, що\[f=h \cdot g+s\] де\(s=0\) або ступінь\(s\) менше, ніж\(N\). Якщо\(s=0\), то нехай\(q=h\) і\(r=0\).

    В іншому випадку за індукційною гіпотезою існує якийсь поліном\(\bar{q}\) такий, що\[s=\bar{q} \cdot g+r\] де\(r=0\) або ступінь\(r\) менше\(M\). Таким чином,\[f=h g+s=h g+\bar{q} g+r=(h+\bar{q}) g+r .\] якщо ми дозволимо\(q=h+\bar{q}\) тоді\[f=q g+r .\] Так, за принципом індукції\(f \in \mathbb{R}[x]\), для будь-якого, є\(q\) і\(r\) такі, що\[f=q \cdot g+r .\] Оскільки\(g\) був довільний многочлен ступеня більше 0, результат тримає для всіх\(f\) і\(g\).

    Доводимо, що\(q\) і\(r\) є унікальними. Нехай\[f=q g+r=\bar{q} g+\bar{r}\] де залишки,\(r\) і\(\bar{r}\), мають ступінь менше, ніж ступінь\(g\) або є 0 многочленом. Потім\ [\ почати {зібраний} q g+r- (\ бар {q} g+\ бар {r}) =\\ (q-\ бар {q}) g+ (r-\ бар {r}) =0. \ end {зібралися}\] Нехай\(Q=q-\bar{q}\) і\(R=r-\bar{r}\). Припустимо, що\(Q \neq 0\). Тоді ступінь\(Q \cdot g\) становить не менше ступеня\(g\). Однак залишки\(r\) і\(\bar{r}\) мають ступінь менше, ніж ступінь\(g\), або є 0 многочленами. При цьому ступінь\(R\) строго менше ступеня\(g\), або\(R=0\). Сума двох многочленів різного ступеня не може бути однаковою 0. Звідси це неможливо\(Q \neq 0\). Якщо\(Q=0\) тоді\(R=0\). Тому\[q=\bar{q}\]\[r=\bar{r}\] і частка і залишок унікальні.

    НАСЛІДОК 7.22. Якщо\(f \in \mathbb{R}[x]\) і\(x_{0} \in \mathbb{R}\), то є\(q \in \mathbb{R}[x]\) таке, що\[f(x)=\left(x-x_{0}\right) \cdot q(x)+f\left(x_{0}\right) .\] ProOf. Застосовуємо алгоритм поділу с\(g(x)=x-x_{0}\). Тоді залишок\(r\) має ступінь 0, або однаково нуль, так є постійною, і оцінка\[f(x)=\left(x-x_{0}\right) q(x)+r(x)\] при\(x=x_{0}\) дає\(r(x)=f\left(x_{0}\right)\). Тому\[f(x)=\left(x-x_{0}\right) q(x)+f\left(x_{0}\right) .\] ми використовуємо ці результати для доведення алгебраїчної властивості поліномів.

    ВИЗНАЧЕННЯ. \(I \subseteq \mathbb{R}[x]\)Ideal Якщо і\(I \neq \emptyset\), то ми називаємо\(I\) ідеалом за\(\mathbb{R}[x]\) умови виконання наступних умов:

    (1) Якщо\(f, g \in I\) тоді\(f+g \in I\).

    (2) Якщо\(f \in I\) і\(g \in \mathbb{R}[x]\) тоді\(f \cdot g \in I\).

    Ідеалом\(\mathbb{R}[x]\) є набір, який закривається під додавання елементів в ідеал, і множення на всі елементи\(\mathbb{R}[x]\), незалежно від того, знаходяться вони в ідеалі чи ні. Якщо придивитися до визначення цілочисельної комбінації (Розділ 7.1), то можна помітити, що набір цілих комбінацій пари цілих чисел закривається при додаванні елементів множини і множенні на довільні цілі числа. Звичайно, ця аналогія між цілими числами та поліномами не випадкова. Якщо узагальнити ідею цілочисельної комбінації до многочленів, можна сказати, що поліноміальні комбінації пари многочленів є ідеалом\(\mathbb{R}[x]\). Для цілих чисел нам вдалося довести, що множина цілих комбінацій пари цілих чисел є саме цілими числами, кратними найбільшому спільному дільнику цілих чисел. Чи можемо ми довести аналогічний результат для многочленів? Визначення. Основний ідеал Ідеал\(I\) в\(\mathbb{R}[x]\) є принциповим, якщо є\(f \in \mathbb{R}[x]\) таке, що\[I=\{f \cdot g \mid g \in \mathbb{R}[x]\} .\] У визначенні принципового ідеалу,\(f\) називається генератором\(I\). Теорему\(7.7\) можна повторити, щоб сказати, що множина цілих комбінацій пари цілих чисел є головним ідеалом (in\(\mathbb{Z}\)), породженим найбільшим спільним дільником пари.

    ТЕОРЕМА 7.23. Кожен ідеал\(\mathbb{R}[x]\) є принциповим.

    Доказ. Нехай\(I\) буде ідеалом\(\mathbb{R}[x]\). \(f\)Дозволяти поліном найнижчого ступеня в\(I\). Доводимо, що\(f\) породжує\(I\). Нехай\(h \in I\). Достатньо показати, що\(h\) є кратним\(f\). За теоремою 7.21, є\(q, r \in \mathbb{R}[x]\),\(r=0\) або ступінь\(r\) менше ступеня\(f\), такі, що\[h=q f+r .\] Since\(I\) є ідеалом і\(f \in I\),\[q f \in I\] і \[h-q f=r \in I .\]За припущенням\(f\) це мінімальний ступінь в\(I\), так\(r=0\). Тому\[h=q f\] і\(f\) породжує\(I\).

    Ця програма, здається, рухає нас до результату для поліномів, який є аналогом Фундаментальної теореми арифметики. Многочлен є незвідним, якщо його не можна записати як добуток многочленів нижчого ступеня. У теоремі доведено\(9.48\), що кожен многочлен у\(\mathbb{R}[x]\) множниках однозначно перебуває у добутку незведених многочленів (аж до порядку множників і множення на константи), і більше того, що всі нескоротні многочлени мають максимум ступінь\(2 .\) Вивчення алгебраїчних властивостей многочленів є найважливішим мотивуючим принципом алгебри. Хороші тексти з алгебри включають Джона Фралі [2] та Ізраїля Герштейна [3].

    Вправи

    ВПРАВА 7.1. Нехай\(n \in \mathbb{N}\). Доведіть,\(n\) що якщо не простий, то\(n\) має простий коефіцієнт\(p \leq \sqrt{n}\).

    Вправа\(7.2\). Є\(15,462,227\) і\(15,462,229\) відносно прості?

    ВПРАВА 7.3. Якщо\(n \in \mathbb{N}\), за яких умов бувають\(n\) і\(n+2\) відносно прості?

    ВПРАВА 7.4. Доведіть, що кожне натуральне число може бути записано як добуток степеня 2 і непарне число.

    Вправа 7.5. Знайти\(\operatorname{gcd}(8243235,453169)\).

    Вправа 7.6. Знайти\(\operatorname{gcd}(15570555,10872579)\).

    ВПРАВА 7.7. \(b\)Дозволяти\(a\) і бути цілими числами і\(m=\operatorname{gcd}(a, b)\). Доведіть, що\(\frac{a}{m}\) і\(\frac{b}{m}\) є відносно прості цілі числа.

    ВПРАВА 7.8. \(b\)Дозволяти\(a\) і бути додатними цілими числами з простим розкладанням, заданим\[a=\prod_{n=1}^{N} p_{n}^{r_{n}}\]\(p_{n}, r_{n}, s_{n} \in \mathbb{N}\) і\[b=\prod_{n=1}^{N} p_{n}^{s_{n}}\] де і\(p_{n}\) є простим для\(1 \leq n \leq N\). Доведіть, що якщо\(t_{n}=\min \left(r_{n}, s_{n}\right)\) для\(1 \leq n \leq N\), то\[\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}} .\] ВПРАВА 7.9. У заяві Лемма 7.14 припустимо, що\(\operatorname{gcd}(a, n) \neq\) 1. Доведіть, що функція не\(\phi_{a}\) є перестановкою\(\mathbb{Z}_{n}^{*}\). ВПРАВА 7.10. Доведіть пропозицію 7.16.

    Вправа 7.11. Є 4757 прем'єр-міністром?

    Вправа 7.12. Визначте ідеал природним чином: набір\(I \subseteq \mathbb{Z}\) - це ідеал,\(\mathbb{Z}\) якщо для будь-якого\(m, n \in I\) і\(c \in \mathbb{Z}\),\(\mathbb{Z}\)

    1. \(m+n \in I\)

    і

    1. \(m c \in I\).

    Якщо\(a, b \in \mathbb{Z}\), довести, що множина цілочисельних комбінацій\(a\) і\(b\) є ідеалом\(\mathbb{Z}\).

    ВПРАВА 7.13. Доведіть, що кожен ідеал\(\mathbb{Z}\) є принциповим. (Підказка: знайдіть генератор ідеалу.)

    ВПРАВА 7.14. \(p\)Дозволяти бути простим і\(\mathbb{Z}_{p}[x]\) бути множиною поліномів з коефіцієнтами в\(\mathbb{Z}_{p}\). Що можна сказати про коріння многочлена\(x^{p-1}-[1]\) в\(\mathbb{Z}_{p}\)? (Ми говоримо, що\([a] \in \mathbb{Z}_{p}\) це корінь многочлена,\(f \in \mathbb{Z}_{p}[x]\) якщо\(\left.f([a])=[0] .\right)\)

    ВПРАВА 7.15. Доведіть, що 0 є адитивна ідентичність в\(\mathbb{R}[x]\) і 1 мультиплікативна ідентичність в\(\mathbb{R}[x]\). Використовуйте формальні визначення додавання і множення в\(\mathbb{R}[x]\).

    Вправа 7.16. Довести, що ступінь добутку многочленів дорівнює сумі ступенів многочленів. Використовуйте формальне визначення множення в\(\mathbb{R}[x]\).

    ВПРАВА 7.17. Нехай\(p \in \mathbb{R}[x]\). Доведіть, що\(p\) має добавку, зворотну в\(\mathbb{R}[x]\). Доведіть, що\(p\) має мультиплікативний зворотний iff\(p\) має ступінь 0. Використовуйте формальні визначення додавання і множення в\(\mathbb{R}[x]\).

    Вправа 7.18. Доведіть, що додавання і множення в\(\mathbb{R}[x]\) асоціативні і комутативні, і що розподільна властивість має. Використовуйте формальні визначення додавання і множення в\(\mathbb{R}[x]\).

    ВПРАВА 7.19. Бо\(0 \leq n \leq N\), нехай\(a_{n} \in \mathbb{R}\). Якщо\(f=\sum_{n=0}^{N} a_{n} x^{n}\) і\(g(x)=x-1\), знайти унікальний частка і залишок,\(f\) де\(g\) дивіденд і дільник. ВПРАВА 7.20. Нехай\(f, g, q \in \mathbb{R}[x], g \neq 0\). Припустимо, що\(f\) це дивіденд,\(g\) дільник і\(q\) частка. Доведіть, що сума ступеня\(g\) і ступінь\(q\) дорівнює ступеня\(f\).

    ВПРАВА 7.21. Чи існує версія евклідового алгоритму для\(\mathbb{R}[x]\)?

    ГЛАВА 8

    Реальні числа

    Що таке дійсні числа і чому раціональних чисел не вистачає для наших математичних потреб? Зрештою, дійсні числа повинні задовольняти певні аксіоматичні властивості, які ми вважаємо бажаними для інтерпретації природного світу, задовольняючи прагнення математика до формальної основи математичних міркувань.

    Звичайно, дійсні числа повинні містити раціональні числа. Ми також вимагаємо, щоб дійсні числа задовольняли досить очевидні алгебраїчні властивості, які мають раціональні числа, такі як комутатність додавання або розподільна властивість. Ці аксіоми дозволяють використовувати алгебру для вирішення завдань. Крім того, ми повинні задовольнити геометричні властивості, такі як нерівність трикутника, які дозволяють інтерпретувати позитивні дійсні числа як відстані. Нам потрібна наша система числення, щоб містити числа, що виникають з алгебраїчної та геометричної інтерпретації чисел. На жаль, раціональних чисел недостатньо для цієї обмеженої мети. Наприклад\(\sqrt{2}\), який ви знаєте на\(3.23\) прикладі ірраціональний, виникає геометрично як довжина діагоналі одиничного квадрата, і як рішення алгебраїчного рівняння\(x^{2}=2\).

    Розвиток ліміту породило нові питання про реальні цифри. Зокрема, коли ми впевнені, що послідовність чисел збігається в нашій системі числення? У доказах конвергенції претензій часто використовується інша властивість дійсних чисел, найменш верхня межа властивості. Багато з потужних висновків числення є наслідками цієї властивості. Вільно кажучи, найменш верхня межа властивість означає, що дійсний числовий рядок не має ніяких «дірок». Іншим способом, якщо всі елементи одного непорожнього набору дійсних чисел менше всіх елементів іншого непорожнього набору дійсних чисел, то існує дійсне число більше або дорівнює всім елементам першої множини, і менше або дорівнює всім елементам другого множини. Це властивість називається порядком-повнотою, і формально визначено в Розділі 8.10. Замовлення-повнота, і його бажані наслідки, не дотримуються раціональних чисел.

    Як довести існування множини з порядком і операціями, що задовольняє всі ці потреби одночасно? Не можна просто припустити, що така структура існує. Цілком можливо, що зазначені властивості логічно суперечливі. Ми могли б спробувати побудувати набір. Які правила побудови математичного об'єкта? Це питання спонукало математиків кінця дев'ятнадцятого - початку ХХ століття розробити правила такої конструкції - аксіоми теорії множин.

    З цієї причини ми будуємо дійсні числа за допомогою множинно-теоретичної побудови. Тобто ми побудуємо натуральні числа, цілі числа, раціональні та ірраціональні числа по черзі, використовуючи базові множини, функції та відносини. При цьому ми побудуємо набір з порядком та операціями, який містить раціональні числа (або структуру, яка поводиться точно так, як ми очікуємо, що раціональні числа будуть вести себе), задовольняє аксіоми алгебраїчного та порядку, має властивості, необхідні для обчислення, і будується за допомогою інструментів, які ви розроблено в розділах 1 і 2.

    Натуральні числа

    Коли ми ввели натуральні числа в главі 1, ми були явними, що ми не визначали множину. Натомість ми продовжили припущення, що ви знайомі з натуральними числами в силу вашого попереднього математичного досвіду. Тепер ми визначаємо натуральні числа у всесвіті множин, будуючи їх з порожньої множини. ВИЗНАЧЕННЯ. Функція наступника\(Y\) Дозволяти бути множиною. Функція\(S\) наступника визначається\[S(Y):=Y \cup\{Y\} .\] визначенням. Індуктивна множина Дозволяти\(S\) бути наступною функцією і\(X\) бути будь-якою колекцією множин, що задовольняють наступним умовам:
    (1)\(\emptyset \in X\)
    (2)\([Y \in X] \Rightarrow[S(Y) \in X]\).

    Тоді\(X\) називається індуктивним набором.

    ВИЗНАЧЕННЯ. Натуральні числа\(X\) Дозволяти бути будь-яким індуктивним набором. Множина натуральних чисел - це перетин всіх підмножин\(X\), які є індуктивними множинами.

    Чи добре визначені натуральні числа? Тобто, чи залежить визначення від вибору набору\(X\)? Якщо\(\mathcal{F}\) це сімейство множин, всі з яких є індуктивними, то легко довести, що перетин над також\(\mathcal{F}\) є індуктивним. Якщо нам дають множини\(X\) і\(Y\) які є індуктивними, чи будуть множини породжувати той самий набір «натуральних чисел»? Знову легко побачити, що відповідь так, оскільки\(X \cap Y\) є підмножиною обох\(X\) і\(Y\), і є індуктивним. «Натуральні числа», визначені термінами\(X\) і\(Y\) будуть «натуральними числами», визначеними термінами\(X \cap Y\) - вони складають «найменшу» індуктивну множину. Для того, щоб визначити натуральні числа у Всесвіті множин, необхідно надати, що існує індуктивна множина. Це аксіома теорії множин, що існує така множина, яка називається аксіомою нескінченності (див. Додаток В для обговорення аксіом теорії множин).

    Яке відношення має цей набір до натуральних чисел, як ми розуміємо, і використовуємо їх у математиці? Розглянемо функцію\(i\), визначену\[i(0)=\emptyset\] і\[i(n+1)=i(n) \cup\{i(n)\} .\] Так\ [\ begin {вирівняний} i (0) &=\ порожній набір\\ i (1) &=\ {\ порожній набір\}\ i (2) &=\ {\ emptyset\}\\ i (3) &=\ {\ порожній набір\}\\ i (3) &=\ {\ порожній набір\},\\\ порожній набір,\ {\ порожній набір\} \}\}. \ end {aligned}\] Потім\(i\) дає біекцію між натуральними числами, як ми розуміємо їх інтуїтивно, і мінімальним індуктивним набором, який ми визначили вище.

    Давайте\(\ulcorner n\urcorner\) формально визначимо як множина, яку отримує, застосовуючи функцію наступника\(S\) до порожніх встановлених\(n\) часів. Отже,\[0=\emptyset\] і для\(n>0\) набору\[\ulcorner n\urcorner=\{\emptyset,\{\emptyset\}, \ldots\}\] є саме\(n\) елементи, і ми ототожнюємо його з набором\[\{0,1, \ldots, n-1\}\], який ми раніше вибрали як канонічний набір з\(n\) елементами.

    Множина\[\mathbf{N}:=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\}\] є індуктивною, а тому містить натуральні числа. Нарешті, читач може підтвердити, що не\(\mathbf{N}\) має належної підмножини, яка є індуктивною.

    Підсумовуючи конструкцію до цих пір, аксіома нескінченності гарантує, що існує набір, який є індуктивним. Підібрати такий набір,\(X\). Перетин всіх підмножин,\(X\) що є індуктивними є\(\mathbf{N}\), які ми можемо ототожнити з натуральними числами (задуманими інтуїтивно) за допомогою біекції i Для того, щоб продовжити будівництво, ми вважаємо\(\mathbb{N}\) і\(\mathbf{N}\) бути той же набір. Нам\(\mathbb{N}\) потрібно мати операції\(+\) і. а також відношення\(\leq\). Визначимо додавання\(\mathbb{N}\) з основними операціями набору та кардинальністю. Якщо\(m, n \in \mathbb{N}\), то ми визначаємо додавання по\[m+n:=|(\ulcorner m\urcorner \times\{\ulcorner 0\urcorner\}) \cup(\ulcorner n\urcorner \times\{\ulcorner 1\urcorner\})| .\] Renall, що кардинальність скінченної множини - це унікальне натуральне число, яке є двооб'єктивним з множиною - звідси складний вираз в правій частині визначення є натуральним числом. Легко підтвердити, що доповнення, визначене таким чином, узгоджується зі звичайною операцією в\(\mathbb{N}\). Навіщо нам визначати операцію, яку ви розуміли протягом багатьох років? Ми визначили додавання натуральних чисел як операцію множини.

    Множення визначити дещо простіше. Якщо\(m, n \in \mathbb{N}\), то\[m \cdot n:=|\ulcorner m\urcorner \times\ulcorner n\urcorner| .\] (Звичайно, під\(\ulcorner m\urcorner \times\ulcorner n\urcorner\) декартовим добутком множин\(\ulcorner m\urcorner\) і\(\ulcorner n\urcorner\).) Нарешті, якщо\(m, n \in \mathbb{N}\)\[[m \leq n] \Longleftrightarrow[\ulcorner m\urcorner \subseteq\ulcorner n\urcorner] .\] Ви повинні підтвердити, що операції і відношення погодитися зі звичайними\(+, \cdot\) і\(\leq\) на натуральні числа.

    Завершивши цю конструкцію, розумно запитати,\(\mathbb{N}\) чи дійсно набір натуральних чисел. Це, безумовно, виправдано для вас зробити висновок, що ніякої ясності щодо числа 2 не забезпечується, ототожнюючи його з набором\(\{\emptyset,\{\emptyset\}\}\). Те, що ми отримуємо, - це зменшення чисел до множин, які проведуть нас через побудову всіх дійсних чисел, включаючи числа, які нелегко побудувати.

    Цілі числа

    Побудуємо цілі числа з натуральних чисел. Алгебраїчне призначення цілих чисел полягає у включенні адитивних обернень для натуральних чисел. Звичайно, це природно породжує операцію віднімання.

    Нехай\(Z=\mathbb{N} \times \mathbb{N}\). Визначте відношення еквівалентності,\(\sim\)\(Z\) на\[\left\langle m_{1}, n_{1}\right\rangle \sim\left\langle m_{2}, n_{2}\right\rangle \quad \Longleftrightarrow \quad m_{1}+n_{2}=m_{2}+n_{1} .\] Тоді цілі числа Ми\[\mathbf{Z}:=Z / \sim .\] думаємо про впорядковану пару\(\langle m, n\rangle \in \mathbf{Z}\) як представник цілого числа\(m-n\). Ми говоримо, що ціле число є додатним, якщо\(m>n\) і негативним, якщо\(m<n\). Повинно бути зрозуміло, що множина невід'ємних цілих чисел (тобто\(\mathbb{N}\)) є\[\{[\langle m, n\rangle] \mid m \geq n\}=\{[\langle m, 0\rangle] \mid m \in \mathbb{N}\} .\]\(\mathbb{Z}\) Дозволяти бути (інтуїтивним) цілими числами і нехай\(i: \mathbf{Z} \rightarrow \mathbb{Z}\) бути\[i([\langle m, n\rangle])=m-n .\] визначена Then\(i\) - це біекція. Як ми зробили з натуральними числами, ми будемо будувати операції і порядок на\(\mathbf{Z}\) що погодитися зі звичайними операціями і порядком на\(\mathbb{Z}\). Звичайно, ми могли б використовувати\(i\) і звичайні визначення\(\mathbb{Z}\) в для визначення операцій і відносин на\(\mathbf{Z}\), але це б не вистачало духу побудови, і нехтувало б прагненням до множинних теоретичних визначень. Аналогічно побудові попереднього розділу визначаємо\(\mathbb{Z}\) як\(\mathbf{Z}\). Нехай\(x_{1}, x_{2} \in \mathbb{Z}\) де\(x_{1}=\left[\left\langle m_{1}, n_{1}\right\rangle\right]\) і\(x_{2}=\left[\left\langle m_{2}, n_{2}\right\rangle\right]\). Додавання визначається\[x_{1}+x_{2}=\left[\left\langle m_{1}+m_{2}, n_{1}+n_{2}\right\rangle\right] .\] адитивною оберненою від\([\langle m, n\rangle]\) is\([\langle n, m\rangle]\) (тобто сума цих цілих чисел\([\langle 0,0\rangle]\) - адитивна ідентичність в\(\mathbb{Z})\).

    Множення визначається лінійним\[x_{1} \cdot x_{2}=\left[\left\langle m_{1} \cdot m_{2}+n_{1} \cdot n_{2}, n_{1} \cdot m_{2}+m_{1} \cdot n_{2}\right\rangle\right] .\] впорядкуванням на\(\mathbb{Z}\) визначено\[x_{1} \leq x_{2} \Longleftrightarrow m_{1}+n_{2} \leq n_{1}+m_{2} .\] додавання та множення для натуральних чисел, а операції та лінійне впорядкування\(\mathbb{Z}\) визначено щодо операцій. і лінійне упорядкування, яке раніше було визначено для\(\mathbb{N}\). Зауважимо, що всі наші визначення були дані в терміні представників класів еквівалентності. Щоб показати, що\(+, \cdot\) і чітко\(\leq\) визначені, ми повинні показати, що визначення не залежать від вибору представника - див. Вправа 8.6.

    Раціональні числа

    Раціональні числа - це співвідношення цілих чисел, або майже так. Звичайно, різні чисельники та знаменники можуть породжувати одне і те ж раціональне число - дійсно велика частина арифметики початкової школи присвячена визначенню, коли два різних вирази для раціональних чисел рівні. Побудовано цілі числа з натуральних чисел з класами еквівалентності «відмінностей» натуральних чисел. Аналогічно побудовано раціональні числа з цілих чисел з класами еквівалентності «часткових» цілих чисел. Алгебраїчно це породжує поділ.

    Нехай\(Q=\mathbb{Z} \times \mathbb{N}^{+}\). Визначаємо відношення еквівалентності\(\sim\) на\(Q\). Якщо\(\langle a, b\rangle,\langle c, d\rangle \in Q\), то\[\langle a, b\rangle \sim\langle c, d\rangle \Longleftrightarrow a \cdot d=b \cdot c .\] ми визначаємо раціональні числа\(\mathbf{Q}\), як класи еквівалентності щодо відношення еквівалентності\(\sim\).\(Q\) Тобто,\[\mathbf{Q}:=Q / \sim \text {. }\] Ми пов'язуємо класи еквівалентності з\(\mathbf{Q}\) інтуїтивними раціональними числами за допомогою біекції,\(i: \mathbb{Q} \rightarrow \mathbf{Q}\)\[i\left(\frac{p}{q}\right)=[\langle p, q\rangle]\] визначеної for\(\langle p, q\rangle \in Q\).

    Визначено операції та лінійне впорядкування\(\mathbb{Q}\) за операціями та лінійним упорядкуванням в\(\mathbb{Z}\). Визначте додавання на\[[\langle a, b\rangle]+[\langle c, d\rangle]:=[\langle a d+b c, b d\rangle]\] і множення на\[[\langle a, b\rangle] \cdot[\langle c, d\rangle]:=[\langle a \cdot c, b \cdot d\rangle] .\] Ми визначаємо лінійне впорядкування на\(\mathbb{Q}\)\[[\langle a, b\rangle] \leq[\langle c, d\rangle] \quad \text { iff } \quad a \cdot d \leq b \cdot c .\] шляхом побудови раціональних чисел, ми використовували множинні операції для побудови математичних структур, з якими ви вже знайомий. Отже, ви можете перевірити, чи поводиться конструкція так, як ви очікуєте. Наприклад, можна легко довести, що побудовані нами операції узгоджуються зі звичайними операціями додавання і множення на раціональні числа. Так само можна легко перевірити, чи співвідношення, на якому ми побудували,\(\mathbb{Q}\) узгоджується зі звичайним лінійним упорядкуванням раціональних чисел. Побудова дійсних чисел складніше.

    Реальні числа

    Ми завершуємо наше побудова дійсних чисел (у нас залишилися ірраціональні числа) з метою довести порядковість повноти дійсних чисел і вивести деякі важливі наслідки повноти. Багато з найпотужніших і цікавих результатів обчислення залежать від цієї властивості дійсних чисел. Якщо вас попросили прийняти деякі з цих теорем про віру, тепер настав час винагородити вашу довіру.

    Існує кілька різних способів побудови дійсних чисел з раціональних чисел. Один з підходів полягає у визначенні дійсних чисел як збіжних послідовностей раціональних чисел. Інший поширений підхід полягає в характеристиці дійсних чисел як підмножин раціональних чисел, які задовольняють певним умовам.

    ВИЗНАЧЕННЯ. Виріз Dedekind A Виріз Дедекінда\(L\) - це непорожня належна підмножина\(\mathbb{Q}\), яка не має максимального елемента і задовольняє\[(\forall a, b \in \mathbb{Q})[a \in L \wedge b<a] \Rightarrow[b \in L] .\]\(L\) Дозволяти бути вирізом Дедекінда. Потім є якесь раціональне число\(a \in L\), і тому всі раціональні числа менше тоді\(a\) знаходяться в\(L\). Нехай\(R=\mathbb{Q} \backslash L\). З тих пір\(L \neq \mathbb{Q}\), є\(c \in R\) і кожне раціональне число більше, ніж\(c\) є в\(R\). Зрозуміло, що\(\{L, R\}\) це розділ\(\mathbb{Q}\) і що кожен елемент\(L\) менше, ніж кожен елемент\(R\). Так Дедекінд скорочує «розкол» раціональних чисел. Ми пов'яжемо кожен розріз Дедекінда з дійсним числом, розташованим на розщепленні на дійсному числовому рядку.

    ЗАУВАЖЕННЯ. Щоб допомогти нашій ментальній картині того, що відбувається, ми думаємо про всі раціональні числа зліва від деякого фіксованого дійсного числа\(\alpha\), тобто як\((-\infty, \alpha) \cap \mathbb{Q}\), і\(R\) як раціональні числа праворуч,\([\alpha, \infty) \cap \mathbb{Q}\).\(L\) Звичайно, ми ще не знаємо, що саме ми маємо на увазі під «реальним числом\(\alpha\) «, але це ідея, яку слід пам'ятати. Зверніть увагу, що\(R\) буде мати найменший елемент, якщо\(\alpha\) раціональний.

    Щоб зрозуміти, як скорочення Дедекінда пов'язані з числами, ми будуємо ін'єкцію від раціональних чисел до розрізів Дедекінда. Нехай\(\mathcal{D}\) буде набір дедекінд розрізів. Ми визначаємо ін'єкцію\(i: \mathbb{Q} \rightarrow \mathcal{D}\) за\[i(a)=\{b \in \mathbb{Q} \mid b<a\} .\] Функція\(i\) - це чітко визначена ін'єкція, яка інформує нас про те, як\(\mathbb{Q}\) вписується\(\mathcal{D}\).

    Ми визначимо порядок і операції на\(\mathcal{D}\) так, щоб вони узгоджувалися зі звичайним лінійним упорядкуванням і операціями\(\mathbb{Q}\), які успадковуються в\(i[\mathbb{Q}]\). Тобто ми визначимо лінійний порядок, додавання і множення на\(\mathcal{D}\) так, щоб для\(a, b \in \mathbb{Q}\),\ [\ begin {вирівняний} {[a\ leq b]} &\ Longleftrightarrow [i (a)\ leq i (b)]\ i (a+b) &= i (a) +i (b)\\ i (a\ cdot b) &=i (a)\ cdot i (b) \ end {вирівняний} \] Якщо ми можемо це зробити, ми можемо розглядати\(\mathcal{D}\) як розширення\(\mathbb{Q}\). Як ми це робимо?

    Для\(L, K \in \mathcal{D}\), ми визначаємо відношення\(\leq\) в\(\mathcal{D}\) по\[[L \leq K] \Longleftrightarrow[L \subseteq K] .\] Ви повинні підтвердити, що\(\leq\) це лінійне впорядкування\(\mathcal{D}\) і що відношення\(\leq\) на\(i[\mathbb{Q}]\) задовольняє (1). Якщо\(L \in \mathcal{D}\) і\(L<i(0)\) ми говоримо,\(L\) що негативно. Якщо\(L>i(0)\), ми говоримо,\(L\) що позитивно. З аналогічною метою ми визначаємо додавання і множення на\(\mathcal{D}\). Тобто ми хочемо, щоб операції задовольняли певні властивості додавання та множення, і ми хочемо,\(i[\mathbb{Q}]\) щоб операції, визначені на, узгоджувалися з операціями на\(\mathbb{Q}\).

    Якщо\(L, K \in \mathcal{D}\), то\[L+K:=\{a+b \mid a \in L \text { and } b \in K\} .\] Переконайтеся, що\(L+K\) це розріз Dedekind, і що (2) тримає.

    Множення вимагає трохи більше зусиль для визначення. (Чому ми не можемо дозволити\(L \cdot K=\{a b \mid a \in L, b \in K\}\)?) Якщо\(L\) або\(K\) є\(i(0)\), то\[L \cdot K:=i(0) .\] Якщо обидва\(L, K \in \mathcal{D}\) позитивні, то\[L \cdot K=\{a \cdot b \mid a \in L, b \in K, a>0 \text { and } b>0\} \cup\{c \in \mathbb{Q} \mid c \leq 0\} .\] Переконайтеся, що\(L \cdot K\) це розріз Дедекінда, і що (3) тримає для\(a, b>0\).

    Як ми визначаємо множення на «негативні» скорочення Дедекінда? Почнемо з визначення множення на\(-1\). Нехай\(L \in \mathcal{D}\) і\(R=\)\(\mathbb{Q} \backslash L\). Ми визначаємо\(-L\) по\[-L:=\{c \in \mathbb{Q} \mid(\exists r \in R)-c>r\} .\] Тепер ми можемо визначити множення на довільні елементи,\(\mathcal{D}\) щоб задовольнити бажані властивості. Якщо\(L, K \in \mathcal{D}\) і обидва негативні, то\[L \cdot K:=(-L \cdot-K) .\] Якщо точно один з\(L\) і\(K\) є негативним, то\[L \cdot K:=-(-L \cdot K) .\] ВИЗНАЧЕННЯ. Реальні числа,\(\mathbb{R}\) дійсні числа - це скорочення Дедекінда, з додаванням, множенням та\(\leq\) визначенням, як зазначено вище. Ми позначаємо дійсні числа тим,\(\mathbb{R}\) коли нам не потрібно думати про них явно як про скорочення Дедекінда.

    Ми визначили дійсні числа як множини раціональних чисел. Оскільки раціональні числа визначалися з використанням основних уявлень про множини, функції та відносини, так само і дійсні числа. Властивості дійсних чисел, які ми обговорювали на початку цього розділу, задовольняють розрізи Дедекінда. Для кожного раціонального числа\(a\) ми ототожнюємося\(a\) з розрізом Дедекінда\(i(a)\).

    ТЕОРЕМА 8.2. Справжні числа, визначені вище, задовольняють:

    (i) Додавання та множення є як комутативними, так і асоціативними.

    (ii)\((\forall L \in \mathcal{D}) L+0=L, L \cdot 1=L\).

    (iii)\((\forall L \in \mathcal{D}) L+(-L)=0\).

    (iv)\((\forall L \in \mathcal{D} \backslash\{0\})(\exists K \in \mathcal{D}) L \cdot K=1\).

    (v)\((\forall L, K, J \in \mathcal{D}) L \cdot(K+J)=L \cdot K+L \cdot J\).

    Доказ. Вправа.

    Найменша верхня межа властивість

    ВИЗНАЧЕННЯ. Верхня межа Let\(X \subset \mathcal{D}\). Ми говоримо, що\(X\) обмежується вище, якщо є\(M \in \mathcal{D}\) таке, що\[(\forall x \in X) x \leq M .\] У цьому випадку ми говоримо, що\(M\) це верхня межа для\(X\).

    ВИЗНАЧЕННЯ. Найменша верхня\(X \subset \mathcal{D}\) межа Дозволяти бути обмеженою вище. Припустимо,\(M\) це верхня межа для\(X\) такої, що для будь-якої верхньої межі\(N\) для\(X, M \leq N\). Тоді число\(M\) називається найменшою верхньою межею для\(X\).

    Нижня межа і найбільша нижня межа визначаються аналогічно.

    ТЕОРЕМА 8.3. Найменша верхня межа Властивість Якщо\(X\) є непорожньою\(\mathcal{D}\) підмножиною і обмежена вище, то\(X\) має найменшу верхню межу. Якщо вона обмежена нижче, то вона має найбільшу нижню межу.

    ДОКАЗ. Дозвольте\(X \subset \mathcal{D}\) бути обмеженим вище. Нехай\[M=\bigcup_{L \in X} L \subseteq \mathbb{Q} .\] множина\(M\) обмежена вище (чому?) , А значить\(M \neq \mathbb{Q}\). Будь-який елемент\(M\) є елементом деякого\(L \in X\), а отже, не може бути максимальним елементом\(L\). Тому не\(M\) має найбільшого елемента. Якщо\(a \in M\),\(c \in \mathbb{Q}\) і\(c<a\) то\(c \in M\). Тому\(M\) це розріз Дедекінда. Для будь-якого\(L \in X, L \subseteq M\) і, отже,\[L \leq M .\] Тобто,\(M\) є верхньою межею для\(X\).

    Нехай\(K<M\). Тоді є\(a \in M \backslash K\). Так\(a\) є в деяких\(L_{0}\) в\(X\). Тому не\(L_{0}\) міститься\(K\) і не\(K\) є верхньою межею для\(X\). Звідси випливає, що\(M\) є найменшою верхньою межею для\(X\).

    Аргумент на користь існування найбільшої нижньої межі залишаємо читачеві.

    Найменша верхня межа властивість є істотною властивістю дійсних чисел, що дозволяє основні теореми числення. Саме тому ми використовуємо цей великий набір, а не, скажімо, алгебраїчні числа. Він однозначно характеризує дійсні числа як продовження раціональних чисел - див. Теорему\(8.23\) для точного твердження.

    Тепер, коли ми довели цю ключову властивість, ми будемо використовувати\(\mathbb{R}\) для позначення множини дійсних чисел, ідентифікуючи дійсне число за\(\alpha\) допомогою розрізу Дедекінда\((-\infty, \alpha) \cap \mathbb{Q}\). Нам більше не потрібно турбуватися про скорочення Dedekind як такої.

    Реальні послідовності

    Нагадаємо, що послідовність - це функція з доменом\(\mathbb{N}\) (або\(\mathbb{N}^{+}\)). Реальна послідовність - це дійсна послідовність (тобто діапазон послідовності є підмножиною дійсних чисел).

    ВИЗНАЧЕННЯ. Підпослідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) Дозволяти бути послідовністю і\(f \in \mathbb{N}^{\mathbb{N}}\) бути строго зростаючою послідовністю натуральних чисел. Потім\[\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\] йде підпослідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\).

    Приклад 8.4. \(s\)Дозволяти послідовність\[\langle 2 n \mid n \in \mathbb{N}\rangle=\langle 0,2,4,6,8, \ldots\rangle .\] Тоді послідовність,\(t\) задана\[\langle 6 n \mid n \in \mathbb{N}\rangle=\langle 0,6,12,18, \ldots\rangle\] є підпослідовністю\(s\). У цьому прикладі\(f(n)=3 n\) є функція, яка демонструє, що\(t\) є підпослідовністю\(s\). Іншою підпослідовністю\(s\) є послідовність\[\left\langle 2^{5 n+3} \mid n \in \mathbb{N}\right\rangle\] Згадати, що послідовність\(\left\langle a_{n}\right\rangle\) називається неспадаючою, якщо\(a_{n+1} \geq a_{n}\) для всіх\(n\). Він називається незростаючим, якщо нерівність зворотна. Все, що вірно для неспадної послідовності, є істинним, з нерівностями, зворотними, для незростаючих послідовностей (чому?) , Тому замість того, щоб стверджувати все двічі, ми можемо використовувати слово монотонний, щоб означати послідовність, яка або не збільшується (скрізь) або не зменшується.

    ЛЕМА 8.5. Кожна неспадна дійсна послідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\), яка обмежена вище, сходиться до її найменшої верхньої межі. Кожна незростаюча реальна послідовність, яка обмежена нижче, сходиться до своєї найбільшої нижньої межі.

    Доказ. Доведемо лише перше твердження. \(M\)Дозволяти бути найменшою верхньою межею\(\left\langle a_{n}\right\rangle\). Нехай\(\varepsilon>0\). Оскільки\(M\) є найменшою верхньою межею, Існує\(N \in \mathbb{N}\) така, що,\[0<M-a_{N}<\varepsilon .\] Оскільки послідовність не зменшується,\[(\forall n \geq N) 0<M-a_{n}<\varepsilon .\] Тому\(M\) є межа послідовності, за бажанням.

    ТЕОРЕМА 8.6. Теорема Больцано-Вейєрштрасса\([b, c]\) Дозволяти бути замкнутим обмеженим інтервалом дійсних чисел і\(s=\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) бути послідовністю дійсних чисел така, що\[(\forall n \in \mathbb{N}) a_{n} \in[b, c] .\] Тоді\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) має збіжну підпослідовність з обмеженням в\([b, c]\). Обговорення. Розглянуто вкладену послідовність інтервалів, всі з яких містять нескінченно багато елементів діапазону послідовності\(s\), при цьому радіус інтервалів наближається до 0. Побудовано підпослідовність\(s\) шляхом послідовного виділення елементів в місцях перетину діапазону\(s\) і послідовних інтервалів. Потім ми покажемо, що підпослідовність, яку ми будуємо, є збіжною.

    ProOf. Доведено теорему для замкнутого одиничного інтервалу\([0,1]\). Це просто узагальнити цей аргумент до довільних замкнутих обмежених інтервалів.

    Якщо діапазон послідовності є скінченною множиною, то хоча б один елемент діапазону\(a_{n}\), повинен мати нескінченне попереднє зображення. Попереднє зображення\(a_{n}\) дає підпослідовність, яка сходиться до\(a_{n}\). Тому припускаємо, що діапазон послідовності нескінченний. \(S\)Дозволяти діапазон послідовності\(\left\langle a_{n}\right\rangle\).

    Визначаємо вкладену послідовність замкнутих інтервалів,\(I_{n}=\left\langle\left[b_{n}, c_{n}\right]\right| n \in\)\(\mathbb{N}\rangle\) що задовольняють

    (1)\(I_{0}=[0,1]\)

    (2) Для всіх\(n \in \mathbb{N}, I_{n+1} \subset I_{n}\)

    (3)\(c_{n}-b_{n}=\frac{1}{2^{n}}\)

    (4) Бо все\(n \in \mathbb{N}, I_{n} \cap S\) нескінченно.

    Нехай\(I_{0}=[0,1]\). Припустимо, що ми\(I_{n}\) задовольняємо вищезазначеним умовам. Хоча б один з інтервалів\(\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right]\) і\(\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right]\) повинен містити нескінченно багато елементів\(S\). Нехай\(I_{n+1}=\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right]\) якщо перетин цієї множини з\(S\) нескінченно; інакше нехай\(I_{n+1}=\)\(\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right]\). Тоді\(I_{n+1}\) задовольняє вищенаведеним умовам.

    Послідовність лівих кінцевих точок інтервалів\(I_{n},\left\langle b_{n} \mid n \in \mathbb{N}\right\rangle\) не зменшується. Послідовність правих кінцевих точок інтервалів\(I_{n}\), не\(\left\langle c_{n} \mid n \in \mathbb{N}\right\rangle\) збільшується. Крім того, для будь-якого\(m, n \in \mathbb{N}\),\[b_{m}<c_{n} .\] множина\(\left\{b_{n} \mid n \in \mathbb{N}\right\}\) обмежена вище, тому за допомогою властивості найменшої верхньої межі набір має найменшу верхню межу,\(\beta\). Аналогічно набір\(\left\{c_{n} \mid\right.\)\(n \in \mathbb{N}\}\) має найбільшу нижню межу\(\gamma\). За лемою\(8.5\)\ [\ почати {вирівняний} &\ lim _ {n\ rightarrow\ infty} b_ {n} =\ бета\\ &\ lim _ {n\ rightarrow\ infty} c_ {n} =\ гамма. \ end {aligned}\] За нерівністю трикутника, для будь-якого\(n \in \mathbb{N}\),\[|\beta-\gamma| \leq\left|\beta-b_{n}\right|+\left|b_{n}-c_{n}\right|+\left|c_{n}-\gamma\right| .\] Всі три члени на правій стороні нерівності мають тенденцію до 0 як\(n\) наближається до нескінченності, так і для будь-якого\(\varepsilon>0\),\[|\beta-\gamma|<\varepsilon .\] Отже \(\beta=\gamma\).

    Тепер ми хочемо визначити підпослідовність, яка сходиться до\(\beta\), вибираючи точку в кожному інтервалі\(I_{n}\) по черзі. Формально ми робимо це, визначаючи\(f \in \mathbb{N}^{\mathbb{N}}\) рекурсивно\[f(0)=0\] і\(f(n+1)\) є найменш\(k \in \mathbb{N}\) таким, що\[[k>f(n)] \wedge\left[a_{k} \in I_{n+1}\right] .\] Це добре визначено, оскільки\(S \cap I_{n+1}\) нескінченно. Потім послідовність\(\left\langle a_{f(n)}\right|\)\(n \in \mathbb{N}\rangle\) сходиться до\(\beta\). Щоб переконатися в цьому, давайте\(\varepsilon>0\). Для будь-якого\(n \in \mathbb{N}\) такого\(\frac{1}{2^{n}}<\varepsilon\),\[\left|\beta-a_{f(n)}\right|<c_{n}-b_{n}=\frac{1}{2^{n}}<\varepsilon .\] Тому\(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\) є збіжною підпослідовністю, що сходиться до\(\beta\).

    ВИЗНАЧЕННЯ. Послідовність Коші\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) Дозволяти бути послідовністю. Послідовність\(\left\langle a_{n}\right\rangle\) є послідовністю Коші, якщо\[(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall m, n \in \mathbb{N})[m, n \geq N] \Rightarrow\left[\left|a_{m}-a_{n}\right|<\varepsilon\right] .\] ТЕОРЕМА 8.7. Реальна послідовність сходиться, якщо це послідовність Коші. ДОКАЗ. \(\Rightarrow\)

    \(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\)Дозволяти послідовність дійсних чисел, яка сходиться до\(a \in \mathbb{R}\).

    Нехай\(\varepsilon>0\) і\(N \in \mathbb{N}\) бути таким, що\[(\forall n \geq N)\left|a-a_{n}\right|<\frac{\varepsilon}{2} .\] Тоді для будь-якого\(m, n \geq N\),\[\left|a_{n}-a_{m}\right| \leq\left|a_{n}-a\right|+\left|a-a_{m}\right|<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon .\] Тому\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) є послідовність Коші.

    \(\Leftarrow\)

    \(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\)Дозволяти бути послідовність Коші. Тоді\[(\exists N \in \mathbb{N})(\forall m, n>N)\left|a_{n}-a_{m}\right|<1 .\] Кожен член в послідовності після\(N^{\text {th }}\) терміну знаходиться в\(\varepsilon\) -сусідстві\(a_{N}\). Отже\[(\forall n \geq N) a_{n} \in\left[a_{N}-1, a_{N}+1\right] .\], послідовність\(\left\langle a_{n} \mid n \geq N\right\rangle\) задовольняє гіпотезам теореми БольцаноВейєрштрасса, і, таким чином, має збіжну підпослідовність.

    \(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\)Дозволяти збіжну підпослідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) сходяться до\(a \in \mathbb{R}\). Нехай\(\varepsilon>0\). Оскільки\(\left\langle a_{n}\right\rangle\) є Коші, є\(N_{1}\) таке, що\[\left(\forall m, n \geq N_{1}\right)\left|a_{m}-a_{n}\right|<\frac{\varepsilon}{2} .\] Крім того, є\(N_{2} \in \mathbb{N}\) таке, що\[\left(\forall n \geq N_{2}\right)\left|a_{f(n)}-a\right|<\frac{\varepsilon}{2} .\] Нехай\(N_{3} \geq N_{1}, f\left(N_{2}\right)\). Тоді\(N_{3} \geq N_{2}\) і\[\left(\forall n \geq N_{3}\right)\left|a_{n}-a\right| \leq\left|a_{n}-a_{f(n)}\right|+\left|a_{f(n)}-a\right|<\varepsilon .\] Тому послідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) сходиться до\(a\).

    Послідовності Коші отримують за сутністю порядку-повноту дійсних чисел. Послідовність Коші раціональних чисел не повинна сходитися до раціонального числа. Наприклад,\(a\) нехай будь-яке ірраціональне число, і\(a_{n}\) нехай десяткове наближення\(a\) до\(n^{\text {th }}\) цифри. Послідовність\(\left\langle a_{n}\right\rangle\) являє собою послідовність Коші раціональних чисел, яка сходиться до ірраціонального числа. Однак якщо послідовність Коші не може сходитися в наборі чисел, розумно сказати, що в наборі чисел є розрив. Реальні числа визначаються таким чином, щоб ці прогалини заповнилися.

    Тест коефіцієнта

    Одним із застосувань повноти порядку-повноти дійсних чисел є доведення того, що нескінченна послідовність сходиться, не маючи багато знати про число, до якого вона сходиться. У главі 5 ми натякаємо на тест співвідношення, стверджуючи, що поліном Тейлора для експоненціальної функції, оціненої на дійсне число\(a, \sum_{k=0}^{\infty} \frac{a^{k}}{k !}\), сходиться. Як довести, що нескінченна сума сходиться? Якщо ми маємо уявлення про його межі, ми можемо показати, що послідовність часткових сум наближається до цього значення. Так ми довели, що геометрична сума зі співвідношенням менше 1 сходиться. Багато важливих математичних функцій визначаються нескінченними сумами, а межа суми визначає значення функції. У цьому випадку нам потрібно показати, що сума сходиться за допомогою властивостей дійсних чисел.

    ВИЗНАЧЕННЯ. Абсолютна збіжність\(\left\langle a_{n}\right\rangle\) Дозволяти бути нескінченною послідовністю. Якщо нескінченна сума\[\sum_{k=0}^{\infty}\left|a_{k}\right|\] сходиться, то\(\operatorname{sum} \sum_{k=0}^{\infty} a_{k}\) нескінченне, як кажуть, сходиться абсолютно.

    ЛЕМА 8.8. Якщо нескінченна сума сходиться абсолютно, то вона сходиться.

    Доказ. Припустимо,\(\sum_{k=0}^{\infty} a_{k}\) сходиться абсолютно. Показано, що послідовність часткових сум цього ряду є послідовністю Коші.\(\left\langle s_{n} \mid n \in \mathbb{N}\right\rangle\) Бо\(n \in \mathbb{N}\), нехай\[b_{n}=\left|a_{n}\right| .\] потім\(\sum_{k=0}^{\infty} b_{k}\) сходиться. \(\left\langle t_{n} \mid n \in \mathbb{N}\right\rangle\)Дозволяти послідовність часткових сум\(\sum_{k=0}^{\infty} b_{k}\). За теоремою\(8.7,\left\langle t_{n}\right\rangle\) є послідовність Коші. Нехай\(\varepsilon>0\). Тоді є\(N \in \mathbb{N}\) таке, що для будь-якого\(n \geq m \geq N\),\[\left|t_{n}-t_{m}\right| \leq \varepsilon .\] шляхом узагальнення нерівності трикутника (див. Вправа 8.24)\[\left|s_{n}-s_{m}\right|=\left|\sum_{k=m+1}^{n} a_{k}\right| \leq \sum_{k=m+1}^{n} b_{k}=\left|t_{n}-t_{m}\right|<\varepsilon\] Звідси\(\left\langle s_{n}\right\rangle\) є послідовність Коші і сходиться. Тому\(\sum_{k=0}^{\infty} a_{k}\) сходиться.

    ТЕОРЕМА 8.9. Перевірка коефіцієнта Припустимо,\(\left\langle a_{k}\right\rangle\) це нескінченна послідовність дійсних чисел\(N \in \mathbb{N}\) і що є і додатне дійсне число\(r<1\) таке, що для всіх\(n \geq N\),\[\left|\frac{a_{n+1}}{a_{n}}\right| \leq r .\] Потім\(\sum_{k=0}^{\infty} a_{k}\) сходиться.

    Доказ. \(\sum_{k=0}^{\infty} a_{k}\)Дозволяти нескінченну суму з термінами, що задовольняють гіпотезу. Бо\(n \in \mathbb{N}\), нехай\(b_{n}=\left|a_{n}\right|\). За припущенням, є\(N \in \mathbb{N}\) і позитивне дійсне число\(r<1\) таке, що для всіх\(n \geq N\),\[\frac{b_{n+1}}{b_{n}} \leq r .\] Ми можемо припустити без втрати спільності\(N=0\), що, так як ряд\(\sum_{k=0}^{\infty} b_{k}\) сходиться iff \(\sum_{k=N}^{\infty} b_{k}\)сходиться, і при необхідності ми можемо ігнорувати скінченно багато термінів нескінченної суми. Ми стверджуємо, що для всіх\(n \in \mathbb{N}\),\[b_{n} \leq b_{0} r^{n} .\] якщо претензія\(n=0\) очевидна. Припустимо, що позов тримається на\(n\). За припущенням,\[\frac{b_{n+1}}{b_{n}} \leq r .\] Тому\[b_{n+1} \leq r b_{n} \leq r b_{0} r^{n} \leq b_{0} r^{n+1} .\] Вправа 5.28 геометрична сума з радіусом\(-1<r<1\) сходиться до\(\frac{1}{1-r}\). Тому для будь-якого\(n \in \mathbb{N}\),\[s_{n}:=\sum_{k=0}^{n} b_{k} \leq \sum_{k=0}^{n} b_{0} r^{k}=b_{0}\left(\sum_{k=0}^{\infty} r^{k}\right) \leq \frac{b_{0}}{1-r} .\] послідовність часткових сум\(\left\langle s_{n}\right\rangle\), є монотонною обмеженою послідовністю і по лемі\(8.5\), сходиться. Тому\(\sum_{k=0}^{\infty} a_{k}\) сходиться абсолютно. За Лемою\(8.8\) сума сходиться.

    Реальні функції

    Якщо ви перечитаєте текст обчислення, ви помітите, що багато теорем числення в кінцевому рахунку залежать від теореми проміжних значень.

    ТЕОРЕМА 8.10. Теорема про проміжні значення\(f\) Нехай є неперервною дійсною функцією на замкнутому обмеженому інтервалі\([a, b]\). Якщо\(f(a)<L<f(b)\) або\(f(b)<L<f(a)\) потім\[(\exists c \in(a, b)) \quad f(c)=L .\] ProOB. \(f\)Дозволяти неперервна дійсна функція на замкнутому обмеженому інтервалі\([a, b]\), і\(f(a)<L<f(b)\). Доводимо особливий випадок\(L=0\). З огляду на результат\(L=0\), теорема випливає з застосування спеціального випадку до функції\(f(x)-L\).

    Нехай\[X=\{x \in[a, b] \mid(\forall y \in[a, x]) f(y) \leq 0\} .\] тоді\(X \neq \emptyset\) і\(X\) обмежується вище\(b\). За найменш верхньою межою властивістю,\(X\) має найменшу верхню межу,\(m \leq b\). \(f\)Функція безперервна, а значить\(\lim _{x \rightarrow m} f(x)=f(m)\). Якщо\(f(m)=0\), теорема доведена.

    (i) Припустимо, що\(f(m)>0\). Нехай\(0<\varepsilon<f(m)\). Для будь-якого\(x \in[a, m)\),\(f(x) \leq 0\) а\[|f(x)-f(m)| \geq f(m)>\varepsilon\] отже, для будь-якого\(\delta>0\), є\(x\) в проколотому\(\delta\) -сусідство\(m\) такого, що\[|f(x)-f(m)| \geq \varepsilon\] Це суперечить припущення, що\(\lim _{x \rightarrow m} f(x)=f(m)\). Тому\(f(m) \leq 0 .\)

    (ii) Припустимо, що\(f(m)<0\). Нехай\(0<\varepsilon<|f(m)|\). Для будь-якого\(\delta>0\), є\(x \in(m, m+\delta)\) таке, що\(f(x)>0\). Інакше\[[a, m+\delta) \subseteq X,\] суперечить припущенню, що\(m\) є найменшою верхньою межею для\(X\). Таким чином, для будь-якого\(\delta>0\) є\(x\) в проколоті\(\delta\) -сусідство\(m\) такого, що\[|f(x)-f(m)| \geq|f(m)|>\varepsilon .\] Це суперечить припущенню, що\(f\) є безперервним в\(m\). Тому\(f(m)=0 .\)

    ТЕОРЕМА 8.11. Теорема про екстремальні значення Якщо\(f\) є неперервною дійсною функцією на замкнутому обмеженому інтервалі\([a, b]\), то\(f\) досягається максимум і мінімум на\([a, b]\).

    ProOf. Спочатку ми показуємо, що діапазон обмежений вище і нижче.\(\left.f\right|_{[a, b]}\) За способом протиріччя припустимо, що діапазон не обмежений вище.\(f\) Бо\(n \in \mathbb{N}\), нехай\(a_{n} \in[a, b]\) буде таким, що\(f\left(a_{n}\right)>n\). За теоремою Больцано-Вейєрштрасса послідовність\(\left\langle a_{n}\right\rangle\) має збіжну підпослідовність\(\left\langle a_{g(n)}\right\rangle\), що сходиться до деякого числа\(c \in[a, b]\). За безперервністю\(f\), якщо\(c \in(a, b)\) тоді\[f(c)=\lim _{x \rightarrow c} f(x)=\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right) .\] (Див. Вправа 8.25.) Якщо\(c\) є кінцевою точкою\([a, b]\), ми пред'являємо відповідну претензію на відповідний односторонній ліміт. Однак для будь-якого\(n \in \mathbb{N}\),\[f\left(a_{g(n)}\right)>g(n)>n .\] отже,\(\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right)\) не існує. Тому діапазон\(f\) обмежений вище. Аналогічно діапазон\(f\) обмежується нижче. За властивістю Найменша верхня межа діапазон\(f\) має найменшу верхню межу та найбільшу нижню межу\(L\).\(M\)

    Оскільки\(M\) є найменшою верхньою межею для діапазону\(f\), для будь-якого\(\varepsilon>0\), є\(x \in[a, b]\) таке, що\[|f(x)-M|<\varepsilon .\] для\(n \in \mathbb{N}^{+}\), нехай\(a_{n} \in[a, b]\) бути таким, що\[\left|f\left(a_{n}\right)-M\right|<\frac{1}{n} .\] Послідовність \(\left\langle a_{n}\right\rangle\)має збіжну підпослідовність за теоремою Больцано-Вейєрштрасса. \(\left\langle c_{n}\right\rangle\)Дозволяти збіжну підпослідовність\(\left\langle a_{n}\right\rangle\) з межею\(c \in[a, b]\). Оскільки\(\left\langle c_{n}\right\rangle\) є підпослідовністю\(\left\langle a_{n}\right\rangle\), для будь-якого\(n \in \mathbb{N}^{+}\),\[\left|f\left(c_{n}\right)-M\right|<\frac{1}{n} .\] Отже,\[\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M .\] безперервністю\(f\),\[\lim _{x \rightarrow c} f(x)=f(c)=\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M .\] якщо\(c \in(a, b)\) тоді\(c\) If є кінцева точка\([a, b]\) ми маємо аналогічну претензію на відповідну односторонню межу. Тому\(f\) досягається максимальне значення на\([a, b]\). За аналогічним аргументом,\(f\) досягається мінімальне значення на\([a, b]\).

    За теоремою про екстремальні значення неперервна функція досягає екстремальних значень на замкнутому обмеженому інтервалі. Легко побудувати приклади, для яких теорема виходить з ладу для відкритих інтервалів. Теорема про екстремальне значення має спільне з найменшою верхньою межою властивістю, що гарантує існування числа, що задовольняє бажаній умові, без надання додаткової інформації про саме число. Досить часто досить абстрактно знати, що функція досягає свого екстремуму без необхідності подальшого розрізнення об'єкта. Що ще можна зробити висновок про екстремальні значення функції? ТЕОРЕМА 8.12. \(f\)Дозволяти реальна функція, визначена на інтервалі\((a, b)\). Якщо\(c \in(a, b)\) таке, що\(f(c)\) є крайнім значенням\(f\) на\((a, b)\) і\(f\) диференціюється при\(c\), то\(f^{\prime}(c)=0\).

    ProOf. Нехай\(f\) і\(c\) задовольняють гіпотези теореми. Припустимо, що\(f(c)\) це максимальне значення, досягнуте\(f\) на\((a, b)\). Для будь-якого\(x \in(a, c), f(x) \leq f(c)\) і\[\frac{f(c)-f(x)}{c-x} \geq 0 .\] тому\[\lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x} \geq 0 .\] Аналогічно,\[\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 .\] Однак\(f\) диференційований на\(c\), тому\[0 \leq \lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x}=f^{\prime}(c)=\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 .\] подібний аргумент доводить претензію на\(f(c)\) мінімальне значення\(f\) на\((a, b)\).

    НАСЛІДОК 8.13. \(f\)Дозволяти неперервна дійсна функція на замкнутому обмеженому інтервалі\([a, b]\). Потім\(f\) досягає максимуму і мінімуму,\([a, b]\) і якщо\(c \in[a, b]\) це число, при якому\(f\) досягається екстремальне значення, то одне з наступних має бути вірним\(c\):

    (i)\(f^{\prime}(c)=0\)

    (ii)\(f\) не диференціюється при\(c\)

    (iii)\(c\) є кінцевою точкою\([a, b]\).

    ТЕОРЕМА 8.14. Теорема про середнє значення Дозволяє\(f\) бути неперервною дійсною функцією на замкнутому обмеженому інтервалі\([a, b]\) і диференційовною на\((a, b)\). Тоді є\(c \in(a, b)\) таке, що\[f^{\prime}(c)=\frac{f(b)-f(a)}{b-a} .\] Доказ. Спочатку доведено окремий випадок теореми про середнє значення, відомої як теорема Ролла. Припустимо, що\(f(a)=f(b)\). Доводимо, що\(x \in(a, b)\) таке є\(f^{\prime}(x)=0\).

    Якщо\(f\) постійний, то\(f^{\prime}(x)=0\) для всіх\(x \in(a, b)\). Припустимо, що\(f\) є непостійним і що є\(x \in(a, b)\) таке, що\(f(x)>f(a)\). За теоремою екстремальних\(f\) значень досягається максимальне значення\(M\) на\([a, b]\). Таким чином,\[M>f(a)=f(b) .\] Нехай\(c \in(a, b)\) буде таким, що\(f(c)=M\). За теоремою 8.12,\(f^{\prime}(c)=0\). Якщо\(x \in(a, b)\) таке є\(f(x)<f(a)\), то доказ аналогічний.

    Щоб довести теорему про середнє значення загалом, ми зведемо її до теореми Ролла. Віднімаємо від лінії\(f(x)\) відрізок, утворений\((a, f(a))\) і\((b, f(b))\). Нехай\[g(x)=f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(x-a) .\] Функція\(g(x)\) задовольняє гіпотези теореми Ролла. Так що є\(c \in(a, b)\) таке\(g^{\prime}(c)=0\). Оскільки у\[g^{\prime}(x)=f^{\prime}(x)-\frac{f(b)-f(a)}{b-a}\] нас є\[g^{\prime}(c)=f^{\prime}(c)-\frac{f(b)-f(a)}{b-a}=0\] і\[f^{\prime}(c)=\frac{f(b)-f(a)}{b-a} .\] Теорема про середнє значення має багато практичних наслідків, один з яких ми викладемо тут.

    НАСЛІДОК 8.15. \(f\)Дозволяти диференційовні функції на\((a, b)\). Якщо\(f^{\prime}(x)>0\) (Відп. \(f^{\prime}(x)<0\)) на\((a, b)\) потім\(f\) збільшується (відз. зменшення) на\((a, b)\).

    Кардинальність дійсних чисел

    Ми закінчили главу 6 з недоведеним твердженням про те, що дійсні числа є незліченними. Тепер, коли у нас є формальне визначення дійсних чисел, ми готові завершити наше розслідування кардинальності\(\mathbb{R}\). За теоремою\(6.11\) множина нескінченних десяткових послідовностей є незліченною, з кардинальністю\(2^{\aleph_{0}}\). Ми продовжували стверджувати, що це мало наслідки для кардинальності\(\mathbb{R}\). Розглянуто пов'язане питання про кардинальність замкнутого одиничного інтервалу\([0,1]\).

    Пропозиція 8.16. \(|[0,1]|=|\mathbb{R}|\).

    Доказ. Визначити\(f:[0, \infty) \rightarrow(1 / 2,1]\) по\[f(x)=\frac{1}{x+2}+1 / 2 \text {. }\] Тоді\(f\) - це ін'єкція. \(\mathbb{R}^{-}\)Дозволяти від'ємні дійсні числа, і визначити\(g: \mathbb{R}^{-} \rightarrow[0,1 / 2)\) за\[g(x)=\frac{-1}{x-2} .\] Потім\(g\) є ін'єкцією. \(h: \mathbb{R} \rightarrow[0,1]\)Дозволяти об'єднання функцій\(f\) і\(g\). Потім явно\(h\) робиться укол. Функція ідентичності на\([0,1]\) - це ін'єкція в\(\mathbb{R}\). За теоремою Шредера-Бернштейна\[|[0,1]|=|\mathbb{R}| \text {. }\] ми досліджуємо зв'язок між нескінченними десятковими розширеннями (які пов'язані з нескінченними десятковими послідовностями) та дійсними числами. Обмежуємо свою увагу нескінченними десятковими розширеннями чисел в одиничному інтервалі\([0,1]\).

    ВИЗНАЧЕННЯ. Нескінченне десяткове розширення Для всіх\(n \in \mathbb{N}^{+}\), нехай\(a_{n} \in\)\(\ulcorner 10\urcorner\). Потім\[a_{1} a_{2} \ldots a_{n} \ldots\] відбувається нескінченне десяткове розширення. \(s\)Дозволяти нескінченне десяткове розширення\(a_{1} a_{2} \ldots\). Для\(n \in \mathbb{N}\), нехай\[s_{n}:=a_{1} \ldots a_{n}=\sum_{k=1}^{n} a_{k} 10^{-k} .\] Ми хочемо, щоб зв'язати нескінченні десяткові розширення з дійсними числами (розуміється як Dedekind скорочення). Ми інтерпретуємо нескінченні десяткові розкладення як послідовності Коші раціональних чисел.

    \(D\)Дозволяти бути безліч нескінченних десяткових розширень, і нехай\(f: D \rightarrow \mathbb{R}\) бути визначені\[f\left(. a_{1} \ldots\right)=\lim _{n \rightarrow \infty} s_{n} .\]\(\left\langle s_{n}\right\rangle\) послідовність Коші послідовність, так що вона сходиться до дійсного числа. Нехай\[L:=\left\{x \in \mathbb{Q} \mid(\exists n \in \mathbb{N}) x<s_{n}\right\} .\] Набір\(L\) - це розріз Дедекінда і\(f(s)=L\). \[\lim _{n \rightarrow \infty} s_{n}=L .\]\(L\)Тобто найменша верхня межа множини\(\left\{s_{n} \mid n \in \mathbb{N}\right\}\). Ми можемо пов'язати з кожним нескінченним десятковим розширенням дійсне число в одиничному інтервалі, і може тим самим визначити функцію\(f: D \rightarrow[0,1]\). Це\(f\) відмова? Тобто, чи може кожне дійсне число в одиничному інтервалі бути реалізовано як нескінченне десяткове розширення? Нехай\(x \in[0,1]\). Визначено зростаючу послідовність раціональних чисел, що сходяться до\(x\). Для\(n \in N^{+}\), нехай\(s_{n}\) буде найбільшим десятковим розширенням до\(n\) десяткових знаків, що не більше\(x\). Якщо\(n<m\),\(s_{n}\) то відбувається усічення\(s_{m}\). Нехай\[s=\lim _{n \rightarrow \infty} s_{n} .\] тоді\(f(s)=x\). Тому\(f\) є вигнання на\([0,1]\).

    Було б ідеально,\(f\) якби ін'єкція, бо це випливало б, що скорочення Дедекінда - це лише нескінченні десяткові розширення. Однак це неправда. Припустимо, що\[s=. a_{1} \ldots a_{n} a_{n+1} \ldots\] де\(a_{n} \neq 9\) і для всіх\(k>n, a_{k}=9\). Якщо\[t=. a_{1} \ldots a_{n-1}\left(a_{n}+1\right) 000 \ldots\] тоді\[f(s)=f(t) .\] Якщо ні\(s\)\(t\) ні нескінченні десяткові розширення, які закінчуються в повторюванні 9, і\(s<t\), то є деякі\(n\) такі, що\(s<t_{n}\). Отже, раціональне число\(\left(s_{n}+t_{n}\right) / 2\) знаходиться в\(f(t)\) розрізі Дедекінда, а не в\(f(s)\), так\(f(s) \neq f(t)\). Тому ми довели наступну теорему.

    ТЕОРЕМА 8.17. \(D_{0}\)Дозволяти множина нескінченних десяткових розширень для чисел в одиничному інтервалі. \(f: D_{0} \rightarrow[0,1]\)Дозволяти визначатися\[f\left(. a_{1} a_{2} \ldots\right)=\lim _{n \rightarrow \infty} . a_{1} \ldots a_{n}=\sum_{k=1}^{\infty} a_{k} 10^{-k} .\] Тоді\(f\) є surjection. Крім того, два різних десяткових розширення\(f\) ідентифікуються, якщо одне з них має форму\(a_{1} a_{2} \ldots a_{n} 9999 \ldots\) з,\(a_{n} \neq 9\) а інше є. \(a_{1} a_{2} \ldots\left(a_{n}+1\right) 000 \ldots .\)

    НАСЛІДОК 8.18. \(|[0,1]|=2^{\aleph_{0}}\).

    ДОКАЗ. За Леммою 8.17, Пропозиція\(6.15\) та теорема 6.11,\[|[0,1]| \leq\left|D_{0}\right|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\]зображення\[g\left(\left\langle a_{n}\right\rangle\right)=. a_{1} a_{2} \ldots\] і\(h: D_{0} \rightarrow[0,1]\) бути визначені як в аргументі для теореми 8.17. Потім\(h \circ g:\ulcorner 2\urcorner^{\mathbb{N}} \rightarrow[0,1]\) ін'єкція, і так\[2^{\aleph_{0}} \leq|[0,1]| .\] За теоремою Шредера-Бернштейна\[|[0,1]|=2^{\aleph_{0}} .\], НАСЛІДКИ 8.19. \(|\mathbb{R}|=2^{\aleph_{0}}\).

    Замовлення-повнота

    Наведено аргумент за незліченність\(\mathbb{R}\) залежності тільки від його властивостей абстрактного порядку.

    ВИЗНАЧЕННЯ. Завершення замовлення Дозволяє\((X, \leq)\) бути лінійно впорядкованим набором. Він називається order-complete якщо, коли\(A\) і\(B\) є непорожніми\(X\) підмножинами з властивістю, яка\[(\forall a \in A)(\forall b \in B) \quad a \leq b,\] існує\(c\) в\(X\) такому, що\[(\forall a \in A)(\forall b \in B) \quad a \leq c \leq b .\] Зверніть увагу, що будь-який order-complete set повинен мати найменшу верхню межу властивість - якщо\(A\) будь-який непорожній обмежений набір, нехай\(B\) буде набір усіх верхніх меж для\(A\), а потім\(c\) from (8.20) є (унікальною) найменшою верхньою межею для \(A\).

    Визначення. Щільний\((X, \leq)\) Дозволяти лінійно впорядкований набір, і\(Y \subseteq\)\(X\). Ми говоримо\(Y\) щільно,\(X\) якщо\[(\forall a<b \in X)(\exists y \in Y) a<y<b .\] визначення. Розширення\(\left(Y, \leq_{Y}\right)\) Дозволяти\(\left(X, \leq_{X}\right)\) і бути лінійно впорядкованими множинами. Ми говоримо, що\(\left(Y, \leq_{Y}\right)\) це розширення\(\left(X, \leq_{X}\right)\) якщо\(X \subseteq Y\) і, для всіх\(x_{1}, x_{2}\) в\(X\),\[x_{1} \leq_{X} \quad x_{2} \quad \text { iff } \quad x_{1} \leq_{Y} x_{2} .\] ТЕОРЕМА 8.21. \((X, \leq)\)Дозволяти бути продовженням\((\mathbb{Q}, \leq)\). Якщо\((X, \leq)\) є\(\mathbb{Q}\) порядком-повним і щільним в\(X\),\(X\) то незліченним.

    Доказ. Припустимо, що\(X\) це зліченний порядок повного розширення\(\mathbb{Q}\) і\(\mathbb{Q}\) що щільно в\(X\).

    Нехай послідовність\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) буде біекцією від\(\mathbb{N}\) до\(X\). Зверніть увагу, що послідовність накладає порядок на\(X\). \(\preceq\)Дозволяти визначатися\(X\) на\[(\forall m, n \in \mathbb{N}) a_{m} \preceq a_{n} \Longleftrightarrow m \leq n .\] Тобто, для будь-якого,\(x, y \in X, x \preceq y\) якщо\(x\) з'являється в послідовності\(\left\langle a_{n}\right\rangle\) перед\(y\). Тоді\(\preceq\) це добре впорядкування\(X\).

    З огляду на\(Y \subseteq X\) і\(y_{0} \in Y\), ми говоримо, що\(y_{0}\) це\(\preceq\) -мінімальний елемент\(Y\) якщо\[(\forall x \in Y) y_{0} \preceq x .\] так кожен підмножина\(X\) має\(\preceq\) -мінімальний елемент.

    Визначимо дві підпослідовності\(\left\langle a_{n}\right\rangle\), звані\(\left\langle a_{f(n)}\right\rangle\) і\(\left\langle a_{g(n)}\right\rangle\), так що для будь-якого\(n \in \mathbb{N}\)

    (1)\(f(n+1)>g(n)\)

    (2)\(g(n)>f(n)\)

    (3)\(a_{f(n+1)}\)\(\preceq\) -мінімальний елемент множини\[\left\{y \in X \mid a_{f(n)}<y<a_{g(n)}\right\}\] (4)\(a_{g(n+1)}\) є\(\preceq\) -мінімальний елемент множини\[\left\{y \in X \mid a_{f(n+1)}<y<a_{g(n)}\right\} .\] Ми визначаємо підпослідовності шляхом рекурсії, використовуючи послідовність\(\left\langle a_{n}\right\rangle\) до ретельно контролювати конструкцію. Цей аргумент називається аргументом назад і вперед. За даними скінченних послідовностей довжини, що\(N\) задовольняють перерахованим вище властивостям, визначено з\(a_{f(N+1)}\) урахуванням обмежень, накладених\(a_{f(N)}\) і\(a_{g(N)}\). Потім ми визначаємо\(a_{g(N+1)}\) предмет обмежень, накладених\(a_{f(N+1)}\) і\(a_{g(N)}\). Потім визначаємо\(a_{f(N+2)}, a_{g(N+2)}\), і так далі.

    Нехай\(f(0)=0\). Отже\(a_{f(0)}=a_{0}\). \(g(0)\)Дозволяти найменше ціле число\(n\) таке, що\(a_{0}<a_{n}\). Зверніть увагу, що це еквівалентно визначенню\(g(0)\) так\(a_{g(0)}\) що\(\preceq\) -мінімальний елемент\(X\) більше ніж\(a_{0}\). Припустимо, ми визначили кінцеві підпослідовності,\(\left\langle a_{f(n)} \mid n \leq N\right\rangle,\left\langle a_{g(n)} \mid n \leq N\right\rangle\) що задовольняють властивостям порядку, перерахованим вище. Ми визначимо\(a_{f(N+1)}\) та\(a_{g(N+1)}\) задовольняємо властивості замовлення, перераховані вище. Набір\(X\) містить раціональні числа і так як\(\mathbb{Q}\) щільний в\(X\), є елемент, такий\(X\)\(x\), що\[a_{f(N+1)}<x<g_{(N+1)} .\]\(a_{f(N+1)}\) Дозволяти бути\(\preceq\) -мінімальний елемент\(X\) такого, що\[a_{f(N)}<a_{f(N+1)}<a_{g(N)} .\] так як\(\preceq\) добре\(X, f(N+1)\) впорядковується добре визначено. Ми дозволяємо\(a_{g(N+1)}\) бути\(\preceq\) -мінімальним елементом\(X\) такого, що\[a_{f(N+1)}<a_{g(N+1)}<a_{g(N)} .\] За нашим попереднім обговоренням,\(g(N+1)\) чітко визначено. Зверніть увагу, що для будь-якого\(m, n \in \mathbb{N}\),\[a_{f(m)}<a_{g(n)} .\] Тому зростаюча послідовність\(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\) обмежена вище, і Лемма 8.5, послідовність сходиться до її найменшої верхньої межі,\(a\).

    Для будь-якого\(n \in \mathbb{N}\),\[a_{f(n)}<a<a_{g(n) .} .\] Так не\(a\) є терміном жодної підпослідовності. Ми показуємо, що\(a\) це не термін у послідовності\(\left\langle a_{n}\right\rangle\). Припустимо, шляхом протиріччя, що\(a=a_{n}\) для деяких\(n \in \mathbb{N}\). З тих пір\(f(0)=0, n \neq 0\). Нехай\[Y=(f[\mathbb{N}] \cup g[\mathbb{N}]) \cap\ulcorner n\urcorner .\] Тоді\(Y \neq \emptyset\) є кінцевим, і має максимальний елемент.

    Якщо максимальний елемент\(Y\) є\(f(0)\), то для кожного\(1 \leq k<n\), ми повинні мати\(a_{k}<a_{0}\). Але тоді\(g(0)\) буде\(n\), що суперечить тому,\(n\) що не в асортименті\(g\).

    Якщо максимальний елемент\(Y\) є\(f(m+1)\) для деяких\(m\), то\(g(m+1)>\)\(n\), і\[f(m+1)<n<g(m+1) .\] Однак\[a_{f(m+1)}<a_{n}<a_{g(m+1)}<a_{g(m) .} .\] Це неможливо, так як\(a_{g(m+1)}\) є\(\preceq\) - мінімальний елемент\(X\) у відкритому інтервалі\(\left(a_{f(m+1)}, a_{g(m)}\right)\).

    Якщо максимальний елемент\(Y\) є\(g(m)\) для деяких\(m\), то\(f(m+1)>n\) і\[g(m)<n<f(m+1) .\] Однак\[a_{f(m)}<a_{f(m+1)}<a_{n}<a_{g(m)} .\] Це неможливо, оскільки\(a_{f(m+1)}\) є\(\preceq\) -мінімальним елементом \(X\)у відкритому проміжку\(\left(a_{f(m)}, a_{g(m)}\right)\). Так що не\(a\) є терміном в послідовності\(\left\langle a_{n}\right\rangle\). Тому немає ніякого біекції від\(\mathbb{N}\) до\(X\), і\(X\) є незліченним.

    За вправою 8.20,\(\mathbb{Q}\) є щільним в\(\mathbb{R}\). Оскільки множина дійсних чисел завершена по теоремі найменшої верхньої межі, отримаємо:

    НАСЛІДОК 8.22. Безліч дійсних чисел є незліченним.

    ТЕОРЕМА 8.23. \(\left(X, \leq_{X}\right)\)Дозволяти бути порядковим розширенням,\(\mathbb{Q}\) в якому\(\mathbb{Q}\) щільно, і таке, що не\(X\) має максимального або мінімального елемента. Тоді існує біекція, що зберігає порядок від\(\mathbb{R}\) на\(X\), що є ідентичністю\(\mathbb{Q}\).

    Доказ. Визначимося з картою\(f: \mathbb{R} \rightarrow X\). Якщо\(q \in \mathbb{Q}\), визначте\(f(q)=q\). Якщо\(\alpha \in \mathbb{R} \backslash \mathbb{Q}\), визначте,\(f(\alpha)\) щоб бути найменшою верхньою межею\(X\) в\(\{q \in \mathbb{Q} \mid q \leq \alpha\}\). \(f\)Функція чітко визначена, тому що\(X\) має властивість Найменша верхня межа. Він є ін'єкційним, тому що якщо\(\alpha \neq \beta\), між\(\alpha\) і є раціональні числа\(\beta\).

    Показати\(f\) це на, припустимо\(x \in X\). Визначте,\(\alpha \in \mathbb{R}\) щоб бути найменшою верхньою межею в\(\mathbb{R}\) of\(\left\{q \in \mathbb{Q} \mid q \leq_{X} x\right\}\). Потім\(f(\alpha)=x\).

    Нарешті,\(f\) це збереження порядку, тому що якщо\(\alpha \leq \beta\), то\(f(\beta)\) визначається як найменша верхня межа надмножини множини, чия найменша верхня межа\(f(\alpha)\), і так\(f(\alpha) \leq_{X} f(\beta)\).

    ЗАУВАЖЕННЯ. Що станеться, якщо ми відкинемо вимогу, яка не\(X\) має максимального або мінімального елемента?

    Вправи

    ВПРАВА 8.1. \(S\)Дозволяти бути наступником функції у визначенні 8.1. Доведіть, що\[S(\emptyset) \neq \emptyset .\] Доведіть, що для будь-якого набору\(X\),\[S(X) \neq X .\] Вправа 8.2. Доведіть, що немає належної підмножини\(\mathbf{N}\) (див. Рівняння 8.1) є індуктивним.

    ВПРАВА 8.3. \(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in Y\right\}\)Дозволяти сімейство індуктивних множин, індексованих по\(Y\). Доведіть, що\[\bigcap_{\alpha \in Y} X_{\alpha}\] є індуктивним.

    ВПРАВА 8.4. Доведіть, що додавання і множення в\(\mathbb{N}\) (як формально визначено в Розділі 8.1) асоціативні, комутативні та розподільні.

    ВПРАВА 8.5. Довести, що відношення,\(\leq\) визначене\(\mathbb{N}\) в розділі\(8.1\), є лінійним упорядкуванням\(\mathbb{N}\).

    ВПРАВА 8.6. Доведіть, що додавання та множення в\(\mathbb{Z}\) (як формально визначено в розділі 8.2) є асоціативними, комутативними та розподільними.

    ВПРАВА 8.7. Довести, що відношення,\(\leq\) визначене\(\mathbb{Z}\) в розділі\(8.2\), є лінійним упорядкуванням\(\mathbb{Z}\).

    ВПРАВА 8.8. Доведіть, що\(\leq\) це добре впорядкування,\(\mathbb{N}\) але не з\(\mathbb{Z}\) (використовуючи формальне визначення відношення).

    ВПРАВА 8.9. Доведіть, що додавання і множення в\(\mathbb{Z}\) і відношення\(\leq\) на\(\mathbb{Z}\) розширює операції і відношення на\(\mathbb{N}\). Дозвольте\(I: \mathbb{N} \rightarrow \mathbb{Z}\) бути визначені\[I(n)=[\langle n, 0\rangle] .\] Доведіть, що\(I\) це ін'єкція і що для всіх\(m, n \in \mathbb{N}\),\[I(m+n)=I(m)+I(n),\]\[I(m \cdot n)=I(m) \cdot I(n)\] і\[m \leq n \Rightarrow I(m) \leq I(n)\] Зверніть увагу, що операції на лівій стороні рівнянь \(8.24\)і\(8.25\) визначаються в\(\mathbb{N}\) і з правого боку визначаються в\(\mathbb{Z}\). Аналогічно визначено\(8.26\) попереднє твердження,\(\mathbb{N}\) а наслідок визначається в\(\mathbb{Z}\).

    ВПРАВА 8.10. Доведіть, що додавання та множення\(\mathbb{Q}\) (як формально визначено в розділі 8.3) є асоціативними, комутативними та розподільними.

    ВПРАВА 8.11. Довести, що відношення,\(\leq\) визначене\(\mathbb{Q}\) в розділі\(8.3\), є лінійним упорядкуванням\(\mathbb{Q}\).

    ВПРАВА 8.12. Доведіть, що додавання і множення на\(\mathbb{Q}\) і відношення\(\leq\) на\(\mathbb{Q}\) розширює операції і відношення на\(\mathbb{Q}\). Дозвольте\(I: \mathbb{Z} \rightarrow \mathbb{Q}\) бути визначені\[I(a)=[\langle a, 1\rangle] .\] Доведіть, що\(I\) це ін'єкція і що для всіх\(a, b \in \mathbb{Z}\),\ [\ begin {зібраний} I (a+b) =I (b)\\ I (a\ cdot b) =I (a)\ cdot I (b) \ end {зібрався}\] і\[a \leq b \Rightarrow I(a) \leq I(b)\] Примітка що операції на лівій стороні рівнянь\(8.27\) і\(8.28\)\(\mathbb{Z}\) визначені в і з правого боку визначені в\(\mathbb{Q}\). Аналогічно визначено\(8.29\) попереднє твердження,\(\mathbb{Z}\) а наслідок визначається в\(\mathbb{Q}\).

    ВПРАВА 8.13. Доведіть, що кожен ненульовий елемент\(\mathbb{Q}\) має мультиплікативний зворотний в\(\mathbb{Q}\). Вправа 8.14. Доведіть твердження (1), (2) та (3) у розділі 8.4.

    Вправа 8.15. Доведіть теорему 8.2.

    Вправа 8.16. Нехай\(X \subseteq \mathbb{R}, Y \subseteq \mathbb{R}\) і нехай кожен елемент\(X\) бути менше, ніж кожен елемент\(Y\). Доведіть, що є\(a \in \mathbb{R}\) задовольняє\[(\forall x \in X)(\forall y \in Y) x \leq a \leq y .\] ВПРАВА 8.17. Дозвольте\(X \subseteq \mathbb{R}\) бути обмеженим вище. Доведіть, що найменша верхня\(X\) межа унікальна.

    ВПРАВА 8.18. \(X \subseteq \mathbb{R}\)Дозволяти бути обмежені нижче. Доведіть, що\(X\) має найбільшу нижню межу.

    Вправа 8.19. Доведено лише окремий випадок теореми Больцано-Вейєрштрасса (теорема 8.6) (де\([b, c]\) замкнутий одиничний інтервал,\([0,1])\). Узагальнити доказ до довільного\(b, c \in \mathbb{R}\) де\(b \leq c\).

    Вправа 8.20. Нехай\(X \subseteq \mathbb{R}\). Ми говоримо,\(X\) що щільно в\(\mathbb{R}\) якщо дано будь-який\(a, b \in \mathbb{R}\) з\(a<b\), є\(x \in X\) таке, що\[a \leq x \leq b .\] а) Доведіть,\(\mathbb{Q}\) що щільно в\(\mathbb{R}\).

    б) Доведіть,\(\mathbb{R} \backslash \mathbb{Q}\) що щільно в\(\mathbb{R}\).

    ВПРАВА 8.21. \(\left\langle a_{n}\right\rangle\)Дозволяти бути ін'єкційна послідовність. Яка кардинальність множини всіх підпослідовностей\(\left\langle a_{n}\right\rangle\)? Що можна сказати про множину підпослідовностей неін'єкційної послідовності?

    ВПРАВА 8.22. \(s\)Дозволяти нескінченне десяткове розширення\(n \in \mathbb{N}^{+}\), і для будь-якого, нехай\(s_{n}\) бути усічення\(s\) до\(n^{t h}\) десяткового знака. Доведіть, що послідовність\(\left\langle s_{n}\right\rangle\) є послідовність Коші.

    Вправа 8.23. \(\left\langle a_{n}\right\rangle\)Дозволяти збіжну послідовність і\(\left\langle a_{f(n)}\right\rangle\) бути підпослідовністю\(\left\langle a_{n}\right\rangle\). Доведіть, що\[\lim _{n \rightarrow \infty} a_{n}=\lim _{n \rightarrow \infty} a_{f(n)} .\] вправа 8.24. Доведіть наступне узагальнення нерівності трикутника: якщо ряд\(\sum_{n=0}^{\infty} a_{n}\) сходиться, то\[\left|\sum_{n=0}^{\infty} a_{n}\right| \leq \sum_{n=0}^{\infty}\left|a_{n}\right| .\] ВПРАВА 8.25. \(f\)Дозволяти бути реальна функція безперервної в\(a\), і\(\left\langle a_{n}\right\rangle\) нехай послідовність сходяться до\(a\). Доведіть, що\[\lim _{n \rightarrow \infty} f\left(a_{n}\right)=f(a) .\] вправа 8.26. Наведіть приклад неперервної функції на відкритому інтервалі, яка досягає своїх крайніх значень на інтервалі. Наведіть приклад неперервної функції, визначеної на відкритому інтервалі, яка не досягає своїх крайніх значень на інтервалі.

    Вправа 8.27. Завершити доказ теореми\(8.12\) - тобто довести результат для\(f(c)\) мінімального значення\(f\) на\((a, b)\).

    ВПРАВА 8.28. Доведіть наслідок 8.15.

    ВПРАВА 8.29. Довести, що будь-яка безперервна ін'єкційна реальна функція на інтервалі є монотонним на цьому інтервалі.

    ВПРАВА 8.30. Доведіть, що немає безперервного біекції від\((0,1)\) до\([0,1]\).

    Вправа 8.31. Доведіть, що кожен многочлен в\(\mathbb{R}[x]\) непарного ступеня має принаймні один реальний корінь.

    Вправа 8.32. Доведіть, що якщо у вас квадратний стіл, з ніжками однакової довжини, і суцільним підлогою, ви завжди можете обертати стіл так, щоб всі 4 ніжки одночасно стикалися з підлогою. (Підказка: Застосуйте теорему проміжного значення до відповідним чином обраної функції). Це одне з найбільш ранніх застосувань математики до кав'ярень.

    ВПРАВА 8.33. Доказ Пропозиції 8.16 вимагає, щоб ненульові дійсні числа мали взаємні (а отже, частки дійсних чисел чітко визначені). Доведіть, що ненульові дійсні числа мають взаємні. Вправа 8.34. Покажіть, що існує рівно 4 завершених розширень порядку,\(\mathbb{Q}\) в яких\(\mathbb{Q}\) щільно. ГЛАВА 9

    Комплексні числа

    Кубіки

    Як знайти коріння кубічного многочлена? Вавилоняни знали квадратичну формулу ще в другому тисячолітті до нашої ери, але формула кубічного була знайдена лише в\(16^{\text {th }}\) столітті. Історія відкриття складна, але велика частина кредиту повинна йти Ніколо Тарталья. Рішення було опубліковано в 1545 році в дуже впливовій книзі Джироломо Кардано Artis magnae sive de regulis algebraicis liber unus. Формула\(9.2\) відома сьогодні як формула Тарталья-Кардано. Для історичного рахунку див. Наприклад, [6].

    Розглянемо кубічний многочлен в\(\mathbb{R}[x]\)\[p(x)=a_{3} x^{3}+a_{2} x^{2}+a_{1} x+a_{0} .\] Якщо ми хочемо знайти коріння, немає втрати спільності в\(p\) припущенні\(a_{3}=1\), що, оскільки нулі збігаються з нулями\(\frac{1}{a_{3}} p\).

    Друге спрощення полягає в тому, що ми можемо припустити\(a_{2}=0\). Дійсно, зробити зміну змінної\[x=y-\beta,\] для деяких,\(\beta\) які будуть обрані пізніше. Потім\ [\ почати {вирівнювання} p (x) &=x^ {3} +a_ {2} x^ {2} +a_ {1} x+a_ {0}\ & =( y-\ бета) ^ {3} +a_ {2} (y-\ бета) ^ {2} +a_ {1} (y-\ бета) +a_ {0}\ &=y^ {3} +\ лівий [a_ {2} -3\ бета\ справа] y^ {2} +\ лівий [a_ {1} -2 a_ {2}\ бета+3\ бета^ {2}\ праворуч] y+\ ліворуч [a_ {0} -a_ {1}\ бета+a_ {2}\ beta^ {2} -\ beta^ {3}}\ право]\\ & ; =:\ квадрат q (y). \ end {вирівняний}\] Вибрати\(\beta=a_{2} / 3\). Потім коефіцієнт\(y^{2}\) in\(q(y)\) зникає. Припустимо, що можна знайти коріння\(q\), назвіть їх\(\alpha_{1}, \alpha_{2}, \alpha_{3}\). Тоді коріння вихідного многочлена\(p\) знаходяться\(\alpha_{1}-\beta, \alpha_{2}-\beta, \alpha_{3}-\beta\).

    Тому достатньо знайти формулу для коренів кубічного, в якому квадратичний член зникає. Це називається зменшеним кубічним. Оскільки зараз залишилося лише два коефіцієнти, ми скинемо індекси і запишемо наш зменшений кубічний як\[q(x)=x^{3}+a x+b .\] Ключова ідея полягає в тому, щоб зробити іншу, більш геніальну, підміну. Введемо нову змінну\(w\), пов'язану\(x\) з\[x=w+\frac{c}{w},\] де\(c\) є константою, яку ми виберемо пізніше. Потім\ [\ почати {вирівняний} q (x) &=\ лівий (w+\ frac {c} {w}\ праворуч) ^ {3} +a\ лівий (w+\ frac {c} {w}\ праворуч) +b\\ &= w^ {3} + [3 c+a] w+\ лівий [3 c^ {2} +a c\ праворуч]\ frac {1} {w} +c^ {3}\ розрив {1} {w^ {3}} +b. \ end {aligned}\] Виберіть,\[c=-\frac{a}{3},\] щоб обидва коефіцієнти\(w\) і\(1 / w\) in (9.4) зникли. Потім знайти\(x\) так, що\(q(x)=0\) це те ж саме, що знайти\(w\) так, що\ [\ begin {вирівняні} w^ {3} +\ frac {c^ {3}} {w^ {3}} +b &= 0\\ \ Longleftrightarrow w^ {6} +b w^ {3} +c^ {3} &=0. \ end {aligned}\] Рівняння (9.5) має ступінь 6, що здається гіршим, ніж початковий кубічний; але так багато термінів зникають, що це насправді квадратне рівняння в\(w^{3}\). Тому вона може вирішуватися за квадратичною формулою:\[w^{3}=\frac{-b \pm \sqrt{b^{2}-4 c^{3}}}{2} .\] Знаючи\(w\), ми можемо відновитися\(x\)\[x=w+\frac{c}{w}=w-\frac{a}{3 w} .\] Таким чином, ми приходимо до формули Тарталії - Кардано для коренів зменшеної кубічної (9.2):\[x=\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}-\frac{a}{3\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}} .\] Як формула працює на практиці?

    Приклад 9.8. Нехай\(p(x)=x^{3}-3 x+2\). Потім\(c=1\), і (9.6) говорить\(w^{3}=-1\). \(w=-1\)Тому і так\(x=-2\) є корінь. Тому Лемма\(4.13,(x+2)\) є фактором\(p\). Факторинг, ми\[x^{3}-3 x+2=(x+2)\left(x^{2}-2 x+1\right) .\] отримуємо останній термін фактори як\((x-1)^{2}\), тому робимо висновок, що коріння є\(-2,1,1\).

    У прикладі 9.8 формула спрацювала, але лише дала нам одне з коренів. Розглянемо наступний приклад:

    ПРИКЛАД 9.9. Нехай\[p(x)=x^{3}-3 x+1 .\] Тоді\(c=1\), і\[w^{3}=\frac{-1 \pm \sqrt{-3}}{2} .\] Тепер у нас є гірша проблема:\(w^{3}\) включає квадратний корінь негативного числа, і навіть якщо ми маємо сенс цього, ми потім повинні витягти куб корінь. Це аналогічно спробі вирішити квадратне рівняння\[q(x):=x^{2}+x+1=0 ?\] Квадратична формула знову дає праву частину\((9.11)\), і ми пояснюємо це тим, що насправді не\(q\) має реальних коренів. Дійсно, графіка показує, що\(q\) виглядає як рис. 9.12.

    зображення

    МАЛЮНОК 9.12. Сюжет\(q(x)=x^{2}+x+1\)

    Але це не може бути так\(p\). Дійсно,\ [\ begin {вирівняний} p (-2) &=-1<0\\ p (0) &=1>0\ p (1) &=-1<0\\ p (2) &=3>0 \ end {вирівняний}\] Отже, за теоремою проміжних значень\(8.10, p\) повинен мати корінь у кожному з інтервалів\((-2,0),(0,1)\) і \((1,2)\). Як\(p\) може мати не більше 3 коренів за теоремою\(4.10\), отже, він повинен мати рівно три корені. Графік\(p\) виглядає як рис. 9.13.

    Виявляється, можна знайти коріння\(p\) в\(9.9\) Прикладі, правильно інтерпретувавши формулу Тартаглія-Кардано. Ми повернемося до цього прикладу в розділі 9.3, після того як розробимо необхідні ідеї. Велика ідея полягає в тому, щоб ввести поняття комплексного числа.

    Комплексні числа

    ВИЗНАЧЕННЯ. Комплексне число Комплексне число - це вираз виду\(a+i b\), де\(a\) і\(b\) є дійсними числами.

    зображення

    МАЛЮНОК 9.13. Сюжет\(p(x)=x^{3}-3 x+1\)

    На даний момент ви можете думати про\(i\) in\(a+i b\) як про формальний символ, або місце власника. Пізніше ми побачимо, що воно має інше тлумачення.

    Позначення. \(\mathbb{C}\)Давайте\(\mathbb{C}\) позначимо множину всіх комплексних чисел:\[\mathbb{C}=\{a+i b: a, b \in \mathbb{R}\} .\] Як множина, можна ідентифікувати\(\mathbb{C}\) з\(\mathbb{R}^{2}\) очевидним чином. Це дозволяє нам визначити додавання; що не так очевидно, це те, що існує також гарне визначення для множення.

    ВИЗНАЧЕННЯ. \(c+i d\)Дозволяти\(a+i b\) і бути комплексними числами. Потім їх сума і добуток визначаються за допомогою\ [\ begin {вирівняні} (a+i b) + (c+i d) & =( a+c) +i (b+d)\\ (a+i b)\ times (c+i d) & =( a c-b d) +i (a d+b c). \ end {aligned}\] Формула для суми (9.14) - це саме те, що ви отримаєте, якби ви ідентифікували комплексне число\(a+i b\) з вектором\((a, b)\) в\(\mathbb{R}^{2}\) і використовували векторне додавання. Продукт більш тонкий. Якщо помножити ліву частину (9.15), ви отримаєте\[a c+i(a d+b c)+i^{2} b d .\] Один приходить праворуч від (9.15), визначаючи\[i^{2}=-1 \text {. }\] Так\(i\) квадратний корінь\(-1\); тобто це алгебраїчна величина, яку ми вводимо, яка визначена для мають властивість, що його площа\(-1\). Очевидно, що це\(i\) виключає реальне число.

    По суті, ми продовжили програму визначення систем числення, яку ми розпочали в главі 8. Додавання та множення комплексних чисел визначено алгебраїчними операціями на\(\mathbb{R} \times \mathbb{R}\). Оскільки алгебраїчні операції над дійсними числами були визначені множинно-теоретично, ми тим самим визначили алгебраїчні операції\(\mathbb{C}\) по множинним операціям. На відміну від інших систем чисел, які ми визначили, ми не визначаємо лінійне впорядкування\(\mathbb{C}\). Як правило, не корисно думати про комплексні числа на числовому рядку. Однак дуже корисно думати про комплексні числа як точки на площині\(\mathbb{R}^{2}\), і описувати їх у полярних координатах.

    Як завжди, точка з декартовими координатами\((x, y)\) має полярні координати\((r, \theta)\), де вони пов'язані\ [\ begin {масив} {cl} r=\ sqrt {x^ {2} +y^ {2}} &\ tan (\ theta) =y/ x\ x = r\ cos\ theta & y=r\ sin\ theta. \ end {array}\] Таким чином, комплексне число також\(z=x+i y\) можна записати як\[z=r(\cos \theta+i \sin \theta) .\] Форма (9.18) настільки широко використовується, що для нього існує спеціальне позначення.

    зображення

    МАЛЮНОК 9.17. Полярні координати

    Позначення. Cis\[\operatorname{Cis}(\theta):=\cos \theta+i \sin \theta .\] ВИЗНАЧЕННЯ. Для комплексного числа\(z=x+i y=r \operatorname{Cis}(\theta)\) ми маємо наступне:

    \(\Re(z) x\)називається реальна частина\(z\), написана\(\Re(z)\);

    \(\Im(z) y\)називається уявна частина\(z\), написана\(\Im(z)\);

    \(|z| r\)називається модулем\(z\), або абсолютним значенням\(z\), записаним\(|z|\);\(\arg (z) \theta\) називається аргументом\(z\), записаним\(\arg (z)\).

    \(\bar{z}\)Число\(x-i y\) називається сполученим з\(z\), написаним\(\bar{z}\).

    ЗАУВАЖЕННЯ. Існує важливий момент, який слід пам'ятати про аргумент: він є унікальним лише до додавання кратних\(2 \pi\). Іншими словами, якщо\(\theta_{0}\) аргумент комплексного числа\(z\), то так і всі числа\(\left\{\theta_{0}+2 k \pi: k \in \mathbb{Z}\right\}\). Додавання найпростіше в декартових координатах: додайте реальну та уявну частини. Множення найпростіше в полярних координатах: множте модулі та додайте аргументи.

    Пропозиція 9.19. Нехай\(z_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right)\) і\(z_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right)\). Потім\[z_{1} z_{2}=r_{1} r_{2} \operatorname{Cis}\left(\theta_{1}+\theta_{2}\right) .\] ProOf. Перемноживши, отримуємо\ [\ begin {вирівняний} z_ {1} z_ {2} =r_ {1} r_ {2}\ лівий [\ cos\ theta_ {1}\ cos\ theta_ {2} -\ sin\ theta_ {1}\ sin\ theta_ {2}\ право. \\ &\ ліворуч. +я\ лівий (\ cos\ theta_ {1}\ sin\ theta_ {2} +\ cos\ theta_ {2}\ sin\ theta_ {1}\ праворуч)\ праворуч]. \ end {aligned}\] Результат слідує за тригонометричними тотожностями для косинуса та синуса суми двох кутів.

    Наслідком Пропозиції\(9.19\) є наступна формула для підняття комплексного числа до степеня, яка називається теоремою Де Муавра.

    ТЕОРЕМА 9.20. Теорема Де Муавра\(z=r \operatorname{Cis}(\theta)\) Дозволяти бути ненульовим комплексним числом, і нехай\(n \in \mathbb{Z}\). Потім\[z^{n}=r^{n} \operatorname{Cis}(n \theta) .\] ProOf. Якщо\(n \geq 0\), то\((9.21)\) можна довести індукцією з Пропозиції 9.19. Для\(n\) негативних достатньо спостерігати, що за допомогою пропозиції\(9.19\)\[[r \operatorname{Cis}(\theta)]\left[r^{-1} \operatorname{Cis}(-\theta)\right]=1 \operatorname{Cis}(0)=1 .\] Ми можемо довести, що кожне ненульове комплексне число має точно\(n\) чіткі\(n^{\text {th }}\) коріння.

    ТЕОРЕМА 9.22. \(z=r \operatorname{Cis}(\theta)\)Дозволяти бути ненульовим комплексне число, і\(n\) нехай ціле число більше 1. Тоді є точно\(n\) комплексні числа, що\(w\) задовольняють рівнянню\(w^{n}=z\). Вони є\[\left\{r^{1 / n} \operatorname{Cis}\left(\frac{\theta}{n}+\frac{2 k \pi}{n}\right): k=0,1, \ldots, n-1\right\} .\] доказом. Припустимо,\(w=\rho \operatorname{Cis}(\phi)\) це\(n^{\text {th }}\) корінь\(z\). Тоді за теоремою Де Муавра,\(\rho^{n}=r\) і\(n \phi\) є аргументом\(z\). Як і\(\rho\) має бути позитивним дійсним числом, це унікальний позитивний\(n^{\text {th }}\) корінь\(r\). Число\(n \phi\) може бути будь-який аргумент\(z\), так що у нас є\[n \phi=\theta+2 k \pi, \quad k \in \mathbb{Z} .\] Так\(\phi\) може мати форму\[\frac{\theta}{n}+\frac{2 k \pi}{n}\] для будь-якого цілого числа\(k\). Однак різні\(\phi\) породжують одне і те ж комплексне число,\(w\) якщо вони відрізняються кратним\(2 \pi\). Так що є точно\(n\) різні\(w\) 's, які є\(n^{\text {th }}\) корінням\(z\).

    ПРИКЛАД 9.24. Що Теорема\(9.22\) говорить нам квадратні коріння\(-1\)? Допускаємо\(r=1\) і\(\theta=\pi\), і отримуємо квадратні коріння\(\operatorname{Cis}(\pi / 2)=i\) і\(\operatorname{Cis}(-\pi / 2)=-i\).

    Приклад 9.25. Знайти куб коріння\(1 .\)

    У позначеннях теореми\(9.22, r=1\) і\(\theta=0\). Тому коріння куба\ [\ begin {вирівняні} 1 &=\ ім'я оператора {Cis} (2\ pi/3) =-\ frac {1} {2} +i\ frac {\ sqrt {3}} {2} \\ омега^ {2} &=\ ім'я оператора {Cis} (4\ pi/3) =-\ frac {1} {2} -i\ frac {\ sqrt {3}} {2}. \ end {aligned}\] Число\(\omega\) називається примітивним кубовим коренем одиниці, тому що всі кубові корені отримуються як\(\omega, \omega^{2}, \omega^{3}\).

    ВИЗНАЧЕННЯ. Примітивний корінь єдності Примітивний\(n^{\text {th }}\) корінь єдності - це число\(\omega\) таке, що\(\left\{1, \omega, \omega^{2}, \ldots, \omega^{n-1}\right\}\) складають всі\(n^{\text {th }}\) коріння 1.

    Пропозиція 9.26. \(z\)Дозволяти складне число, і\(w_{0}\) бути деяким\(n^{\text {th }}\) коренем\(z\). Нехай\(\omega\) буде примітивний\(n^{\text {th }}\) корінь єдності. Потім все\(n^{\text {th }}\) коріння\(z\) знаходяться\(\left\{w_{0}, \omega w_{0}, \omega^{2} w_{0}, \ldots, \omega^{n-1} w_{0}\right\}\).

    Тарталія - Кардано переглянуто

    Розглянемо ще раз приклад 9.9. Ми хотіли знайти куб коріння\[\zeta_{\pm}=\frac{-1 \pm \sqrt{-3}}{2} .\] Якщо ми беремо\(+\) знак, ми отримаємо\[\zeta_{+}=\operatorname{Cis}(2 \pi / 3),\] і якщо ми беремо - знак, ми отримуємо\[\zeta_{-}=\operatorname{Cis}(4 \pi / 3) .\] Так\(\zeta_{+}\) має 3 коріння, а саме\[\left\{\operatorname{Cis}\left(\frac{2 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, }\] і\(\zeta_{-}\) має 3 коріння, а саме\[\left\{\operatorname{Cis}\left(\frac{4 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, }\] знаючи\(w\), ми хочемо знайти\(x\), який для Прикладу\(9.9\) наводиться\(w+1 / w\). Для будь-якого числа\(w\), яке можна записати як\(\operatorname{Cis}(\theta)\) (тобто будь-яке комплексне число модуля 1), ми маємо\ [\ begin {вирівняний} w+\ frac {1} {w} &=\ cos\ theta+i\ sin\ theta+\ cos (-\ theta) +i\ sin (-\ theta)\\ &=2\ cos\ theta. \ end {aligned}\] Отже, коріння многочлена, заданого в (9.10), чи\[\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{8 \pi}{9}, 2 \cos \frac{14 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{10 \pi}{9}, 2 \cos \frac{16 \pi}{9}\right\} .\] є ці 6 різних коренів? Теорема\(4.10\) говорить, що\(p\) може мати не більше 3 різних коренів. Як\(\cos (\theta)=\cos (2 \pi-\theta)\), ми бачимо, наш набір (9.27) може бути записаний як\[\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{8 \pi}{9}\right\} .\] Виявляється, що формула Тарталья-Кардано (9.7) дійсно дає всі три корені кубічного, і до того ж неважливо, чи вибирає один\(-\) знак\(+\) або, як довго оскільки один обчислює всі 3 кубових кореня (9.6) для деякого вибору знака. Ми будемо використовувати\(\mathbb{C}[z]\) для позначення множини поліномів в\(z\) з коефіцієнтами від\(\mathbb{C}\).

    ТЕОРЕМА 9.29. Розглянемо многочлен\[p(z)=z^{3}+a z+b\] в\(\mathbb{C}[z]\), і припустимо\(a \neq 0\). Дозволяти\(c=-a / 3\), і\[\zeta=\frac{-b+\sqrt{b^{2}-4 c^{3}}}{2} .\] нехай нехай\(\zeta\)\(w_{1}, w_{2}, w_{3}\) буде три різних куба коріння\(\zeta\). Для кожного\(w_{i}\) визначте\(z_{i} b y\)\[z_{i}=w_{i}+\frac{c}{w_{i}} .\] Потім\[p(z)=\left(z-z_{1}\right)\left(z-z_{2}\right)\left(z-z_{3}\right) .\] ЗАУВАЖЕННЯ. Це буде випливати з доказу того, що не має значення, який квадратний корінь\(b^{2}-4 c^{3}\) одного вибирає в (9.31).

    Доказ. Якщо\(p\) задається (9.32), то\[p(z)=z^{3}-\left(z_{1}+z_{2}+z_{3}\right) z^{2}+\left(z_{1} z_{2}+z_{2} z_{3}+z_{3} z_{1}\right) z-\left(z_{1} z_{2} z_{3}\right) .\] Ми повинні показати, що коефіцієнти в (9.33) відповідають тим, що в (9.30). За пропозицією 9.26 можна припустити,\[w_{1}=\omega w_{3}, \quad w_{2}=\omega^{2} w_{3}\] де\(\omega=-\frac{1}{2}+i \frac{\sqrt{3}}{2}\) знаходиться примітивний кубовий корінь єдності. У наступних розрахунках використовуємо факти, які\(\omega^{2}=1 / \omega\) і\(1+\omega+\omega^{2}=0\). (Чому це правда?) Зауважте\(w_{3} \neq 0\), що, як це змусить\(c=0\).

    Коефіцієнт\(z^{2}\) in (9.33) дорівнює\ [\ почати {вирівняний} -\ лівий (z_ {1} +z_ {2} +z_ {3}\ правий) &=-w_ {3}\ лівий (\ омега+\ омега^ {2} +1\ праворуч) -\ frac {1} {w_ {3}}\ left (\ omega^ {2} +\ omega +1\ праворуч)\\ &=0. \ end {вирівняний}\] Коефіцієнт\(z\) дорівнює\ [\ почати {вирівняний} z_ {1} z_ {2} +z_ {2} z_ {3} +z_ {3} z_ {1} =&\ ліворуч (\ омега w_ {3} +c\ омега^ {2}\ frac {1} {w_ {3}}\ праворуч)\ ліворуч (\ omega^ {2} w_ {3} +c\ омега\ frac {1} {w_ {3}}\ праворуч)\\ &+\ ліворуч (\ омега^ {2} w_ {3} +c\ омега\ frac {1} {w_ {3}}\ праворуч)\ ліворуч (w_ {3} +c\ frac {1} {w_ {3}}\ праворуч)\\ &+\ ліворуч (w_ {3} +c\ frac {1} {w_ {3}}\ праворуч)\ ліворуч (\ омега w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ праворуч)\ =& w_ {3} ^ {2}\ ліворуч (1+\ омега^ {2} +\ омега\ праворуч) +3 c\ ліворуч (\ омега+\ омега^ {2}\ праворуч) +\ frac {c^ {2}} {w_ {3} ^ {2}}\ ліворуч (1+\ омега+\ омега+\ омега^ {2}\ праворуч)\\ =&&-3 с\\ =& a. \ end {вирівняний}\] Константний термін в (9.33) є\ [\ begin {вирівняний} -z_ {1} z_ {2} z_ {3} &=-\ ліворуч (\ омега w_ {3} +c\ омега^ {2}\ frac {1} {w_ {3}}\ праворуч)\ ліворуч (\ омега^ {2} w_ {3} +c\ омега\ гідророзриву {1} {w_ {3}}\ праворуч)\ лівий (w_ {3} +\ frac {1} {w_ {3}}\ праворуч)\\ &=-w_ {3} ^ {3} -c w_ {3}\ лівий (1+\ омега^ {2} +\ омега\ праворуч) -\ frac {c^ {2}} {\ frac {1} {w_ {3}}}\ лівий (\ омега+1+\ омега^ {2}\ праворуч) -\\ &=-\ зета-\ frac {c^ {3}} {\ зета}\\ &=-\ frac {-b+\ sqrt {b^ {2} -4 c^ {3}}} {2} -\ frac {2 c^ {3}} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=\ frac {-b^ {2} +2 b\ sqrt {2} -4 c^ {3}} -\ ліво (b^ {2} -4 c^ {3}} -4 c^ {3}} {2\ ліворуч (-b+\ sqrt {b^ {2} -4 c^ {3}} \ праворуч)}\\ &=\ frac {b\ ліворуч (-b+\ sqrt {b^ {2} -4 c^ {3}}\ праворуч)} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=b. \ end {aligned}\] Тому всі коефіцієнти (9.30) і (9.32) збігаються, тому вони є однаковими поліномами.

    Тому формула Тартаглія-Кардана дає всі три корені зменшеному кубічному поліному\(p\) зі складними коефіцієнтами (можуть виникнути повторні корені). Якщо коефіцієнти\(a\) і\(b\) дійсні, ми знаємо з теореми проміжних значень, що принаймні один з трьох коренів\(p\) буде реальним (див. Вправа 8.31). Як показує приклад 9.9, однак, може знадобитися взяти кубічний корінь комплексу,\(\zeta\) щоб отримати реальні корені реального кубічного. Це усвідомлення призвело до прийняття складних чисел як корисних об'єктів, а не химерної фантазії.

    Фундаментальна теорема алгебри

    Алгебра над комплексними числами багато в чому простіше, ніж над дійсними числами. Причина в тому, що многочлен ступеня\(N\) in\(\mathbb{C}[z]\) має точно\(N\) нулі, рахуючи кратність. Це називається фундаментальною теоремою алгебри. Щоб це довести, ми повинні встановити деякі попередні результати.

    Деякий аналіз.

    ВИЗНАЧЕННЯ. Ми говоримо, що послідовність\(\left\langle z_{n}=x_{n}+i y_{n}\right\rangle\) комплексних чисел сходиться до числа\(z=x+i y\) iff\(\left\langle x_{n}\right\rangle\) сходиться до\(x\) і\(\left\langle y_{n}\right\rangle\) сходиться до\(y\). Ми говоримо, що послідовність Коші, якщо обидва\(\left\langle x_{n}\right\rangle\) і\(\left\langle y_{n}\right\rangle\) є Коші.

    ЗАУВАЖЕННЯ. Це те саме, що говорити, що\(\left\langle z_{n}\right\rangle\) сходиться до\(z\) iff\(\left|z-z_{n}\right|\) прагне до нуля, і\(\left\langle z_{n}\right\rangle\) це Коші iff\[(\forall \varepsilon>0)(\exists N)(\forall m, n>N)\left|z_{m}-z_{n}\right|<\varepsilon .\] ВИЗНАЧЕННЯ. Нехай\(G \subseteq \mathbb{C}\). Ми говоримо, що функція\(f: G \rightarrow \mathbb{C}\) є безперервним на\(G\) якщо, всякий раз, коли\(\left\langle z_{n}\right\rangle\) є послідовність в\(G\), що сходиться до деякого значення\(z_{\infty}\) в\(G\), потім\(\left\langle f\left(z_{n}\right)\right\rangle\) сходиться до \(f\left(z_{\infty}\right)\).

    ПРОПОЗИЦІЯ 9.34. Поліноми є неперервними функціями на\(\mathbb{C}\).

    Доказ. Повторіть доказ Пропозиції\(5.23\) з комплексними числами замість дійсних чисел.

    ВИЗНАЧЕННЯ. Замкнутий прямокутник - це набір форми\(\{z \in \mathbb{C} \mid a \leq\)\(\Re(z) \leq b, c \leq \Im(z) \leq d\}\) для деяких дійсних чисел\(a \leq b\) і\(c \leq d\). Ми хотіли б отримати версію теореми про екстремальні значення, але незрозуміло, як слід визначати мінімальне та максимальне значення комплексної функції. Однак наше визначення безперервності має сенс, навіть якщо діапазон\(f\) міститься в\(\mathbb{R}\), і кожна складноцінна безперервна функція\(g\) має три природно пов'язані реальні неперервні функції, а саме.\(\Re(g), \Im(g)\) і \(|g|\).

    ТЕОРЕМА 9.35. \(R\)Дозволяти бути замкнутий прямокутник в\(\mathbb{C}\), і\(f: R \rightarrow \mathbb{R} a\) безперервна функція. Потім\(f\) досягає свого максимуму і мінімуму.

    Доказ. Нехай\(R=\{z \in \mathbb{C} \mid a \leq \Re(z) \leq b, c \leq \Im(z) \leq d\}\). \(\left\langle z_{n}=x_{n}+i y_{n}\right\rangle\)Дозволяти послідовність точок такі, що\(f\left(z_{n}\right)\) прагне або до найменшої верхньої межі діапазону\(f\), якщо це існує, або нехай\(f\left(z_{n}\right)>n\) для всіх\(n\), якщо діапазон не обмежений вище. За теоремою БольцаноВайєрштрасса 8.6 існує певна підпослідовність, для якої дійсні частини сходяться до деякого числа\(x_{\infty}\) в\([a, b]\). За Больцано-Вейерштрассом знову, деяка підпослідовність цієї підпослідовності має властивість, що уявні частини також сходяться, в якийсь момент\(y_{\infty}\) в\([c, d]\). Отже, замінивши вихідну послідовність цією підпослідовністю, можна вважати, що\(z_{n}\) сходиться до точки\(z_{\infty}=x_{\infty}+i y_{\infty} \in R\). За безперервності,\(f\left(z_{\infty}\right)=\lim _{n \rightarrow \infty} f\left(z_{n}\right)\). Якщо початкова послідовність була необмеженою, то\(f\left(z_{n}\right)>n\) в підпослідовності. Це неможливо, оскільки послідовність\(\left\langle f\left(z_{n}\right)\right\rangle\) сходиться до\(f\left(z_{\infty}\right)\). Тому підпослідовність обмежена і\(f\left(z_{\infty}\right)\) повинна бути найменшою верхньою межею діапазону\(f\). \(f\left(z_{\infty}\right)\)Тому максимум\(f\) більше\(R\).

    Подібний аргумент показує, що досягається і мінімум.

    ЗАУВАЖЕННЯ. Попередню теорему можна вдосконалити, щоб показати, що безперервна дійсна функція на замкнутій обмеженій множині\(\mathbb{C}\) досягає своєї крайності. Множина\(F\) закривається, якщо всякий раз, коли послідовність точок\(\left\langle z_{n}\right\rangle\) сходиться до деякого комплексного числа\(z_{\infty}\), то\(z_{\infty}\) знаходиться в\(F\). Набір обмежується, якщо він міститься в якомусь прямокутнику.

    Потрібен ще один геометричний факт. ЛЕМА 9.36. Нерівність трикутника\(z_{1}, z_{2}\) Дозволяти комплексні числа. Тоді\[\left|z_{1}+z_{2}\right| \leq\left|z_{1}\right|+\left|z_{2}\right|\]зображення

    ФІГУРА\(9.18\). Нерівність трикутника

    Доказ. Напишіть\(z_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right)\) і\(z_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right)\). Потім\ [\ почати {вирівняний} \ ліворуч | r_ {1}\ ім'я оператора {Cis}\ ліворуч (\ theta_ {1}\ праворуч) +r_ {2}\ ім'я оператора {Cis}\ left (\ theta_ {2}\ праворуч |\\ &=\ left (r_ {1}\ cos\ theta_ {1} +r_ 2}\ cos\ theta_ {2}\ праворуч) ^ {2} +\ ліворуч (r_ {1}\ sin\ theta_ {1} +r_ {2}\ ім'я оператора {si}\ праворуч. \ праворуч. \\ &=\ ліворуч [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ ліворуч (\ cos\ theta_ {1}\ cos\ theta_ {2} +\ sin\ theta_ {1}\ sin\ theta_ {2}\ справа)\\\ &=\ ліворуч [r_ {1}} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ cos\ cos\ ліворуч (\ тета_ {1} -\ тета_ {2}\ справа)\ праворуч] ^ {1/2} ^ {2} ^ {2} ^ {2} ^ {2} ^ {2} +2 r_ {1} {2}\ праворуч] ^ {1/2 }\\ &=r_ {1} +r_ {2}. \ end {вирівняний}\] НАСЛІДОК 9.38. Нехай\(z_{1}, \ldots, z_{n} \in \mathbb{C}\). Тоді\[\left|z_{1}+\cdots+z_{n}\right| \leq\left|z_{1}\right|+\cdots+\left|z_{n}\right| .\]

    Доказ фундаментальної теореми алгебри.

    Спочатку ми спостерігаємо, що пошук коренів і пошук факторів тісно пов'язані між собою.

    ЛЕМА 9.39. \(p\)Дозволяти поліном ступеня\(N \geq 1\) в\(\mathbb{C}[z]\). Комплексне\(c\) число - це корінь\(p\) iff,\[p(z)=(z-c) q(z),\] де\(q\) многочлен ступеня\(N-1\).

    Доказ. Повторіть доказ Лемми\(4.13\) з дійсними числами, заміненими комплексними числами.

    Тепер доведено лему Д'Аламберта, яка стверджує, що модуль полінома не може мати локального мінімуму, окрім як у корені.

    ЛЕМА 9.40. Лемма\(p \in \mathbb{C}[z]\) Д'Аламберта Нехай і\(\alpha \in \mathbb{C}\). Якщо\(p(\alpha) \neq 0\), то\[(\forall \varepsilon>0)(\exists \zeta)[|\zeta-\alpha|<\varepsilon] \wedge[|p(\zeta)|<|p(\alpha)|]\] Доказ. Фікс\(\alpha\), а не корінь\(p\). Запишіть\(p\) як\[p(z)=\sum_{k=0}^{N} a_{k}(z-\alpha)^{k},\] де\(a_{0}\) ні\(a_{N}\) ні 0. Нехай\[m=\min \left\{j \in \mathbb{N}^{+} \mid a_{j} \neq 0\right\} .\] так\[p(z)=a_{0}+a_{m}(z-\alpha)^{m}+\cdots+a_{N}(z-\alpha)^{N} .\] нехай\(a_{0}=r_{0} \operatorname{Cis}\left(\theta_{0}\right)\) і\(a_{m}=r_{m} \operatorname{Cis}\left(\theta_{m}\right)\). Ми\(\zeta\) виберемо форму таким\[\zeta=\alpha+\rho \operatorname{Cis}(\phi)\] чином, щоб отримати деяке скасування в перші два терміни (9.42). Отже, нехай\[\phi=\frac{\theta_{0}+\pi-\theta_{m}}{m} .\] Тоді\[a_{0}+a_{m}(\zeta-\alpha)^{m}=r_{0} \operatorname{Cis}\left(\theta_{0}\right)-r_{m} \rho^{m} \operatorname{Cis}\left(\theta_{0}\right) .\] залишається показати, що для досить\(\rho\) малих ми можемо ігнорувати всі умови вищого порядку. Зверніть увагу\(\rho<1\), що якщо, ми маємо\ [\ begin {вирівняний} \ left|a_ {m+1} (\ зета-\ альфа) ^ {m+1} +\ cdots+a_ {N} (\ зета-\ альфа) ^ {N}\ праворуч |\\ &\ leq\ left|a_ {m+1} (\ zeta-\ альфа) ^ {m+1} +\ cdots+\ ліво|a_ {N} (\ дзета-\ альфа) ^ {N}\ праворуч |\\ &=\ ліво|a_ {m+1}\ право|\ rho^ {m+1} +\ cdots+\ ліво|a _ {N}\ праворуч |\ rho^ {N}\\ &\ leq\ rho^ {m+1}\ ліворуч [\ ліво|a_ {m+1}\ право|+\ cdots+\ left|a_ {N}\ праворуч |\\\ &=: C\ rho^ {m+1}. \ end {aligned}\] Виберіть\(\rho\) так\(r_{m} \rho^{m}<r_{0}\). Тоді\[p(\zeta)=\left(r_{0}-r_{m} \rho^{m}\right) \operatorname{Cis}\left(\theta_{0}\right)+a_{m+1}(\zeta-\alpha)^{m+1}+\cdots+a_{N}(\zeta-\alpha)^{N},\]\(\mathrm{SO}\)\[|p(\zeta)| \leq r_{0}-r_{m} \rho^{m}+C \rho^{m+1} .\] якщо\(\rho<r_{m} / C\), права сторона (9.43) менше, ніж\(r_{0}\).

    Отже, ми робимо висновок, що приймаючи\[\rho=\frac{1}{2} \min \left(1, \frac{r_{m}}{C},\left[\frac{r_{0}}{r_{m}}\right]^{1 / m}, \varepsilon\right)\] потім\[\zeta=\rho \operatorname{Cis}\left(\frac{\theta_{0}+\pi-\theta_{m}}{m}\right)\] задовольняє висновок леми.

    ТЕОРЕМА 9.44. Фундаментальна теорема алгебри\(p \in \mathbb{C}[z]\) Дозволяти бути поліном ступеня\(N \geq 1\). Тоді\(p\) можуть бути враховані як\[p(z)=c\left(z-\alpha_{1}\right) \ldots\left(z-\alpha_{N}\right)\] для комплексних чисел\(c, \alpha_{1}, \ldots, \alpha_{N}\). Крім того, факторинг є унікальним під замовлення. Доказ. (i) Показати, що\(p\) має принаймні один корінь.

    Нехай\(p(z)=\sum_{k=0}^{N} a_{k} z^{k}\), з\(a_{N} \neq 0\). \(S\)Дозволяти бути замкнутим квадратом\(\{z \in \mathbb{C} \mid-L \leq \Re(z) \leq L,-L \leq \Im(z) \leq L\}\), де\(L\) є деяке (велике) число, яке буде вибрано пізніше.

    Якщо\(|z|=R\) потім\[\left|\sum_{k=0}^{N-1} a_{k} z^{k}\right| \leq \sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} .\] вибрати\(L_{0}\) так, що якщо\(R \geq L_{0}\),\[\sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} \leq \frac{1}{2}\left|a_{N}\right| R^{N} .\] то якщо\(L \geq L_{0}\) і\(z\) знаходиться зовні\(S\), у нас є\ [\ begin {вирівняний} \ left|a_ {N} z^ {N}\ праворуч | &=\ ліво|р (z) -\ сума_ {k=0} ^ {N-1} a_ {k} z^ {k}\ праворуч |\\ &\ leq|p (z) |+\ ліво|\ сума {k=0} ^ {N-1} a_ {k} z^ {k}\ праворуч |\\ &\ leq|p (z) |+\ frac {1} {2}\ left|a_ {N}\ right| L^ {N}, \ end {aligned}\] де перша нерівність є нерівністю трикутника, а друга тому, що\(|z|>L\) . Вибираємо\(L_{1}\) такі, що\[\frac{1}{2}\left|a_{N}\right| L_{1}^{N}>\left|a_{0}\right| .\] нехай\(L=\max \left(L_{0}, L_{1}\right)\), і нехай\(S\) буде відповідний закритий квадрат. \(|p|\)Функція безперервна\(S\), тому вона досягає свого мінімуму в якийсь момент,\(\alpha_{1}\) скажімо, за теоремою 9.35. На кордоні\(S\), ми знаємо\[|p(z)| \geq \frac{1}{2}\left|a_{N}\right| L^{N}>\left|a_{0}\right|=|p(0)| .\] Тому\(\alpha_{1}\) повинні бути в інтер'єрі\(S\). За лемою D'Alembert, ми повинні мати\(p\left(\alpha_{1}\right)=0\), інакше буде поруч точка\(\zeta\), також в\(S\), де\(|p(\zeta)|\) було менше, ніж\(\left|p\left(\alpha_{1}\right)\right|\). Так\(\alpha_{1}\) і корінь\(p\).

    (ii) Тепер ми застосовуємо Lemma,\(9.39\) щоб зробити висновок, що ми можемо фактор,\(p\) як\[p(z)=\left(z-\alpha_{1}\right) q(z)\] де\(q\) є поліном ступеня\(N-1\). За допомогою простого індукційного аргументу ми можемо\(p\) враховувати\(N\) лінійні фактори.

    (iii) Унікальність очевидна. Число\(c\) - коефіцієнт\(a_{N}\). Числа\(a_{k}\) - це саме ті точки, в яких функція\(p\) зникає, як випливає з Пропозиції,\(9.19\) що добуток скінченно багатьох комплексних чисел може бути 0 тоді і тільки тоді, коли одне з чисел саме по собі 0.

    Застосування до дійсних многочленів

    Якщо\(p\) це поліном в\(\mathbb{R}[x]\), то з фундаментальної теореми алгебри випливає, що він має коріння, але вони можуть бути складними. Якщо він має складні коріння, вони повинні зустрічатися в складних сполучених парах.

    ТЕОРЕМА 9.46. Нехай\(p \in \mathbb{R}[x]\). \(\alpha\)Дозволяти бути корінь\(p\). Тоді так і є\(\bar{\alpha}\).

    ProOf. Нехай\(p(x)=\sum_{k=0}^{N} a_{k} x^{k}\). Тоді\[p(\alpha)=\sum_{k=0}^{N} a_{k} \alpha^{k}=0,\] так\[p(\bar{\alpha})=\sum_{k=0}^{N} a_{k} \bar{\alpha}^{k}=\overline{p(\alpha)}=0 .\] нехай\(\alpha=a+i b\). Потім\ [\ почати {вирівняний} (х-\ альфа) (х-\ бар {\ альфа}) & =( x- (a+i b)) (x- (a-i b))\\ &=x^ {2} -2 a x+a^ {2} +b^ {2}\\ & =( x-a) ^ {2} +b^ {2}. \ end {aligned}\] Отже, застосовуючи фундаментальну теорему алгебри до дійсного многочлена\(p\), ми спочатку обчислюємо дійсні корені, і для кожної пари складних сполучених коренів отримуємо множник, як у (9.47). Таким чином ми отримуємо:

    ТЕОРЕМА 9.48. \(p \in \mathbb{R}[x]\)Дозволяти поліном ступеня\(N\). Потім\(p\) можуть бути враховані у добуток лінійних факторів\(\left(x-c_{k}\right)\) і квадратичних факторів\(\left(\left(x-a_{k}\right)^{2}+b_{k}^{2}\right)\):\[p(x)=c\left(\prod_{k=1}^{N_{1}}\left(x-c_{k}\right)\right)\left(\prod_{j=1}^{N_{2}}\left(\left(x-a_{j}\right)^{2}+b_{j}^{2}\right)\right)\] для деяких (не обов'язково відмінних) дійсних чисел\(c, c_{j}, a_{j}, b_{j}\). У нас\(N_{1}+2 N_{2}=N\), і факторинг унікальний, аж до замовлення і заміни будь-якого\(b_{j} b y-b_{j}\).

    Подальші зауваження

    У главі 5 ми визначили косинус і синус за степеневими рядами. У розділі 9.2 ми інтерпретували їх геометрично і використовували тригонометричні тотожності. Показано, що ряди степенів та тригонометрична інтерпретація дійсно описують одну і ту ж функцію, є частиною курсу комплексного аналізу.

    Є два основні інгредієнти для першого курсу в комплексному аналізі. Перший полягає в тому, щоб показати, що якщо функція\(f\) має похідну скрізь на якомусь відкритому диску, в тому сенсі, що\[\lim _{z \rightarrow z_{0}} \frac{f\left(z_{0}\right)-f(z)}{z_{0}-z}\] існує, то функція автоматично аналітична, тобто виражається збіжним степеневим рядом. Це не стосується реальних функцій, і пояснює значну частину особливого характеру складних диференційованих функцій.

    Друга частина курсу стосується оцінки контурних інтегралів складних диференційовних функцій. Це корисно не тільки самостійно, але і в додатках до реального аналізу, таких як інвертування перетворення Лапласа або оцінка певних інтегралів.

    Хорошим вступом до Комплексного аналізу є книга Дональда Сарассона\([7]\).

    вправи

    ВПРАВА 9.1. Які первісні четверті корені єдності?

    Вправа 9.2. Показати,\(\omega\) що якщо будь-який\(n^{\text {th }}\) корінь єдності, крім 1, то\(1+\omega+\omega^{2}+\cdots+\omega^{n-1}=0 .\) ВПРАВА 9.3. Скільки примітивних кубових коренів єдності? Скільки примітивних шостих коренів? Скільки примітивних\(n^{\text {th }}\) коренів у генерала\(n\)?

    ВПРАВА 9.4. Повторіть приклад\(9.8\), щоб отримати всі три корені з формули Тартаглія-Кардано.

    ВПРАВА 9.5. Нехай\(p(x)=x^{3}+3 x+\sqrt{2}\). Покажіть без використання формули Кардано-Тарталья, яка\(p\) має рівно один справжній корінь. Знайдіть його. Які бувають складні коріння?

    ВПРАВА 9.6. Заповніть доказ Пропозиції 9.34.

    Вправа 9.7. \(g: G \rightarrow \mathbb{C}\)Дозволяти бути безперервної функції на\(G \subseteq \mathbb{C}\). Покажіть, що\(\Re(g), \Im(g)\) і\(|g|\) є безперервними. І навпаки, показати, що безперервність\(\Re(g)\) і\(\Im(g)\) припускають безперервність\(g\).

    ВПРАВА 9.8. Показати, що кожна неперервна дійсна функція на замкнутій обмеженій підмножині\(\mathbb{C}\) досягає своєї крайності.

    ДОДАТОК A

    Грецький алфавіт

    Назва у верхньому регістрі нижнього регістру

    зображення

    ДОДАТОК Б

    Аксіоми Цермело-Френкеля з аксіомою вибору

    Парадокс Рассела (розділ 1.7) демонструє, що Загальний принцип розуміння є помилковим, оскільки він породжує протиріччя. Отже, як ми вирішуємо, чи є визначена колекція набором? Це питання породило програму аксіоматизації теорії множин з метою створення рівномірних припущень про множини, які задовольняли численні обмеження:

    • Аксіоми зрозумілі і інтуїтивно звучать. Ми повинні вміти розпізнавати, коли твердження про множини є аксіомою.

    • Аксіом достатньо, щоб вивести стандартні теореми математики.

    • Аксіоми не зайві. Тобто жодна аксіома не може бути виведена з інших аксіом.

    • Кожне математичне твердження про множини є або доказовим, або спростованим з аксіом.

    • Аксіоми логічно послідовні і, отже, не породжують протиріччя.

    Як ми обговоримо пізніше, жодна колекція аксіом не може одночасно досягти цих цілей. Спочатку наведемо аксіоми, на яких математики в кінцевому підсумку зупинилися.

    Аксіоми Цермело-Френкеля (з аксіомою вибору):

    (1) Розширення Якщо встановлює\(X\) і\(Y\) має однакові елементи, то\(X=Y\).

    (2) Спарювання Для будь-яких наборів\(X\) і\(Y\), є набір\(Z=\{X, Y\}\). 268 B. АКСІОМИ ЗЕРМЕЛО-ФРЕНКЕЛЯ З АКСІОМОЮ ВИБОРУ

    (3) Союз Дозволяти\(X\) бути набором наборів. Потім є набір\[\{x \mid(\exists Y \in X) x \in Y\}\] (4) Power Set Якщо\(X\) набір, то колекція всіх підмножин\(X\) є множиною.

    (5) Нескінченність Існує індуктивний набір.

    (6) Схема поділу Якщо\(P\left(x, y_{1}, \ldots, y_{n}\right)\) є формулою зі\(n+1\) змінними, і\(X, X_{1}, \ldots, X_{n}\) множини, то існує безліч\[\left\{x \in X \mid P\left(x, X_{1}, \ldots, X_{n}\right\}\right.\] (7) Схема заміни Якщо\(F\) функція на довільних колекціях,\(X\) це встановити і\(f=\left.F\right|_{X}\), то діапазон\(f\) - це набір.

    (8) Регулярність\(X\) Дозволяти бути набором. Тоді немає нескінченної послідовності елементів\(X,\left\langle x_{i}\right\rangle\), таких, що для всіх\(n \in \mathbb{N}, x_{n+1} \in x_{n}\).

    (9) Вибір\(X\) Дозволяти бути набором непорожніх наборів. Тоді є функція\(f\) з доменом\(X\) такий, що для всіх\(x \in X, f(x) \in x\).

    Аксіоми Цермело-Френкеля з аксіомою вибору називаються як\(Z F C\). Існує сім аксіом і дві схеми аксіом. Схеми дають нескінченно багато аксіом. Аксіома Extensionality характеризує множинну ідентичність. У ньому йдеться про те, що набір визначається його членами. Аксіоми Спарювання, Союзу та Power Set гарантують, що колекції, побудовані з наборів з цими операціями набору, будуть наборами. Аксіома Нескінченності має на увазі, що натуральні числа - це безліч. Схема поділу говорить, що будь-яка підмножина заданого множини, визначеного формулою, є множиною. Це ослаблена версія Загального принципу розуміння. Схема заміни говорить, що задана функція\(F\), на довільних колекціях (не обов'язково множини) і\(X\) множині, діапазон\(\left.F\right|_{X}\) є множиною. Аксіома регулярності - це технічна аксіома, яка передбачає, що жоден набір не може бути членом самого себе.

    Аксіома вибору відрізняється від інших аксіом тим, що вона не стверджує, що визначеним об'єктом у Всесвіті множин також є Б. АКСІОМИ ЗЕРМЕЛО-ФРЕНКЕЛЯ З АКСІОМОЮ ВИБОРУ 269

    набір. Швидше, вона має на увазі існування функції без вказівки функції. Якщо\(X\) є множиною і\(f\) є функцією з доменом, існування\(X\) якої гарантується аксіомою вибору, то\(f\) називається функцією вибору для\(X\). Аксіома вибору логічно еквівалентна аксіомам, які часто використовуються в аргументах у багатьох галузях математики. Наприклад, Аксіома вибору еквівалентна твердженню, що кожен набір може бути добре впорядкованим (принцип замовлення). Аксіома породжує цікаві парадокси, які змусили деяких математиків поставити під сумнів її обґрунтованість. Куртом Геделем було доведено, що якщо аксіоми Цермело-Френкеля без Choice були логічно послідовними, то аксіоми Цермело-Френкеля з Choice були логічно послідовними. У главі 6 було кілька випадків, коли ми посилалися на Аксіому Вибору. Були випадки (наприклад, теорема Кантора), коли аксіома насправді необхідна, але обговорення її було б неприпустимо заплутаним. Аксіома вважається необхідною більшістю математиків. Наприклад, без нього або якоїсь логічно еквівалентної аксіоми ми навіть не можемо зробити висновок, що будь-яку пару множин можна порівняти (тобто для будь-яких множин\(X\) і\(Y\), або\(X \preceq Y\) або\(Y \preceq X\)). Аксіома вибору називається\(A C\), а аксіоми Зермело-Френкеля без аксіоми вибору називається\(Z F\).

    Чи\(Z F C\) досягає цілей аксіоматизації теорії множин? Аксіоми, як правило, інтуїтивно зрозумілі з можливими винятками\(A C\) та аксіомою регулярності. Також відомо, що якщо\(Z F C\) без регулярності аксіома логічно узгоджується, то\(Z F C\) з аксіомою регулярності логічно узгоджується. Математики припускають\(Z F C\) майже повсюдно, не приділяючи цьому занадто багато уваги. Аксіоми\(Z F C\) були достатніми для доведення теорем стандартної математики.

    Ми говоримо, що набір може бути вирішеним (або рекурсивним), якщо членство в множині може бути визначено шляхом обчислення rote. Наприклад, множина парних цілих чисел можна визначити - ви можете використовувати алгоритм ділення, щоб перевірити, чи ділиться ціле число на\(2 . Z F C\) рекурсивну множину 270 B. АКСІОМИ ЗЕРМЕЛО-ФРЕНКЕЛЯ З АКСІОМОЮ ВИБОРУ

    аксіом. Дійсно, необхідно, щоб набір аксіом був рекурсивним, щоб мати будь-яку практичну користь. Це теорема математики, перша теорема Геделя про неповноту, що будь-який вирішуваний набір аксіом, в якому можна робити арифметику, буде логічно неповним. Тобто є твердження мовою аксіом, які не є ні доказовими, ні спростовними з аксіом. Невідомо, і не може бути відомо за допомогою математичного доказу (використання\(Z F C\)), чи\(Z F C\) є логічно послідовним. Послідовність вирішуваного набору аксіом, в яких можна робити арифметику, не може бути логічним наслідком цих аксіом. Цей результат відомий як друга теорема про неповноту Геделя і є одним з чудових результатів математики ХХ століття.

    Для хорошого лікування теорії множин на рівні бакалаврату див. книгу Ю.Мошовакіса\([\mathbf{5}]\).

    ДОДАТОК C

    Підказки, щоб почати роботу на ранніх вправах

    Вправа 1.2. Ви можете зробити це за допомогою діаграми Венна. Однак, як тільки буде більше трьох сетів (див. Вправа 1.13), такий підхід буде складним. Алгебраїчне доказ узагальнить легше, тому спробуйте знайти його тут. Аргументуйте два включення\ [\ begin {вирівняні} (X\ чашка Y) ^ {c} &\ subseteq X ^ {c}\ cap Y^ {c}\ cap Y^ {c}\ cap Y^ {c} &\ subseteq (X\ чашка Y) ^ {c} \ кінець {вирівняний}\] окремо. У першому, наприклад, припустимо, що\(x \in(X \cup Y)^{c}\) і показати, що воно повинно бути в обох\(X^{c}\) і\(Y^{c}\).

    Вправа 1.13. Частиною проблеми тут є позначення - що робити, якщо у вас більше наборів, ніж букв? Почніть з кінцевої кількості наборів, що містяться в\(U\), і називайте їх\(X_{1}, \ldots, X_{n}\). Як ви думаєте, що доповнення їх союзу? Доведіть це, як ви робили, коли\(n=2\) в вправи\(1.2\). (Побачити перевагу наявності доказів у Вправі\(1.2\), які не використовували діаграми Венна? Однією з причин, чому математики люблять мати кілька доказів однієї теореми, полягає в тому, що кожен доказ, ймовірно, узагальнить по-іншому).

    Чи можете ви змусити той самий аргумент працювати, якщо ваші набори індексуються деяким нескінченним набором індексів?

    Тепер виконайте те ж саме з доповненням перехрестя.

    Вправа 1.14. Знову є нотаційна проблема, але поки\(Y\) і\(Z\) грають ту ж роль у вправі 1.3,\(X\) грає іншу роль. Отже, перепишіть рівняння як\ [\ почати {вирівняний} &X\ cap\ лівий (Y_ {1}\ cup Y_ {2}\ правий) =\ лівий (X\ cap Y_ {1}\ праворуч)\ чашка\ лівий (X\ cap Y_ {2}\ правий)\\ &X\ чашка\ лівий (Y_ {1}\ шапка Y_ {2}\ правий)\\ лівий (Y_ {1} cap\ Y_ {2}\ правий)\\ лівий (Y_ {1} cap X\ чашка Y_ {1}\ праворуч)\ cap\ left (X\ cup Y_ {2}\ праворуч), \ end {вирівняний}\] і подивитися, чи можете ви узагальнити ці.

    Вправа 1.35. (i) Знову ж таки, це зводиться до доказу двох захисних оболонок. Якщо\(y\) знаходиться в лівій частині, то має бути деякі\(x_{0}\) в якомусь\(U_{\alpha_{0}}\) такому, що\(f(x)=y\). Але потім\(y\) знаходиться в\(f\left(U_{\alpha_{0}}\right)\), так\(y\) знаходиться в правій частині.

    І навпаки, якщо\(y\) знаходиться в правій частині, то він повинен бути в\(f\left(U_{\alpha_{0}}\right)\) для деяких\(\alpha_{0} \in A\). Але потім\(y\) знаходиться в\(f\left(\cup_{\alpha \in A} U_{\alpha}\right)\), і так знаходиться в лівій стороні.

    Вправа\(3.1\) Існує чотири можливі призначення значень істини 0 і 1 до двох тверджень\(P\) і\(Q\). Для кожного такого призначення оцініть значення істинності лівої та правої сторін (3.3) і покажіть, що вони завжди однакові.

    Бібліографія

    [1] Айгнер і Г.М. Циглер. Докази з Книги. Спрінгер, Берлін,\(2003 .\)

    [2] Дж.Б. Фрейлі. Перший курс з абстрактної алгебри. Аддісон-Уеслі, Редінг,\(1982 .\)

    [3] Герштейн І.М. Абстрактна алгебра. Дж. Уайлі, Нью-Йорк, 1999.

    [4] І. Лакатош. Докази та спростування: Логіка математичного відкриття. Кембриджський університетський прес, Кембридж,\(1976 .\)

    [5] Мошовакіс Ю.Н. Примітки щодо теорії множин. Спрінгер, Берлін, 1994.

    [6] Архів історії математики MacTutor. http://www-groups.des.stand.ac.uk/ history/index.html.

    [7] Д. Сарассон. Примітки щодо теорії складних функцій. Книжкове агентство Хіндустан, Нью-Делі,\(1998 .\)

    [8] Е.М. Штейн і Р.Шакарчі. Аналіз Фур'є. Преса Прінстонського університету, Прінстон,\(2003 .\)