Skip to main content
LibreTexts - Ukrayinska

4.1: Вступ

  • Page ID
    72395
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Як ми навчимося читати, займатися математикою та займатися спортом? Навчання в нейронній мережі означає модифікацію синаптичних ваг у відповідь на локальні моделі активності відправляючих та приймальних нейронів. Як підкреслювалося в попередніх розділах, ці синаптичні ваги визначають те, що виявляє окремий нейрон, і, отже, є критичними параметрами для визначення поведінки нейрона та мережі.

    Іншими словами, все, що ви знаєте, закодовано в шаблони ваших синаптичних ваг, і вони були сформовані кожним досвідом, який ви мали (до тих пір, поки цей досвід отримав ваші нейрони достатньо активними). Багато з цих переживань не залишають дуже сильного сліду, і в більшій частині мозку сліди індивідуального досвіду змішуються разом, тому важко їх чітко запам'ятати (ми побачимо в розділі Пам'яті, що це змішування може бути досить корисним для загального інтелекту, насправді ). Але кожен досвід, тим не менш, керує певним рівнем навчання, і наша велика проблема в цьому розділі полягає в тому, щоб з'ясувати, як прості впливи моделей активності між окремими нейронами можуть складатися, щоб ми могли вчитися великим речам.

    Біологічно синаптична пластичність (модифікація синаптичних ваг шляхом навчання) була широко вивчена, і тепер ми знаємо величезну кількість про детальні хімічні процеси, що відбуваються в результаті нервової активності. Тут ми надамо кілька рівнів деталізації (включаючи обговорення пластичності, залежної від часу спайка (STDP), яка захопила уяву багатьох дослідників у цій галузі), але історія високого рівня досить проста: загальний рівень нейронної активності на обох кінцях синапсу (посилаючи та приймаючи нейронну стрільбу) призводить до припливу іонів кальцію (Ca++) по каналах NMDA, а синаптичні зміни ваги обумовлені рівнем постсинаптичного Ca++ в дендритному хребті, пов'язаному з заданим синапсом. Низький рівень Ca ++ змушує синапси слабкіше, а більш високі рівні змушують їх ставати сильнішими.

    Обчислювально було розроблено багато різних наборів рівнянь, які можуть керувати синаптичними змінами ваги для досягнення багатьох різних обчислювальних цілей. Що з них відповідає тому, що насправді робить біологія? Це велике питання. Хоча остаточна відповідь залишається невловимою, проте у нас є розумний кандидат, який добре узгоджується з біологічними даними, а також виконує обчислювально-дуже корисні форми навчання, які можуть вирішувати найскладніші когнітивні завдання (наприклад, навчитися читати або розпізнавати об'єкти).

    Існує два основних типи навчання:

    • Самоорганізоване навчання, яке витягує більш тривалу часову статистику про навколишнє середовище, і, таким чином, може бути корисним для розробки ефективної внутрішньої моделі зовнішнього світу (тобто, які речі, як правило, надійно відбуваються у світі — ми називаємо ці статистичними закономірності).
    • Навчання, кероване помилками, яке використовує більш швидкі контрасти між очікуваннями та результатами для виправлення цих очікувань і, таким чином, формує більш детальні, конкретні знання про непередбачені ситуації у світі. Наприклад, маленькі діти здаються нескінченно захопленими, дізнаючись про те, що відбувається, коли вони штовхають речі зі своїх піддонів для високих стільців: чи все одно впаде на землю і цього разу зробить величезний безлад? Як тільки вони виробляють досить точне очікування про те, що саме станеться, воно починає ставати трохи менш цікавим, а інші більш непередбачувані речі починають захоплювати їх інтерес. Як ми бачимо в цьому прикладі, навчання, кероване помилками, швидше за все, тісно пов'язане з цікавістю, несподіванкою та іншими такими мотиваційними факторами. З цієї причини ми висуваємо гіпотезу, що нейромодулятори, такі як дофамін, норадреналін та ацетилхолін, ймовірно, відіграють важливу роль у модуляції цієї форми навчання, оскільки вони були задіяні в різних версіях несподіванки, тобто коли є невідповідність між очікуваннями та результатами.

    Цікаво, що основна обчислювальна різниця між цими двома формами навчання пов'язана з часовою шкалою, протягом якої оновлюється одна з критичних змінних - самоорганізоване навчання передбачає усереднення протягом тривалого часу, тоді як навчання, кероване помилками, відбувається набагато швидше. Ця різниця також підкреслюється у вищезазначених описах і забезпечує важливе джерело інтуїції щодо відмінностей між цими типами навчання. Самоорганізоване навчання - це те, що відбувається, коли ви розмиваєте очі і просто берете речі протягом певного періоду часу, тоді як навчання, кероване помилками, вимагає набагато більш пильних та швидких форм нейронної діяльності. В рамках, які ми будемо використовувати в решті книги, ми об'єднуємо ці типи навчання в єдиний набір рівнянь навчання, щоб дослідити, як ми прийшли сприймати, пам'ятати, читати і планувати.