Skip to main content
LibreTexts - Ukrayinska

3.3: Категоризація та розподілені уявлення

  • Page ID
    72414
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    1200px-fig_category_hierarch_dist_reps.png
    Рисунок\(3.7\): Схема ієрархічної послідовності категоріальних уявлень, що обробляють стимул введення особи. Представлення розподіляються на кожному рівні (активні кілька нейронних детекторів). На найнижчому рівні розташовані елементарні детектори ознак (орієнтовані краї). Далі вони об'єднуються в стики ліній, за якими слідують більш складні візуальні особливості. Окремі обличчя розпізнаються на наступному рівні (навіть тут кілька одиниць обличчя активні в градуйованій пропорції до того, як схожі люди виглядають). Нарешті, на найвищому рівні важливі функціональні «семантичні» категорії, які служать хорошою основою для дій, які можна зробити — можливість розвивати такі категорії високого рівня має вирішальне значення для розумної поведінки.

    Як пояснюється у вступі до цієї глави, процес формування категоричних уявлень входів, що надходять у мережу, дозволяє системі вести себе набагато потужніше і «розумніше» (рис. 3.7). Філософськи, це цікаве питання про те, звідки походять наші психічні категорії - чи є щось об'єктивно реальне, що лежить в основі наших психічних категорій, чи це просто ілюзії, які ми нав'язуємо реальності? Чи дійсно поняття «стілець» існує в реальному світі, чи це просто те, що наш мозок будує для нас, щоб дозволити нам пройти (і відпочити наші втомлені ноги)? Це питання розглядалося ще з самого початку філософії, наприклад, Платоном з його уявленням про те, що ми живемо в печері, сприймаючи лише тіні на стіні справжньої реальності за межами печери. Здається правдоподібним, що є щось «об'єктивне» про стільці, що дозволяє нам класифікувати їх як такі (тобто вони не є суто колективною галюцинацією), але надання суворого, точне визначення їх, здається, надзвичайно складним зусиллям (спробуйте! не забудьте картонну коробку, або грудку снігу, або мініатюрний стілець в ляльковому будиночку, або той, на якому ніхто ніколи не сидів..). Не здається, що більшість наших концепцій, ймовірно, будуть справжніми «природними видами», які мають дуже точну основу в природі. Такі речі, як закони фізики Ньютона, які, здавалося б, мають міцну об'єктивну основу, ймовірно, затьмарюються повсякденними речами, такими як стільці, які не настільки чітко визначені (і «наївне» розуміння фізики часто насправді не є правильним у багатьох випадках або).

    Брудний онтологічний статус концептуальних категорій нас не дуже турбує. Як ми бачили в попередньому розділі, Нейрони - це дуже здатні детектори, які можуть інтегрувати багато тисяч різних вхідних сигналів і тим самим можуть мати справу зі складними та аморфними категоріями. Крім того, ми побачимо, що навчання може формувати ці уявлення про категорії, щоб підібрати речі, які мають відношення до поведінки, не вимагаючи жодної формальності чи строгості у визначенні, якими можуть бути ці речі. Коротше кажучи, наші психічні категорії розвиваються тому, що вони нам так чи інакше корисні, а зовнішній світ виробляє достатньо надійних сигналів, щоб наші детектори могли підхопити ці речі. Важливо, що основним драйвером для вивчення цих категорій є соціальна та мовна взаємодія, яка дозволяє вивчати та ділитися дуже складними та незрозумілими речами - найдивніші речі можна дізнатися за допомогою соціальних взаємодій (наприклад, тепер ви знаєте, що значний додатковий простір у мішку з чіпами є називається «закусочна атмосфера», люб'язно надано Річ Холл). Таким чином, наше культурне середовище відіграє вирішальну роль у формуванні наших психічних уявлень і, очевидно, є основною силою в тому, що дозволяє нам бути такими ж розумними, як і ми (ми іноді підбираємо деякі корисні ідеї разом з такими речами, як «закусочна сфера»). Якщо ви хочете глибше зануритися в філософські питання істини та релятивізму, які виникають з цієї слабкої точки зору психічних категорій, див. Філософія категорій.

    Один інтуїтивний спосіб розуміння важливості наявності правильних категорій (і вибору їх відповідним чином для даної ситуації) походить від проблем розуміння. Ці проблеми часто влаштовані так, що наш нормальний спосіб класифікації ситуації за замовчуванням веде нас в неправильному напрямку, і необхідно повторно представляти проблему по-новому («нестандартне мислення»), вирішити її. Наприклад, розглянемо цю «загадку» проблеми: «двоє чоловіків мертві в каюті в лісі. що сталося?» — потім ви продовжуєте задавати купу правдивих/помилкових питань і врешті-решт розумієте, що вам потрібно вибрати інший спосіб категоризації слова «кабіна», щоб вирішити головоломку. Ось список деяких із цих видів загадок: http://www.angelfire.com/oh/abnorm/ (ПОПЕРЕДЖЕННЯ: натисніть на власний ризик для зовнішніх посилань - здається, добре, але спливає оголошення або два, здається).

    Для комп'ютерних програмістів одним з найважливіших уроків, який можна засвоїти, є те, що вибір правильного уявлення є найважливішим кроком у вирішенні даної проблеми. Як простий приклад, використання поняття «купа» дозволяє особливо елегантно вирішити проблему сортування. Бінарні дерева також є широко використовуваною формою представлення, яка часто значно скорочує обчислювальний час різних проблем. Загалом, ви просто хочете знайти уявлення, яке дозволяє легко робити те, що вам потрібно зробити. Це саме те, що робить мозок.

    Одним із поширених прикладів схильності мозку до розвитку категоричних кодувань речей є стереотипи. Стереотип - це насправді просто психічна категорія, застосована до групи людей. Той факт, що всі, здається, мають їх, є вагомим доказом того, що це принципово, як працює мозок. Ми не можемо не думати з точки зору абстрактних категорій, як це, і, як ми вже стверджували вище, категорії в цілому є важливими для того, щоб ми могли мати справу зі світом розумно. Але очевидні проблеми зі стереотипним мисленням також вказують на те, що ці категорії також можуть бути проблематичними (для стереотипів конкретно і категоричного мислення в цілому), і обмежувати нашу здатність точно представляти деталі будь-якої конкретної особистості або ситуації. Як ми обговорюємо далі, наявність багатьох різних категоричних уявлень одночасно може потенційно допомогти пом'якшити ці проблеми. Здатність одночасно розважати кілька таких потенційних категорій може бути індивідуальною змінною різниці, пов'язаною з такими речами, як політичні та релігійні переконання (завдання: знайти цитати). Цей матеріал може стати цікавим!

    Розподілені представлення

    Окрім того, що наші психічні категорії є дещо аморфними, вони також дуже поліморфні: будь-який даний вхід може бути класифікований різними способами одночасно - немає такого поняття, як відповідний рівень категоризації для будь-якої даної речі. Стілець також може бути меблевим, художнім, сміттєвим, дровами, дверною пробкою, пластиком і будь-якою кількістю інших подібних речей. Як аморфна, так і поліморфна природа категорій добре вміщується поняттям розподіленого представлення. Розподілені уявлення складаються з багатьох окремих нейронів-як-детекторів, кожен з яких виявляє щось інше. Сукупна картина вихідної активності («тривоги виявлення») у цій сукупності детекторів може фіксувати аморфність психічної категорії, оскільки це не лише один дискретний фактор, який входить в неї. Існує безліч факторів, кожен з яких відіграє певну роль. Стільці мають сидячі поверхні, а іноді мають спинку, і зазвичай мають форму, схожу на крісло, але їх форми також можуть бути дуже мінливими і дивними. Вони часто виготовляються з дерева або пластику або металу, але також можуть бути виготовлені з картону або навіть скла. Усі ці різні фактори можуть бути захоплені всією популяцією нейронів, що стріляють, щоб кодувати ці та багато інших ознак (наприклад, включаючи навколишній контекст, історію дій та дій, пов'язаних із відповідним об'єктом).

    Те ж саме стосується поліморфного характеру категорій. Один набір нейронів може виявляти стільці подібні аспекти стільця, тоді як інші активізуються на основі всіх різних речей, які він може представляти (матеріал, ширші категорії, зовнішній вигляд, стиль тощо). Всі ці різні можливі значення входу стільця можуть бути активними одночасно, що добре захоплюється розподіленим представленням з нейронами, які одночасно виявляють всі ці різні категорії.

    1200px-fig_dist_rep_vis_bio.png
    Рисунок\(3.8\): Градуйована реакція як функція подібності. Це один з аспектів розподілених уявлень, показаних тут, у нейроні в зоровій корі мавпи - цей нейрон градуйовано реагує на різні вхідні стимули, пропорційно тому, наскільки вони схожі на те, на що він реагує найбільш активно (наскільки відомо з представлення широкого зразка) різних вхідних зображень). З такими градуйованими відповідями повсюдно поширені в корі, випливає, що будь-який даний вхід активує багато різних детекторів нейронів. Репродуковано з Танаки (1996).
    fig_tanaka03_topo_maps.png
    Малюнок\(3.9\): Розподілені зображення різних форм, відображені по областях інферотемпоральної (ІТ) кори мавпи. Кожна форма активує велику кількість різних нейронів, розподілених по ІТ-корі, і ці нейрони частково перекриваються в деяких місцях. Репродуковано з Танаки (2003).

    Деякі реальні дані про розподілених представленнях показані на малюнку 3.8 і малюнку 3.9. Вони показують, що окремі нейрони реагують градуйовано як функція схожості з входами щодо оптимальної речі, яка їх активує (цю саму властивість ми бачили в дослідженні детектора з розділу Нейрон, коли ми знизили рівень витоку так, щоб він буде реагувати на кілька входів). На малюнку 3.10 показана загальна підсумкова карта топології представлень форми в інферотемпоральній (ІТ) корі мавпи, де кожна область має заданий оптимальний стимул, який його активує, тоді як сусідні області мають подібні, але чіткі такі оптимальні подразники. Таким чином, будь-який заданий вхід форми буде закодований як розподілений шаблон по всіх цих областях в тій мірі, в якій він має функції, достатньо схожі для активації різних детекторів.

    fig_tanaka03_topo.png
    Малюнок\(3.10\): Принципова схема топографічно організованих зображень фігури в корі ІТ мавп, від Tanaka (2003) - кожна невелика область ІТ оптимально реагує на іншу форму стимулу, а сусідні області мають схожі, але не однакові зображення.

    Інша демонстрація розподілених уявлень походить від знакового дослідження Хаксбі та його колег (2001), використовуючи функціональну магнітно-резонансну томографію (ФМРТ) мозку людини, при перегляді різних зорових подразників (рис. 3.11). Вони показали, що всупереч попереднім твердженням про те, що візуальна система була організована строго модульно, з абсолютно різними зорами для облич проти інших візуальних категорій, наприклад, насправді існує високий рівень перекриття в активації над широкою областю зорової системи для цих різних візуальних входи. Вони показали, що можна з високим рівнем точності розрізнити, який об'єкт розглядає людина в апараті fMRI на основі цих розподілених моделей активності. Критично, цей рівень точності не знижується помітно, коли ви виключаєте область, яка демонструє максимальну реакцію для цього об'єкта. Попередні «модуляристські» дослідження лише повідомляли про існування цих максимально реагуючих областей. Але, як ми знаємо з даних мавп, нейрони реагуватимуть градуйовано, навіть якщо стимул не ідеально підходить для їх максимально активуючого входу, і Haxby et al. показали, що ці градуйовані відповіді передають багато інформації про природу вхідного стимулу.

    509px-fig_haxbyetal01_obj_maps.jpg
    Малюнок\(3.11\): Карти нервової активності в мозку людини у відповідь на різні зорові вхідні подразники (як показано — обличчя, будинки, стільці, взуття), записані за допомогою функціональної магнітно-резонансної томографії (фМРТ). Існує високий рівень перекриття нейронної активності цих різних подразників, крім певного рівня спеціалізації. Це є відмінною рисою розподіленого представлення. Репродуковано з Хаксбі та співавт. (2001).

    Див. більше прикладів розподілених представлень для більш цікавих емпіричних даних про розподілені зображення в корі.

    Грубе кодування

    fig_coarse_coding.png
    Малюнок\(3.12\): Грубе кодування, яке є екземпляром розподіленого представлення з нейронами, які реагують градуйовано. Цей приклад заснований на кодуванні кольору в оці, яке використовує лише 3 різних фоторецептора, налаштованих на різні частоти світла (червоний, зелений синій), щоб охопити весь видимий спектр. Це дуже ефективне подання в порівнянні з тим, що набагато більше рецепторів налаштовані більш вузько і дискретно на різні частоти уздовж спектра.

    Рисунок 3.12 ілюструє важливий конкретний випадок розподіленого представлення, відомого як грубе кодування. Це насправді не відрізняється від того, що ми описали вище, але особливий приклад того, як око використовує лише 3 фоторецептори для захоплення всього видимого спектру світла, є особливо хорошим прикладом потужності розподілених уявлень. Кожна окрема частота світла унікально закодована з точки зору відносного балансу градуйованої активності різних детекторів. Наприклад, колір між червоним і зеленим (наприклад, певний відтінок жовтого) кодується як часткова активність червоних і зелених одиниць, причому відносна сила червоного проти зеленого визначає, наскільки він виглядає більш помаранчевим порівняно з шартрезом. Підсумовуючи, грубе кодування дуже важливо для ефективного кодування інформації з використанням відносно небагатьох нейронів.

    Представлення локалістів

    Протилежністю розподіленого подання є локалістське подання, де один нейрон активний для кодування заданої категорії інформації. Хоча ми не думаємо, що локалістські зображення характерні для фактичного мозку, вони, тим не менш, досить зручні для використання для обчислювальних моделей, особливо для вхідних і вихідних шаблонів для представлення в мережі. Часто досить важко побудувати відповідний розподілений шаблон активності, щоб реально захопити подібність між різними входами, тому ми часто вдаємося до локалістської вхідної моделі з одним вхідним нейроном, активним для кожного різного типу входу, і просто дозволяємо мережі розвивати свою власну. розподілені уявлення звідти.

    1200px-fig_halle_berry_neuron.jpg
    Малюнок\(3.13\): Знаменитий випадок нейрона Холлі Беррі, зафіксований у людини з епілепсією, якій електроди імплантували в мозок. Нейрон здається чутливим до багатьох різних презентацій Холлі Беррі (включаючи просто бачити її ім'я в тексті), але не до інших потенційно подібних людей. Хоча це, здавалося б, свідчить про наявність локалістських «бабусиних клітин», насправді існує багато інших розподілених нейронів, активованих будь-яким заданим входом, наприклад, в тій же області, і навіть цей нейрон демонструє певний рівень стрільби до подібних випадків дистрактора. Репродуковано з Quian Quiroga та ін. (2005).

    На малюнку 3.13 показаний знаменитий випадок нейрона «Холлі Беррі», зафіксований у людини з епілепсією, якій електроди імплантували в мозок. Це, здавалося б, є свідченням екстремальної форми локалістського представлення, відомої як бабусина клітина (термін, очевидно, придуманий Джеррі Леттвіном у 1969 році), що позначає нейрон настільки специфічний, але абстрактний, що він відповідає лише бабусі, заснований на будь-якому вході, але не на будь-який інший. людей або речей. Люди давно знущалися над поняттям про таких бабусиних осередках. Незважаючи на те, що докази для них є захоплюючими (включаючи також інші нейрони для Білла Клінтона та Дженніфер Еністон), це мало що змінює наше основне розуміння того, як реагує переважна більшість нейронів у корі. Зрозуміло, що при перегляді зображення Холлі Беррі відповість величезна кількість нейронів на всіх рівнях кори, тому загальне представлення все ще сильно розподілене. Але виявляється, що серед усіх різних способів категоризації таких входів є кілька високоселективних «бабусиних» нейронів! Ще одне невирішене питання полягає в тому, наскільки ці нейрони насправді показують градуйовані відповіді на інші вхідні дані - на малюнку є деякі вказівки, і для більш широкого тестування цього буде потрібно більше даних.

    Розвідки

    Див. Категоризація обличчя (лише частина I) для вивчення того, як зображення обличчя можна класифікувати по-різному (емоції, стать, ідентичність), кожен з яких підкреслює деякі аспекти вхідних стимулів та руйнується між іншими.