6.2: Біологія сприйняття
- Page ID
- 72516
Наша мета в цьому розділі полягає в тому, щоб зрозуміти достатньо про біологію, щоб отримати загальне уявлення про те, як інформація протікає через зорову систему, і основні факти про те, як працюють різні частини системи. Це послужить для розміщення моделей, які з'являться пізніше, які дають набагато більш повне уявлення про кожен крок обробки інформації.


На малюнку 6.1 показана основна оптика і шляхи передачі зорових сигналів, які надходять через сітківку, і прогресують до бічного колінчастого ядра таламуса (LGN), а потім до первинної зорової кори (V1). Основними принципами організації, що працюють тут, а також в інших модальностях сприйняття та сприйняття в більш загальному плані, є:
- Трансдукція різної інформації - в сітківці, фоторецептори чутливі до різних довжин хвиль світла (червоний = довгі довжини хвиль, зелений = середні довжини хвиль, і синій = короткі довжини хвиль), даючи нам кольоровий зір, але сигнали сітківки також відрізняються за своїми просторова частота (наскільки груба або тонка ознака, яку вони виявляють - фоторецептори в центральній області ямки можуть мати високу просторову частоту = тонку роздільну здатність, тоді як ті, що знаходяться на периферії, мають нижчу роздільну здатність), і в їх тимчасовій відповіді (швидкий проти повільного реагування, включаючи диференціальна чутливість до руху).
- Організація інформації топографічним способом — наприклад, ліве та праве поля зору організовані в контралатеральні півкулі кори — як показано на малюнку, сигнали з лівої частини зорового простору направляються до правої півкулі, і навпаки. Інформація в межах LGN і V1 також організована топографічно різними способами. Ця організація, як правило, дозволяє протиставити подібну інформацію, виробляючи посилений сигнал, а також групувати разом для спрощення обробки на більш високих рівнях.
- Вилучення відповідних сигналів під час фільтрації нерелевантних - Рисунок 6.2 показує, як клітини сітківки реагують лише на контрастне, а не рівномірне освітлення, використовуючи сприйнятливі поля центрального оточення (наприклад, на центрі, поза об'ємом або навпаки). Тільки коли одна частина цього сприйнятливого поля отримує різну кількість світла порівняно з іншими, ці нейрони реагують. Зазвичай це виникає з краями контрасту, де освітленість переходить між світлим і темним, як показано на малюнку - ці переходи є найбільш інформативними аспектами зображення, тоді як області постійного освітлення можна сміливо ігнорувати. На малюнку 6.3 показано, як ці центральні об'ємні сигнали (які також присутні в LGN) можуть бути інтегровані разом у прості комірки V1 для виявлення орієнтації цих країв - ці крайові детектори утворюють основний словниковий запас для опису зображень у V1. Має бути легко побачити, як більш складні форми можуть бути побудовані з цих основних елементів лінії/краю. V1 також містить складні клітини, які будуються на простих реакціях клітин (рис. 6.4), забезпечуючи дещо багатший базовий словниковий запас. Наступні відео показують, як ми знаємо, як виглядають ці сприйнятливі поля:
- Класичне відображення сприйнятливого поля Hubel & Wiesel V1 за допомогою стимулів проектора старої школи: http://www.youtube.com/watch?v=KE952yueVLA
- Нові зворотна кореляція V1 сприйнятливого поля відображення: http://www.youtube.com/watch?v=n31XBMSSSpI


У слуховому шляху кохлеарна мембрана відіграє аналогічну роль сітківки, а також має топографічну організацію за частотою звуків, виробляючи грубий еквівалент перетворення Фур'є звуку в спектрограму. Потім цей основний звуковий сигнал обробляється в слухових шляхах для вилучення відповідних моделей звуку з плином часу, приблизно так само, як це відбувається в зорі.

Рухаючись за межі первинної зорової кори, система сприйняття є чудовим прикладом потужності ієрархічно організованих шарів нейронних детекторів, як ми обговорювали в розділі Мережі. На малюнку 6.5 показані анатомічні схеми зв'язку всіх основних зорових областей, починаючи від гангліозних клітин сітківки (RGC) до LGN до V1 і далі вгору. Конкретні закономірності зв'язності дозволяють витягти ієрархічну структуру, як показано, хоча існує багато взаємозв'язків поза суворою ієрархією.

Рисунок 6.6 поміщає ці області в їх анатомічні місця, показуючи більш чітко, що проти де (вентральний проти спинного) розщеплення при візуальній обробці. Проекції, що йдуть у вентральному напрямку від V1 до V4 до областей інферотемпоральної кори (ІТ) (TE, TEO, позначені як PIT для заднього ІТ на попередньому малюнку) важливі для розпізнавання ідентичності («що») об'єктів у зоровому вході, тоді як ті, що піднімаються через екстракт тім'яної кори просторова («де») інформація, включаючи сигнали руху в області МТ і МСТ. Пізніше в цьому розділі ми побачимо, як кожен з цих візуальних потоків обробки може функціонувати незалежно, а також взаємодіяти разом для вирішення важливих обчислювальних проблем в сприйнятті.
Ось короткий підсумок потоку інформації вгору по якій стороні зорового шляху (зображено на правій стороні малюнка 6.5):
- V1 — первинна зорова кора, яка кодує зображення в плані орієнтованих крайових детекторів, які реагують на ребра (переходи в освітленні) по різним кутам орієнтації. У першому моделюванні в цьому розділі ми побачимо, як ці крайові детектори розвиваються через самоорганізоване навчання, кероване надійною статистикою природних зображень.
- V2 — вторинна зорова кора, яка кодує комбінації крайових детекторів для розвитку словникового запасу перетинів та стиків, поряд з багатьма іншими основними візуальними особливостями (наприклад, селективність глибини 3D, базові текстури тощо), які забезпечують основу для виявлення більш складних форм. Ці нейрони V2 також кодують ці особливості в більш широкому діапазоні місць, починаючи процес, який закінчується тим, що ІТ-нейрони можуть розпізнати об'єкт незалежно від того, де він з'являється в полі зору (тобто інваріантне розпізнавання об'єктів).
- V4 - виявляє більш складні функції форми в ще більшому діапазоні місць (і розмірів, кутів тощо).
- IT-задній (PIT) - виявляє цілі форми об'єктів у широкому діапазоні місць, розмірів та кутів. Наприклад, на нижній поверхні скроневої частки є область біля веретеноподібної звивини, яка називається веретеноподібною областю обличчя (ФФА), яка виглядає особливо чуйною до обличчя. Однак, як ми бачили в розділі Мережі, об'єкти кодуються в розподілених представленнях в широкому діапазоні областей в ІТ.
- IT-передній (АІТ) — саме тут візуальна інформація набуває гранично абстрактної та семантичної природи — вона може кодувати всіляку важливу інформацію про різних людей, місця та речі.
На відміну від цього, де аспект візуальної обробки, що йде вгору в спинному безпосередньо через тім'яну кору (області MT, VIP, LIP, MST) містить області, важливі для обробки руху, глибини та інших просторових особливостей.
