Skip to main content
LibreTexts - Ukrayinska

3.1: Природні фотосенсорні системи

  • Page ID
    33640
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Біологічні сенсорні системи виконують енергоефективні та обчислювально-елегантні алгоритми для виконання таких завдань, як ті, які необхідні для певних інженерних застосувань. Тварини та деякі інженерні системи мають здатність до обмеженого руху в природному середовищі у відповідь на сенсорні подразники. Наприклад, розглянемо фронтенд шукача на ракеті, призначеної для автономного пошуку і попадання в задану ціль. Ракета повинна бути спрямована на ціль, яку бачить шукач з фоновим сенсорним шумом; ця вимога схожа на вимогу бабки, яка шукає і купує менших літаючих комах. Завдання, загальні для обох систем, включають навігацію та керівництво системою в природному середовищі, виявлення, виявлення та відстеження об'єктів, ідентифікованих як цілі, ефективне наведення системи до цілей, а потім перехоплення цих цілей.

    Ця частина стосується фотосенсорних систем, або зору, яке передбачає перетворення фотонної енергії в електронні сигнали. Ці сигнали згодом обробляються для отримання відповідної інформації. Основний акцент буде зроблений на обчислювальні моделі зору, засновані на системі зору приматів, оскільки багато досліджень було зроблено в цій галузі. Ми починаємо з деяких принципів бачення, загальних для багатьох видів у тваринному світі. Потім досліджується структура та функція природних систем зору, з акцентом на обробку інформації спочатку всередині безхребетних (зокрема членистоногих), а потім у хребетних (зокрема приматів). Наступні приклади інженерних додатків, які використовують концепції природного бачення.

    3.1 Природні фотосенсорні системи

    Пасивний означає, що датчик спостерігає природні подразники, які можуть бути доступні в навколишньому середовищі, тоді як активний означає, що датчик посилає подразники і спостерігає за реакцією навколишнього середовища. Фізичні датчики в тваринному світі включають фотосенсорні, такі як пасивні системи зору, що обробляють фотони, механосенсорні, такі як пасивний сонар (прослуховування), активний сонар (кажани, дельфіни, кити), пасивне стиснення (дотик) та активне стиснення (антени комах), і хіміо-сенсорні, такі як смак (смак) та нюх (запах). У цій главі мова піде про пасивні фотосенсорні системи зору.

    3.1.1 Загальні принципи серед природних фотосенсорних систем

    Фотон - це хвильово-частинкова одиниця світла з енергією E = h, де h - постійна Планка, а - електромагнітна частота. Енергія за час (або простір) моделюється як вейвлет, оскільки вона задовольняє загальному визначенню наявності початку та закінчення та унікального вмісту частоти. Інформація, що міститься в частоті і потоці фотонів, являє собою фотонну інформацію, яка перетворюється в електронну інформацію, закодовану в градуйованих (або аналогових) нейронних іонних потенціалах напруги або в частотах потенціалів дії.

    Біологічні системи можна розділити на хребетних, таких як ссавці і плазуни, і безхребетних, таких як комахи. Тварини збирають і обробляють інформацію з навколишнього середовища для визначення подальших дій. Багато різноманітних видів та пов'язаних з ними сенсорних систем відображають широкий спектр доступної екологічної інформації, а також широкий спектр біологічних завдань.

    Спільність фотоприйому і ХЕМО-прийому

    Фотоприйом стає можливим завдяки органічній хімії фотопігментів, які ініціюють візуальний процес шляхом захоплення фотонів світла. Фотопігменти складаються з форми вітаміну А під назвою сітківки і великої молекули білка, яка називається опсіном. Опсіни належать до великого сімейства білків, до складу яких входять нюхові (нюхові) рецепторні білки. Молекули одоранта та тастанта прикріплюються до спеціального мембранного рецептора, викликаючи послідовність молекулярних реакцій, в результаті чого нейрональна сигналізація. Фотопігментні молекули схожі на ці хемосенсорні мембранні рецептори з сітківкою, яка служить одорантом або тастантом вже прикріпленим. Вхідний фотон світла дає молекулі достатньо енергії, щоб ініціювати подібну ланцюгову реакцію при хемосенсорному прийомі, коли молекула одоранта або тастанта контактує з рецептором. В результаті процес фотоприйому дійсно є спрощеною формою процесу хеморецепції. Фото-сенсорна (або зорова) система починається з перетворення фотонного подразника в хімічний подразник (фотопігменти), а решта обробки інформації зорової системи - це хіміосенсорна система.

    Кривизна і відображення

    Дві первинні конструкції очей - це везикулярне (що містить порожнину) око, виявлене у хребетних та деяких молюсків, та складне око, знайдене у членистоногих. На малюнку 3.1-1 показаний увігнутий характер везикулярного ока і опуклий характер складеного ока. Зображення в біологічних системах утворюються на вигнутому аркуші фоторецепторів, званому сітківкою. Аналогічним чином камери формують зображення на аркуші фотоплівки, де плівка плоска, а не вигнута. Стародавній морський молюск Наутілус має увігнуту структуру сітківки з точковим отвором, що створює перевернуте зображення без збільшення. Більшість увігнутих сітківок (хребетних і т.д.) залежать від заломлення світла через більший отвір. Лінза служить цій меті. Більша діафрагма необхідна для того, щоб більше фотонного потоку потрапляло в зону прийому, щоб забезпечити достатню кількість енергії для стимуляції фоторецепторів, а заломлення через лінзу та рідину очного яблука (склоподібний гумор) служить для компенсації інакше розмитий вигляд навколишнього середовища як збільшена діафрагма.

    На першій ілюстрації показано світло, що надходить у увігнуту сітківку, а на ілюстрації праворуч показано світло, що відбивається від опуклої сітківки.

    Малюнок 3.1-1

    (а) увігнута сітківка везикулярного ока багатьох хребетних і молюсків. (б) Опукла сітківка членистоногих з'єднаних очей.

    Фізичні властивості відображення також використовуються в очних конструкціях гребінців і деяких риб і ссавців. Деякі цілі конструкцій, заснованих на відображенні, не відомі (гребінці), але інші конструкції системи зору експлуатують відображення в нічних (нічний час з низьким рівнем освітленості) умовах. Наприклад, нічне полювання певними ссавцями посилюється тим фактом, що фотон світла має вдвічі більше шансів бути захопленим тим самим фоторецептором, як світло проходить вдруге після відображення. Спеціальна світловідбиваюча тканина (tapetum lucidum) позаду сітківки дає цю перевагу в нічних умовах. Це відображення можна спостерігати, коли світить світло (ліхтарик, фара) у бік тварини і воно озирається назад.

    Фоторецептори, як правило, довгі і циліндричні клітини, що містять фотопігменти, розташовані в багатьох плоских дископодібних шарах. Така конструкція дає невелику кутову зону прийому, приводячи до достатньої просторової гостроти, забезпечуючи при цьому безліч можливостей для захоплення вхідного фотона фотопігментом.

    Оптичні недосконалості

    Є кілька недосконалостей, які розглядаються в системах природного зору. Деякі з них включають сферичну аберацію, хроматичну аберацію та дифракцію. Параметри системи природного зору зазвичай представляють оптимальний баланс наслідків цих недосконалостей. Сферична аберація викликана світлом, що надходить у фокус на меншій відстані при проходженні через периферію лінзи, ніж від центру. Хроматична аберація викликана залежністю від довжини хвилі індексу заломлення: чим коротша довжина хвилі, тим більша кількість заломлення. Це означає, що якщо синя частина зображення знаходиться в фокусі, то червона частина зображення трохи не фокусується. Оптичні властивості наявного біологічного матеріалу не дозволяють забезпечити ідеальну компенсацію цих ефектів. Наприклад, для корекції сферичної аберації потрібно постійне зниження показника заломлення рогівки з відстанню від центру. Так як молекулярна структура рогівки постійна, це неможливо. Однак загальна форма ока примата трохи асферична, що мінімізує наслідки сферичної аберації. Оскільки приматне око змінює форму з віком, ці аберації коригуються зовнішніми лінзами (окулярами).

    Третя недосконалість викликана дифракцією. Дифракція - це явище геометричної оптики, що виникає внаслідок крайових ефектів діафрагми. У поєднанні зі сферичною та хроматичною аберацією результатом є просторова межа частоти зображення, яка може бути нанесена на сітківку. Ця межа характеризується кутовою відстанню, яку можна вирішити двома окремими точковими джерелами, що називається кутовою гостротою. Просторова гострота відноситься до найвищої просторової частоти, яку може обробити система зору. Зсув між фоторецепторами у високорозвинутих видів, як правило, є відстанню, представлену кутовою гостротою. Будь-яке подальше зменшення відстані не є практичним, оскільки не було б ніякої переваги щодо вмісту інформації про зображення.

    Іншим міркуванням є контрастна чутливість, яка полягає в тому, наскільки чутливі два окремі фоторецептори до різних рівнів інтенсивності потоку фотонів. У біологічних системах передана інформація часто є різницею в контрасті між двома сусідніми фоторецепторами. Якщо фоторецептори дуже близькі, то різниця ніколи не буде достатньо великою, щоб показати відносний контраст, оскільки краї на зображенні вже розмиті через вищезгадані недоліки. Інтервал фоторецепторів у сітківці знаходиться на порядку просторового інтервалу вибірки Nyquist для частот, обмежених цими недосконалостями. У сітківці дорослої людини це виявляється близько 120 мільйонів фоторецепторів: близько 100 мільйонів паличок, які дуже чутливі і використовуються в нічних умовах, і близько 20 мільйонів конусів, які бувають трьох типів і надають інформацію про колір в умовах денного світла.

    Візуальні інформаційні шляхи

    Сприйнятливі поля для різних сенсорних систем відображаються на конкретних поверхневих ділянках нейрональної тканини (таких як сітківка, мозок та інші нейронні поверхні). Завдяки зв'язності зазвичай спостерігається кілька шляхів. Наприклад, один фоторецептор може бути представлений в декількох нейронів, які передають фотонну інформацію в мозок. Один нейрон може представляти контраст між цим конкретним фоторецептором і найбільш сусідніми з ними. Це було б прикладом нейрону парвоклітинного шляху (parvo означає малий). Інший нейрон може представляти контраст між середнім показником цього фоторецептора і найбільш сусідніми з ними, і в середньому більшої області, що зосереджується на цьому фоторецепторі. Це було б прикладом нейрона магноцелюлярного шляху (магно означає великий). Як з'ясовується, назви походять від відносного фізичного розміру цих нейронів, і вони, трапляється, також відповідають розміру сприйнятливого поля, яке вони представляють. Парвоклітинний і магноцелюлярний шляхи поширені серед багатьох видів, наприклад, як людини (і інших ссавців), так і деяких членистоногих.

    Підключення та гострота

    Існує баланс між скроневою гостротою, яка є здатністю виявляти незначні зміни фотонного потоку в часі, і просторовою гостротою, яка є здатністю виявляти незначні зміни між двома сусідніми об'єктами, зображення яких просторово розділені на сітківці. Оскільки рецептори більш сильно взаємопов'язані, існує краща скронева гострота завдяки кращій фотонно-інтегруючої здатності агрегату. Рецептори, які не сильно взаємопов'язані, демонструють кращу просторову гостроту.

    Щоб проілюструвати цю концепцію, розглянемо стійкий фотонний потік, представлений 1 фотоном на 10 фоторецепторів в одиницю часу. В середньому кожен фоторецептор отримував би 1 фотон кожні 10 одиниць часу. Якщо ця швидкість вхідних фотонів змінилася до 2 фотонів на 10 фоторецепторів, то вихід одного фоторецептора довелося б контролювати протягом 10 одиниць часу, щоб виявити середнє збільшення потоку фотонів. Якби була інтегрована сукупність з 100 фоторецепторних клітин, і якщо фотонний потік був рівномірно розподілений, то загальний вихід стрибнув би з 10 фотонів до 20 фотонів, що може бути помітно в саму наступну одиницю часу. Результатом є те, що тварина зможе набагато краще виявити незначні зміни фотонного потоку, якщо клітини сильно пов'язані, тоді як здатність розрізняти два сусідніх дрібних об'єктів погіршиться. Таким чином, більш висока зв'язність призводить до різкої часової гостроти ціною просторової гостроти.

    Грубе кодування

    Грубе кодування - це перетворення необроблених даних за допомогою невеликої кількості широко перекриваються фільтрів. Ці фільтри можуть існувати у часі, просторі, кольорі або інших інформаційних областях. Біологічні сенсорні системи, як правило, використовують грубе кодування для досягнення високого ступеня гостроти в сенсорних інформаційних областях. Наприклад, у кожній із інформаційних областей візуальної системи (простір, час та колір, або хроматичний) ми знаходимо фільтри, які, як правило, нечисленні та відносно грубі (широкі) за площею (або пропускною здатністю): По суті, існує лише чотири типи хроматичних детекторів, спектральне поглинання яких відповіді показані на малюнку 3.1-2, три часові канали та три просторові канали. Нейрони в сітківці, які отримують інформацію від фоторецепторів, з'єднані таким чином, що ми можемо спостерігати ці просторові, часові та хроматичні інформаційні канали в зоровому нерві.

    Грубе кодування може приймати різні форми, і один грубо закодований простір функцій може бути перетворений в інший. Наприклад, всередині колірних каналів системи зору ми знаходимо трансформацію від широкосмугового в кожному з трьох кольорів на сенсорному рівні до широкосмугового в колірно-опонентних каналах на проміжному рівні. Інші цікаві приклади грубого кодування включають обчислення швидкості вітру та напряму за допомогою датчиків хвоста крикету та розрахунки швидкості об'єкта з режимами розряду розриву та спокою агрегатів нейронів у верхньому колікулюсі кота.

    Відповіді системи зору стрижнів і конусів повинні бути широкими за обсягом, щоб охопити свою частину простору даних. Наприклад, в денних умовах тільки три типи конусів мають різну реакцію. Як мінімум, кожен тип повинен забезпечувати певну реакцію понад третину видимого спектру. Кожен тип детектора реагує на набагато більше третини видимого спектру. Оскільки одна реакція від даного детектора може бути результатом однієї з багатьох комбінацій кольору та інтенсивності, значення саме по собі дає неоднозначну локальну інформацію про колір та інтенсивність. Якби крива відгуку була дуже вузькою смугою, то будь-яка реакція є результатом певної частоти, і значення відгуку відображало б її інтенсивність. Однак багато з цих детекторів потрібні для досягнення широкого діапазону (мільйонів) кольорів, які ми можемо сприймати. Непрактично мати кожен з багатьох вузькосмугових детекторів на кожному просторовому місці. Природний дизайн оптимізований, щоб дозволити виявити багато кольорів у кожному місці, мінімізуючи вимоги до нейронного обладнання (або «мокрого посуду»).

    Графік кривих відгуку з чотирма кривими, що представляють фотопі

    Ці криві є нормалізованими піками кривих відгуку трьох відомих фотопігментів у сітківці приматів. Відповіді значно перекриваються. Ця цифра була виготовлена за допомогою кривої підгонки Matlab до вибраних точок у виміряній біологічній тканині.

    3.1.2 Концепції системи зору членистоногих

    Хоча в тваринному світі є мільйони видів, існує відносно мало концепцій дизайну фоторецепторів, які витримали випробування часом, наприклад, членистоногі сполучені очі. Існують деякі цікаві подібності між системами зору комахи філи і приматів. Наприклад, обидва відображають вхідне світло на масив фоторецепторів, розташованих у сітківці. Обидва демонструють чіткі нейрональні шляхи після сітківки для того, що, здається, є просторовою та тимчасовою обробкою.

    Звичайно, існують деякі ключові відмінності між системами зору комах та приматів. Комахи мають нерухому фіксовану оптику. Вони не можуть виводити відстані, використовуючи фокус або змінюючи погляд для зближення об'єктів. Очі набагато ближче один до одного, так що паралакс також не може бути використаний для визначення відстані. Розмір набагато менше, а охоплення практично в кожну сторону, так що загальна просторова гострота набагато гірше, ніж у приматів. Як результат, навігація, здається, здійснюється більше відносним рухом зображення, ніж будь-якою формою виявлення та розпізнавання об'єктів [Srini02].

    Членистоногі З'єднання очей

    Членистоногое складне око являє собою опуклу структуру. З'єднане око являє собою сукупність окремих омматідій, які представляють собою складну структуру, що детектує світло, зазвичай складається з кришталика рогівки, кристалічного конуса та групи світлочутливих клітин. Кожен ommatidium утворює один шматок вхідного зображення так, що повне зображення формується шляхом інтеграції всіх омматидій. Існує три основні конструкції для інтеграції омматідій в складене зображення:

    1. Призначення. Кожен омматидій відображає свій сигнал на єдиний фоторецептор.
    2. Суперпозиція: Кілька омматидій сприяють вхідному сигналу для кожного фоторецептора
    3. Нейронна суперпозиція: Фоторецептор не тільки вводить суперпозицію декількох омматидій, але нейрони далі в ланцюжку обробки також отримують свої входи з декількох виходів фоторецепторів.

    Apposition очі утворюють відносно точні зображення навколишнього середовища. Така конструкція поширена серед добових (денних) комах. Суперпозиційні очі поширені серед нічних (нічних) і крепускулярних (сутінкових) комах. В умовах низького рівня освітленості конструкція суперпозиції дозволяє забезпечити більшу чутливість, оскільки світло від декількох омматидій фокусується на одному фоторецепторі. Більша чутливість суперпозиційного ока відбувається за рахунок просторової гостроти, оскільки деталізація зображення ділиться сусідніми пікселями. Це приклад «вищої зв'язності призводить до різкої часової гостроти ціною просторової гостроти», поясненого раніше. Нейронне суперпозиційне око знаходиться у двокрилої (двокрилої) мухи. Така конструкція дозволяє проводити подальшу обробку, щоб компенсувати втрату просторової гостроти, що призводить як до хорошої просторової гостроти, так і чутливості.

    Око суперпозиції має більшу чутливість до змін фотонного потоку через більш високий ступінь зв'язності омматідій з одним фоторецептором. Аналогічним чином стрижнева система приматів сильно взаємопов'язана, що призводить до високого ступеня тимчасової чутливості. Фоторецептори приматів поділяються на стрижні і конуси, названі за формою зовнішнього фотопігментосодержащего сегмента. Деякі конусні клітини також сильно взаємопов'язані, що забезпечує кращу чутливість до тимчасових змін.

    Сканування очей

    Кілька молюсків і членистоногих розробили скануючий механізм для створення візуального образу зовнішнього середовища. Вузька смужка фоторецепторів переміщається вперед і назад, щоб генерувати повне зображення. Деякі морські равлики мають сітківки, які мають від 3 до 6 фоторецепторів шириною і 400 фоторецепторів довжиною. Око сканує 90°, займає близько секунди, щоб сканувати вгору, і близько четвертої секунди, щоб повернутися вниз [Smith00].

    Креветка-богомол містить 6 рядів збільшених омматідій в центральній області складеного ока. Більші омматидії містять кольорові візуальні пігменти, які можуть бути використані для подальшого дослідження об'єкта, що цікавить, шляхом сканування з цими центральними фоторецепторами. Це дозволяє креветці використовувати будь-яку інформацію про колір у процесі прийняття рішень [Smith00].

    Деякі стрибають павуки містять сітківки від 5 до 7 фоторецепторів шириною і 50 фоторецепторів довжиною. Павук зазвичай сканує з боку, але може обертати око, щоб додатково дослідити конкретний об'єкт, що цікавить. Бічні (додаткові) очі на цьому павуку містять сильно взаємопов'язані фоторецептори для виявлення легких швидких рухів. Після виявлення увагу первинного ока може бути спрямовано на знову виявлений об'єкт. Цей процес аналогічний зору приматів, де більше периферійних клітин сильно пов'язані, а центральна область (ямка, про яку буде сказано пізніше) більш щільно упаковані і не настільки взаємопов'язані. Різкий рух по периферії змушує примата обертати очі, щоб зафіксуватися на джерелі руху. Після фіксації вища просторова гострота центральної області може бути використана для розрізнення просторового затримання нового об'єкта, що представляє інтерес [Smith00].

    3.1.3 Системи зору приматів

    Раннє бачення можна визначити як процеси, що відновлюють властивості поверхонь об'єктів з 2D масивів інтенсивності. Повне бачення буде процесом використання інформації раннього бачення для прийняття певного рішення. Основна увага в цьому розділі зосереджена на інформаційних шляхах зору хребетних, які починаються в сітківці і закінчуються на етапах обробки кірки. Кортикальна походить від кори, яка використовується для опису частини мозку, де обробляється інформація про сенсорну систему. Зір обробляється в первинній зоровій корі, слух обробляється в слуховій корі, а дотик обробляється в соматосенсорної корі. Багато з цих понять також поширені в зору комах.

    На малюнку 3.1-3 показані відповідні ділянки очі примата. Фотонна енергія спочатку заломлюється рогівкою і далі кришталиком і склоподібним гумором, який заповнює камеру оптики. Сітківка охоплює більшу частину внутрішньої частини ока і служить першим етапом обробки зору. Приблизно 120 мільйонів фоторецепторів закодовані приблизно в 1 мільйон аксонів, що складають зоровий нерв.

    На малюнку 3.1-4 показані інші основні компоненти системи зору приматів. Проекція 3D-середовища відображається на 2D аркуші нейрональної тканини під назвою сітківка. Сітківка приматів складається з декількох шарів нейронів, включаючи фоторецепторні, горизонтальні, біполярні, амакринові та гангліозні шари, які будуть розглянуті пізніше. Інформація градуйована, що в основному означає аналог інженерів-електриків, поки вона не досягне аксона (виходу) шару гангліозних клітин. Градуйована потенційна сигналізація замінюється сигналізацією потенціалу дії через зоровий нерв. Після досягнення зорового хіазму права сторона обох сітківок (що представляє ліву сторону поля зору) відображається на правій стороні мозку, а ліва сторона обох сітківок (права сторона поля зору) - на ліву сторону мозку.

    Простий малюнок лінії ока з мітками для рогівки, зіниці, кришталика, склоподібного гумору, сітківки і зорового нерва.
    Малюнок 3.1-3. Спрощена анатомія ока примата.

    Сітківка, бічне колінчасте ядро (LGN) і мозок складаються з шарів нейронів. Малюнок 3.1-4 підкреслює LGN, зовнішні 4 шари якого є припиненням оптичних нейронів Парвоклітинного шляху (PP) та внутрішніми 2 шарами припинення оптичних нейронів Магноцелюлярного шляху (МП). Обидва сигнали PP і MP є сигналами противника, тобто рівні сигналу відповідають контрасту між центральним сприйнятливим полем (РФ) і більшим навколишнім РФ, який би включав відповіді від нейронів, не представлених центральним РФ. Парво (малий) і магно (великий) були імена, дані анатомами, які базували імена на розмірі тіл клітин. Зручно, пізніше було з'ясовано, що ПП відповідає меншим RF (центральний РФ може бути однією коміркою), а МП більшим RF (центральний РФ буде більшою сукупністю клітин). В обох випадках навколишня РФ буде більшою, ніж центральна РФ. Існує подвійність в центральних сигналах об'ємного контрасту в тому, що деякі представляють центральний сигнал мінус об'ємний (сигнали «ON»), тоді як інші представляють об'ємний сигнал мінус центральний (сигнали «OFF»).

    РР містить інформацію про колір, оскільки конусна реакція одного центрального сигналу матиме іншу спектральну реакцію від середньої реакції оточуючих нейронів. Деякі попередні дослідники використовували б r, g, b для позначення трьох рецепторів конуса. Але оскільки криві спектрального поглинання широко перекривають більшу частину видимого спектра (як показано на малюнку 3.1-2), кращими позначеннями є l, m, s для довгохвильових та короткохвильових типів конусів [Dev88]. Ми приймаємо цю конвенцію в цій книзі.

    Кольорові ілюстрації мозку з анатомією зору позначені

    Малюнок 3.1-4. Основні компоненти зору приматів.

    Завантажено серпня 2020 року з www.ncbi.nlm.nih.gov/Книги/NBK541137/, CC BY

    Просторово-часові площини обробки

    Сітківку можна вважати «частиною» мозку, як це пропонує підзаголовок книги Джона Даулінга «Сітківка: доступна частина мозку» [Dowl87]. Сітківка являє собою багатошарову область нейрональної тканини, що вистилає внутрішню поверхню ока, як показано на малюнку 3.1-3. На ранніх стадіях ембріонального розвитку приматної центральної нервової системи (ЦНС) в одній нервовій трубці розвиваються два зорових бульбашки з зоровими чашками, які з часом розвиваються в сітківки для кожного ока. Фізіологія (або функціонування) шарів нейронів схожі, чи розташовані периферично в сітківці (близько 5 шарів), в ЛГН (близько 6 шарів), або в зоровій корі (близько 10-12 шарів). Якщо ми зможемо краще зрозуміти просторово-тимчасово-хроматичну обробку сигналу, яка існує в сітківці, це краще наше розуміння того, що також відбувається в LGN та вищих центрах обробки зорової кори.

    Механіку обробки зору можна найкраще візуалізувати у вигляді серії паралельних площин обробки, кожна з яких представляє один з нейронних шарів у сітківці або в мозку, як показано на малюнку 3.1-5. Паралельно вхідні фотони приймаються зовнішніми сегментами фоторецепторів, в результаті чого з'являються сигнали, які поширюються на зорову кору головного мозку. Кожна площина нейрональної обробки діє на зображення послідовно. Однак механізм обробки не можна просто описати як прості фільтри зображення, що діють на кожній окремій площині. Оскільки енергія поширюється через нейронні шари, іонний заряд поширюється латерально по кожній площині обробки. Як результат, вихід кожної площини обробки являє собою комбінацію поточних та історичних входів комірок у шляху, а також історичний вхід сусідніх комірок.

    Щоб адекватно моделювати просторові та часові ефекти нейрональних взаємозв'язків, кожна клітина в кожній площині обробки нейронів повинна враховувати ефекти посередництва сусідніх клітин, а також тимчасові ефекти деградації сигналу в часі. Одним із способів моделювання обох ефектів є застосування 2D просторового фільтра до кожної площини зображення та слідувати фільтру за допомогою негерметичного інтегратора, що дозволяє тимчасові іонні ефекти рівноваги.

    Кодування інформації

    Природні системи зору витягують космічну (просторову), часову (часову) та кольорову (хроматичну) інформацію, щоб прийняти певне рішення. Інформація часто кодується для передачі, наприклад, від сітківки до ЛГН. На малюнку 3.1-6а показані основні інформаційні блоки в системі зору. Рисунок 3.1-6b ілюструє загальні числові елементи обробки на кожному з різних етапів обробки зору. Існує приблизно 100:1 стиснення фоторецепторів сітківки до сигналів зорового нерва, але розширення 1:1000 сигналів зорового нерва до нейронів зорової кори. Це розширення відоме як оптичне випромінювання. Поєднуючи стиснення та розширення, відбувається загальне розширення близько 1:10 фоторецепторів сітківки до нейронів зорової кори. Як типово в біології, стиснення та розширення досить неоднорідні, оскільки в ямку сітківки (дуже центральна частина зору) є близько 2 нейронів зорового нерва на фоторецептор, але лише 1 нейрон зорового нерва приблизно на кожні 400 фоторецепторів в периферичній частині сітківки. Цей дисбаланс є наслідком важливості інформації в центрі погляду.

    Вхідні фотони проходять через різні шари клітин і фоторецепторів сітківки.

    Малюнок 3.1-5. Плана/серійна подвійність обробки зору.

    Інформація у вигляді клітинних іонних потенціалів фільтрується просторово, коли вона поширюється через різні шари системи зору. Детально показують шари сітківки; шари в LGN і зоровій корі продовжують просторово-часову обробку.

    Ілюстрація процесу фотонів, що проходять через анатомію зору для створення зображення
    (а)
    Кодування сигналу для фотонів, які проходять процес, щоб виробляти дію в мозку
    (б)
    Малюнок 3.1-6. Функціональні блоки зору (а) та кодування сигналу (б).

    Природна фільтрація зору починається з фотонної рефракції через рогівку і кришталик (рис. 3.1-3). На малюнку 3.1-7 зображені різні клітинні шари всередині сітківки і грубе наближення математичної функції, яку виконує кожен шар на вхідних знімках. Вхідне світло потім проходить через склоподібний гумор і клітинну тканину сітківки і фокусується на поверхні мозаїки фоторецептора. Потік в рецептивній області фоторецептора сітківки усереднений до одного виходу в синапсі тріади (в корені фоторецептора). В результаті інформація може бути візуалізована у вигляді мозаїки, де кожен шматок представляє вихід одного фоторецептора.

    Фотонна енергія перетворюється в електронний заряд в фотопігментних дисках фоторецепторів (палички і конуси). Вважається, що швидкість передачі інформації пропорційна логарифму вхідної інтенсивності. Фоторецептори за допомогою шару горизонтальних клітин поширюють заряд в просторі і часі в межах локального сусідства з іншими рецепторами. Таке поширення заряду може бути змодельовано просторово-часовими гаусовими фільтрами. Дві окремі відхилення (горизонтальні та вертикальні) потрібні для просторового 2D-фільтра, а інша - для того, як сигнал погіршується у часі.

    Розкинутий заряд і оригінальний заряд фоторецепторів, обидва з яких можуть бути змодельовані як гаусово-фільтровану версію вхідних зображень, обидва доступні в корені фоторецептора, в синапсі тріади. Біполярні клітини з'єднуються з триадними синапсами і, імовірно, активують сигнали, пропорційні різниці між входом фоторецептора і горизонтальним входом клітини. Тому вихід біполярної клітини представляє різницю гаусової версії вихідного зображення.

    Просторові ребра виявляються двома типами біполярних клітин, на- біполярних і офф-біполярних, які реагують на світло і темряву відповідно. На біполярний реагує, якщо центральне рецептивне поле перевищує навколишнє рецептивне поле, тоді як позабіполярні клітини реагують, якщо навколишнє рецептивне поле перевищує центральне рецептивне поле. Тимчасові краї (швидкі зміни рівнів фотонного потоку) виявляються включеннями-вимкненими та вимкненими біполярними клітинами, які реагують на швидкі зменшення або збільшення фотонного потоку відповідно. Відповідні гангліозні клітини (увімкнено, вимкнено, вимкнено та вимкнено) поширюють амакриноклітинні опосередковані реакції на ці біполярні клітини.

    Ілюстрація клітин сітківки та їх відповідної функції
    Малюнок 3.1-7. Загальна модель шарів клітин сітківки та відповідна функціональність

    Різницевий сигнал, що поширюється біполярними клітинами, є наслідком бічного гальмування, викликаного зв'язністю фоторецепторів і горизонтальних клітин. Горизонтальні клітини з'єднуються горизонтально з численними фоторецепторами в синапсі тріади. Горизонтальні клітини мають лише дендрити, які для інших нейронів зазвичай служать вхідними каналами. Дендрити (входи) для цих клітин пропускають іони в обидві сторони, в залежності від того, як розподіляється іонний заряд. Чистий ефект полягає в тому, що сусідні фоторецептори мають свою інформацію, частково розділену цією посередницькою активністю горизонтальних клітин.

    Розривні переходи між сусідніми фоторецепторами впливають на заряд фоторецепторів. Відповідь від фоторецепторного агрегату може бути змодельована як просторово-часова гаусова з невеликою дисперсією. Вхідні дані з сусідньої сукупності горизонтальних комірок можуть бути змодельовані за допомогою аналогічної гаусової з більшою дисперсією. Диференціруюча функція призводить до роботи фільтра різниці гаусса (DOG), що призводить до антагоністичного профілю сприйнятливого поля центру оточення. Функції DOG та функції другої похідної Гаусса, званої лаплаціаном-гауссовим (LOG), були використані для моделювання виходу біполярних клітин.

    Інформація про аналоговий заряд в сітківці передається в інформаційні шляхи, коли вона направляється від площини мозаїки до зорового нерва. Ці інформаційні канали походять в сітківці і підтримуються через зоровий нерв і до частин мозку. До них відносяться стрижневий канал, ініційований стрижневими біполями, парвоклітинний шлях (РР) та магноцелюлярний шлях (МП), останні два ініційовані конусними біполями. І ПП, і МП демонструють центрово-оточуючі антагоністичні сприйнятливі поля. Конуси ПП щільно з'єднані, реагуючи на невеликі сприйнятливі поля, в той час як конуси МП більш вільно з'єднані (разом зі стрижневими входами), реагуючи на великі сприйнятливі поля.

    MP і PP виконують окрему просторову смугову фільтрацію, надають інформацію про колір і інтенсивність, а також забезпечують канали тимчасової відповіді, як показано на малюнку 3.1-8. Відносно високий ступінь гостроти досягається в кожній області (простір, час і колір, або хроматичний) з цих кількох фільтрів. МП чутливий до низьких просторових частот і широкої інтенсивності кольору, які забезпечують основну інформацію про об'єкти на зображенні. PP, як відомо, чутливий до більш високих просторових частот і хроматичних відмінностей, які додають деталізації та роздільну здатність. У кольоровій області PP забезпечує колірну опоненцію і, отже, спектральну специфічність, а МП забезпечує кольорову непротивність і, отже, загальну інтенсивність. У часовій області РР забезпечує повільно мінливу динаміку, тоді як МП забезпечує перехідні реакції на динаміку зображення.

    Три різних інформаційних канали зображення, включаючи не-противника магноцелюлярний шлях (MP), парвоклітинний шлях кольорового опонента (PP) та високо пов'язаний шлях системи стрижнів

    Малюнок 3.1-8. Інформаційні канали природного бачення.

    Кольоровий опонент PP реагує на просторові деталі, повільно змінюючи динаміку зображення та хроматичну деталізацію. Колір, що не опонент MP реагує на просторові середні показники, швидкі перехідні процеси та варіації інтенсивності. Шляхи стрижневої системи сприяє загальній яскравості та забезпечує швидкі тимчасові реакції на периферії.

    Градуйована потенційна обробка

    Інформація про сітківку в першу чергу у вигляді градуйованих потенціалів, коли вона рухається від шару фоторецепторної клітини (ПК) через сітківку до шарів амакринової клітини (AC) та гангліозних клітин (ГК). Вихідні аксони GC складають зоровий нерв, транспортуючи спайки до LGN. Гангліозні аксональні сигнали починають передачу зорового нерва кольору, часу та космічної інформації до решти нейрональних органів на шляху зору. Типово, що локалізована обробка градуйована, як аналоговий рівень напруги в ланцюзі RLC, але імпульсується за допомогою потенціалів дії при переміщенні відстані, наприклад, від сітківки до LGN, а звідти до верхнього колікулу та до зорової кори.

    На малюнку 3.1-9 показані функції обробки сигналів і зображень на різних стадіях сітківки. На малюнку 3.1-10 показана більша деталізація нижньої лівої області малюнка 3.1-9. Просторово-часова фільтраційна характеристика обумовлена зв'язністю перших трьох шарів нейронів: фоторецепторів, горизонтальних клітин і біполярних клітин.

    Грубе кодування в частотній області сигналу

    Розширено використання грубого кодування на частотну область сигналу, розглядаючи гаусові криві, що імітують фільтри обробки сигналів. Фільтри на основі Гаусса були обрані через гаусову природу різних етапів обробки нейронів в системах зору, а також простоти впровадження гаусових фільтрів в електронні системи.

    Фільтри на основі Гаусса з різними відхиленнями та їх спектрами потужності показані на малюнку 3.1-11. Гауссові криві від G1 до G4 мають зростаючі дисперсії. Кожна крива нормалізується так, щоб пік знаходився в одному місці. Таким чином можна спостерігати форму кривої. У практичному застосуванні криві будуть нормалізовані для площі єдності, так що фільтрація змінює сигнал, не додаючи або забираючи енергію.

    Спектр цих гаусових фільтрів є гаусовим зі зменшенням дисперсій. Крива з невеликою дисперсією, така як G1, буде пропускати низькочастотні та середні частотні компоненти та послаблювати високі, тоді як одна з більшою дисперсією, наприклад G4, буде пропускати лише дуже низькочастотні компоненти. Віднімання цих фільтрів дає нам показані різниці гаусових (DOG) фільтрів. Для вибраних відхилень DoG G1-G2 служить фільтром високих частот, тоді як інші служать більше смуговими фільтрами.

    Майте на увазі, що частота тут має на увазі частоту сигналу. Сигнал може містити варіації просторово розподіленої енергії (просторової частоти), зміни інтенсивності з часом в одному місці (тимчасова частота, або варіації кольору щодо часу або простору (хроматична частота).

    Детальна модель обробки сигналів системи зору, класифікована за типом сигналу та функцією обробки

    Загальна роль (верхня лінія) полягає в обробці фотонної інформації та прийнятті деякого рішення в результаті. Цей малюнок вертикально ілюструє фізику, характер сигналу та функціональність обробки щодо різних органічних етапів, коли інформація рухається горизонтально (праворуч).

    Лінійна модель з мітками окорухової системи

    Малюнок 3.10. Функціональні деталі, що спостерігаються в сітківці.

    Окорухова система контролює напрямок погляду; частина її автоматична, а частина свідомо контролюється. Просторово-часове посилення функції DOG є наслідком реакції фоторецепторів та горизонтальної та біполярної зв'язності клітин.

    Пари фільтрів можуть бути обрані для розкладання сигналу на вибрані задані частотні компоненти. Наприклад, якщо бажано виміряти силу сигналу приблизно на 10% частоти дискретизації (горизонтальна вісь на рис. 3.1-11), то різниця між гауссами G3 і G4 буде використовуватися для фільтрації сигналу. Завдяки лінійності перетворення Фур'є спектральними реакціями (середній графік на рис. 3.11) можна маніпулювати додаванням або відніманням, щоб отримати бажану спектральну реакцію фільтра (нижній графік). Це просто перекладається на ту саму маніпуляцію в сигнальній області (верхній сюжет).

    Три ділянки фільтрів Гаусса і DoG

    Всі криві нормалізуються до одиничного пікового значення. Верхній графік показує гаусові фільтри, нанесені на зразки даних. Середній і нижній графіки показують спектри потужності гаусових фільтрів і фільтрів DoG (відповідно), побудовані відповідно до частоти дискретизації.

    Фоторецептор Мозаїка

    Ці концепції фільтрації легко розширюються до двох вимірів для використання з поведінкою планарної обробки моделей систем зору. Щоб повністю оцінити характер фільтра зображень, важливо розуміти, що пікселі не розподіляються рівномірно за розміром або типом. Вхідне зображення походить від фоторецепторної мозаїки, що складається з S, M і L конусів і стрижнів.

    На малюнку 3.1-12 показано грубе спрощення фоторецепторної мозаїки. Центральна область називається ямочкою і являє собою кругову проекцію приблизно 1 o конічного вигляду навколишнього середовища. У цій області знаходяться всього два типи фоторецепторів: M і L клітини. Два типи конусів дозволяють колірну дискримінацію в ямочці, а відсутність стрижневих клітин дозволяє забезпечити високий ступінь просторової гостроти. Швидке зниження просторової гостроти з ексцентриситетом, або величина відриву від центру, можна наочно продемонструвати, подивившись книгу на книжковій полиці. Зберігаючи очі фіксованими, стає важко читати заголовки, які все ще відносно близькі до точки фіксації.

    Відсутність стрижневих клітин в ямці пояснює зникнення слабкої зірки, коли ми дивимося прямо на неї. Стрижневі клітини набагато чутливіші, тому вони реагують в нічних умовах тьмяного освітлення. Однак, якщо конуси не стимулюються, колірної дискримінації немає, оскільки сильний сигнал на частоті зі слабкою характеристикою такий же, як слабкий сигнал на частоті з сильним відгуком.

    Триколірна мозаїка з шишок і стрижнів

    Три типи конусів і стрижневі клітини показані в репрезентативному розподілі з ексцентриситетом. Коефіцієнт L: M становить близько 2:1 у фовеа без стрижневих клітин, але загальні стрижневі клітини значно перевищують кількість клітин конуса. Розміри комірок конуса трохи збільшуються з ексцентриситетом.

    На малюнку 3.1-13 показано репрезентативне відображення L і M клітин fovea в парво- (РР) та магноцелюлярний (МП) шляхи. Клітини PP фізично менші, але також несуть інформацію, що стосується менших сприйнятливих полів. На малюнку співвідношення L і M в МП зберігаються майже постійними (2:1), так що єдиною реакцією буде збільшена або зменшена інтенсивність (яскравість). Однак об'ємні клітини PP перекошені до клітини не в центрі. Іншими словами, загалом існує співвідношення L: M клітин 2: 1. Об'ємне поле у верхньому лівому з'єднанні становить 1:1, що сприяє внеску M клітин, коли L-клітина є центром. Інший приклад (вгорі праворуч), об'ємний звук є чисто L, що сприяє L над співвідношенням 2:1, коли M знаходиться в центрі. Отже, об'ємне оточення знаходиться в дещо іншій клітинній концентрації, що допомагає сприяти місцевому контрасту між двома спектрально різними типами конусів, що дозволяє забезпечити більш сильну гостроту в хроматичній області.

    3.1.4 Моделі обробки кольорового зору

    Існує кілька способів позначення трьох типів конусів, показаних їх спектральними відгуками на малюнку 3.1-2. Деякі дослідники використовують B, G та R для представлення синіх, зелених та червоних піків у кривих поглинання фотонів, хоча піки не мають цих точних кольорів. Інші вважають за краще використовувати S, M і L для позначення короткої довжини хвилі, середньої довжини хвилі та довгих хвиль відповідей відповідно. Це останнє позначення є більш доцільним, оскільки позначення в моделі Бойнтона змінено, щоб зберегти узгодженість між трьома моделями, представленими в наступних розділах. Всі три описують окремі світлові та хроматичні канали інформації в рамках обробки кольорового зору.

    Червоні та жовті точки представляють середню та довгу довжину хвиль

    «Вкл.» і «Викл» мають на увазі полярність різниці між центром і об'ємом. Темні лінії, що з'єднують центри осередків, представляють зв'язок сигналу в області. Кожна область (центр або об'ємний) представлена єдиним інтегрованим значенням. MP клітини контрастують більші концентричні сприйнятливі поля, тоді як клітини PP контрастують окремі клітини з сусідніми клітинами.

    Кольорова модель Гута [Guth91]

    Модель, запропонована Гутом, включала яскравість і хроматичні канали, як показано на малюнку 3.1-14. Відгук каналу яскравості можна узагальнити як L+M, тоді як реакція хроматичного каналу може бути описана як L - S. Варіація цієї моделі змішує хроматичні та світлові канали з автоматичним регулюванням посилення в штучній нейронній мережі, навченій психофізичними даними. Локалізований контроль посилення імітує просторово-часові характеристики фоторецепторно-горизонтальної клітинної мережі. Існують численні дослідницькі зусилля, які використовували різні методи емуляції бічного гальмування для екстракції просторово-часових ознак, властивих фоторецепторно-горизонтальній клітинній мережі.

    Першим етапом моделі Гута є підсумовування імітованого рецепторного шуму, що надсилається до кожного конуса, з подальшим стаціонарним самоадаптаційним нелінійним керуванням коефіцієнтом посилення. Другий етап - лінійні комбінації сигналів, розділених на два набори по три канали кожен. Третя стадія - це нелінійне стиснення каналів другого ступеня. Один набір включає два канали опонента та один канал, що не є противником, стиснутий для забезпечення візуальної дискримінації та видимої яскравості. Інший набір включає три канали, стиснуті для забезпечення появи світла з точки зору білизни, почервоніння або зеленості, а також синюшності або жовтизни [Guth91, Guth96].

    Цю модель критикували як погану емуляцію структури сітківки, оскільки не передбачено пропорцій конусів, характеру анатомічних зв'язків та рецептивної польової структури гангліозних та колінних (LGN) нейронів. Крім того, це штучна нейронна мережа, без фізіологічної основи, яка навчена відповідати психофізичним даними [Dev96]. Проте поділ обробки кольору на канали яскравості і кольору є невід'ємною частиною моделі, і справа тут в тому, що кілька з цих моделей включають аналогічні розташування типів конусів для цих каналів зору.

    Колірна модель Бойнтона [Boyn60]

    Класична модель Boynton також ділить колірні шляхи зору на світлові та хроматичні канали. Канал яскравості в його моделі описується як L + M. Хроматичні канали описуються як L - M і (L+ M) - S. Він вказує на схожість у численних інших. Хроматичні канали противника відомі із записів на горизонтальному клітинному шарі. Горизонтальні клітини з'єднуються з фоторецепторами і виконують просторовий і тимчасовий змішування фоторецепторних сигналів. Вважається, що біполярні клітини поширюють різницеві сигнали в шляхах противника [Boyn60].

    Колірна модель Девалуа [Dev88]

    Пізніша модель, запропонована Девалуа (рис. 3.1-14), докладніше розглядає відносні концентрації клітин до уваги. Помічено, що концентрація різних комірок конуса є функцією ексцентриситету, або відстані від центру. У центрі, фовеола, є тільки L і M клітини у відповідному співвідношенні близько 2:1. S шишки стають більш очевидними в парафовеї і більш периферичних областях сітківки. Існує загальне передбачуване співвідношення клітин L: M: S 10:5: 1. Нормована реакція сусідства з цими концентраціями дає:

    ДЕВ_ЛМС = 0,625 Л + 0,3125 М + 0,0625 С.

    Змінна Dev_LMS представляє відповідь від типового мікрорайону фоторецепторів з репрезентативною щільністю популяції клітин. Колірна модель DeValois складається з 4 центральних антагоністично-об'ємних каналів, 3 представляють канали PP і один представляє канал MP. Кожен з 4 каналів існує в двох полярності в цілому 8 каналів. 6 хроматичних каналів модель реакцій каналу PP як

    РР Л = (+/-) (Л - ДеВ_ЛМС)

    ПП М = (+/-) (М - ДеВ_ЛМС)

    ПП S = (+/-) (S - ДеВ_ЛМС)

    в той час як канали яскравості моделюють реакції MP каналу як

    МП = (+/-) ((Л+ М) - ДеВ_ЛМС)

    Загальна концепція моделі кольорового зору Гута та ДеВалуа проілюстрована на малюнку 3.14.

    Загальна модель кольору противника

    Моделі Бойнтона і ДеВалуа разом з моделями від Мартінеса-Урієгаса [Mart94] і Chittka [Chittka96] порівнюються на малюнку 3.1-15. Всі вони (як і Guth) мають якийсь синергізм L і M клітин для кодування яскравості і антагонізму клітин для кодування кольору. (N і W в моделі Мартінеса-Урієгаса призначені для вузьких і широких сприйнятливих полів. S в інших моделах призначені для малохвильових конусів). На основі цих популярних моделей проста кольорова модель може включати в себе центральне сприйнятливе поле, що контрастує з місцевим сусідством. Центр сприйнятливого поля моделюється як єдиний елемент зображення, або піксель. Співвідношення центрального пікселя з місцевим сусідством представляють відповідь колір-опонент. Представлені моделі використовують відмінності, але співвідношення є в цій загальній моделі. Це правдоподібно, оскільки багато нейронів реагують логарифмічно стимулом, а співвідношення стають відмінностями після логарифмічного перетворення. Фактичні реакції біполярних клітин передбачаються віднімальними, але їх можна вважати ділительними, оскільки віднімання слід за логарифмічною реакцією фоторецепторів.

    Графіка порівнює модель кольорового зору Гута та модель кольорового зору DeValois на основі реакції LMS.

    Ці моделі та інші, як правило, включають адитивну реакцію L та M на яскравість та віднімну реакцію L, M або S з навколишнім оточенням для кольору.

    Таблиця порівняння різних кольорових моделей з колонками для хроматичного каналу та каналу яскравості

    Поширеним серед цих моделей є локальний контраст між відповідями L та M для хроматичної інформації та широка інтеграція відповідей L та M для інформації про інтенсивність.

    Вважається, що реакції фоторецепторів є логарифмічними, тоді як відповіді біполярних клітин вважаються віднімними. Через логарифмічну природу реакції фоторецепторів біполярний різницевий сигнал дійсно відображає контрастність фоторецептора з горизонтально-клітинним опосередкованим сигналом (який є локалізованим просторово-часовим середнім сигналом). Це пов'язано з тим, що логарифм перетворення відношення зменшує множення до додавання. Наприклад, якщо детектор М відповідає вихідним значенням M o, а детектор L відповідає вихідним значенням L o, то логарифм відношення такий же, як і віднімання окремої логарифмотрансформованої комірки відповіді. Тобто,

    ln (М о о) = лн (М о) — лн (Л о).

    3.1.5 Витяг кольору з парвоклітинного шляху колір-супротивник

    На малюнку 3.1-13 показано включення і виключення парвоклітинних шляхів як різниця між однією фоторецепторною клітиною в центрі та місцевим сусідством декількох сусідніх фоторецепторів. Представницька крива поглинання фотонів для кожного рецептора (S, M, L та Rod) показана на малюнку 3.1-2 Якщо сусідні рецептори усереднені разом, середня реакція буде відрізнятися від відповіді центральної клітини, оскільки в середньому реакція центрального поля відрізняється від реакції центру околиці. Щоб проілюструвати це поняття, розглянемо такий приклад:

    Приклад 3.1, Обробка опонентів з центральним об'ємом

    Задані криві спектральної відповіді фоторецепторів на рисунку 3.1-2 та монохроматичний стимул єдності інтенсивності визначають вихід антагоніста центра-оточення. Припустимо, що об'ємний вхід складається з відношення довгохвильових (L) до середньохвильових (M) до короткохвильових (S) конусів L:M:S = 10:5:1. Припустимо, що центральне поле є лише однією коміркою (L, M або S). Визначте вихід для центральної комірки кожного типу клітин (S, M та L) для подразника, довжина хвилі якого дорівнює

    1. 450 нм

    2. 500 нм

    3. 550 нм

    4. 600 нм

    Рішення:

    Використовуючи малюнок 3.1-2, нам потрібно оцінити реакцію кожного подразника, який очікується від кожного з трьох типів клітин. Дивлячись на нормовані значення при 450 нм, реакція S-конуса становить близько 0,6, М-конус близько 0,3, а L-конус - близько 0,1. Розрахункові вимірювання наведені на малюнку 3.1-16. Якщо центральною коміркою є комірка S-конуса, значення центру дорівнює 0,6. Навколишнє сусідство розраховується як середньозважене значення різних відповідей. Для L: M: S = 10:5: 1 тоді середньозважений буде

    оточуючий_відповідь =\( \frac{1}{16}(10(0.1)+5(0.3)+(0.6))=\frac{3.1}{16}=0.194 \)

    і S-клітинний центр об'ємного реагування буде

    S осередок: центр_відповідь — об'єм_відповідь = 0,6 - 0.194 = 0,406

    Аналогічно при 450 нм

    M осередок: center_response — об'єм_відповідь = 0.3 — 0.194 = 0.106

    L осередок: центр_відповідь — об'єм_відповідь = 0,1 — 0,194 = -0,094

    Потім те ж саме можна зробити і при 500, 550, і 600 нм. На наступному малюнку показана розрахункова виміряна реакція для всіх трьох типів клітин на кожній з 4 довжин хвиль:

    Графік чотирьох кривих, що представляють довгі, середні та короткі конуси та довжини хвиль стрижня

    Див. Приклад 3.1

    Використовуючи середньозважене, як і раніше, результатом для кожного з трьох типів комірок для кожної з чотирьох довжин хвиль є:


    Довжина хвилі стимулу
    Центр-об'ємний опонент відповідь
    S-осередок M-Cell L-клітина
    450 нм 0,41 0,11 -0.09
    500 нм -0.53 0,22 -0.06
    550 нм -0.89 0,07 0,06
    600 нм -0.61 -0.31 0,21

    Дивлячись на результати цього прикладу, ми бачимо позитивні відповіді в прямому діагоналі та негативні відповіді від неї. Це має сенс, оскільки вхідні довжини хвиль, що використовуються для цього прикладу, поступово збільшуються, як і пікові довжини хвиль відгуку, що йдуть від S до M до L клітини. Коли вхідний стимул знаходиться поблизу пікової реакції центральної клітини, то середньозважене місцеве сусідство нижче, оскільки на нього впливають клітини, які не реагують так сильно. Звичайно, цей контраст набагато важливіший у каналі PP, ніж канал MP, оскільки центральне поле PP, як правило, є однією коміркою замість сукупності комірок у типовому каналі MP. Тому контраст, спричинений кольором, набагато сильніший у каналі PP, ніж канал MP, тому колір приписується каналу PP на малюнку 3.1-8.

    Цей приклад передбачає об'єкт, що випромінює (або відбиває) енергію на одній монохроматичній частоті, але більшість природних об'єктів випромінюють широкий розподіл частот по видимому спектру. Незалежно від хроматичного розподілу частоти алгоритм призводить до єдиної конкретної відповіді на кожен вхід, який вища обробка мозку може використовувати для сприйняття певного кольору. Різниця кольорів об'єкта на його тлі посилюється цим контрастом, що приносить користь виду, залежному від сприйняття кольору для виживання.

    3.1.6 Гаусові фільтри

    Однією з оригінальних моделей зовнішнього плексиформного шару (фоторецептор-горизонтально-біполярний шар взаємозв'язку комірок) є фільтр Лаплаціан-оф-Гаусса (LoG). Для гаусової функції G, визначена через радіус від центру, r, так що r 2 = x 2 + y 2 для декартових координат x і y, то G визначається в члени дисперсії, σ, як

    \( G=e^{\frac{-\left(x^{2}+y^{2}\right)}{2 \pi \sigma^{2}}}=e^{\frac{-r^{2}}{2 \pi \sigma^{2}}} \)

    Гауссовий фільтр

    Фільтр LoG визначається як друга похідна від G:

    \( \nabla^{2} G(r)=\frac{-1}{\pi \sigma^{2}}\left(1-\frac{r^{2}}{\pi \sigma^{2}}\right) e^{\frac{-r^{2}}{2 \pi \sigma^{2}}} \)

    Фільтр за гаусом (LoG)

    Різниця гаусових (DoG) для двох гаусів з дисперсіями σ 1 і σ 2, дорівнює

    \( G_{1}-G_{2}=e^{\frac{-r^{2}}{2 \pi \sigma_{1}{ }^{2}}}-e^{\frac{-r^{2}}{2 \pi \sigma_{2}^{2}}} \)

    Різниця гаусових (DoG) Фільтр

    За певних умов фільтр DOG може дуже тісно збігатися з фільтром LoG [Marr82]. Фільтр DoG забезпечує більшу гнучкість, оскільки дві дисперсії можуть бути змінені, таким чином, існує два ступені свободи. Фільтр LoG використовує лише одну дисперсію, отже, лише один ступінь свободи.

    Спектр гаусса також є гаусовим:

    \( e^{-t^{2} / 2 \sigma^{2}} \Leftrightarrow \sigma \sqrt{2 \pi} e^{-\sigma^{2} \omega^{2} / 2} \)

    Зверніть увагу, що дисперсія, σ 2, знаходиться в знаменнику показника в часовій області і в чисельнику показника в частотній області. Це показано графічно на малюнку 3.1-11, оскільки широкі (велика дисперсія) гаусси призводять до різких спектральних реакцій, пропускаючи лише дуже низькі частоти. Вузькі (невелика дисперсія) гауси проходять більше нижньої і середньої частот. Межі являють собою гаусову нульову дисперсію, яка при нормалізації до одиничної площі стає імпульсною функцією, і нескінченно-дисперсійна гаусова, яка стає постійною. Імпульсна функція пропускає всі частоти, а постійна проходить тільки постійна складова сигналу, яка в частотній області представлена у вигляді імпульсу при ω = 0 (повторюється кожен 2π приріст ω за рахунок періодичності перетворення Фур'є:

    \(\delta(t) \Leftrightarrow 1 \)Гаусова межа нульової дисперсії

    \(1 \Leftrightarrow 2 \pi \delta(t)\)Нескінченна дисперсія гаусова межа

    3.1.7 Банки вейвлет-фільтрів та шляхи зору

    Два основні шляхи зору - це магноцелюлярний шлях (МП) та парвоклітинний шлях (PP). Кожна реакція нейронів у МП представляє локальне середнє значення над великим сприйнятливим полем. Кожна реакція нейронів у ПП представляє локальну деталь у меншому сприйнятливому полі. Таким чином, МП і ПП розкладають природне вхідне зображення на локальні середні та локальні компоненти деталізації відповідно.

    Аналогічно, цифрові зображення також можна розкласти на набір середніх та інший набір деталей за допомогою квадратурної дзеркальної фільтрації (QMF). Цей метод аналізу зображень (розбивання зображень на компоненти) та синтезу (реконструювання зображень з компонентів) призводить до серії усереднення компонентів та іншої серії деталізаційних компонентів [Strang96]. QMF - це особливий випадок піддіапазонного кодування, де відфільтровані компоненти представляють нижню і верхню частотні половини вихідної смуги пропускання сигналу. Якщо коефіцієнти аналізуючого фільтра симетричні, то синтезуючі компоненти дзеркальні щодо значення півсмуги, таким чином, терміном квадратурне дзеркало. Структура такого вейвлет-аналізатора і синтезатора показана на малюнку 3.1-17. Фільтр низьких частот (LPF) і фільтр високих частот (HPF) аналогічні за функціональністю MP і PP в часових, просторах і кольорових доменах. З QMF з'явилося безліч застосувань.

    Модель квадратурної дзеркальної фільтрації у стилі Flowchart-style

    QMF вимагає фільтрів низьких частот і високих частот, спектри яких перетинаються на одній четвертій частоті дискретизації і відображають один одного в спектральному відгуку. Кожен LPF і HPF на шляху аналізу включає в себе нижчевідбірник, тоді як кожен суміжний LPF і HPF в шляху синтезу включає в себе добірник (або інтерполятор).

    Для ілюстрації QMF наступний приклад і вправа розкладає послідовність на її середні (після LPF) і деталі (після HPF). Послідовність вибірки вниз після кожного проходу через LPF; всі LPF однакові і всі НПФ однакові (технічно фільтри реконструкції є суміжними фільтрами, але однакові для реальних коефіцієнтів).

    Для ілюстрації QMF наступний приклад і вправа розкладає послідовність на її середні (після LPF) і деталі (після HPF). Послідовність вибірки вниз після кожного проходу через LPF; всі LPF однакові і всі НПФ однакові (технічно фільтри реконструкції є суміжними фільтрами, але однакові для реальних коефіцієнтів).

    Приклад 3.2, 1D QMF аналіз і синтез

    1. Використовуючи дискретні хвилі Харра [0.5 0.5] і [0.5 -0.5] для LPF і HPF відповідно, показати, як розкласти наступну послідовність на одне середнє значення і набір деталізованих значень.

    2. Реконструювати вихідну послідовність з обчислених компонентів, щоб перевірити правильність розкладання.

    3. Порівняйте енергію вихідної послідовності з енергією компонентів.

    x [n] = {12 16 8 10 10 18 13 17}

    Рішення:

    На малюнку 3.1-18 показана симетрія QMF PSD для заданих LPF і HPF.

    Графік відображення кривих відгуку LP і HP

    Малюнок 3.1-18 Спектральна щільність потужності HARR LPF та HPF, що показує симетрію QMF.

    Горизонтальна вісь - частота дискретизації. Див. Приклад 3.2

    Частина a:

    Тепер ми фільтруємо вхідну послідовність з LPF і HPF (і зупиняємося, як тільки ми маємо однакову кількість значень, таким чином відкидаючи останнє значення). Використовуючи графічний метод згортки, перегортання LPF (що є симетричним) і проходження під x [n], прийняття точкового добутку, і зсув призводить до

    х [п]: 12 16 8 10 10 18 13 17

    ЛПФ [-n]: 0,5 0,5 = 6

    0,5 = 14

    0,5 = 12

    0,5 = 9

    0,5 = 10

    0,5 = 14

    0,5 = 15,5

    0,5 = 15

    Перший результат LPF {6 14 12 9 10 14 15.5 15}

    Зниження дискретизації результатів LPF дає {14 9 14 15}, який буде входом до наступного етапу LPF.

    Аналогічно, використовуючи графічний метод згортки, перегортання HPF і проходження під x [n], прийняття точкового добутку, і зсув призводить до

    х [п]: 12 16 8 10 10 18 13 17

    ВПФ [-n]: -0,5 = 6

    -0.5 = 2

    -0.5 = -4

    -0.5 = 1

    -0.5 = 0

    -0.5 = 4

    -0.5 = -2,5

    -0.5 = 2

    Перший результат HPF {6 2 -4 1 0 4 -2.5 2}

    Зниження дискретизації результатів HPF дає {2 1 4 2}, які будуть збережені як детальні компоненти.

    Для визначення результатів другого етапу повторюємо LPF і HPF за результатами нижньої вибірки LPF першого етапу:

    Результати LPF першого етапу нижньої вибірки: 14 9 14 15

    ЛПФ [-n]: 0,5 0,5 = 7

    0,5 = 11.5

    0,5 = 11.5

    0.5 0,5 = 14.5

    Другий результат LPF {7 11.5 11.5 14.5}

    Зниження дискретизації дає {11.5 14.5}, який буде входом до наступного етапу LPF.

    Результати LPF першого етапу нижньої вибірки: 14 9 14 15

    ВПФ [-n]: -0,5 = 7

    -0.5 = -2,5

    -0,5 = 2,5

    -0.5 0,5 = 0.5

    Другий результат HPF {7 -2.5 2.5 0,5}

    Зниження дискретизації дає {-2.5 0.5}, який буде збережено як докладні компоненти

    Для визначення результатів третього етапу повторюємо LPF і HPF на вибіркових результатах ЛПФ другого етапу. Наступні результати зниження дискретизації в одному значенні з будуть збережені:

    Результати LPF другого етапу з нижньою вибіркою: 11.5 14.5

    ЛПФ [-n]: 0,5 0,5 = 5,75

    0.5 = 13

    Третій результат LPF {5.75 13}

    Зниження дискретизації дає значення 13. Це значення представляє середнє значення послідовності.

    Результати LPF другого етапу з нижньою вибіркою: 11.5 14.5

    ВПФ [-n]: -0,5 = 5,75

    -0.5 = 1,5

    Третій результат HPF {5.75 1.5}

    Даун-вибірка дає значення 1,5, і аналіз завершений.

    Тут наведено резюме виходів фільтра, а значення після зменшення дискретизації підкреслено:

    Перший результат LPF: {6 14 12 9 10 14 15.5 15}

    Перший результат HPF: {6 2 -4 1 0 4 -2.5 2}

    Другий результат LPF: {7 11.5 11.5 14.5}

    Другий результат HPF: {7 -2.5 2.5 0,5}

    Третій результат LPF: {5.75 13}

    Третій результат HPF: {5.75 1.5}

    Компоненти QMF у x [n] - це результати HPF з нижчою вибіркою та кінцеве середнє значення, яке є послідовністю {2 1 4 2 -2,5 0,5 1,5 13}, де останнім значенням є середнє значення послідовності.

    Частина b:

    Для цілей цього тексту, який полягає в тому, щоб проілюструвати реконструкцію з компонентів, ми просто віднімемо деталь із середнього, а потім додамо деталізацію до середнього, щоб показати, що вихідна послідовність може бути реконструйована. Остаточна деталь, 1,5 буде відніматися від кінцевого середнього, 13, щоб дати 11,5, а потім ті ж два значення будуть додані, щоб дати 14,5:

    Реконструкція другої черги: {(13-1.5) (13+1.5)}

    = {11.5 14.5}

    Потім другої стадії деталізації, послідовність {-2.5 0.5} буде використана для віднімання і додавання до другого етапу середніх значень щойно визначених вище:

    Реконструкція першого етапу: {(11.5- (-2.5)) (11.5+ (-2.5)) (14.5-0.5) (14.5+0.5)}

    = {14 9 14 15}

    і вихідна послідовність, визначена з цих значень мінус потім плюс нижча вибірка деталей першого етапу:

    x [n] = {14-2 14+2 9-1 9+1 14-4 14+4 15-2 15+2}

    = {12 16 8 10 10 18 13 17}

    Частина c:

    Однією з переваг розкладання є велике зниження енергії сигналу. Загальна енергія - це сума квадрата кожної зі складових, в результаті чого

    Потужність в х [п]: 12 2 + 16 2 + 8 2 + 10 2 + 10 2 + 18 2 +13 2 + 17 2 = 1446

    Енергія в компонентах QMF x [n]: 2 2 + 1 2 + 4 2 + 2 + (-2,5) 2 + 0,5 2 + 1,5 2 + 13 2 = 202,8

    Оскільки послідовності стають більшими, а сигнали стають багатовимірними (наприклад, зображення або послідовності зображень), порівняння може бути набагато більш драматичним (на порядки).

    Вправа 3.1, 1D QMF аналіз і синтез

    Використовуючи дискретні хвилі Харра [0.5 0.5] і [0.5 -0.5] для LPF і HPF відповідно, показати, як розкласти наступну послідовність на одне середнє значення і набір деталізованих значень.

    x [n] = {2 22 4 12 0 16 0 4}

    Відповідь: QMF Компоненти x [n]: {10 4 8 2 -2 -3 -2,5 7,5},
    де останнє значення - середнє значення послідовності.

    Шляхи зору (MP та PP) та банки фільтрів QMF, отже, розбивають вхідний сигнал зображення на високочастотні та низькочастотні компоненти. MP і PP додатково доповнюються шляхом стрижневої системи. Стрижневі клітини сильно взаємопов'язані між собою, і хоча самі стрижні в основному насичені в умовах денного світла; стрижневі біполярні клітини опосередковані сусідніми клітинами конуса. Загальним ефектом є просторовий фільтр низьких частот мозаїчного зображення.

    Модель фільтра низькочастотної стрижневої системи може бути об'єднана з моделлю ПП для створення пари фільтрів, спектральна характеристика яких перетинається на одну четверту частоту дискретизації, або половину обмеженої частоти NYQuist. Ретельно підібрана пара може надати вражаючу схожість з типовими парами фільтрів, вибраними для застосувань QMF. Модель МП може бути замінена на фільтр низьких частот, але спектральна характеристика зменшиться при дуже низьких частотах.

    3.1.8 Грубе кодування та ефективне використання базових функцій

    Системи природного зору обробляють інформацію в просторі, часі та кольоровій областях. У кожному з цих доменів ми знаходимо фільтри, які, як правило, нечисленні і відносно грубі за пропускною здатністю. По суті, існує лише чотири типи хроматичних детекторів, три часові канали та три просторові канали. Відповіді цих елементів повинні бути широкими за обсягом, щоб охопити їх частину простору даних. Наприклад, в денних умовах тільки три типи детекторів мають різну реакцію. Як мінімум, кожен тип повинен охоплювати одну третину видимого спектру.

    Грубе кодування нагадує більш поширені вейвлет-додатки, типізовані комплементарними грубими фільтрами низьких частот і високих частот. Можливість реконструкції сигналу QMF - це практична демонстрація вилучення конкретних спектральних деталей лише з двох широкосмугових фільтрів. Цікавим наслідком цього напрямку досліджень є те, що поведінка таких синтетичних додатків може призвести до більш глибокого розуміння явищ обробки природної інформації.

    3.1.9 Неортогональність і неповнота в обробці зору

    Набори вейвлетів можна поділити на ортогональні або неортогональні та повні або неповні категорії. Набір функцій є ортогональним, якщо внутрішній добуток будь-яких двох різних функцій дорівнює нулю, і повним, якщо жодна ненульова функція у просторі не є ортогональною кожному вектору множини. Ортогональність забезпечує зручність обчислень для аналізу та синтезу сигналів. Повнота забезпечує існування послідовного представлення кожної функції в межах заданого простору. Ортогональність і повнота є бажаними властивостями для вейвлет-баз у програмах стиснення.

    Однак біологічні системи не стосуються зберігання інформації для досконалої реконструкції. Будь-яке додаток машинного зору, що вимагає певних дій, які повинні бути вжиті на основі розуміння змісту зображення, також буде відповідати цьому загальному опису. Насправді багато біологічних процесів можуть бути змодельовані наборами функцій, які є неортогональними [Daug88]. Завдання полягає в обробці інформації, щоб зробити якісь дії, а не обробляти інформацію для подальшої реконструкції. Використання неортогональних фільтрів призводить до надмірності інформації для покриття обсягу інформації. Надмірність фільтрів зору врівноважується потребою в ефективності, простоті та надійності. Надмірність інформації призводить до непотрібного обладнання та взаємозв'язків, але часто може знадобитися надмірність, щоб достатньо охопити інформаційний простір, властивий навколишньому середовищу. Витрати на підтримку надмірності можуть бути менш значними, ніж вигода від використання більш простих елементів обробки, які граціозно погіршуються. Оскільки існує близькість між фільтрами на основі Гаусса та більш математично елегантними фільтрами (такими як Лапласіан), існує хороше збереження відповідної інформації (хоча і не ідеальної).