8.4: Слухання
Університет Міннесоти
Слух дозволяє нам сприймати світ акустичних коливань навколо нас, і забезпечує нам наші найважливіші канали спілкування. Цей модуль розглядає основні механізми слуху, починаючи з анатомії і фізіології вуха і короткого огляду слухових шляхів аж до слухової кори. За окресленням основних перцептивних ознак звуку, включаючи гучність, висоту тону і тембр, слідує огляд принципів тонотопної організації, встановлених в равлику. Огляд маскування та частотної селективності супроводжується переглядом сприйняття та нейронних механізмів, що лежать в основі просторового слуху. Нарешті, надається огляд аналізу слухової сцени, який вирішує важливе питання про те, як слухова система здатна розуміти складні суміші звуків, які зустрічаються в повсякденних акустичних середовищах.
цілі навчання
- Опишіть основні слухові атрибути звуку.
- Опишіть будову і загальну функцію слухових шляхів від зовнішнього вуха до слухової кори.
- Обговоріть способи, за допомогою яких ми можемо знаходити звуки в просторі.
- Опишіть різні акустичні сигнали, які сприяють нашій здатності перцептивно відокремлювати одночасно надходять звуки.
Слух є вирішальною частиною нашого повсякденного життя. Більшість нашого спілкування з іншими, через мову чи музику, доходить до нас через вуха. Дійсно, приказка, яку часто приписують Хелен Келлер, полягає в тому, що сліпота відокремлює нас від речей, але глухота відокремлює нас від людей. Вуха реагують на акустичну інформацію, або звук - крихітні та швидкі зміни тиску повітря. Звукові хвилі рухаються від джерела і виробляють зміни тиску у вушних каналах слухача, викликаючи вібрацію барабанних перетинок (або барабанних перетинок). Цей модуль надає огляд подій, які слідують, які перетворюють ці прості механічні вібрації в наш багатий досвід, відомий як слух або слухове сприйняття.

Перцептивні атрибути звуку
Існує багато способів опису звуку, але перцептивні атрибути звуку зазвичай можна розділити на три основні категорії, а саме: гучність, висоту тону та тембр. Хоча всі три відносяться до сприйняття, а не до самих фізичних звуків, вони сильно пов'язані з різними фізичними змінними.
Гучність
Найбільш прямим фізичним корелятом гучності є інтенсивність звуку (або звуковий тиск), виміряна близько до барабанної перетинки. Однак на гучність звуку також впливають багато інших факторів, включаючи його частотний вміст, тривалість та контекст, в якому він представлений. Деякі з найбільш ранніх психофізичних досліджень слухового сприйняття, що йдуть більше століття, були спрямовані на вивчення взаємозв'язку між сприйнятою гучністю, фізичною інтенсивністю звуку та просто помітними відмінностями в гучності (Fechner, 1860; Stevens, 1957). Багато часу і сил було витрачено на вдосконалення різних методів вимірювання. Ці методи передбачають такі методи, як оцінка величини, де серія звуків (часто синусоїди або чисті тони однієї частоти) подаються послідовно на різних рівнях звуку, а суб'єктів просять призначити номери кожному тону, відповідні сприйнятій гучності. Інші дослідження вивчали, як змінюється гучність як функція частоти тону, в результаті чого з'явилися міжнародні стандартні контури рівня ізо-гучності (ISO, 2003), які використовуються в багатьох галузях промисловості для оцінки проблем шуму та роздратування. Такі дослідження призвели до розробки обчислювальних моделей, які призначені для прогнозування гучності довільних звуків (наприклад, Moore, Glasberg, & Baer, 1997).
Крок

Висота тону відіграє вирішальну роль в акустичному зв'язку. Варіації тону з часом забезпечують основу мелодії для більшості типів музики; контури тону в мові надають нам важливу просодичну інформацію в нетональних мовах, таких як англійська, і допомагають визначити значення слів у тональних мовах, таких як мандаринська китайська. Крок - це, по суті, перцептивний корелят періодичності форми хвилі або частоти повторення: чим швидше форма хвилі повторюється з часом, тим вище її сприймається крок. Найпоширеніші звуки, що викликають тон, відомі як гармонійні складні тони. Вони складні, оскільки складаються з більш ніж однієї частоти, і вони гармонійні, оскільки частоти є цілими кратними загальній основній частоті (F0). Наприклад, гармонічний складний тон з F0 100 Гц також містив би енергію на частотах 200, 300, 400 Гц тощо. Ці вищі частоти відомі як гармоніки або обертони, і вони також відіграють важливу роль у визначенні висоти звуку. Насправді, навіть якщо енергія на F0 відсутня або маскується, ми, як правило, все ще сприймаємо залишок звуку, щоб мати висоту, відповідну F0. Це явище відоме як «крок відсутнього фундаментального», і воно зіграло важливу роль у формуванні теорій та моделей щодо висоти тону (de Cheveigné, 2005). Ми чуємо висоту тону з достатньою точністю, щоб сприймати мелодії в діапазоні F0s приблизно від 30 Гц (Pressnitzer, Passnitzer, Patterson, & Krumbholz, 2001) до приблизно 4—5 кГц (Attneave & Olson, 1971; Oxenham, Micheyl, Keebler, Loper, & Santurette, 2011). Цей діапазон також досить добре відповідає діапазону, охопленому музичними інструментами; наприклад, сучасний рояль має ноти, які простягаються від 27,5 Гц до 4186 Гц. Ми можемо розрізняти зміни частоти понад 5000 Гц, але ми вже не дуже точні у розпізнаванні мелодій або судженні музичних інтервалів.
Тембр
Тембр відноситься до якості звуку і часто описується за допомогою таких слів, як яскравий, тьмяний, різкий і порожнистий. Технічно тембр включає все, що дозволяє нам розрізняти два звуки, які мають однакову гучність, висоту та тривалість. Наприклад, скрипка і фортепіано, що грають одну і ту ж ноту, звучать дуже по-різному, залежно від їх якості звуку або тембру.
Важливим аспектом тембру є спектральний вміст звуку. Звуки з більш високочастотною енергією, як правило, звучать яскравіше, тонше або суворіше, ніж звуки з більш низькочастотним вмістом, які можуть бути описані як глибокі, насичені або тьмяні. Інші важливі аспекти тембру включають скроневу оболонку (або контур) звуку, особливо те, як він починається і закінчується. Наприклад, фортепіано має швидкий початок, або атаку, вироблену молотом, що вдаряє струну, тоді як атака ноти кларнета може бути набагато більш поступовим. Штучно змінюючи початок фортепіанної ноти, наприклад, граючи запис назад, може різко змінити його характер так, що вона більше не впізнається як фортепіанна нота. Загалом, загальний спектральний вміст і тимчасова оболонка можуть забезпечити хороше перше наближення до будь-якого звуку, але виявляється, що тонкі зміни спектру з плином часу (або спектро-часові варіації) мають вирішальне значення для створення правдоподібних імітацій природних музичних інструментів (Risset & Wessel, 1999).
Огляд слухової системи

Наше слухове сприйняття залежить від того, як звук обробляється через вухо. Вухо можна розділити на три основні частини - зовнішнє, середнє і внутрішнє вухо (див. Рис. Зовнішнє вухо складається з верхівки (видимої частини вуха, з усіма її унікальними складками і горбками), вушної раковини (або слухового проходу), барабанної перетинки. Звичайно, у більшості з нас є два функціонуючих вуха, які виявляються особливо корисними, коли ми намагаємося з'ясувати, звідки йде звук. Як обговорюється нижче в розділі про просторовий слух, наш мозок може порівняти тонкі відмінності сигналів на двох вухах, щоб локалізувати звуки в просторі. Однак цей трюк не завжди допомагає: наприклад, звук безпосередньо спереду або безпосередньо позаду вас не дасть різниці між вухами. У цих випадках фільтрація, що виробляється pinnae, допомагає нам локалізувати звуки та вирішувати потенційні плутанини спереду назад та вгору-вниз. Більш загально, складки та нерівності сосни створюють чіткі піки та провали в частотній характеристиці, які залежать від місця розташування джерела звуку. Потім мозок вчиться асоціювати певні закономірності спектральних піків і провалів з певними просторовими місцями. Цікаво, що ця навчена асоціація залишається податливою, або пластичною, навіть у зрілому віці. Наприклад, дослідження, яке змінило пінне за допомогою форм, виявило, що люди можуть навчитися точно використовувати свої «нові» вуха протягом декількох тижнів (Hofman, Van Riswick, & Van Opstal, 1998). Через невеликий розмір пінни ці види акустичних сигналів зустрічаються лише на високих частотах, вище приблизно 2 кГц. На більш низьких частотах звук в основному незмінний, незалежно від того, йде він зверху, спереду або знизу. Сам вушний канал являє собою трубку, яка допомагає посилити звук в області приблизно від 1 до 4 кГц - область, особливо важлива для мовного спілкування.
Середнє вухо складається з заповненої повітрям порожнини, яка містить кістки середнього вуха, відомі як інкус, молоток та штапес, або ковадло, молоток та стремено, через їх відповідні форми. Вони мають відмінність бути найменшими кістками в організмі. Їх основна функція полягає в передачі вібрацій від барабанної перетинки до овального вікна равлики і за допомогою форми важеля дії краще відповідати імпедансу повітря, що оточує барабанну перетинку, з імпедансом рідини всередині равлики.
Внутрішнє вухо включає равлику, укладену в скроневу кістку черепа, в якій механічні коливання звуку перетворюються в нервові сигнали, які обробляються мозком. Равлик являє собою спіралеподібну конструкцію, яка наповнена рідиною. По довжині спіралі проходить базилярна мембрана, яка вібрує у відповідь на перепади тиску, вироблені коливаннями овального вікна. Сидячи на базилярной мембрані знаходиться орган Корті, який проходить по всій довжині базилярної мембрани від основи (овальним вікном) до верхівки («кінчика» спіралі). Орган Корті включає в себе три ряди зовнішніх волосяних клітин і один ряд внутрішніх волосяних клітин. Волосяні клітини відчувають вібрації за допомогою своїх крихітних волосків або стереоцилії. Зовнішні клітини волосся, здається, функціонують для механічного посилення звукових коливань, тоді як внутрішні клітини волосся утворюють синапси зі слуховим нервом і перетворюють ці вібрації в потенціали дії, або нервові спайки, які передаються вздовж слухового нерва до вищих центрів слухового шляхи.
У равлику встановлено один з найважливіших принципів слуху — частотний аналіз. У певному сенсі дію равлики можна порівняти з дією призми: багато частот, що складають складний звук, розбиваються на складові частоти, при цьому низькі частоти створюють максимальні коливання базилярно-мембрани біля вершини равлики і високі частоти створюють максимальні базилярно- вібрації мембрани ближче до основи равлики. Це розкладання звуку на складові частоти та відображення частоти до місця, або «тонотопне» представлення, є основним організаційним принципом слухової системи і підтримується в нейронному представленні звуків аж від равлики до первинної слухової кори. Розкладання звуку на складові його частотні компоненти є частиною того, що дозволяє нам чути більше одного звуку одночасно. Крім представлення частоти за місцем збудження всередині равлики, частоти також представлені хронометражем спайків всередині слухового нерва. Ця властивість, відома як «блокування фаз», має вирішальне значення для порівняння різниць часу прибуття сигналів між двома вухами (див. Розділ про просторовий слух нижче).
На відміну від зору, де первинна зорова кора (або V1) вважається ранньою стадією обробки, слухові сигнали проходять багато стадій обробки, перш ніж вони досягнуть первинної слухової кори, розташованої в скроневій частці. Хоча ми досить добре розуміємо електромеханічні властивості равлики та її різних структур, наше розуміння обробки, здійсненої вищими етапами слухових шляхів, залишається дещо схематичним. За можливим винятком просторової локалізації та нейронів, налаштованих на певні місця в просторі (Harper & McAlpine, 2004; Knudsen & Konishi, 1978), існує дуже мало консенсусу щодо того, як, що і де вилучення слухових функцій та представлення. Є докази для «пітч-центру» в слуховій корі з обох досліджень нейровізуалізації людини (наприклад, Гріффітс, Бучел, Фракковяк, & Паттерсон, 1998; Penagos, Melcher, & Oxenham, 2004) і одноодиничних досліджень фізіології (Bendor & Wang, 2005), але навіть тут залишаються деякі питання щодо чи відповідає одна область кори кори за кодування окремих функцій, таких як крок, або чи код більш розподілений (Walker, Bizley, King, & Schnupp, 2011).
Чутність, маскування та селективність частоти
Загалом, людська равлика забезпечує нам слух у дуже широкому діапазоні частот. Молоді люди з нормальним слухом здатні сприймати звуки з частотами приблизно від 20 Гц аж до 20 кГц. Діапазон інтенсивностей, які ми можемо сприймати, також вражає: найтихіші звуки, які ми можемо почути в середньочастотному діапазоні (приблизно від 1 до 4 кГц), мають інтенсивність звуку, яка становить приблизно 1 000 000 000 000 менш інтенсивних, ніж найгучніший звук, який ми можемо слухати, не зазнаючи швидкого та постійного зниження слуху. Частково через цей величезний динамічний діапазон ми, як правило, використовуємо логарифмічну шкалу, відому як децибели (дБ), для опису звукового тиску або інтенсивності. У цій шкалі рівень звукового тиску 0 дБ (SPL) визначається як 20 мікропаскалей (мкПа), що приблизно відповідає найбільш тихому відчутному рівню звуку, а 120 дБ SPL вважається небезпечно гучним.

Маскування - це процес, за допомогою якого наявність одного звуку ускладнює чуття іншого звуку. Всі ми стикаємося з маскуванням у нашому повсякденному житті, коли ми не чуємо телефонного дзвінка під час прийняття душу, або коли ми намагаємося стежити за розмовою в галасливому ресторані. Загалом, більш інтенсивний звук замаскує менш інтенсивний звук за умови дотримання певних умов. Найголовнішою умовою є те, що частотний вміст звуків перекривається таким чином, що активність в равлику видається маскуючим звуком «болота», які видаються цільовим звуком. Інший тип маскування, відомий як «придушення», виникає, коли реакція на маску зменшує нейронну (а в деяких випадках і механічну) реакцію на цільовий звук. Через те, як фільтрація в равлики функціонує, низькочастотні звуки частіше маскують високі частоти, ніж навпаки, особливо при високій інтенсивності звуку. Цей асиметричний аспект маскування відомий як «поширення маскування вгору». Втрата різкої кохлеарної настройки, яка часто супроводжує пошкодження кохлеара, призводить до більш широкої фільтрації та більшого маскування - фізіологічного явища, яке, ймовірно, сприятиме труднощам, які відчувають люди з втратою слуху в галасливих умовах (Moore, 2007).
Хоча багато маскування можна пояснити з точки зору взаємодії всередині равлики, є й інші форми, які не можуть бути враховані так легко, і які можуть виникнути навіть тоді, коли взаємодії всередині равлики малоймовірні. Ці більш центральні форми маскування бувають різних форм, але часто класифікуються разом під терміном «інформаційне маскування» (Durlach et al., 2003; Watson & Kelly, 1978). Про причини інформаційного маскування відомо відносно мало, хоча більшість форм можна приписувати перцептивному «злиття» маскувального і цільового звуків або хоча б неможливості відокремити ціль від маскуючих звуків. Також відносно мало відомо про фізіологічний локус інформаційного маскування, за винятком того, що принаймні деякі форми, здається, зароджуються в слуховій корі, а не раніше (Gutschalk, Micheyl, & Oxenham, 2008).
Просторовий слух
На відміну від зору, ми маємо 360° поле слуху. Наша слухова гострота, однак, принаймні на порядок бідніша за зір у розташуванні об'єкта в просторі. Отже, наші слухові здібності до локалізації є найбільш корисними для попередження нас та дозволяють орієнтуватися на джерела, при цьому наш візуальний сенс, як правило, забезпечує дрібнозернистий аналіз. Звичайно, існують відмінності між видами, а деякі, такі як сови і ехолокуючі кажани, розробили вузькоспеціалізовані системи локалізації звуку.

Наша здатність знаходити джерела звуку в космосі - вражаючий подвиг нейронних обчислень. Два основних джерела інформації походять від порівняння звуків у двох вухах. Перший заснований на міжзвукових різницях часу (ITD) і спирається на те, що джерело звуку зліва буде генерувати звук, який трохи досягне лівого вуха, перш ніж він досягне правого вуха. Хоча звук набагато повільніший за світло, його швидкість все ще означає, що різниця часу прибуття між двома вухами становить частку мілісекунди. Найбільший ITD, з яким ми стикаємося в реальному світі (коли звуки знаходяться безпосередньо ліворуч або праворуч від нас), становить лише трохи більше півмілісекунди. З деякою практикою люди можуть навчитися виявляти ITD від 10 до 20 мкс (тобто 20 мільйонних часток секунди) (Klump & Eady, 1956).
Друге джерело інформації базується на міжзвукових відмінностях рівня (ІЛД). На більш високих частотах (вище приблизно 1 кГц) голова відкидає акустичну «тінь», так що при подачі звуку з лівого боку рівень звуку в лівому вусі дещо вище рівня звуку на правому вусі. На дуже високих частотах ILD може бути цілих 20 дБ, і ми чутливі до відмінностей лише 1 дБ.
Як коротко говорилося в обговоренні зовнішнього вуха, інформація щодо висоти джерела звуку, або походить вона спереду чи ззаду, міститься у високочастотних спектральних деталах, що виникають внаслідок фільтруючих ефектів сосни.
Загалом, ми найбільш чутливі до ITD на низьких частотах (нижче приблизно 1,5 кГц). На більш високих частотах ми все ще можемо сприймати зміни часу на основі повільно мінливої часової оболонки звуку, але не тимчасової тонкої структури (Bernstein & Trahiotis, 2002; Smith, Delgutte, & Oxenham, 2002), можливо, через втрату нейронної фазової блокування до тимчасової тонкої структури в високі частоти. На відміну від цього, ІЛД найбільш корисні на високих частотах, де тінь голови найбільша. Таке використання різних акустичних сигналів у різних частотних областях призвело до класичної і дуже ранньої «дуплексної теорії» локалізації звуку (Rayleigh, 1907). Для повсякденних звуків з широким частотним спектром здається, що в нашому сприйнятті просторового розташування переважають міжзвукові часові відмінності в низькочастотній тимчасовій тонкій структурі (Macpherson & Middlebrooks, 2002).
Як і у випадку із зором, наше сприйняття відстані значною мірою залежить від контексту. Якщо ми чуємо, як хтось кричить на дуже низькому рівні звуку, ми робимо висновок, що крик повинен бути далеко, виходячи з наших знань про звукові властивості крику. У приміщеннях та інших закритих місцях реверберація також може надавати інформацію про відстань: Коли динамік рухається далі, рівень прямого звуку знижується, але рівень звуку реверберації залишається приблизно таким же; отже, відношення прямої до реверберантної енергії зменшується (Zahorik & Уайтман, 2001).
Аналіз слухової сцени
Зазвичай в навколишньому середовищі є більше одного джерела звуку в будь-який час - уявіть, що ви розмовляєте з другом в кафе, з деякою фоновою музикою, брязкання кавових гуртків за прилавком, трафік на вулиці, і розмова йде за столом поруч з вашим. Всі ці джерела виробляють звукові хвилі, які об'єднуються, утворюючи єдину складну форму хвилі на барабанній перетинці, форма якої може мати дуже мало відношення до будь-якої з хвиль, що виробляються окремими джерелами звуку. Якимось чином слухова система здатна руйнувати або розкладатися ці складні форми хвиль і дозволяють нам зрозуміти наше акустичне середовище, утворюючи окремі слухові «об'єкти» або «потоки», за якими ми можемо слідувати, коли звуки розгортаються з часом (Bregman, 1990).
Було сформульовано ряд евристичних принципів для опису того, як звукові елементи групуються для формування одного об'єкта або відокремлені для формування декількох об'єктів. Багато з них походять від ранніх ідей, запропонованих у баченні так званими гештальт-психологами, такими як Макс Вертхаймер. Згідно з цими правилами, звуки, які знаходяться в безпосередній близькості, за часом або частотою, як правило, групуються разом. Також звуки, які починаються і закінчуються одночасно, як правило, утворюють єдиний слуховий предмет. Цікаво, що просторове розташування не завжди є сильним або надійним сигналом групування, можливо, тому, що інформація про місцезнаходження з окремих частотних компонентів часто неоднозначна через наслідки реверберації. Кілька досліджень вивчали відносну важливість різних сигналів, «торгуючи» одним сигналом проти іншого. У деяких випадках це призвело до відкриття цікавих слухових ілюзій, де мелодії, які не присутні в звуках, представлених ні до вуха, виникають у сприйнятті (Deutsch, 1979), або де звуковий елемент сприйнятливо «втрачається» у конкуруючих організаціях сприйняття (Shinn-Cunningham, Lee, & Оксенхем, 2007).
Більш пізні спроби використовували обчислювальні та нейтрально засновані підходи для розкриття механізмів аналізу слухової сцени (наприклад, Elhilali, Ma, Micheyl, Oxenham та Shamma, 2009), а область обчислювального аналізу слухової сцени (CASA) виникла частково як спроба рухатися до більш принципові та менш евристичні підходи до розуміння розбору та сприйняття складних слухових сцен (наприклад, Wang & Brown, 2006). Вирішення цієї проблеми не тільки забезпечить нам краще розуміння слухового сприйняття людини, але може забезпечити нові підходи до «розумних» слухових апаратів та кохлеарних імплантатів, а також автоматичних систем розпізнавання мови, які є більш надійними до фонового шуму.
Висновок

Слух забезпечує нам найважливіший зв'язок з оточуючими людьми. Складна фізіологія слухової системи перетворює крихітні зміни тиску повітря, які досягають нашого вуха, у величезний масив слухових переживань, які ми сприймаємо як мова, музику та звуки з навколишнього середовища. Ми тільки починаємо розуміти основні принципи нейронного кодування на вищих стадіях слухової системи, і як вони співвідносяться зі сприйняттям. Однак навіть наше рудиментарне розуміння покращило життя сотень тисяч за допомогою таких пристроїв, як кохлеарні імплантати, які відтворюють деякі функції вуха для людей з глибокою втратою слуху.
Зовнішні ресурси
- Аудіо: Слухові демонстрації з лабораторії Річарда Уоррена в Університеті Вісконсіна, Мілуокі
- WWW4.uwm.edu/APL/Демонстрації.html
- Аудіо: Слухові демонстрації. CD, опублікований Акустичним товариством Америки (ASA). Ви можете послухати демонстрації тут
- www.feilding.net/sfuad/музика30... 1/демо/аудіо/
- Інтернет: Демонстрації та ілюстрації кохлеарної механіки можна знайти тут
- http://lab.rockefeller.edu/hudspeth/...calSimulations
- Інтернет: Більше демонстрацій та ілюстрацій кохлеарної механіки
- www.neurophys.wisc.edu/анімації/
Питання для обговорення
- Виходячи з наявних акустичних сигналів, наскільки добре, на вашу думку, ми оцінюємо, чи виходить низькочастотний звук перед нами чи позаду нас? Як ми можемо вирішити цю проблему в реальному світі?
- Зовнішні клітини волосся сприяють не тільки посиленню, але і налаштуванню частоти в равлику. Які труднощі можуть виникнути у людей з кохлеарною втратою слуху через ці два фактори? Чому слухові апарати не вирішують всіх цих проблем?
- Як ви думаєте, чому слухова система має стільки стадій обробки, перш ніж сигнали потраплять до слухової кори, в порівнянні з зоровою системою? Чи є різниця в швидкості необхідної обробки?
Лексика
- Равлик
- Равлик-ракоподібний орган, який перетворює механічні коливання в нервові сигнали.
- Міжзвукові відмінності
- Відмінності (зазвичай за часом або інтенсивністю) між двома вухами.
- Пінна
- Видима частина зовнішнього вуха.
- Барабанна перетинка
- Вушний барабан, який відокремлює зовнішнє вухо від середнього вуха.
Посилання
- Атрибут, Ф., Олсон, Р.К. (1971). Пітч як середовище: Новий підхід до психофізичного масштабування. Американський журнал психології, 84, 147—166.
- Бендор, Д., і Ван, Х. (2005). Нейрональне представлення висоти тону в слуховій корі приматів. Природа, 436, 1161—1165.
- Бернштейн, Л.Р., і Трахіотіс, К. (2002). Підвищення чутливості до міжзвукових затримок на високих частотах за допомогою «транспонованих подразників». Журнал Акустичного товариства Америки, 112, 1026—1036.
- Брегман А.С. Аналіз слухової сцени: Перцептивна організація звуку. Кембридж, Массачусетс: MIT Press.
- Дойч, Д. (1979). Бінауральна інтеграція мелодійних візерунків. Сприйняття та психофізика, 25, 399—405.
- Дурлах, Н.І., Мейсон, К.Р., Кідд, Г., молодший, Арбогаст, Т. Л., Колберн, Г.С., і Шинн-Каннінгем, Б.Г. (2003). Примітка щодо інформаційного маскування. Журнал Акустичного товариства Америки, 113, 2984—2987.
- Елхілалі, М., Ма, Л., Мішель, К., Оксенхем, А.Дж., і Шамма, С. Тимчасова когерентність в організації сприйняття та коркове представлення слухових сцен. Нейрон, 61, 317—329.
- Фехнер, Г.Т. (1860). Елементи психофізики (Том 1). Лейпциг, Німеччина: Breitkopf und Haertl.
- Гріффітс, Т.Д., Бучел, К., Фракковяк, Р.С., і Паттерсон, Р.Д. (1998). Аналіз тимчасової структури в звуці мозком людини. Нейронаука про природу, 1, 422—427.
- Гутсхалк, А., Мішел, К., & Оксенхем, А.Дж. (2008). Нейронні кореляти слухового перцептивного усвідомлення в умовах інформаційного маскування. Лос Біологія, 6, 1156-1165 (e1138).
- Харпер, Н.С., і МакАлпін, Д. (2004). Оптимальне нейронне кодування популяцій слухового просторового кия. Природа, 430, 682—686.
- Хофман, П.М., Ван Рісвік, Дж., і Ван Опсталь, А.Дж. (1998). Перенавчання локалізації звуку з новими вухами. Нейронаука про природу, 1, 417—421.
- ISO. (2003). ISO:226 Акустика - нормальні контури рівного рівня гучності. Женева, Швейцарія: Міжнародна організація зі стандартизації.
- Клумп, Р.Г., & Еді, Г.Р. (1956). Деякі вимірювання міжзвукових порогів різниці в часі. Журнал Акустичного товариства Америки, 28, 859—860.
- Кнудсен Е.І., Коніші М. (1978). Нейронна карта слухового простору у сови. Наука, 200, 795—797.
- Макферсон, Е.А., & Міддлбрукс, Дж. К. (2002). Зважування слухачів сигналів для бічного кута: переглянуто дуплексну теорію локалізації звуку. Журнал Акустичного товариства Америки, 111, 2219—2236.
- Мур, Б.К. (2007). Кохлеарна втрата слуху: фізіологічні, психологічні та технічні проблеми. Чичестер: Уайлі.
- Мур, Б.К., Гласберг, Б.Р., і Баер, Т. (1997). Модель для прогнозування порогів, гучності та часткової гучності. Журнал Товариства аудіотехніки, 45, 224—240.
- Оксенхем, А.Дж., Мішель, К., Кіблер, М.В., Лопер, А., & Сантуретт, С. (2011). Сприйняття тону поза традиційною областю існування висоти тону. Праці Національної академії наук США, 108, 7629—7634.
- Пенагос, Х., Мельчер, Дж. Р., і Оксенхем, А.Дж. (2004). Нейронне зображення висоти тону в непервинній слуховій корі людини виявлено за допомогою фМРТ. Журнал неврології, 24, 6810—6815.
- Пресніцер, Д., Паттерсон, Р.Д., & Крумбгольц, К. (2001). Нижня межа мелодійного тону. Журнал Акустичного товариства Америки, 109, 2074—2084.
- Релі, Л. (1907). Про наше сприйняття звукового напрямку. Філософський журнал, 13, 214—232.
- Ріссет, Дж., і Вессел, Д. Л. (1999). Дослідження тембру шляхом аналізу та синтезу. В Д. Дойч (ред.), Психологія музики (2-е изд., с. 113—168): Академічна преса.
- Шинн-Каннінгем, Б.Г., Лі, А.К., і Оксенхем, А.Дж. (2007). Звуковий елемент губиться в перцептивній конкуренції. Праці Національної академії наук США, 104, 12223—12227.
- Сміт, З.М., Делгутт, Б., & Оксенхем, А.Дж. (2002). Химерічні звуки виявляють дихотомії в слуховому сприйнятті. Природа, 416, 87—90.
- Стівенс С.С. (1957). Про психофізичному законі. Психологічний огляд, 64, 153—181.
- Уокер, К.М., Бізлі, Дж., Кінг, А.Дж., і Шнапп, Дж. Мультиплексні та надійні уявлення про звукові особливості в слуховій корі. Журнал неврології, 31, 14565—14576.
- Ван, Д., і Браун, Дж. (ред.). (2006). Обчислювальний аналіз слухової сцени: принципи, алгоритми та програми. Хобокен, Нью-Джерсі: Уайлі.
- Уотсон, К.С., і Келлі, В.Дж. (1978). Інформаційне маскування в слухових моделах. Журнал Акустичного товариства Америки, 64, S39.
- Загорик П., & Вайтман Ф.Л. (2001). Сталість гучності при змінній відстані джерела звуку. Нейронаука про природу, 4, 78—83.
- де Шевеньє, А. (2005). Моделі сприйняття тону. У К.Дж. Плак, А.Дж. Оксенхем, А.Н. Поппер, і Р. Фей (ред.), Крок: Нейронне кодування та сприйняття (стор. 169—233). Нью-Йорк, Нью-Йорк: Спрингер Верлаг.