Навчальні примітки до глави 1
Ресурси
- Британський національний корпус (BNC) доступний для безкоштовного завантаження з Оксфордського текстового архіву за адресою http://ota.ox.ac.uk/desc/2554.
- Корпус сучасної американської англійської мови (COCA) комерційно доступний від Марка Девіса в Університеті Брайгам-Янг, який також надає безкоштовний веб-інтерфейс за адресою https://corpus.byu.edu/coca/.
Подальше читання
Хоча це може здатися дещо застарілим, одне з найкращих обговорень того, що саме «мова» є чи може бути, - це Lyons (1981).
Навчальні примітки до глави 2
Ресурси
- Корпус сучасної англійської мови Ланкастер-Осло-Берген (LOB) доступний безкоштовно з Оксфордського текстового архіву за адресою http://purl.ox.ac.uk/ota/ 0167.
- Британський національний корпус, дитяче видання (BNC-BABY) доступний для безкоштовного завантаження з Оксфордського текстового архіву за адресою http://purl.ox.ac. uk/ota/2553.
- Лондонсько-Лундський корпус розмовної англійської мови доступний безкоштовно з Оксфордського текстового архіву за адресою http://purl.ox.ac.uk/ota/0168.
- Корпус Сюзанни доступний з деякими обмеженнями з Оксфордського текстового архіву за адресою http://purl.ox.ac.uk/ota/1708.
- Частини корпусу Санта-Барбара розмовної американської англійської мови (SBCSAE) доступні для завантаження та через веб-інтерфейс за адресою https: //ca.talkbank.org/access/SBCSAE.html.
- Міжнародний корпус англійської мови, британський компонент комерційно доступний з http://ice-corpora.net/ice/; компоненти для деяких інших сортів (Канада, Східна Африка, Гонконг, Індія, Ірландія, Ямайка, Філіппіни, Сінгапур та США) можна завантажити за цією URL-адресою після написання реєстрація.
- Університетський стандартний корпус сучасного американської англійської мови (BROWN), Фрайбург-Браун корпус американської англійської мови (FROWN), Freiburg—LOB Corpus британської англійської мови (FLOB) та корпус WELLINGTON доступні для установ, що беруть участь у проекті CLARIN за адресою http://clarino.uib.no/korpuskel/.
- Версію корпусу BROWN також можна завантажити за адресою http://www. nltk.org/nltk_data/, але зауважте, що це не оригінальна версія, а деякі тексти частково відсутні.
Подальше читання
Wynne (2005) - це короткий, але важливий вільно доступний вступ до всіх аспектів розробки корпусу, включаючи питання анотації; Сяо (2008) - компактний огляд відомих англійських корпусів.
Навчальні примітки до глави 3
Ресурси
- Корпус комутатора доступний безкоштовно після письмової реєстрації в Консоріумі лінгвістичних даних, див. https://catalog.ldc.upenn. edu/LDC97s62.
- WordNet доступний для безкоштовного завантаження з Прінстонського університету за адресою https://wordnet.princeton.edu.
- Багато основних словників англійської мови в даний час доступні для пошуку в Інтернеті безкоштовно. У цій книзі рекомендовані та використані наступні:
Подальше читання
Читається експозиція уявлень Поппера про фальсифікацію - його нарис «Наука як фальсифікація», що входить до збірки «Гіпотези і спростування» (Поппер 1963). Обговорення ролі операціоналізації в контексті семантики, заснованої на корпусі, знайдено у Stefanowitsch (2010), Wulff (2003) - це дослідження порядку прикметників в англійській мові, що оперізує різноманітні мовні конструкції зразково та дуже прозоро. Zaenen et al. (2004) є прикладом детальної та великої схеми кодування для анімації.
Навчальні примітки до глави 4
Подальше читання
Незалежно від того, з яким програмним забезпеченням для корпусів та узгоджень ви працюєте, вам знадобляться регулярні вирази в якийсь момент. Інформацію легко знайти в Інтернеті, я рекомендую сторінку Вікіпедії як відправну точку (учасники Вікіпедії 2018). Відмінний вступ до питань, пов'язаних з анотуванням корпусів, знаходиться у внеску Джеффрі Ліча «Додавання лінгвістичної анотації» в Wynne (2005). Проникливе тематичне дослідження роботи з текстами в нестандартизованих орфографіях знаходиться в Barnbrook (1996) (який зараз серйозно датується багато в чому, але все ще варто прочитати).
Навчальні примітки до глави 5
(див. примітки до розділу 6)
Навчальні примітки до глави 6
Ресурси
- Комплексний і упорядкований пакет статистичного програмного забезпечення R, доступний для скачування безкоштовно з https://www.r-project.org/ для Linux, Mac OS X, Windows.
- Особливо якщо ви використовуєте Linux або Windows, я також рекомендую вам завантажити R Studio (теж безкоштовно), яка надає просунутий користувальницький інтерфейс R, https://www.rstudio.com/products/rstudio/.
Подальше читання
Той, хто серйозно ставиться до використання статистики в своїх дослідженнях, повинен почати з базового введення в статистику, а потім перейти до впровадження більш просунутих методів, бажано того, який вводить статистичний пакет програмного забезпечення одночасно. Для першого кроку я рекомендую Butler (1985), дуже міцне введення в статистичні поняття та підводні камені, спеціально спрямовані на лінгвістів. Вона вийшла з друку, але автор зробив його доступним безкоштовно за адресою https://web.archive.org/web/2006052306 1748/ http://uwe.ac.uk/hlss/llas/statistic... /bkindex.html. Для другого кроку я рекомендую Gries (2013) як пакетну угоду, орієнтовану саме на лінгвістичні дослідницькі питання, але я також закликаю вас вивчити широкий спектр безкоштовних або комерційно доступних книг, що вводять статистику з R.
Навчальні примітки до глави 7
Якщо ви хочете дізнатись більше про заходи асоціації, Evert (2005) та супутній веб-сайт за адресою http://www.collocations.de/AM/ є дуже всеосяжними та відносно доступними місцями для початку. Stefanowitsch & Flach (2016) обговорюють заходи асоціації на основі корпусу в контексті психолінгвістики.
Навчальні примітки до глави 8
Подальше читання
Граматика - це складне явище, досліджене з дуже різних точок зору. Це ускладнює загальні пропозиції щодо подальшого читання. Можливо, найкраще почати з колекцій, зосереджених на корпусному аналізі граматики, таких як Rohdenburg & Mondorf (2003), Gries & Stefanowitsch (2006), Rohdenburg & Schlüter (2009) або Lindquist & Mair (2004).
Навчальні примітки до глави 9
Подальше читання
Іншу пропозицію про те, як оцінювати TTRs статистично, див. Baayen (2008: Розділ 6.5); дуже цікавий метод порівняння для TTRs та HTR, заснований на тестуванні перестановки замість класичної інференційної статистики див. Säily & Suomela (2009).
Навчальні примітки до глави 10
Ресурси
- Корпус історичної американської англійської мови (COHA) комерційно доступний від Марка Девіса в Університеті Брігама-Янга, який також надає безкоштовний веб-інтерфейс за адресою https://corpus.byu.edu/coha/.
- Дані\(n\) -gram з архіву Google Books доступні для скачування безкоштовно за адресою http://storage.googleapis.com/books/ngrams/books/ datasetsv2.html (зверніть увагу, що файли надзвичайно великі).
Подальше читання
Цей розділ зосереджений на дуже простих аспектах варіації між типами тексту та дуже простому поняттю «тип тексту». Бібер (1988) та Бібер (1989) є хорошими відправними точками для більш всеосяжного погляду на корпусні типи тексту. Як видно з деяких тематичних досліджень у цьому розділі, текст часто є проксі демографічних властивостей ораторів, які його створили, що робить корпусну лінгвістику варіантом соціолінгвістики, див. Далі Бейкер (2010a).
Навчальні примітки до глави 11
Подальше читання
Deignan (2005) є всеосяжною спробою застосувати корпусно-лінгвістичні методи до ряду теоретично обґрунтованих дослідницьких питань, що стосуються метафори. Внески в Stefanowitsch & Gries (2006) демонструють низку методологічних підходів багатьох провідних дослідників, які застосовують корпусні методи для дослідження метафори.