Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обзор английского Использования был первым научно - исследовательский центр в Европе для проведения исследований с корпусами . Исследование проводится на факультете английского языка и литературы Университетского колледжа Лондона .

История [ править ]

Обзор использования английского языка был основан в 1959 году Рэндольфом Квирком . Многие известные лингвисты проводили исследования в Survey, в том числе Бас Аартс, Валери Адамс, Джон Альгео, Дуайт Болинджер, Ноэль Бертон-Робертс, Дэвид Кристал , Дерек Дэви, Ян Фирбас, Сидни Гринбаум , Лилиан Хегеман, Роберт Илсон, Рут Кемпсон, Джеффри Лич , Ян Русецки, Ян Свартвик и Джо Таглихт. Нынешний директор - Бас Аартс. [1]

Первоначальный Survey Corpus предшествовал современным вычислениям. Это было записано на катушке, переписано на бумагу, сохранено в картотеке и проиндексировано на бумажных карточках. Транскрипции сопровождались подробной просодической и паралингвистической аннотацией, разработанной Кристаллом и Куирком (1964). [2] Наборы бумажных карточек вручную аннотировали грамматические структуры и регистрировали, поэтому, например, все словосочетания можно было найти в картотеке именных фраз в Обзоре. Естественно, для поиска по корпусу требовалось посещение Обзора.

Этот корпус теперь более известен как London-Lund Corpus (LLC), поскольку его коллеги из Лунда, Швеция, отвечали за компьютеризацию. Тридцать четыре из устных текстов были опубликованы в виде книг под названием «Свартвик и Куирк» (1980), [3], а весь корпус был использован в качестве основы для знаменитой книги «Комплексная грамматика английского языка» (Quirk et al. 1985). [4]

Текущее исследование [ править ]

Построение корпуса [ править ]

В 1988 году Сидни Гринбаум предложил новый проект ICE , Международный корпус английского языка . ICE должен был стать международным проектом, осуществляемым в исследовательских центрах по всему миру, по составлению корпусов английских разновидностей, где английский был первым или вторым официальным языком. Тексты ICE будут содержать разговорный и письменный английский в сбалансированной выборке из одного миллиона слов на компонент, чтобы эти образцы можно было сравнивать самыми разными способами. Проект ICE продолжается по всему миру и по сей день.

ICE-GB , британский компонент ICE, был составлен в ходе обзора. ICE-GB был аннотирован на очень подробном уровне, включая построение полного грамматического анализа (синтаксического анализа) для каждого предложения в корпусе. Первый выпуск ICE-GB состоялся в 1998 году. ICE-GB распространялся с программным обеспечением для поиска и изучения проанализированного корпуса под названием ICECUP. Релиз 2 ICE-GB уже выпущен и доступен на компакт-диске.

Помимо контрастных разновидностей английского языка, многие исследователи интересуются развитием языка и его изменениями с течением времени. Недавний проект Survey предпринял анализ большой (400 000 слов) выборки речевой части LLC способом, непосредственно сопоставимым с ICE-GB, с формированием нового диахронического корпуса из 800 000 слов, названного Diachronic Corpus of Present- Дневной разговорный английский ( DCPSE ). DCPSE уже выпущен и доступен на компакт-диске в Survey.

Эти два корпуса содержат самую большую в мире коллекцию проанализированных и исправленных, орфографически расшифрованных данных разговорного английского языка, содержащую более миллиона слов разговорного английского языка в этой форме.

Изучение корпусов [ править ]

Анализируемые корпуса - это большие базы данных, содержащие подробные грамматические древовидные структуры. Одним из последствий формирования больших коллекций ценных лингвистических данных является острая потребность в методах и инструментах, которые помогут исследователям и другим пользователям максимально использовать их. Таким образом, параллельно с анализом данных на естественном языке команда Survey провела исследование и разработку программных инструментов, чтобы помочь лингвистам использовать эти корпуса. Исследовательская платформа ICECUP использует интуитивно понятное грамматическое представление запроса, называемое Fuzzy Tree Fragments (FTF), для поиска в проанализированных корпусах.

Лингвистические исследования с корпусами [ править ]

Помимо распространения корпусов и инструментов среди исследователей корпусной лингвистики , SEU проводит исследования по английскому языку. Недавние проекты включают исследование английской словосочетания существительное, подчиненности в устной и письменной речи и английской глагольной фразы. Обзор также оказывает поддержку аспирантам, которые проводят исследования корпусов английского языка.

Ссылки [ править ]

  1. ^ «Исследовательский персонал» . Университетский колледж Лондона . Проверено 14 ноября +2016 . CS1 maint: обескураженный параметр ( ссылка )
  2. ^ Кристалл, Дэвид и Квирк, Рэндольф (1964). Системы просодических и паралингвистических признаков в английском языке . Гаага: Мутон.
  3. ^ Svartvik, Ян и Причуда, Рэндольф (1980) (ред.). Корпус английского разговора Лунд: CWK Gleerup.
  4. ^ Причуда, Рэндольф, Greenbaum, Сидней, пиявки, Джеффри и Svartvik, Ян (1985). Комплексная грамматика английского языка Лондон: Лонгман.

Внешние ссылки [ править ]