Страница полузащищенная
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Исследования, которые оценивают и ранжируют наиболее употребительные слова в английском, исследуют тексты, написанные на английском языке. Возможно, наиболее полный такой анализ был проведен в отношении Oxford English Corpus (OEC), очень большой коллекции текстов со всего мира, написанных на английском языке. Текст корпус большая коллекция письменных работ, которые организованы таким образом , что делает такой анализ проще.

Всего тексты Oxford English Corpus содержат более 2 миллиардов слов. [1] OEC включает в себя широкий спектр образцов письма, таких как литературные произведения, романы, академические журналы, газеты, журналы, парламентские дебаты Hansard , блоги , журналы чатов и электронные письма. [2]

Другой корпус английского языка, который использовался для изучения частотности слов, - это Brown Corpus , который был составлен исследователями из Университета Брауна в 1960-х годах. Исследователи опубликовали свой анализ Brown Corpus в 1967 году. Их результаты были похожи, но не идентичны результатам анализа OEC.

Согласно Книге списков читающего учителя , первые 25 слов в OEC составляют около одной трети всех печатных материалов на английском языке, а первые 100 слов составляют около половины всего письменного английского языка. [3] Согласно исследованию, процитированному Робертом МакКрамом в «Истории английского языка» , все первые сотни наиболее распространенных слов в английском языке имеют англосаксонское происхождение, [4] за исключением слова «люди», в конечном итоге от латинского «populus». », и« потому что », частично от латинского« causa ».

Некоторые списки общих слов различают словоформы , в то время как другие ранжируют все формы слова как единую лексему (форма слова в том виде, в котором оно отображается в словаре). Например, лексема be (as in to be ) включает в себя все его спряжения ( is , was , am , are , were и т. Д.) И сокращения этих спряжений. [5] Эти 100 лучших лемм, перечисленных ниже, составляют 50% всех слов Oxford English Corpus. [1]

100 самых распространенных слов

Список из 100 слов, которые наиболее часто встречаются в письменном английском, приведен ниже на основе анализа Oxford English Corpus (сборник текстов на английском языке, содержащий более 2 миллиардов слов). [1] часть речи предусмотрена для большинства слов, но часть из-речи категорий варьируются от анализов, а не все возможности перечислены. Например, «я» может быть местоимением или римским числом; «to» может быть предлогом или маркером инфинитива; «время» может быть существительным или глаголом. Кроме того, одно написание может представлять более одного корневого слова . Например, «певец» может быть формой «петь» или «петь». Разные корпуса могут относиться к такой разнице по-разному.

Количество различных смыслов, перечисленных в Викисловаре , показано в столбце Многозначность . Например, «аут» может относиться к побегу, отстранению от игры в бейсболе или к любому из 36 других понятий. В среднем каждое слово в списке имеет 15,38 смысла. Подсчет смысла не включает использование терминов во фразовых глаголах, таких как «съесть вне» (отчитывать) и других многословных выражений, таких как междометие «убирайся!», Где слово «вне» не имеет индивидуального значения. [6] Например, «out» встречается как минимум в 560 фразовых глаголах [7] и встречается почти в 1700 многословных выражениях. [1]

В таблицу также включены частоты из других корпусов. Обратите внимание, что, помимо различий в использовании, лемматизация может отличаться от корпуса к корпусу - например, разделение предложного использования «to» от использования в качестве частицы. Также список COCA включает дисперсию, а также частоту для расчета ранга.

Части речи

Ниже приводится очень похожий список, разделенный по частям речи . [1] Список с пометкой «Другие» включает местоимения , притяжательные формы , артикли , модальные глаголы , наречия и союзы .

Смотрите также

  • Начальный английский
  • Частотный анализ , изучение частотности букв или групп букв
  • Частоты букв
  • Oxford English Corpus
  • Список Сводеша , сборник основных понятий для историко-сравнительной лингвистики
  • Закон Ципфа , теория, утверждающая, что частота любого слова обратно пропорциональна его рангу в таблице частот.

Списки слов

  • Dolch Word List , список часто используемых английских слов
  • Список общего обслуживания
  • Списки слов по частоте

Рекомендации

  1. ^ a b c d "Oxford English Corpus: Факты о языке" . OxfordDictionaries.com . Издательство Оксфордского университета . Какое слово самое распространенное ?. Архивировано из оригинального 26 декабря 2011 года . Проверено 22 июня 2011 года .
  2. ^ "Оксфордский английский корпус" . AskOxford.com . Проверено 22 июня 2006 года .
  3. Первые 100 наиболее часто используемых английских слов, заархивированные 16 июня 2013 г. в Wayback Machine .
  4. Перейти ↑ Bill Bryson, The Mother Tongue: English and How It Got That Way, Harper Perennial, 2001, стр.
  5. ^ Бенджамин Циммер . 22 июня 2006 г. Время от времени после времени ... . Журнал языков . Проверено 22 июня 2006 года.
  6. ^ Бенджамин, Мартин (2019). «Многозначность в 100 лучших слов Оксфордского корпуса английского языка в Викисловаре» . Учите вас в обратном направлении . Проверено 28 декабря 2019 года .
  7. Перейти ↑ Garcia-Vega, M (2010). «Выявлять значение слова« вне » » . 29-я Международная конференция по лексике и грамматике .
  8. ^ "Частота слов: на основе корпуса COCA 450 миллионов слов" . www.wordfrequency.info . Проверено 11 апреля 2018 года .

Внешние ссылки