Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
График частотно-ранговых слов в романе « Моби-Дик» . Около 44% различных слов в этом романе, таких как «супружеский», встречаются только один раз, как и hapax legomen (красный). Около 17%, такие как «ловкость», отображаются дважды (так называемые « дизомены» , выделены синим цветом). Закон Ципфа предсказывает, что слова на этом графике должны приближаться к прямой линии с наклоном -1.

В корпусной лингвистике , A гапакс ( / ч Ae р ə к ы л ɪ ɡ ɒ м ɪ п ɒ п / и / ч æ р æ к ы / или / ч р æ к s / ; [1 ] [2] пл. Hapax legomena , иногда сокращенно Hapax , множественного hapaxes) - это слово или выражение, которое встречается только один раз в контексте: либо в письменной записи всего языка , либо в произведениях автора, либо в отдельном тексте. Иногда этот термин неправильно используется для описания слова, которое встречается только в одном произведении автора, но более одного раза в этом конкретном произведении. Гапакс является транслитерацией из греческого ἅπαξ λεγόμενον , что означает «однажды сказало существо». [3]

Соответствующие термины дис legomenon , трис legomenon и тетракис legomenon соответственно ( / г ɪ с / , / т г ɪ с / , / т ɛ т г ə K ɪ с / ) относятся к двойной, тройной или четверной вхождения , но используются гораздо реже.

Hapax legomena является довольно распространенным явлением, как предсказан законом Ципфа , [4] , который гласит , что частота любого слова в корпусе обратно пропорциональна его ранг в таблице частот. Для больших корпусов от 40% до 60% слов являются hapax legomen , а еще от 10% до 15% являются отклонениями . [5] Таким образом, в Коричневом корпусе американского английского примерно половина из 50 000 отдельных слов являются hapax legomen в этом корпусе. [6]

Hapax legomenon относится к появлению слова или выражения в тексте, а не к его происхождению или распространенности в речи. Таким образом, оно отличается от одноразового слова , которое может никогда не быть записано, может иметь ценность и может быть широко записано, или может появляться несколько раз в произведении, которое его чеканило , и т.

Значение [ править ]

Легомены Hapax в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных глифов майя являются hapax legomen , а библейские (особенно на иврите ; см. § Примеры на иврите ) hapax legomen иногда создают проблемы при переводе. Легомены Hapax также создают проблемы при обработке естественного языка . [7]

Некоторые ученые считают, что Hapax legomen полезен для определения авторства письменных работ. П. Н. Харрисон в своей работе «Проблема пастырских посланий» (1921) [8] сделал hapax legomen популярным среди библеистов , когда он утверждал, что в трех пастырских посланиях их значительно больше, чем в других посланиях Павла . Он утверждал, что количество hapax legomen в корпусе предполагаемого автора указывает на его или ее словарный запас и характерно для автора как личности.

Теория Харрисона потеряла свое значение из-за ряда проблем, поднятых другими учеными. Например, в 1896 году В. П. Уоркман обнаружил следующее количество hapax legomen в каждом послании Павла : Римлянам 113, I Кор. 110, II Кор. 99, Гал. 34, Еф. 43 Фил. 41, Кол. 38, I Фес. 23, II Фес. 11, Филимону 5, 1 Тим. 82, II Тим. 53, Титу 33. На первый взгляд, последние три итога (для пастырских посланий) не расходятся с другими. [9] Чтобы принять во внимание разную длину посланий, Уоркман также подсчитал среднее количество hapax legomen на страницу греческого текста , которое варьировалось от 3,6 до 13, как показано на диаграмме справа. [9]Хотя пастырские послания содержат больше hapax legomen на странице, Уоркман обнаружил, что различия умеренные по сравнению с вариациями среди других посланий. Это был усилен , когда Уоркмэн смотрел на несколько пьес от Шекспира , которые показали аналогичные вариации (от 3,4 до 10,4 странице однотомник Ирвинг), как представлено на второй диаграмме справа. [9]

Помимо идентичности автора, существует несколько других факторов, которые могут объяснить количество hapax legomen в работе: [10]

  • длина текста: это напрямую влияет на ожидаемое количество и процент hapax legomen ; Краткость пастырских посланий также делает проблематичным любой статистический анализ.
  • Тема текста: если автор пишет на разные темы, конечно, много тематических слов будет встречаться только в ограниченном контексте.
  • текстовая аудитория: если автор пишет сверстнику, а не студенту, или его супруге, а не работодателю, снова появится совсем другой словарный запас.
  • время: с годами меняются как язык, так и знание и использование языка автором.

В конкретном случае пастырских посланий все эти переменные сильно отличаются от таковых в остальной части корпуса Павла, и hapax legomen больше не широко признаются в качестве убедительных индикаторов авторства (хотя авторство пастырских посланий является предметом споров. по другим основаниям). [11]

Есть также субъективные вопросы о том, составляют ли две формы «одно и то же слово»: собака против собаки, подсказка против невежества, знак против подписи; также возникает много других серых случаев. В Еврейской энциклопедии указывает, что, хотя есть 1500 hapaxes в еврейской Библии , только около 400, не очевидно , связаны с другими заверенных словоформ. [12]

Фальсификатору не составит особого труда создать произведение с любым желаемым процентом hapax legomen . Однако кажется маловероятным, что фальсификаторы задолго до 20-го века придумали бы такую ​​уловку, не говоря уже о том, что они думали, что это стоит усилий. [ необходима цитата ]

Последняя трудность с использованием hapax legomen для определения авторства состоит в том, что существует значительная разница между работами, о которых известно, что они принадлежат одному автору, и разные авторы часто демонстрируют схожие ценности. Другими словами, hapax legomen - ненадежный индикатор. В настоящее время исследования авторства обычно используют широкий спектр мер для поиска закономерностей, а не полагаются на отдельные измерения.

Информатика [ править ]

В области компьютерной лингвистики и обработки естественного языка (NLP), особенно. корпусной лингвистики и машинного обучения НЛП обычно игнорируют hapax legomen (а иногда и другие редкие слова), поскольку они, вероятно, не имеют большого значения для вычислительной техники. Это пренебрежение имеет дополнительное преимущество , заключающееся в значительном сокращении использования памяти приложением, поскольку по закону Ципфа многие слова являются hapax legomen. [13]

Примеры [ править ]

Ниже приведены некоторые примеры hapax legomen в языках или корпусах .

Примеры арабского языка [ править ]

В Коране :

  • Существительные собственные: Iram (Q 89: 7, Iram of the Pillars ), Bābil (Q 2: 102, Babylon ), Bakka (t) (Q 3:96 , Bakkah ), Jibt (Q 4:51), Ramaḍān (Q 2: 185, Рамазан ), ар-Ром (Q 30: 2, Византия ), Tasnim (Q 83:27), Qurayš (Q 106: 1, курайшиты ), Мажус (Q 22:17, волхвы ), Марут ( Вопрос 2: 102, Харут и Марут ), Мекка (т) (Вопрос 48:24, Мекка ),Наср (Q 71:23), (Ḏū) ан-Нун (Q 21:87) и Харут (Q 2: 102, Харут и Марут ) встречаются только один раз. [14]
  • занджабил ( زَنْجَبِيل - имбирь ) - это коранический гапакс (Q 76:17).
  • Epitheton Ornans ас-Самад ( الصمد - Тот умолял ) является Коранический Hapax (Q 112: 2).
  • Туд ( طُوْد - гора ) - коранический гапакс (Q 26:63).

Китайские и японские иероглифы [ править ]

Классическая китайская и японская литература содержит много китайских иероглифов, которые встречаются в корпусе только один раз, и их значение и произношение часто теряются. Известные по-японски как kogo (孤 語) , буквально «одинокие персонажи», их можно рассматривать как разновидность hapax legomenon . [15] Например, в « Классике поэзии» (около 1000 г. до н.э.) символ篪 используется ровно один раз в стихе «伯 氏 吹 埙 , 仲 吹», и это произошло только благодаря открытию описания Гуо Пу. (276-324 г. н.э.), что персонаж мог быть связан с определенным типом древней флейты.

Примеры на английском [ править ]

Слово « honorificabilitudinitatibus » из первого издания пьесы Уильяма Шекспира «Потерянные усилия любви»
  • Flother , как синоним слова « снежинка» , представляет собой hapax legomenon письменного английского языка, найденный в рукописи, озаглавленной «XI адские боли» (около 1275 г.). [16] [17]
  • Hebenon , ядупомянутых в Shakespeare «s„Гамлет“только один раз.
  • Honorificabilitudinitatibus - это частный наследник произведений Шекспира .
  • «Индекси» в « Дракуле» Брэма Стокера используется как прилагательное для описания ситуативного состояния без дальнейшего использования в языке: «Если бы этот человек был обычным сумасшедшим, я бы рискнул довериться ему, но он кажется таким. смешался с графом так неопределенно, что я боюсь сделать что-нибудь плохое, помогая его причудам ". [18]
  • Мантикратик , что означает «правления семьи или клана Пророка», по-видимому, был изобретен Т. Е. Лоуренсом и однажды появляется в « Семи столпах мудрости» . [18]
  • Nortelrye , слово, обозначающее «образование», встречается в Чосере только один раз .
  • Самоуверенность , возможно, имеющая значение «дерзость», встречается только однажды в рассказе Диккенса «Рождественская елка».
  • Slæpwerigne , «усталый от сна», встречается ровно один раз в древнеанглийском корпусе, в Эксетерской книге . Ведутся споры о том, означает ли это «усталость от сна» или «усталость от сна».
  • Сатир , хотя и является обычным словом в английском языке в целом, является hapax legomenon для Шекспира, поскольку в его произведениях оно встречается только один раз. [19]

Немецкие примеры [ править ]

Muspilli, строка 57: «dar nimac denne mak andremo helfan uora demo muspille» ( Баварская государственная библиотека, Clm 14098, ф. 121r)
  • Название стихотворения девятого века муспилля является обратно-образованием от «muspille», древневерхненемецкого гапакс неясного значения можно найти только в этом тексте (см муспилля # Этимологии для обсуждения).

Древнегреческие примеры [ править ]

  • По словам классика Клайда Фарра , « Илиада содержит 1097 hapax legomen , в то время как Одиссея - 868». [20] Другие определили этот термин по-другому, и насчитывают всего 303 в « Илиаде» и 191 в « Одиссее» . [21]
  • panaōrios ( παναώριος ), что с древнегреческого означает «очень несвоевременно», - одно из многих слов, которые встречаются в « Илиаде» только один раз . [22]
  • Греческий Новый Завет содержит 686 локальных гапакс-легоменов , которые иногда называют «новозаветными гапаксами». [23] 62 из них встречаются в 1 Петра, а 54 - во 2 Петра . [24]
  • Epiousios , переведенный на английский язык как «ежедневный» в молитве «Отче наш» в Матфея 6:11 и Луки 11: 3 , больше нигде не встречается во всей известной древнегреческой литературе и, таким образом, является hapax legomenon в самом сильном смысле.
  • Слово aphedrōn (ἀφεδρών) «уборная» в греческом Новом Завете встречается только дважды, в Матфея 15:17 и Марка 7:19, но поскольку широко считается, что автор Евангелия от Матфея использовал Евангелие от Марка как источник, его можно рассматривать как hapax legomenon . Оно было ошибочно переведено как «кишечник», пока надпись из Lex de astynomis Pergamenorum («Закон о городских клерках Пергамона ») не подтвердила, что оно означало «уборная». [25] [26]

Примеры на иврите [ править ]

Число различных hapax legomen в еврейской Библии составляет 1480 (из общего числа использованных 8679 различных слов). [27] : 112 Однако из-за еврейских корней , суффиксов и префиксов только 400 являются «истинными» hapax legomen. [12] Полный список можно увидеть в Еврейской энциклопедии, в статье «Hapax Legomen». [12]

Вот некоторые примеры:

  • Акут (אקוט - сражался) появляется только один раз в еврейской Библии, в Псалме 95:10.
  • Ацей Гофер (עֲצֵי-גֹפֶר - дерево гофер ) однажды упоминается в Библии, в Бытие 6:14, в инструкции сделать Ноев ковчег «из дерева гофер». Из-за его единственного внешнего вида его буквальное значение теряется. Суслик - это просто транслитерация , хотя ученые предварительно предполагают, что предполагаемая древесина - кипарис . [28]
  • Gvina (גבינה - сыр ) является гапаксом из библейского иврита , нашел только в Иове 10:10. Это слово стало чрезвычайно распространенным в современном иврите .
  • Zechuchith (זכוכית) является гапаксом из библейского иврита , нашел только в Иове 28:17. Слово происходит от корня זכה z-ch-h , что означает «прозрачный / прозрачный» и относится к стеклу или хрусталю . В современном иврите это слово означает «стекло».
  • Лилит (לילית) однажды встречается в еврейской Библии , в Исаии 34:14, где описывается запустение Эдома . Переводится несколькими способами.

Ирландский пример [ править ]

  • chomneibi , прилагательное неизвестного значения, описывающее планку , появляется только в Triads of Ireland # 169. [29]

Примеры итальянского [ править ]

  • Ramogna упоминается только один раз в итальянской литературе , в частности , в Dante «s Divina Commedia ( Чистилище XI, 25).
  • Глагол attuia появляется один раз в Комедии ( Purgatorio XXXIII, 48). Значение оспаривается, но обычно интерпретируется как «затемняет» или «препятствует». В некоторых рукописях вместо этого приводится альтернативный вариант hapax accuia . [30]
  • Трасуманар - еще один hapax legomenon, упомянутый в Комедии ( Paradiso I, 70, переведено Мандельбаумом как «Переход за пределы человеческого» ).
  • Ultrafilosofia , что означает "за пределами философии" появляется в Леопарди «s Zibaldone (Zibaldone 114-115 - июнь, седьмой 1820).

Латинские примеры [ править ]

  • Deproeliantis , причастие слова deproelior , что означает «яростно сражаться» или «яростно бороться», появляется только в строке 11 Оды 1.9 Горация .
  • Mactatu , единственная аблатива от mactatus , что означает «из-за убийства». Это происходит только в De Rerum Natura по Лукреция .
  • Mnemosynus , предположительно означающий памятную или памятную записку , появляется только в стихотворении 12 из « Кармины» Катулла .
  • Scortillum , миниатюрная форма означает «маленькая проститутка», происходит только в Poem 10 из Катулла «ы Carmina , строка 3.
  • Terricrepo , прилагательное , видимо , имея в виде грозовой ораторского метода, происходит только в книге 8 Augustine «s Исповеди .
  • Romanitas , существительное, обозначающее «романизм», «римский путь» или «римский образ жизни», встречается только у Тертуллиана де Паллио . [31] [32]
  • Арепо - это имя собственное, которое можно найти только в квадратах Сатора . Это происходит путем написания оперы в обратном порядке.

Славянские примеры [ править ]

  • Вытол (вытол) - гапакс-наследник известного корпуса средневековых русских берестяных рукописей . Слово встречается в надписи № 600 из Новгорода , датируется ок. 1220–1240, в контексте «[ вытол ] был пойман» (вытоло изловили). По словам Андрея Зализняка , это слово больше нигде не встречается, и его значение неизвестно. [33] Были предложены различные интерпретации, такие как личное имя или социальный статус человека. [34]

В популярной культуре [ править ]

  • С 1971 по 1972 год авангардный режиссер Холлис Фрэмптон снял серию из семи фильмов под названием « Hapax Legomen I: Nostalgia to Hapax Legomen VII: Special Effects» . [35]
  • Термин «Hapax legomenon» ненадолго стал популярным в Великобритании после финала University Challenge 2014–2015 годов после того, как стали вирусными видео, на которых Гонвилл и студент Кайуса Тед Ловдей быстро дали его как правильный ответ, когда ведущий Джереми Паксман только успел спросить: «Значение "сказал только один раз", какой двухсловный греческий термин обозначает слово ... ". [36] [37] [38] [39]
  • В 2015 году ведущий Vsauce Майкл Стивенс озадаченно процитировал это слово в качестве примера hapax legomenon, когда Google в то время возвращал только один результат поиска для этого слова. [40] С тех пор этот термин на короткое время стал интернет-мемом и теперь возвращает более 20 000 результатов поиска Google.
  • В видеоигре NetHack "HAPAX LEGOMENON" - один из возможных рандомизированных текстов еще не идентифицированного типа магического свитка. После прочтения свиток применяет свой магический эффект и затем исчезает («вещь, сказанная однажды»), но, возможно, отныне становится идентифицированной (например, свиток чар для доспехов, свиток телепортации и т.д.) для этого игрового процесса. [41]

См. Также [ править ]

  • Редкие и сложные китайские иероглифы
  • Googlewhack
  • Одноразовое слово
  • Протологизм
  • Системы нерасшифрованного письма

Ссылки [ править ]

  1. ^ "hapax legomenon" . Оксфордский словарь английского языка (Интернет-изд.). Издательство Оксфордского университета. (Требуется подписка или членство в учреждении-участнике .)
  2. ^ "hapax legomenon" . Dictionary.com Полный . Случайный дом .
  3. ^ ἅπαξ . Лидделл, Генри Джордж ; Скотт, Роберт ; Греко-английский лексикон в проекте " Персей"
  4. ^ Пол Бэйкер, Эндрю Харди и Тони McEnery, Глоссарий корпусной лингвистики , Эдинбургский University Press, 2006, стр 81, ISBN 0-7486-2018-4 . 
  5. ^ Андраш Корнаи, Математическая лингвистика , Springer, 2008, стр. 72, ISBN 1-84628-985-8 . 
  6. ^ Кирстен Malmkjær, лингвистики Энциклопедия , 2е изд, Routledge, 2002, ISBN 0-415-22210-9 , стр. 87. 
  7. ^ Кристофер Д. Маннинг и Хинрих Шютце, Основы статистической обработки естественного языка , MIT Press, 1999, стр. 22, ISBN 0-262-13360-1 . 
  8. ^ П. Н. Харрисон. Проблема пастырских посланий . Издательство Оксфордского университета, 1921 год.
  9. ^ a b c Уоркман, "The Hapax Legomen of St. Paul", Expository Times , 7 (1896: 418), отмеченная в Католической энциклопедии , sv "Послания к Тимофею и Титу" .
  10. ^ Стивен Дж. ДеРоуз. «Статистический анализ некоторых лингвистических аргументов относительно авторства пастырских посланий». Диплом с отличием, Брауновский университет, 1982 год; Терри Л. Уайлдер. «Краткая защита подлинности пастырских посланий». Среднезападный богословский журнал 2 .1 (осень 2003 г.), 38–4. ( он-лайн )
  11. ^ Марк Хардинг. Что они говорят о пастырских посланиях? , Paulist Press, 2001, стр. 12. ISBN 0-8091-3975-8 , ISBN 978-0-8091-3975-0 .  
  12. ^ a b c Статья о Hapax Legomen в еврейской энциклопедии . Включает список всех ветхозаветных hapax legomen по книгам.
  13. ^ D. Jurafsky и JH Martin (2009). Обработка речи и языка . Прентис Холл.
  14. ^ Орхан Элмаз. "Die Interpretationsgeschichte der koranischen Hapaxlegomen". Докторская диссертация, Венский университет, 2008 г., стр.29.
  15. ^ Керр, Алекс (2015-09-03). Потерянная Япония . Пингвин Великобритания. ISBN 9780141979755.
  16. ^ "flother" . Оксфордский словарь английского языка (Интернет-изд.). Издательство Оксфордского университета. (Требуется подписка или членство в учреждении-участнике .)
  17. ^ "Исторический тезаурус :: Поиск" . historythesaurus.arts.gla.ac.uk . Проверено 28 октября 2017 .
  18. ^ a b https://www.spectator.co.uk/article/the-weird-world-of-the-hapax-legomenon/amp
  19. ^ Хиббард, изд. автор: GR (1998). Гамлет (переиздан как ... ПБК. Ред.). Оксфорд: Издательство Оксфордского университета. п. 163 . ISBN 9780192834164.CS1 maint: дополнительный текст: список авторов ( ссылка )
  20. ^ Фарр, Клайд (1920). Гомеровский греческий, книга для начинающих . DC Heath & Co., Издательство. п. xxii.
  21. ^ Рис, Стив. «Hapax Legomen», в Margalit Finkelberg (ed.), Homeric Encyclopedia (Oxford: Blackwell, 2011) 330-331. Гапакс Легомены в Гомере
  22. ^ ( Ил . 24.540)
  23. ^ например, Ричард Бокхэм Еврейский мир вокруг Нового Завета: сборник эссе I стр. 431 2008 г .: «Новозаветный гапакс, который встречается в Hermas 19 раз».
  24. ^ Джон Ф. Вальвоорд и Рой Б. Zuck, Комментарий Библии знаний: Новый Завет издание , Дэвид С. Кук, 1983, стр 860, ISBN 0-88207-812-7 . 
  25. ^ Г. Клаффенбах, Lex de astynomis Pergamenorum (1954).
  26. ^ Природа и функция воды, ванн, купания и гигиены из ... - Страница 252 Синтия Косо, Энн Скотт - 2009 "Гюнтер Клаффенбах," Die Astynomeninschrift von Pergamon ", Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin. Klasse für. Sprachen, Literatur und Kunst 6 (1953), 3–25 взял на себя ответственность за предоставление полных, но строго филологических комментариев ».
  27. ^ Цукерман, Ghil'ad (2020). Возрождение: от происхождения израильского до восстановления языка в Австралии и за ее пределами . Нью-Йорк: Издательство Оксфордского университета. ISBN 9780199812790.
  28. ^ «Ковчег, конструкция и размер» в помощь пониманию Библии, Общество Сторожевой Башни, Библии и трактатов, 1971.
  29. ^ "Триады Ирландии" . www.smo.uhi.ac.uk . Проверено 28 января 2019 .
  30. ^ "attuiare в" Энциклопедии Дантеска " " . www.treccani.it (на итальянском) . Проверено 28 января 2019 .
  31. Lewis, CT & Short, C. (1879) Латинский словарь, Оксфордский университет, Clarendon Press, стр. 1599.
  32. ^ http://www.thelatinlibrary.com/tertullian/tertullian.pallio.shtml
  33. ^ Андрей Зализняк, Новгородская Русь по берестяным грамотам: взгляд из 2012 г. (Новгородская Русь по берестяным рукописям: вид 2012 г.), стенограмма лекции.
  34. ^ А. Л. Шилов (А.Л. Шилов), ЭТНОНИМЫ И НЕСЛАВЯНСКИЕ АНТРОПОНИМЫ БЕРЕСТЯНЫХ ГРАМОТ (Этнонимы и неславянские антропонимы в берестяных рукописях)
  35. ^ Холлис Фрэмптон в IMDB
  36. ^ https://www.telegraph.co.uk/news/bbc/11537719/University-Challenge-winner-Ted-Loveday-I-learned-my-answers-on-Wikipedia.html
  37. ^ http://metro.co.uk/2015/04/14/this-guy-just-won-university-challenge-with-hapax-legomenon-and-an-awesome-knit-jumper-5149259/
  38. ^ https://www.mirror.co.uk/tv/tv-news/best-ever-university-challenge-contestant-5518411
  39. ^ http://sabotagetimes.com/funny/hapax-legonemum-a-second-by-second-deconstruction-of-that-loveday-vine ; https://www.youtube.com/watch?v=JeDk7QtwwBw
  40. ^ Vsauce; Стивенс, Майкл (15 сентября 2015 г.). «Тайна Ципфа» . YouTube . Проверено 3 августа 2020 года .
  41. ^ https://nethackwiki.com/wiki/Scroll_origins

Внешние ссылки [ править ]

  • Программное обеспечение Java с открытым исходным кодом для анализа текста и расчета коэффициента hapax (JHapax) ( архив )