Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Машиночитаемый словарь ( MRD ) - это словарь, который хранится в виде машинных (компьютерных) данных, а не печатается на бумаге. Это электронный словарь и лексическая база данных .

Машиночитаемый словарь - это словарь в электронной форме, который может быть загружен в базу данных и может быть запрошен с помощью прикладного программного обеспечения. Это может быть толковый словарь на одном языке или многоязычный словарь для поддержки переводов между двумя или более языками или их комбинация. Программное обеспечение для перевода между несколькими языками обычно использует двунаправленные словари. MRD может быть словарем с частной структурой, который запрашивается специальным программным обеспечением (например, онлайн через Интернет), или он может быть словарем с открытой структурой, доступным для загрузки в компьютерные базы данных и, таким образом, может использоваться с помощью различного программного обеспечения. Приложения. Обычные словари содержат леммус различными описаниями. Машиночитаемый словарь может иметь дополнительные возможности, поэтому его иногда называют интеллектуальным словарем. Примером умного словаря является словарь английского языка Gellish с открытым исходным кодом .
Термин «словарь» также используется для обозначения электронного словаря или лексики, которые используются, например, в средствах проверки орфографии . Если словари организованы в иерархию понятий (или терминов) подтипа-супертипа, то это называется таксономией . Если он также содержит другие отношения между концептами, то это называется онтологией.. Поисковые системы могут использовать словарь, таксономию или онтологию для оптимизации результатов поиска. Специализированные электронные словари - это морфологические словари или синтаксические словари.
Термин MRD часто противопоставляется словарю НЛП в том смысле, что MRD - это электронная форма словаря, который раньше печатался на бумаге. Хотя оба термина используются программами, термин «словарь НЛП», напротив, предпочтительнее, если словарь был создан с нуля с учетом НЛП. Стандарт ISO для MRD и NLP может представлять обе структуры и называется Lexical Markup Framework . [1]

История [ править ]

Первыми широко распространенными MRD были Merriam-Webster Seventh Collegiate (W7) и Merriam-Webster New Pocket Dictionary (MPD). Оба были произведены в рамках проекта, финансируемого государством, в System Development Corporation.под руководством Джона Олни. Их вручную вводили с клавиатуры, так как кассет для набора ни одной из книг не было. Первоначально каждый из них был распространен на нескольких барабанах магнитной ленты в виде изображений карточек с каждым отдельным словом каждого определения на отдельной перфокарте с многочисленными специальными кодами, указывающими детали его использования в печатном словаре. Олни изложил грандиозный план анализа определений в словаре, но его проект истек до того, как можно было провести анализ. Роберт Амслер из Техасского университета в Остине возобновил анализ и завершил таксономическое описание карманного словаря при Национальном научном фонде.финансирование, однако его проект истек до того, как таксономические данные могли быть распространены. Рой Берд и др. в IBM Yorktown Heights возобновили анализ Седьмого коллегиата Вебстера после работы Амслера. Наконец, в 1980-х, начиная с начальной поддержки Bellcore, а затем при финансовой поддержке различных федеральных агентств США, включая NSF, ARDA , DARPA , DTO и REFLEX , Джордж Армитаж Миллер и Кристиан Феллбаум из Принстонского университета завершили создание и широкое распространение словаря. и его таксономию в проекте WordNet , который сегодня является наиболее широко распространенным ресурсом по вычислительной лексикологии.

Ссылки [ править ]

  1. ^ Gil Francopoulo (отредактированный) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN  978-1-84821-430-9 )