В цифровом лексикографии , обработки естественного языка и цифровых гуманитарных , лексический ресурс является язык ресурс , состоящий из данных , касающихся в лексем на лексикона одного или нескольких языков например, в виде базы данных . [1]
Характеристики
Различные стандарты для машиночитаемой издания лексических ресурсов существуют, например, лексические Markup Framework (ЛМЗ) стандарт ISO для кодирования лексических ресурсов, включающий в себя абстрактную модель данных и XML - сериализации, [2] и OntoLex-Лимон , RDF словарь для публикации лексических ресурсов в виде графов знаний в сети, например, в виде открытых лингвистических данных . [3]
В зависимости от типа рассматриваемых языков лексический ресурс может быть классифицирован как одноязычный , двуязычный или многоязычный . Для двуязычных и многоязычных лексических ресурсов слова могут быть связаны или не связаны с одним языком с другим. При подключении эквивалентность одного языка другому осуществляется через двуязычную ссылку (для двуязычных лексических ресурсов, например, с использованием отношения vartrans: translatableAs в OntoLex-Lemon ) или через многоязычные обозначения (для многоязычных лексических ресурсов, например, посредством ссылки на тот же онтлекс: Концепция в ОнтоЛекс-Лимон). [4]
Также возможно создание и управление лексическим ресурсом, состоящим из разных лексиконов одного и того же языка, например, один словарь для общих слов и один или несколько словарей для разных специализированных областей.
Машиночитаемый словарь против словаря НЛП
Лексические ресурсы в цифровой лексикографии часто называют машиночитаемым словарем ( MRD ), словарем, который хранится как машинные (компьютерные) данные, а не печатается на бумаге. Это электронный словарь и лексическая база данных. Термин MRD часто противопоставляется словарю НЛП в том смысле, что MRD - это электронная форма словаря, который раньше печатался на бумаге. Хотя оба термина используются программами, термин «словарь НЛП», напротив, предпочтительнее, если словарь был создан с нуля с учетом НЛП. [5]
Лексическая база данных
Лексическая база данных является лексическим ресурсом , который имеет ассоциированные среды программных обеспечения базу данных , которая обеспечивает доступ к его содержимому. База данных может быть специально разработана для лексической информации или универсальной базы данных, в которую была введена лексическая информация.
Информация, обычно хранящаяся в лексической базе данных, включает орфографию , лексическую категорию и синонимы слов, а также семантические и фонологические отношения между различными словами или наборами слов.
Ссылки
Смотрите также
- Lexical Markup Framework (LMF) , стандарт ISO для кодирования лексических ресурсов, включающий абстрактную модель данных и сериализацию XML.
- OntoLex-Lemon , словарь RDF для публикации лексических ресурсов в Интернете, например, как Linguistic Linked Open Data
- Лексическая база данных
- Серия конференций LREC
- Машиночитаемый словарь
- WordNet
Примеры ресурсов
Внешние ссылки
Рекомендации
- ^ САРМА, Шихар Кр и др. Создание многоязычных лексических ресурсов с использованием сетей слов: структура, дизайн и реализация . В: Материалы 3-го семинара по когнитивным аспектам лексики . 2012. С. 161-170.
- ^ Francopoulo, Gil; Бел, Нурия; Джордж, Монте; Кальцолари, Николетта; Моначини, Моника; Домашнее животное, Мэнди; Сория, Клаудия (2009-03-01). «Многоязычные ресурсы для НЛП в структуре лексической разметки (LMF)» (PDF) . Языковые ресурсы и оценка . 43 (1): 57–70. DOI : 10.1007 / s10579-008-9077-5 . ISSN 1574-0218 . S2CID 7697316 .
- ^ Чимиано, Филипп; Чиаркос, Кристиан; McCrae, John P .; Грасиа, Хорхе (2020), Связанные лингвистические данные: представление, создание и приложения , Springer International Publishing, стр. 45–59, DOI : 10.1007 / 978-3-030-30225-2_4 , ISBN 978-3-030-30225-2
- ^ Чимиано, Филипп; McCrae, John P .; Буйтелаар, Пол. «Модель лексики для онтологий: отчет сообщества, 10 мая 2016 г., Заключительный отчет группы сообщества 10 мая 2016 г.» . W3C . Проверено 6 декабря 2019 .
- ^ Gil Francopoulo (отредактированный) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 )