Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

WordNet является лексической базой данных о семантических отношениях между словами в более чем 200 языках. [2] WordNet связывает слова в семантические отношения, включая синонимы , гипонимы и меронимы . Синонимы сгруппированы в синсеты с краткими определениями и примерами использования. Таким образом, WordNet можно рассматривать как комбинацию и расширение словаря и тезауруса . В то время как она доступна для человека пользователей через веб - браузер , [3] его первичное использование в автоматическомприложения для анализа текста и искусственного интеллекта . WordNet был впервые создан на английском языке [4], а английская база данных WordNet и программные инструменты были выпущены под лицензией в стиле BSD и свободно доступны для загрузки с этого веб-сайта WordNet.

История и члены команды [ править ]

WordNet был впервые создан на английском языке только в Лаборатории когнитивных наук Принстонского университета под руководством профессора психологии Джорджа Армитиджа Миллера, начиная с 1985 года, и был направлен в последние годы [ когда? ] От Кристиана Феллбаума . Первоначально проект финансировался Управлением военно-морских исследований США, а затем и другими правительственными агентствами США, включая DARPA , Национальный научный фонд , Управление подрывных технологий. (бывшее направление перспективных исследований и разработок) и REFLEX. Джордж Миллер и Кристиана Феллбаум были удостоены премии Антонио Замполли 2006 года за работу с WordNet.

Глобальная ассоциация WordNet - это некоммерческая организация, которая предоставляет платформу для обсуждения, совместного использования и подключения WordNets для всех языков мира, а ее сопрезидентами являются Кристиан Феллбаум и Пик Т. Дж. М. Фоссен. [5]

Содержимое базы данных [ править ]

Пример записи «Гамбургер» в WordNet

База данных содержит 155 327 слов, организованных в 175 979 синсетов, всего 207 016 пар слов; в сжатом виде - около 12 мегабайт . [6]

WordNet включает в себя лексические категории существительные , глаголы , прилагательные и наречия, но игнорирует предлоги , определители и другие функциональные слова.

Слова из одной и той же лексической категории, которые являются примерно синонимами, группируются в синсеты . Синсеты включают симплексные слова, а также словосочетания, такие как «поесть вне дома » и «автомобильный бассейн». Различные значения многозначной словоформы приписываются разным синсетам. Смысл synset дополнительно выяснен с коротким определяющим глянцем и один или нескольких примерами использования. Пример синсета прилагательного:

хороший, правильный, спелый - (наиболее подходящий или подходящий для конкретной цели; «хорошее время, чтобы сажать помидоры»; «подходящее время для действий»; «время пришло для великих социологических изменений»)

Все синсеты связаны с другими наборами посредством семантических отношений. Эти отношения, не все общие для всех лексических категорий, включают:

  • Существительные
    • гиперонимы : Y является гиперонимом X, если каждый X является (разновидностью) Y ( собака - гипернимом собаки )
    • гипонимы : Y - это гипоним X, если каждый Y является (разновидностью) X ( собака - это гипоним собаки )
    • координаты : Y - это координата X, если X и Y разделяют гипероним ( волк - это координата собаки , а собака - координата волка )
    • мероним : Y является меронимом X, если Y является частью X ( окно является меронимом здания )
    • холоним : Y - холоним X, если X является частью Y ( здание - холоним окна )
  • Глаголы
    • hypernym : глагол Y является гиперонимом глагола X, если действие X является (разновидностью) Y ( воспринимать - это гипероним слова слушать )
    • тропоним : глагол Y является тропонимом глагола X, если действие Y каким-то образомвыполняет X ( шепелявить - тропоним слова говорить )
    • логическое следствие
    • координировать термины : эти глаголы имеют общий гипероним ( шепелявить и кричать )

Эти семантические отношения сохраняются между всеми членами связанных синсетов. Отдельные члены синсета (слова) также могут быть связаны лексическими отношениями. Например, (в одном смысле) существительное «директор» связано (в одном смысле) с глаголом «прямой», от которого оно образовано, посредством «морфосемантической» связи.

Функции морфологии программного обеспечения, распространяемого с базой данных, пытаются вывести лемму или основную форму слова из ввода пользователя. Неправильные формы хранятся в списке, и поиск «съел» вернет, например, «есть».

Структура знаний [ править ]

И существительные, и глаголы организованы в иерархии, определяемые гипернимальными отношениями или отношениями IS A. Например, одно значение слова « собака» встречается в соответствии с гиперонимной иерархией; слова на том же уровне представляют членов синсета. Каждый набор синонимов имеет уникальный индекс.

  • собака, домашняя собака, Canis familis
    • собачий, псовый
      • плотоядное животное
        • плацентарный, плацентарное млекопитающее, эвтерианское млекопитающее, человеческое млекопитающее
          • млекопитающее
            • позвоночное, черепное
              • хордовый
                • животное, живое существо, зверь, животное, существо, фауна
                  • ...

На верхнем уровне эти иерархии организованы в 25 "деревьев" для начинающих для существительных и 15 для глаголов (называемых лексикографическими файлами на уровне обслуживания). Все они связаны с уникальным синсетом для начинающих, "entity". Иерархия существительных намного глубже иерархии глаголов

Прилагательные не организованы в иерархические деревья. Вместо этого два «центральных» антонима, таких как «горячий» и «холодный», образуют бинарные полюса, в то время как «спутниковые» синонимы, такие как «дымящийся» и «холодный», соединяются со своими соответствующими полюсами через отношения «подобия». Таким образом прилагательные можно представить как «гантели», а не как «деревья».

Психолингвистические аспекты [ править ]

Первоначальной целью проекта WordNet было создание лексической базы данных, которая соответствовала бы теориям семантической памяти человека, разработанным в конце 1960-х годов. Психологические эксперименты показали, что говорящие организовали свои знания концепций экономическим, иерархическим образом. Время поиска, необходимое для доступа к концептуальным знаниям, казалось, напрямую связано с количеством иерархий, которые говорящему необходимо «пройти», чтобы получить доступ к знаниям. Таким образом, выступающие могли быстрее проверить, что канарейки могут петь, потому что канарейка - певчая птица, но потребовалось немного больше времени, чтобы убедиться, что канарейки могут летать (где они должны были получить доступ к понятию «птица» на более высоком уровне), и еще больше времени убедиться, что у канарейки есть кожа(требуется поиск на нескольких уровнях гипонимии, вплоть до «животного»). [7] Хотя такие психолингвистические эксперименты и лежащие в их основе теории подвергались критике, часть организации WordNet согласуется с экспериментальными данными. Например, аномная афазия выборочно влияет на способность говорящих произносить слова из определенной семантической категории, иерархии WordNet. Антонимные прилагательные (центральные прилагательные WordNet в структуре гантелей) встречаются гораздо чаще, чем случайность, факт, который, как было установлено, справедлив для многих языков.

Как лексическая онтология [ править ]

WordNet иногда называют онтологией - настойчивое заявление, которого не делают его создатели. Отношения гипероним / гипоним среди синсетов существительных можно интерпретировать как отношения специализации между концептуальными категориями. Другими словами, WordNet можно интерпретировать и использовать как лексическую онтологию в смысле компьютерных наук . Однако такую ​​онтологию следует исправить перед использованием, поскольку она содержит сотни основных семантических несоответствий; например, есть: (i) общие специализации для исключительных категорий и (ii) избыточность в иерархии специализаций. Кроме того, преобразование WordNet в лексическую онтологию, используемую для представления знаний, обычно также должно включать (i) выделение отношений специализации на подтипи отношения instanceOf , и (ii) связывание интуитивных уникальных идентификаторов с каждой категорией. Хотя такие исправления и преобразования были выполнены и задокументированы как часть интеграции WordNet 1.7 в совместно обновляемую базу знаний WebKB-2 [8], в большинстве проектов утверждается, что WordNet повторно используется для приложений, основанных на знаниях (обычно, знаний- ориентированный на поиск информации) просто повторно используйте его напрямую.

WordNet также был преобразован в формальную спецификацию с помощью гибридной восходящей и нисходящей методологии для автоматического извлечения ассоциативных отношений из WordNet и интерпретации этих ассоциаций в терминах набора концептуальных отношений, формально определенных в базовой онтологии DOLCE. . [9]

В большинстве работ, в которых утверждается, что WordNet интегрирован в онтологии, содержание WordNet не просто исправлялось, когда это казалось необходимым; вместо этого WordNet был сильно переинтерпретирован и обновлен по мере необходимости. Так было, например, когда онтология верхнего уровня WordNet была реструктурирована [10] в соответствии с подходом, основанным на OntoClean, или когда WordNet использовался в качестве первичного источника для построения низших классов онтологии SENSUS.

Ограничения [ править ]

Наиболее широко обсуждаемое ограничение WordNet (и связанных ресурсов, таких как ImageNet ) заключается в том, что некоторые семантические отношения больше подходят для конкретных концепций, чем для абстрактных концепций. [11] Например, легко создать отношения гипонимов / гиперонимов, чтобы уловить, что « хвойное дерево » - это тип « дерева », «дерево» - это тип « растения », а «растение» - это тип « организма », но трудно разделить эмоции, такие как «страх» или «счастье», на столь же глубокие и четко определенные гипонимные / гипернимальные отношения.

Многие концепции WordNet специфичны для определенных языков, и наиболее точное соответствие между языками составляет 94%. [12] Синонимы, гипонимы, меронимы и антонимы встречаются на всех языках, где есть WordNet, но другие семантические отношения зависят от языка. [13] Это ограничивает взаимодействие между языками. Однако это также делает WordNet ресурсом для выделения и изучения различий между языками, поэтому это не обязательно ограничение для всех случаев использования.

WordNet не включает информацию об этимологии или произношении слов и содержит лишь ограниченную информацию об использовании. WordNet нацелен на охват большинства повседневных слов и не включает в себя много предметной терминологии.

WordNet - это наиболее часто используемая вычислительная лексика английского языка для устранения неоднозначности смысла слов (WSD), задача, направленная на присвоение контекстно-зависимых значений (то есть членов синсета) словам в тексте. [14] Однако утверждалось, что WordNet кодирует слишком тонкие различия смыслов. Эта проблема не позволяет системам WSD достичь уровня производительности, сопоставимого с производительностью людей, которые не всегда соглашаются, когда сталкиваются с задачей выбора смысла из словаря, который соответствует слову в контексте. Проблема детализации была решена путем предложения методов кластеризации, которые автоматически группируют сходные значения одного и того же слова. [15] [16] [17]

Оскорбительное содержание [ править ]

WordNet включает слова, которые могут быть восприняты как уничижительные или оскорбительные. [18] Интерпретация слова может меняться со временем и между социальными группами , поэтому WordNet не всегда может определить слово как « уничижительное » или «оскорбительное» изолированно. Следовательно, люди, использующие WordNet, должны применять свои собственные методы для определения оскорбительных или уничижительных слов.

Однако это ограничение распространяется и на другие лексические ресурсы, такие как словари и тезаурусы , которые также содержат уничижительные и оскорбительные слова. Некоторые словари указывают слова, которые являются уничижительными , но не включают все контексты, в которых слова могут быть приемлемыми или оскорбительными для различных социальных групп. Поэтому люди, использующие словари, должны применять свои собственные методы для выявления всех оскорбительных слов.

Лицензированные и открытые сети WordNets [ править ]

Некоторые сети слов были впоследствии созданы для других языков. В опросе 2012 года перечислены сети слов и их доступность. [19] Стремясь распространить использование WordNets, глобальное сообщество WordNet медленно перелицензировало свои WordNet на открытый домен, где исследователи и разработчики могут легко получить доступ и использовать WordNet в качестве языковых ресурсов для предоставления онтологических и лексических знаний в Natural Задачи обработки языка .

Open Multilingual WordNet [20] предоставляет доступ к открытым лицензионным сетям слов на различных языках, все они связаны с Princeton Wordnet of English (PWN). Цель состоит в том, чтобы упростить использование сетей слов на нескольких языках.

Приложения [ править ]

WordNet использовался для ряда целей в информационных системах, включая устранение неоднозначности слов , поиск информации , автоматическую классификацию текста , автоматическое обобщение текста , машинный перевод и даже автоматическое создание кроссвордов.

WordNet обычно используется для определения сходства слов. Были предложены различные алгоритмы, в том числе измерение расстояния между словами и наборами синхросигналов в структуре графа WordNet, например, путем подсчета числа ребер среди наборов синхросигналов. Интуиция подсказывает, что чем ближе два слова или синсета, тем ближе их значение. Ряд основанных на WordNet алгоритмов подобия слов реализован в пакете Perl под названием WordNet :: Similarity [21] и в пакете Python под названием NLTK . [22] Другие более сложные методы подобия на основе WordNet включают ADW [23] , реализация которого доступна на Java.. WordNet также можно использовать для связывания других словарей. [24]

Интерфейсы [ править ]

Princeton ведет список связанных проектов [25], который включает ссылки на некоторые из широко используемых интерфейсов прикладного программирования, доступных для доступа к WordNet с использованием различных языков программирования и сред.

Связанные проекты и расширения [ править ]

WordNet подключен к нескольким базам данных семантической сети . WordNet также часто повторно используется через сопоставления между наборами синтаксиса WordNet и категориями из онтологий. Чаще всего отображаются только категории верхнего уровня WordNet.

Глобальная ассоциация WordNet [ править ]

Глобальная ассоциация WordNet (GWA) [26] - это общественная некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и соединения сетей Word для всех языков мира. GWA также способствует стандартизации сетей слов в разных языках, чтобы обеспечить единообразие при перечислении синсетов в человеческих языках. GWA ведет список сетей слов, разработанных по всему миру. [27]

Другие языки [ править ]

  • Арабский WordNet : [28] [29] WordNet для арабского языка.
  • Арабская онтология , лингвистическая онтология, которая имеет ту же структуру, что и wordnet, и сопоставлена ​​с ней.
  • В рамках проекта BalkaNet [30] были созданы сети WordNets для шести европейских языков (болгарский, чешский, греческий, румынский, турецкий и сербский). Для этого проекта был разработан свободно доступный редактор WordNet на основе XML. Этот редактор - VisDic - больше не находится в активной разработке, но все еще используется для создания различных WordNets. Его преемник, DEBVisDic, является клиент-серверным приложением и в настоящее время используется для редактирования нескольких WordNets (голландский в проекте Cornetto, польский, венгерский, несколько африканских языков, китайский).
  • BulNet - это болгарская версия WordNet, разработанная отделом компьютерной лингвистики Института болгарского языка Болгарской академии наук. [31]
  • CWN (китайский Wordnet или 中文 詞彙 網路) при поддержке Национального Тайваньского университета . [32]
  • В рамках проекта EuroWordNet [33] были созданы сети WordNets для нескольких европейских языков и объединены их вместе; однако они не доступны в свободном доступе. Проект Global Wordnet пытается координировать создание и связывание «сетей слов» для всех языков. [34] Oxford University Press , издатель Oxford English Dictionary , озвучил планы по созданию собственного онлайн-конкурента WordNet. [ необходима цитата ]
  • FinnWordNet - это финская версия WordNet, куда были переведены все статьи оригинального английского WordNet. [35]
  • GermaNet - это немецкая версия WordNet, разработанная Тюбингенским университетом. [36]
  • IndoWordNet [37] является связанным лексической базой знаний wordnets из 18 запланированных языков Индии именно., Ассамский , бенгальский , Бодо , гуджарати , хинди , каннада , Кашмира , Конкани , малаялам , Мейтей (Манипури), маратхи , непальский , Одиа , Пенджаби , санскрит , тамильский , телугу и урду .
  • JAWS (Just Another WordNet Subset), еще одна французская версия WordNet [38], построенная с использованием викисловаря и семантических пространств.
  • WordNet Bahasa : WordNet для малайского и индонезийского языков, разработанный Технологическим университетом Наньян .
  • Малаялам WordNet , разработанный Кочинским университетом науки и технологий . [39]
  • Многоязычный центральный репозиторий (MCR) интегрируется в одну и ту же структуру EuroWordNet - словесные сети с испанского, каталонского, баскского, галисийского и португальского языков на английском языке. [40]
  • Проект MultiWordNet [41], многоязычный WordNet, направлен на создание итальянской WordNet, тесно связанной с Princeton WordNet.
  • OpenDutchWordNet, [42] - голландская лексико-семантическая база данных.
  • OpenWN-PT - это бразильская португальская версия оригинальной WordNet, свободно доступная для загрузки по лицензии CC-BY-SA. [43]
  • plWordNet [44] - польскоязычная версия WordNet, разработанная Вроцлавским технологическим университетом .
  • PolNet [45] - это польскоязычная версия WordNet, разработанная Университетом Адама Мицкевича в Познани (распространяется под лицензией CC BY-NC-ND 3.0).

Такие проекты, как BalkaNet и EuroWordNet, сделали возможным создание автономных сетей слов, связанных с исходной. Одним из таких проектов был русский WordNet покровительствовал Петербургского государственного университета путей сообщения [46] под руководством С. А. Яблонского [47] или RussNet [48] по Санкт - Петербургского государственного университета

  • UWN - это автоматически созданная многоязычная лексическая база знаний, расширяющая WordNet и охватывающая более миллиона слов на многих разных языках. [49]
  • WOLF (WordNet Libre du Français), французская версия WordNet. [50]

Связанные данные [ править ]

  • BabelNet , [51] - очень большая многоязычная семантическая сеть с миллионами концепций, полученных путем интеграции WordNet и Википедии с использованием алгоритма автоматического сопоставления.
  • SUMO онтология [52] произвел отображение между всеми Wordnet synsets ( в том числе существительные, глаголы, прилагательные и наречия), а также классов SUMO . Последнее добавление сопоставлений предоставляет ссылки на все более конкретные термины в онтологии уровня MI (MILO), которая расширяет SUMO.
  • OpenCyc , [53] открытая онтология и база знаний в повседневной общеизвестных смысле, 12000 терминов , связанных с WordNet синонимов множеств.
  • DOLCE , [54] - первый модуль библиотеки фундаментальных онтологий WonderWeb (WFOL). Эта верхняя онтология была разработана в свете строгих онтологических принципов, вдохновленных философской традицией, с четкой ориентацией на язык и познание. OntoWordNet [55] - результат экспериментального согласования верхнего уровня WordNet с DOLCE. Предполагается, что такое согласование могло бы привести к «онтологически подслащенному» WordNet, который должен быть концептуально более строгим, когнитивно прозрачным и эффективно используемым в нескольких приложениях.
  • DBpedia , [56] база данных структурированной информации, связана с WordNet.
  • Расширяемый WordNet [57] проект в Университете Техаса в Далласе , который направлен на улучшение WordNet пути семантический разбор глоссы, что делает информацию , содержащейся в этих определениях , доступных для автоматических систем обработки знаний. Он находится в свободном доступе под лицензией, аналогичной WordNet.
  • В рамках проекта GCIDE был создан словарь путем объединения общедоступного словаря Вебстера 1913 года с некоторыми определениями WordNet и материалами, предоставленными добровольцами. Он был выпущен под лицензией GPL с авторским левом .
  • ImageNet - это база данных изображений, организованная в соответствии с иерархией WordNet (в настоящее время только существительные), в которой каждый узел иерархии изображен сотнями и тысячами изображений. [58] В настоящее время в среднем на каждый узел приходится более 500 изображений.
  • BioWordnet, биомедицинское расширение Wordnet, было прекращено из-за проблем со стабильностью версий. [59]
  • WikiTax2WordNet, соответствие между наборами синтаксиса WordNet и категориями Википедии . [60]
  • WordNet ++, ресурс, включающий более миллионов семантических границ, собранных из Википедии, и соединяющих пары наборов синсетов WordNet. [61]
  • SentiWordNet, ресурс для поддержки приложений анализа мнений, полученных путем пометки всех наборов синсетов WordNet 3.0 в соответствии с их предполагаемой степенью положительности, отрицательности и нейтральности. [62]
  • ColorDict - это Android-приложение для мобильных телефонов, использующих базу данных Wordnet и другие, такие как Wikipedia.
  • UBY-LMF база данных из 10 ресурсов, включая WordNet.

Связанные проекты [ править ]

  • FrameNet - это лексическая база данных, которая имеет некоторое сходство с WordNet и относится к ней.
  • Структура лексической разметки (LMF) - это стандарт ISO, указанный в ISO / TC37 для определения общей стандартизированной структуры для построения лексиконов, включая WordNet. Подмножество LMF для Wordnet называется Wordnet-LMF. В рамках проекта KYOTO был создан экземпляр. [63]
  • Программа UNL - это проект под эгидой ООН, направленный на консолидацию лексико-семантических данных многих языков для использования в системах машинного перевода и извлечения информации.

Распределения [ править ]

База данных WordNet распространяется в виде пакета словарей (обычно в виде одного файла) для следующего программного обеспечения:

  • Вавилон [64]
  • GoldenDict [65]
  • Lingoes [66]

См. Также [ править ]

  • Структура лексической разметки
  • Машиночитаемый словарь
  • Синоним Кольцо
  • Таксономия
  • МысльСокровище

Ссылки [ править ]

  1. ^ "Новости WordNet" .
  2. ^ "WordNets в мире" . Глобальная ассоциация WordNet . Проверено 19 января 2020 года .
  3. ^ "Поиск WordNet - 3.1" .
  4. ^ Г. А. Миллер, Р. Беквит, С. Д. Феллбаум, Д. Гросс, К. Миллер. 1990. WordNet: онлайн-лексическая база данных. Int. J. Lexicograph. 3, 4, с. 235–244.
  5. ^ «О всемирной ассоциации WordNet» . Глобальный WordNet . Проверено 19 января 2020 года .
  6. ^ «Статистика WordNet» . Wordnet.princeton.edu . Проверено 22 июня 2018 .
  7. ^ Коллинз А., Куиллиан М.Р. 1972. Эксперименты по семантической памяти и пониманию языка. В познании в обучении и памяти . Вили, Нью-Йорк.
  8. ^ http://www.phmartin.info . «Интеграция WordNet 1.7 в WebKB-2» . Webkb.org . Проверено 11 марта 2014 .
  9. ^ Gangemi, A .; Navigli, R .; Веларди, П. (2003). Проект OntoWordNet: расширение и аксиоматизация концептуальных отношений в WordNet (PDF) . Proc. Международной конференции по онтологиям, базам данных и приложениям семантики (ODBASE 2003) . Катания, Сицилия (Италия). С. 820–838.
  10. ^ Oltramari, A .; Гангеми, А .; Guarino, N .; Масоло, К. (2002). Реструктуризация WordNet верхнего уровня: подход OntoClean . OntoLex'2 Workshop, онтологии и лексические базы знаний (LREC 2002). Лас-Пальмас, Испания. С. 17–26. CiteSeerX 10.1.1.19.6574 . 
  11. ^ Rudnicka, Эва; Бонд, Фрэнсис; Грабовский, Лукаш; Пясецки, Мацей; Пиотровский, Тадеуш (2018). «Лексический взгляд на Wordnet для отображения Wordnet». Материалы 9-й глобальной конференции WordNet (GWC 2018) : 210.
  12. ^ Бонд, Фрэнсис; Фостер, Райан (2013). «Связывание и расширение открытой многоязычной сети Wordnet» (PDF) . Труды 51-го ежегодного собрания Ассоциации компьютерной лингвистики : 1352–1362 . Проверено 20 января 2020 года .
  13. ^ Феллбаум, Кристиана; Фоссен, Пик (2012). «Проблемы для многоязычной сети Word». Языковые ресурсы и оценка . 46 (2): 313–326. DOI : 10.1007 / s10579-012-9186-Z . S2CID 10117946 . 
  14. ^ Р. Навильи. Устранение неоднозначности слов: обзор , ACM Computing Surveys , 41 (2), 2009, стр. 1–69.
  15. ^ Э. Агирре, О. Лопес. 2003. Кластеризация WordNet Word Senses. В Proc. конференции о последних достижениях естественного языка (RANLP'03) , Боровец, Болгария, стр. 121–130.
  16. ^ Р. Навильи. Значимая кластеризация смыслов помогает повысить эффективность устранения неоднозначности смысла слов , In Proc. 44-го ежегодного собрания Ассоциации компьютерной лингвистики совместно с 21-й Международной конференцией по компьютерной лингвистике (COLING-ACL 2006) , Сидней, Австралия, 17–21 июля 2006 г., стр. 105–112.
  17. ^ Р. Сноу, С. Пракаш, Д. Джурафски, AY Ng. 2007. Учимся объединять смыслы слов , In Proc. Совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и компьютерному изучению естественного языка (EMNLP-CoNLL) , Прага, Чешская Республика, стр. 1005–1014.
  18. ^ Джулия Кэрри Вонг. 2019. Вирусное приложение для селфи ImageNet Roulette казалось забавным, пока оно не назвало меня расистским оскорблением . Хранитель
  19. ^ Фрэнсис Бонд и Кёнхи Пайк 2012a. Обзор Wordnet и их лицензий . В материалах 6-й Глобальной конференции WordNet (GWC 2012). Мацуэ. 64–71
  20. ^ "Открыть многоязычную Wordnet" . compling.hss.ntu.edu.sg . Проверено 10 апреля 2018 года .
  21. ^ "Тед Педерсен - WordNet :: Сходство" . D.umn.edu. 2008-06-16 . Проверено 11 марта 2014 .
  22. ^ НЛП с использованием Python NLTK /
  23. ^ MT Пилехвар, Д. Юргенс и Р. Навильи. Выровнять, устранить неоднозначность и пройти: единый подход к измерению семантического сходства. . Proc. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  24. ^ Ballatore A, et al. (2014). «Связывание географических словарей через WordNet». Летопись ГИС . 20 (2): 73–84. arXiv : 1404,5372 . Bibcode : 2014arXiv1404.5372B . DOI : 10.1080 / 19475683.2014.904440 . S2CID 9246582 . 
  25. ^ «Связанные проекты - WordNet - Связанные проекты» . Wordnet.princeton.edu. 2014-01-06 . Проверено 22 июня 2018 .
  26. ^ Всемирная ассоциация WordNet (04.02.2010). "globalwordnet.org" . globalwordnet.org . Проверено 11 марта 2014 .
  27. ^ «Wordnet в мире» . Архивировано из оригинала на 2011-10-21.
  28. ^ Black W., Elkateb С., Родригес Х., Alkhalifa М., Фоссен П., Пиз А., Бертран М., Fellbaum С., (2006) WordNet проекта Arabic, Труды LREC 2006
  29. ^ Lahsen Abouenour, Карим Bouzoubaa, Паоло Rosso (2013) по оценке и улучшению охвата Arabic WordNet и практичности, лингвистические ресурсы и оценка 47 (3)стр 891-917
  30. ^ Д. Tufis, Д. Кристя, С. Stamou. 2004. Балканет: Цели, методы, результаты и перспективы. Общий обзор . Румынский J. Sci. Tech. Сообщить. (Специальный выпуск о Балканете) , 7 (1-2), стр. 9–43.
  31. ^ "BulNet" . dcl.bas.bg . Проверено 7 мая 2015 .
  32. ^ Официальная страница китайского Wordnet (中文 詞彙 網路) в Национальном университете Тайваня
  33. P. Vossen, Ed. 1998. EuroWordNet: многоязычная база данных с лексико-семантическими сетями. Клувер, Дордрехт, Нидерланды.
  34. ^ «Глобальная ассоциация WordNet» . Globalwordnet.org. 2010-02-04 . Проверено 5 января 2014 .
  35. ^ "FinnWordNet - Финский WordNet - Департамент общего языкознания" . Ling.helsinki.fi . Проверено 5 января 2014 .
  36. ^ "GermaNet" . Sfs.uni-tuebingen.de . Проверено 11 марта 2014 .
  37. ^ Pushpak Бхаттачариа, IndoWordNet, лексические ресурсы Engineering Conference 2010 (LREC 2010), Мальта, май 2010.
  38. ^ C. Mouton, G. de Chalendar. 2010. JAWS: еще одно подмножество WordNet . В Proc. ТАЛН 2010 .
  39. ^ Веб-сайт
  40. ^ http://adimen.si.ehu.es/web/mcr/
  41. ^ Е. Pianta, Л. Bentivogli, С. Жирарди. 2002. MultiWordNet: Разработка согласованной многоязычной базы данных . В Proc. 1-й Международной конференции по глобальной сети WordNet , Майсур, Индия, стр. 21–25.
  42. ^ http://wordpress.let.vupr.nl/odwn/
  43. ^ "arademaker / openWordnet-PT - GitHub" . Github.com . Проверено 5 января 2014 .
  44. ^ http://plwordnet.pwr.wroc.pl/wordnet/ официальная веб-страница
  45. ^ http://www.ltc.amu.edu.pl/polnet/ официальная веб-страница
  46. ^ "Русский WordNet" . Pgups.ru . Проверено 5 января 2014 .
  47. ^ Балкова, Валентина; Сухоногов Андрей; Яблонский, Сергей (2003). "Русский WordNet от UML-нотации до реализации базы данных в сети / интранете" (PDF) . GWC 2004 Proceedings : 31–38 . Проверено 12 марта 2017 года .
  48. ^ "RussNet: Главная страница" . Project.phil.spbu.ru . Проверено 11 марта 2014 .
  49. ^ "UWN: К универсальной многоязычной сети Word - D5: Базы данных и информационные системы (Max-Planck-Institut für Informatik)" . Mpi-inf.mpg.de. 2011-08-14 . Проверено 5 января 2014 .
  50. ^ С. Бенуа, Ф. Дарья. 2008. Создание бесплатной французской сети wordnet из многоязычных ресурсов . В Proc. Ontolex 2008 , Марракеш, Марок.
  51. ^ Р. Навильи, С.П. Понцетто. BabelNet: создание очень большой многоязычной семантической сети . Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Упсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  52. ^ А. Пиз, И. Найлз, Дж. Ли. 2002. Предлагаемая верхняя объединенная онтология: большая онтология для семантической сети и ее приложений . В Proc. семинара AAAI-2002 по онтологиям и семантической паутине , Эдмонтон, Канада.
  53. ^ С. Рид и Д. Ленат. 2002. Отображение онтологий в цикл . В Proc. семинара конференции AAAI 2002 по онтологиям для семантической паутины , Эдмонтон, Канада, 2002
  54. ^ Masolo, К., Борго, С., Gangemi, А., Guarino, Н., Oltramari, А., Шнайдер, Л.С. 2002. WonderWeb поставочный Д17. Библиотека основополагающих онтологий WonderWeb и онтология DOLCE . Отчет (вер. 2.0, 15.08.2002)
  55. ^ Gangemi А., Гуарин, Н., Masolo С., Oltramari, A. 2003 подслащивающих WordNet с DOLCE . В AI Magazine 24 (3): Fall 2003, стр. 13–24.
  56. ^ К. Бизер, Дж. Леманн, Г. Кобиларов, С. Ауэр, К. Беккер, Р. Циганиак, С. Хеллманн, DBpedia - точка кристаллизации для сети данных . Веб-семантика, 7 (3), 2009, стр. 154–165.
  57. ^ С. Harabagiu, Г. А. Миллер, Д. Молдавский. 1999. WordNet 2 - Морфологически и семантически расширенный ресурс . В Proc. семинара ACL SIGLEX: Стандартизация лексических ресурсов , стр. 1–8.
  58. Перейти ↑ J. Deng, W. Dong, R. Socher, L. Li, K. Li, L. Fei-Fei. ImageNet: крупномасштабная база данных иерархических изображений . В Proc. конференции IEEE 2009 г. по компьютерному зрению и распознаванию образов
  59. ^ М. Poprat, Е. Beisswanger, У. Хан. 2008. Построение BIOWORDNET с использованием форматов данных WORDNET и программной инфраструктуры WORDNET - история неудач . В Proc. семинара «Разработка программного обеспечения, тестирование и обеспечение качества для обработки естественного языка» , стр. 31–39.
  60. ^ С. Понцетто, Р. Навильи. Крупномасштабное картографирование таксономии для реструктуризации и интеграции Википедии , In Proc. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009) , Пасадена, Калифорния, 14-17 июля 2009 г., стр. 2083–2088.
  61. ^ С.П. Понцетто, Р. Навильи. Богатый знаниями Word Sense Disambiguation, конкурирующий с контролируемыми системами . В Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), 2010 г., стр. 1522–1531.
  62. ^ С. Баччанелла, А. Эсули и Ф. Себастьяни. SentiWordNet 3.0: расширенный лексический ресурс для анализа настроений и сбора мнений . В материалах 7-й конференции по языковым ресурсам и оценке (LREC'10), Валлетта, MT, 2010, стр. 2200–2204.
  63. ^ Пик Фоссен, Клаудиа Сориа, Моника Монакини: Wordnet-LMF: стандартное представление многоязычных сетей слов в LMF Lexical Markup Framework , отредактированный Гилом Франкопуло ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 ) 
  64. ^ "Вавилон WordNet" . Babylon.com . Проверено 11 марта 2014 .
  65. ^ "GoldenDict - Обзор / словари на Sourceforge.net" . Sourceforge.net. 2010-12-01 . Проверено 5 января 2014 .
  66. ^ "Lingoes WordNet" . Lingoes.net. 2007-11-16 . Проверено 11 марта 2014 .

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • "Малаялам WordNet" . Компьютерные науки . Кочинский университет науки и технологий.
  • Пилат, Мария. "Тезаурус прилагательных, интенсификаторов, отрицаний (AIN)" . Итальянские настроения .