Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Wordnet )
Перейти к навигации Перейти к поиску

WordNet является лексической базой данных о семантических отношениях между словами в более чем 200 языках. [2] WordNet связывает слова в семантические отношения, включая синонимы , гипонимы и меронимы . Синонимы сгруппированы в синсеты с краткими определениями и примерами использования. Таким образом, WordNet можно рассматривать как комбинацию и расширение словаря и тезауруса . Хотя он доступен для пользователей через веб-браузер , [3] его основное использование - автоматическоеприложения для анализа текста и искусственного интеллекта . WordNet был впервые создан на английском языке [4], а английская база данных WordNet и программные инструменты были выпущены под лицензией в стиле BSD и свободно доступны для загрузки с этого веб-сайта WordNet.

История и члены команды [ править ]

WordNet был впервые создан на английском языке только в Лаборатории когнитивных наук Принстонского университета под руководством профессора психологии Джорджа Армитиджа Миллера, начиная с 1985 года, и был направлен в последние годы [ когда? ] От Кристиана Феллбаума . Первоначально проект финансировался Управлением военно-морских исследований США, а затем и другими правительственными агентствами США, включая DARPA , Национальный научный фонд , Управление подрывных технологий. (бывшее направление перспективных исследований и разработок) и REFLEX. Джордж Миллер и Кристиана Феллбаум были удостоены премии Антонио Замполли 2006 года за свою работу с WordNet.

Глобальная ассоциация WordNet - это некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и подключения WordNets для всех языков мира, а ее сопрезидентами являются Кристиан Феллбаум и Пик Т. Дж. М. Фоссен. [5]

Содержимое базы данных [ править ]

Пример записи «Гамбургер» в WordNet

База данных содержит 155 327 слов, организованных в 175 979 синсетов, всего 207 016 пар слов; в сжатом виде - около 12 мегабайт . [6]

WordNet включает в себя лексические категории существительные , глаголы , прилагательные и наречия, но игнорирует предлоги , определители и другие функциональные слова.

Слова из одной и той же лексической категории, которые являются примерно синонимами, сгруппированы в синсеты . Синсеты включают симплексные слова, а также словосочетания, такие как «поесть вне дома » и «автомобильный бассейн». Разные значения многозначной словоформы присваиваются разным синсетам. Смысл synset дополнительно выяснен с коротким определяющим глянцем и один или нескольких примерами использования. Пример синсета прилагательного:

хороший, правильный, спелый - (наиболее подходящий или подходящий для конкретной цели; «хорошее время, чтобы сажать помидоры»; «подходящее время, чтобы действовать»; «время пришло для великих социологических изменений»)

Все синсеты связаны с другими наборами посредством семантических отношений. Эти отношения, не все общие для всех лексических категорий, включают:

  • Существительные
    • гиперонимы : Y является гиперонимом X, если каждый X является (разновидностью) Y ( собака - гипернимом собаки )
    • гипонимы : Y - это гипоним X, если каждый Y является (разновидностью) X ( собака - это гипоним собаки )
    • координаты : Y - это координата X, если X и Y разделяют гипероним ( волк - это координата собаки , а собака - координата волка )
    • мероним : Y является меронимом X, если Y является частью X ( окно - это мероним здания )
    • холоним : Y - холоним X, если X является частью Y ( здание - холоним окна )
  • Глаголы
    • hypernym : глагол Y является гиперонимом глагола X, если действие X является (разновидностью) Y ( воспринимать - это гипероним слова слушать )
    • тропоним : глагол Y является тропонимом глагола X, если действие Y каким-то образомвыполняет X ( шепелявить - тропоним слова говорить )
    • логическое следствие
    • координировать термины : эти глаголы имеют общий гипероним ( шепелявить и кричать )

Эти семантические отношения сохраняются между всеми членами связанных синсетов. Отдельные члены синсета (слова) также могут быть связаны лексическими отношениями. Например, (в одном смысле) существительное «директор» связано (в одном смысле) с глаголом «прямой», от которого оно образовано, посредством «морфосемантической» связи.

Функции морфологии программного обеспечения, распространяемого с базой данных, пытаются вывести лемму или основную форму слова из ввода пользователя. Неправильные формы хранятся в списке, и поиск «съел» вернет, например, «есть».

Структура знаний [ править ]

И существительные, и глаголы организованы в иерархии, определяемые гипернимальными отношениями или отношениями IS A. Например, одно значение слова « собака» встречается в соответствии с гиперонимной иерархией; слова на том же уровне представляют членов синсета. Каждый набор синонимов имеет уникальный индекс.

  • собака, домашняя собака, Canis familis
    • собачий, псовый
      • плотоядное животное
        • плацентарный, плацентарное млекопитающее, эвтерианское млекопитающее, человеческое млекопитающее
          • млекопитающее
            • позвоночное, черепное
              • хордовый
                • животное, одушевленное существо, зверь, животное, существо, фауна
                  • ...

На верхнем уровне эти иерархии организованы в 25 "деревьев" для начинающих для существительных и 15 для глаголов (называемых лексикографическими файлами на уровне обслуживания). Все они связаны с уникальным синсетом для начинающих, "entity". Иерархия существительных намного глубже иерархии глаголов

Прилагательные не организованы в иерархические деревья. Вместо этого два «центральных» антонима, таких как «горячий» и «холодный», образуют бинарные полюса, в то время как «спутниковые» синонимы, такие как «дымящийся» и «холодный», соединяются со своими соответствующими полюсами через отношения «подобия». Таким образом прилагательные можно представить как «гантели», а не как «деревья».

Психолингвистические аспекты [ править ]

Первоначальной целью проекта WordNet было создание лексической базы данных, которая соответствовала бы теориям семантической памяти человека, разработанным в конце 1960-х годов. Психологические эксперименты показали, что говорящие организовали свое знание концепций экономическим, иерархическим образом. Время поиска, необходимое для доступа к концептуальным знаниям, казалось, напрямую связано с количеством иерархий, которые говорящему необходимо «пройти», чтобы получить доступ к знаниям. Таким образом, выступающие могли быстрее проверить, могут ли канарейки петь, потому что канарейка - певчая птица, но потребовалось немного больше времени, чтобы убедиться, что канарейки могут летать (где им нужно было получить доступ к понятию «птица» на более высоком уровне), и еще больше времени убедиться, что у канарейки есть кожа(требуется поиск на нескольких уровнях гипонимии, вплоть до «животного»). [7] Хотя такие психолингвистические эксперименты и лежащие в их основе теории подвергались критике, часть организации WordNet согласуется с экспериментальными данными. Например, аномическая афазия выборочно влияет на способность говорящих произносить слова из определенной семантической категории, иерархии WordNet. Антонимные прилагательные (центральные прилагательные WordNet в структуре гантелей) встречаются гораздо чаще, чем случайность, факт, который, как было обнаружено, справедлив для многих языков.

Как лексическая онтология [ править ]

WordNet иногда называют онтологией - настойчивое заявление, которого не делают его создатели. Отношения гипероним / гипоним между синсетами существительных можно интерпретировать как отношения специализации между концептуальными категориями. Другими словами, WordNet можно интерпретировать и использовать как лексическую онтологию в смысле компьютерных наук . Однако такая онтология должна быть исправлена ​​перед использованием, потому что она содержит сотни основных семантических несоответствий; например, есть: (i) общие специализации для исключительных категорий и (ii) избыточность в иерархии специализаций. Кроме того, преобразование WordNet в лексическую онтологию, используемую для представления знаний, обычно также должно включать: (i) выделение отношений специализации на подтипи отношения instanceOf , и (ii) связывание интуитивно понятных уникальных идентификаторов с каждой категорией. Хотя такие исправления и преобразования были выполнены и задокументированы как часть интеграции WordNet 1.7 в совместно обновляемую базу знаний WebKB-2, [8] большинство проектов заявляют о повторном использовании WordNet для приложений, основанных на знаниях (обычно, знаний- ориентированный на поиск информации) просто повторно используйте его напрямую.

WordNet также был преобразован в формальную спецификацию с помощью гибридной восходящей и нисходящей методологии для автоматического извлечения ассоциативных отношений из WordNet и интерпретации этих ассоциаций в терминах набора концептуальных отношений, формально определенных в базовой онтологии DOLCE. . [9]

В большинстве работ, в которых утверждается, что WordNet интегрирован в онтологии, содержание WordNet не просто исправлялось, когда это казалось необходимым; вместо этого WordNet был сильно переинтерпретирован и обновлен по мере необходимости. Так было, например, когда онтология верхнего уровня WordNet была реструктурирована [10] в соответствии с подходом, основанным на OntoClean, или когда WordNet использовался в качестве первичного источника для построения нижних классов онтологии SENSUS.

Ограничения [ править ]

Наиболее широко обсуждаемое ограничение WordNet (и связанных ресурсов, таких как ImageNet ) состоит в том, что некоторые семантические отношения больше подходят для конкретных концепций, чем для абстрактных концепций. [11] Например, легко создать отношения гипонимов / гипернимов, чтобы уловить, что « хвойное дерево » - это тип « дерева », «дерево» - это тип « растения », а «растение» - это тип. « организма », но сложно разделить эмоции, такие как «страх» или «счастье», на столь же глубокие и четко определенные гипонимические / гипернимальные отношения.

Многие концепции WordNet относятся к определенным языкам, и наиболее точное соответствие между языками составляет 94%. [12] Синонимы, гипонимы, меронимы и антонимы встречаются на всех языках, где есть WordNet, но другие семантические отношения зависят от языка. [13] Это ограничивает возможность взаимодействия между языками. Однако это также делает WordNet ресурсом для выделения и изучения различий между языками, поэтому это не обязательно ограничение для всех случаев использования.

WordNet не включает информацию об этимологии или произношении слов и содержит лишь ограниченную информацию об использовании. WordNet нацелен на охват большинства повседневных слов и не включает много предметной терминологии.

WordNet - это наиболее часто используемый вычислительный лексикон английского языка для устранения неоднозначности смысла слов (WSD), задача, направленная на присвоение контекстно-зависимых значений (т.е. членов синсета) словам в тексте. [14] Однако утверждалось, что WordNet кодирует слишком тонкие смысловые различия. Эта проблема не позволяет системам WSD достичь уровня производительности, сравнимого с производительностью людей, которые не всегда соглашаются, когда сталкиваются с задачей выбора смысла из словаря, соответствующего слову в контексте. Проблема детализации была решена путем предложения методов кластеризации, которые автоматически группируют сходные значения одного и того же слова. [15] [16] [17]

Оскорбительное содержание [ править ]

WordNet включает слова, которые могут быть восприняты как уничижительные или оскорбительные. [18] Интерпретация слова может меняться со временем и между социальными группами , поэтому WordNet не всегда может определить слово как « уничижительное » или «оскорбительное» изолированно. Следовательно, люди, использующие WordNet, должны применять свои собственные методы для определения оскорбительных или уничижительных слов.

Однако это ограничение распространяется и на другие лексические ресурсы, такие как словари и тезаурусы , которые также содержат уничижительные и оскорбительные слова. Некоторые словари указывают слова, которые являются уничижительными , но не включают все контексты, в которых слова могут быть приемлемыми или оскорбительными для различных социальных групп. Поэтому люди, использующие словари, должны применять свои собственные методы для выявления всех оскорбительных слов.

Лицензированные и открытые сети WordNets [ править ]

Некоторые сети слов были впоследствии созданы для других языков. В опросе 2012 года перечислены сети слов и их доступность. [19] Стремясь распространить использование WordNets, глобальное сообщество WordNet медленно перелицензировало свои WordNet в открытый домен, где исследователи и разработчики могут легко получить доступ и использовать WordNets в качестве языковых ресурсов для предоставления онтологических и лексических знаний в Natural Задачи языковой обработки .

Open Multilingual WordNet [20] обеспечивает доступ к открытым лицензированным сетям слов на различных языках, все они связаны с Princeton Wordnet of English (PWN). Цель состоит в том, чтобы упростить использование сетей слов на нескольких языках.

Приложения [ править ]

WordNet использовался для ряда целей в информационных системах, включая устранение неоднозначности слов , поиск информации , автоматическую классификацию текста , автоматическое обобщение текста , машинный перевод и даже автоматическое создание кроссвордов.

WordNet обычно используется для определения сходства слов. Были предложены различные алгоритмы, в том числе измерение расстояния между словами и наборами синхросигналов в структуре графа WordNet, например, путем подсчета числа ребер среди наборов синтаксических данных. Интуиция подсказывает, что чем ближе два слова или синсета, тем ближе их значение. Ряд основанных на WordNet алгоритмов подобия слов реализован в пакете Perl под названием WordNet :: Similarity [21] и в пакете Python под названием NLTK . [22] Другие более сложные методы подобия на основе WordNet включают ADW, [23] реализация которого доступна на Java.. WordNet также можно использовать для связывания других словарей. [24]

Интерфейсы [ править ]

Princeton ведет список связанных проектов [25], который включает ссылки на некоторые из широко используемых интерфейсов прикладного программирования, доступных для доступа к WordNet с использованием различных языков программирования и сред.

Связанные проекты и расширения [ править ]

WordNet подключен к нескольким базам данных семантической сети . WordNet также часто повторно используется через сопоставления между наборами синтаксиса WordNet и категориями из онтологий. Чаще всего отображаются только категории верхнего уровня WordNet.

Глобальная ассоциация WordNet [ править ]

Глобальная ассоциация WordNet (GWA) [26] - это общественная некоммерческая организация, которая предоставляет платформу для обсуждения, обмена и соединения сетей Word для всех языков мира. GWA также способствует стандартизации сетей слов в разных языках, чтобы обеспечить единообразие при перечислении синсетов в человеческих языках. GWA ведет список сетей слов, разработанных по всему миру. [27]

Другие языки [ править ]

  • Арабский WordNet : [28] [29] WordNet для арабского языка.
  • Арабская онтология , лингвистическая онтология, которая имеет ту же структуру, что и wordnet, и сопоставлена ​​с ней.
  • В рамках проекта BalkaNet [30] были созданы сети WordNets для шести европейских языков (болгарский, чешский, греческий, румынский, турецкий и сербский). Для этого проекта был разработан бесплатный редактор WordNet на основе XML. Этот редактор - VisDic - больше не находится в активной разработке, но все еще используется для создания различных WordNets. Его преемник, DEBVisDic, является клиент-серверным приложением и в настоящее время используется для редактирования нескольких сетей Word (голландский в проекте Cornetto, польский, венгерский, несколько африканских языков, китайский).
  • BulNet - это болгарская версия WordNet, разработанная отделом компьютерной лингвистики Института болгарского языка Болгарской академии наук. [31]
  • CWN (китайский Wordnet или 中文 詞彙 網路) при поддержке Национального Тайваньского университета . [32]
  • EuroWordNet проект [33] произвел WordNets на нескольких европейских языках и связал их вместе; однако они не доступны в свободном доступе. Проект Global Wordnet пытается координировать создание и создание «сетей слов» для всех языков. [34] Oxford University Press , издатель Oxford English Dictionary , озвучил планы по созданию собственного онлайн-конкурента WordNet. [ необходима цитата ]
  • FinnWordNet - это финская версия WordNet, куда были переведены все статьи оригинального английского WordNet. [35]
  • GermaNet - это немецкая версия WordNet, разработанная Тюбингенским университетом. [36]
  • IndoWordNet [37] является связанным лексической базой знаний wordnets из 18 запланированных языков Индии именно., Ассамский , бенгальский , Бодо , гуджарати , хинди , каннада , Кашмира , Конкани , малаялам , Мейтей (Манипури), маратхи , непальский , Одиа , Пенджаби , санскрит , тамильский , телугу и урду .
  • JAWS (Just Another WordNet Subset), еще одна французская версия WordNet [38], построенная с использованием Викисловаря и семантических пространств.
  • WordNet Bahasa : WordNet для малайского и индонезийского языков, разработанный Наньянским технологическим университетом .
  • Малаялам WordNet , разработанный Кочинским университетом науки и технологий . [39]
  • Многоязычный центральный репозиторий (MCR) интегрируется в одну и ту же структуру EuroWordNet - словесные сети с испанского, каталонского, баскского, галисийского и португальского языков, как и на английском языке. [40]
  • Проект MultiWordNet [41], многоязычный WordNet, направлен на создание итальянской WordNet, тесно связанной с Princeton WordNet.
  • OpenDutchWordNet, [42] - голландская лексико-семантическая база данных.
  • OpenWN-PT - это бразильская португальская версия оригинальной WordNet, свободно доступная для загрузки по лицензии CC-BY-SA. [43]
  • plWordNet [44] - польскоязычная версия WordNet, разработанная Вроцлавским технологическим университетом .
  • PolNet [45] - это польскоязычная версия WordNet, разработанная Университетом Адама Мицкевича в Познани (распространяется по лицензии CC BY-NC-ND 3.0).

Такие проекты, как BalkaNet и EuroWordNet, сделали возможным создание автономных сетей слов, связанных с исходной. Одним из таких проектов был русский WordNet покровительствовал Петербургского государственного университета путей сообщения [46] под руководством С. А. Яблонского [47] или RussNet [48] по Санкт - Петербургского государственного университета

  • UWN - это автоматически созданная многоязычная лексическая база знаний, расширяющая WordNet и охватывающая более миллиона слов на многих разных языках. [49]
  • WOLF (WordNet Libre du Français), французская версия WordNet. [50]

Связанные данные [ править ]

  • BabelNet , [51] очень большая многоязычная семантическая сеть с миллионами понятий , полученного путем интегрирования WordNet и Википедия с использованием автоматического алгоритма отображения.
  • SUMO онтология [52] произвел отображение между всеми Wordnet synsets ( в том числе существительные, глаголы, прилагательные и наречия), а также классов SUMO . Последнее добавление сопоставлений предоставляет ссылки на все более конкретные термины в онтологии уровня MI (MILO), расширяющей SUMO.
  • OpenCyc , [53] открытая онтология и база знаний в повседневной общеизвестных смысле, 12000 терминов , связанных с WordNet синонимов множеств.
  • DOLCE , [54] - это первый модуль библиотеки фундаментальных онтологий WonderWeb (WFOL). Эта верхняя онтология была разработана в свете строгих онтологических принципов, вдохновленных философской традицией, с четкой ориентацией на язык и познание. OntoWordNet [55] является результатом экспериментального согласования верхнего уровня WordNet с DOLCE. Предполагается, что такое согласование может привести к «онтологически подслащенному» WordNet, который должен быть концептуально более строгим, когнитивно прозрачным и эффективно используемым в нескольких приложениях.
  • DBpedia , [56] база данных структурированной информации, связана с WordNet.
  • Расширяемый WordNet [57] проект в Университете Техаса в Далласе , который направлен на улучшение WordNet пути семантический разбор глоссы, что делает информацию , содержащейся в этих определениях , доступных для автоматических систем обработки знаний. Он находится в свободном доступе под лицензией, аналогичной WordNet.
  • В рамках проекта GCIDE был создан словарь путем объединения общедоступного словаря Вебстера 1913 года с некоторыми определениями WordNet и материалами, предоставленными добровольцами. Он был выпущен под лицензией GPL с авторским левом .
  • ImageNet - это база данных изображений, организованная в соответствии с иерархией WordNet (в настоящее время только существительные), в которой каждый узел иерархии представлен сотнями и тысячами изображений. [58] В настоящее время в среднем на каждый узел приходится более 500 изображений.
  • BioWordnet, биомедицинское расширение Wordnet, было прекращено из-за проблем со стабильностью версий. [59]
  • WikiTax2WordNet, соответствие между наборами синтаксиса WordNet и категориями Википедии . [60]
  • WordNet ++, ресурс, включающий более миллионов семантических границ, собранных из Википедии, и соединяющих пары наборов синтаксиса WordNet. [61]
  • SentiWordNet, ресурс для поддержки приложений сбора мнений, полученных путем пометки всех наборов синхронизации WordNet 3.0 в соответствии с их предполагаемой степенью положительности, отрицательности и нейтральности. [62]
  • ColorDict - это Android-приложение для мобильных телефонов, использующих базу данных Wordnet и другие, например Википедию.
  • UBY-LMF база данных из 10 ресурсов, включая WordNet.

Связанные проекты [ править ]

  • FrameNet - это лексическая база данных, которая имеет некоторое сходство с WordNet и относится к ней.
  • Структура лексической разметки (LMF) - это стандарт ISO, указанный в ISO / TC37 для определения общей стандартизированной структуры для построения лексиконов, включая WordNet. Подмножество LMF для Wordnet называется Wordnet-LMF. В рамках проекта KYOTO был создан экземпляр. [63]
  • Программа UNL - это проект под эгидой ООН, направленный на консолидацию лексико-семантических данных многих языков для использования в системах машинного перевода и извлечения информации.

Распределения [ править ]

База данных WordNet распространяется в виде пакета словарей (обычно в виде одного файла) для следующего программного обеспечения:

  • Вавилон [64]
  • GoldenDict [65]
  • Lingoes [66]

См. Также [ править ]

  • Структура лексической разметки
  • Машиночитаемый словарь
  • Синоним Кольцо
  • Таксономия
  • МысльСокровище

Ссылки [ править ]

  1. ^ "Новости WordNet" .
  2. ^ "WordNets в мире" . Глобальная ассоциация WordNet . Проверено 19 января 2020 года .
  3. ^ "Поиск WordNet - 3.1" .
  4. ^ А. Миллер, Р. Беквит, CD Fellbaum, Д. Гросс, К. Миллер. 1990. WordNet: онлайн-лексическая база данных. Int. J. Lexicograph. 3, 4, с. 235–244.
  5. ^ «О всемирной ассоциации WordNet» . Глобальный WordNet . Проверено 19 января 2020 года .
  6. ^ «Статистика WordNet» . Wordnet.princeton.edu . Проверено 22 июня 2018 .
  7. ^ Коллинз А., Quillian MR 1972. Эксперименты по семантической памяти и пониманию языка. В познании в обучении и памяти . Вили, Нью-Йорк.
  8. ^ http://www.phmartin.info . «Интеграция WordNet 1.7 в WebKB-2» . Webkb.org . Проверено 11 марта 2014 .
  9. ^ Gangemi, A .; Navigli, R .; Веларди, П. (2003). Проект OntoWordNet: расширение и аксиоматизация концептуальных отношений в WordNet (PDF) . Proc. Международной конференции по онтологиям, базам данных и приложениям семантики (ODBASE 2003) . Катания, Сицилия (Италия). С. 820–838.
  10. ^ Oltramari, A .; Gangemi, A .; Guarino, N .; Масоло, К. (2002). Реструктуризация верхнего уровня WordNet: подход OntoClean . OntoLex'2 Workshop, онтологии и лексические базы знаний (LREC 2002). Лас-Пальмас, Испания. С. 17–26. CiteSeerX 10.1.1.19.6574 . 
  11. ^ Рудницкая, Ева; Бонд, Фрэнсис; Грабовски, Лукаш; Пясецки, Мацей; Пиотровский, Тадеуш (2018). «Лексическая перспектива Wordnet для отображения Wordnet». Материалы 9-й Глобальной конференции WordNet (GWC 2018) : 210.
  12. ^ Бонд, Фрэнсис; Фостер, Райан (2013). «Связывание и расширение открытой многоязычной сети Wordnet» (PDF) . Труды 51-го ежегодного собрания Ассоциации компьютерной лингвистики : 1352–1362 . Проверено 20 января 2020 года .
  13. ^ Феллбаум, Кристиана; Фоссен, Пик (2012). «Проблемы для многоязычной сети слов». Языковые ресурсы и оценка . 46 (2): 313–326. DOI : 10.1007 / s10579-012-9186-Z . S2CID 10117946 . 
  14. ^ Р. Навильи. Устранение неоднозначности слов: обзор , ACM Computing Surveys , 41 (2), 2009, стр. 1–69.
  15. ^ Э. Агирре, О. Лопес. 2003. Кластеризация WordNet Word Senses. В Proc. конференции о последних достижениях естественного языка (RANLP'03) , Боровец, Болгария, стр. 121–130.
  16. ^ Р. Навильи. Значимая кластеризация смыслов помогает повысить эффективность устранения неоднозначности смысла слов , In Proc. 44-го ежегодного собрания Ассоциации компьютерной лингвистики совместно с 21-й Международной конференцией по компьютерной лингвистике (COLING-ACL 2006) , Сидней, Австралия, 17–21 июля 2006 г., стр. 105–112.
  17. ^ Р. Сноу, С. Пракаш, Д. Джурафски, AY Ng. 2007. Учимся объединять смыслы слов , In Proc. Совместной конференции 2007 г. по эмпирическим методам обработки естественного языка и компьютерному изучению естественного языка (EMNLP-CoNLL) , Прага, Чешская Республика, стр. 1005–1014.
  18. ^ Джулия Кэрри Вонг. 2019. Вирусное селфи-приложение ImageNet Roulette казалось забавным, пока не назвали меня расистским оскорблением . Хранитель
  19. ^ Фрэнсис Бонд и Кёнхи Пайк 2012a. Обзор Wordnet и их лицензий . В материалах 6-й Глобальной конференции WordNet (GWC 2012). Мацуэ. 64–71
  20. ^ "Открыть многоязычный Wordnet" . compling.hss.ntu.edu.sg . Проверено 10 апреля 2018 года .
  21. ^ "Тед Педерсен - WordNet :: Сходство" . D.umn.edu. 2008-06-16 . Проверено 11 марта 2014 .
  22. ^ НЛП с использованием Python NLTK /
  23. ^ MT Пилехвар, Д. Юргенс и Р. Навильи. Выровнять, устранить неоднозначность и пройти: единый подход к измерению семантического сходства. . Proc. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  24. ^ Ballatore A, et al. (2014). «Связывание географических словарей через WordNet». Летопись ГИС . 20 (2): 73–84. arXiv : 1404,5372 . Bibcode : 2014arXiv1404.5372B . DOI : 10.1080 / 19475683.2014.904440 . S2CID 9246582 . 
  25. ^ «Связанные проекты - WordNet - Связанные проекты» . Wordnet.princeton.edu. 2014-01-06 . Проверено 22 июня 2018 .
  26. ^ Всемирная ассоциация WordNet (04.02.2010). "globalwordnet.org" . globalwordnet.org . Проверено 11 марта 2014 .
  27. ^ «Wordnet в мире» . Архивировано из оригинала на 2011-10-21.
  28. ^ Black W., Elkateb С., Родригес Х., Alkhalifa М., Фоссен П., Пиз А., Бертран М., Fellbaum С., (2006) WordNet проекта Arabic, Труды LREC 2006
  29. ^ Лахсен Абуенур, Карим Бузубаа, Паоло Россо (2013) Об оценке и улучшении охвата арабского WordNet и удобства использования, Языковые ресурсы и оценка 47 (3) стр. 891–917
  30. ^ Д. Tufis, Д. Кристя, С. Stamou. 2004. Балканет: цели, методы, результаты и перспективы. Общий обзор . Румынский J. Sci. Tech. Сообщить. (Специальный выпуск о Балканете) , 7 (1-2), стр. 9–43.
  31. ^ "BulNet" . dcl.bas.bg . Проверено 7 мая 2015 .
  32. ^ Официальная страница китайского Wordnet (中文 詞彙 網路) в Национальном университете Тайваня
  33. P. Vossen, Ed. 1998. EuroWordNet: многоязычная база данных с лексико-семантическими сетями. Клувер, Дордрехт, Нидерланды.
  34. ^ «Глобальная ассоциация WordNet» . Globalwordnet.org. 2010-02-04 . Проверено 5 января 2014 .
  35. ^ "FinnWordNet - Финский WordNet - Департамент общего языкознания" . Ling.helsinki.fi . Проверено 5 января 2014 .
  36. ^ "GermaNet" . Sfs.uni-tuebingen.de . Проверено 11 марта 2014 .
  37. ^ Пушпак Бхаттачарья, IndoWordNet, Конференция по разработке лексических ресурсов 2010 (LREC 2010), Мальта, май 2010 г.
  38. ^ C. Mouton, G. de Chalendar. 2010. JAWS: еще одно подмножество WordNet . В Proc. ТАЛН 2010 .
  39. ^ Веб-сайт
  40. ^ http://adimen.si.ehu.es/web/mcr/
  41. ^ Е. Pianta, Л. Bentivogli, С. Жирарди. 2002. MultiWordNet: Разработка согласованной многоязычной базы данных . В Proc. 1-й Международной конференции по глобальной сети WordNet , Майсур, Индия, стр. 21–25.
  42. ^ http://wordpress.let.vupr.nl/odwn/
  43. ^ "arademaker / openWordnet-PT - GitHub" . Github.com . Проверено 5 января 2014 .
  44. ^ http://plwordnet.pwr.wroc.pl/wordnet/ официальная веб-страница
  45. ^ http://www.ltc.amu.edu.pl/polnet/ официальная веб-страница
  46. ^ "Русский WordNet" . Pgups.ru . Проверено 5 января 2014 .
  47. ^ Балкова, Валентина; Сухоногов Андрей; Яблонский, Сергей (2003). "Русский WordNet от UML-нотации до реализации базы данных в Интернете / интранете" (PDF) . GWC 2004 Proceedings : 31–38 . Проверено 12 марта 2017 года .
  48. ^ "RussNet: Главная страница" . Project.phil.spbu.ru . Проверено 11 марта 2014 .
  49. ^ «UWN: к универсальной многоязычной сети Word - D5: базы данных и информационные системы (Институт Макса Планка для информатики)» . Mpi-inf.mpg.de. 2011-08-14 . Проверено 5 января 2014 .
  50. ^ С. Бенуа, Ф. Дарья. 2008. Создание бесплатной французской сети wordnet из многоязычных ресурсов . В Proc. Ontolex 2008 , Марракеш, Марок.
  51. ^ Р. Навильи, С. П. Понцетто. BabelNet: создание очень большой многоязычной семантической сети . Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Упсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  52. Перейти ↑ A. Pease, I. Niles, J. Li. 2002. Предлагаемая верхняя объединенная онтология: большая онтология для семантической сети и ее приложений . В Proc. семинара AAAI-2002 по онтологиям и семантической паутине , Эдмонтон, Канада.
  53. ^ С. Рид и Д. Ленат. 2002. Отображение онтологий в цикл . В Proc. семинара конференции AAAI 2002 г. по онтологиям для семантической паутины , Эдмонтон, Канада, 2002 г.
  54. ^ Masolo, К., Борго, С., Gangemi, А., Guarino, Н., Oltramari, А., Шнайдер, Л.С. 2002. WonderWeb поставочный Д17. Библиотека основополагающих онтологий WonderWeb и онтология DOLCE . Отчет (вер. 2.0, 15.08.2002)
  55. ^ Gangemi А., Гуарин, Н., Masolo С., Oltramari, A. 2003 подслащивающих WordNet с DOLCE . В AI Magazine 24 (3): Fall 2003, стр. 13–24.
  56. ^ К. Бизер, Дж. Леманн, Г. Кобыларов, С. Ауэр, К. Беккер, Р. Циганиак, С. Хеллманн, DBpedia - точка кристаллизации для сети данных . Веб-семантика, 7 (3), 2009, стр. 154–165.
  57. ^ С.М. Харабагиу, Г.А. Миллер, Д.И. Молдован. 1999. WordNet 2 - Морфологически и семантически расширенный ресурс . В Proc. семинара ACL SIGLEX: Стандартизация лексических ресурсов , стр. 1–8.
  58. Перейти ↑ J. Deng, W. Dong, R. Socher, L. Li, K. Li, L. Fei-Fei. ImageNet: крупномасштабная база данных иерархических изображений . В Proc. конференции IEEE 2009 г. по компьютерному зрению и распознаванию образов
  59. ^ М. Попрат, Э. Байсвангер, У. Хан. 2008. Построение BIOWORDNET с использованием форматов данных WORDNET и инфраструктуры программного обеспечения WORDNET - история неудач . В Proc. семинара «Разработка программного обеспечения, тестирование и обеспечение качества для обработки естественного языка» , стр. 31–39.
  60. ^ С. Понцетто, Р. Навильи. Крупномасштабное картографирование таксономии для реструктуризации и интеграции Википедии , In Proc. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009) , Пасадена, Калифорния, 14-17 июля 2009 г., стр. 2083–2088.
  61. ^ С.П. Понцетто, Р. Навильи. Богатая знаниями система устранения неоднозначности, конкурирующая с контролируемыми системами . В Proc. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL), 2010 г., стр. 1522–1531.
  62. ^ С. Баччанелла, А. Эсули и Ф. Себастьяни. SentiWordNet 3.0: расширенный лексический ресурс для анализа настроений и анализа мнений . В материалах 7-й конференции по языковым ресурсам и оценке (LREC'10), Валлетта, MT, 2010 г., стр. 2200–2204.
  63. ^ Пик Фоссен, Клаудиа Сориа, Моника Монакини: Wordnet-LMF: стандартное представление для многоязычных сетей слов в LMF Lexical Markup Framework , под редакцией Гила Франкопуло ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 ) 
  64. ^ "Вавилон WordNet" . Babylon.com . Проверено 11 марта 2014 .
  65. ^ "GoldenDict - Обзор / словари на Sourceforge.net" . Sourceforge.net. 2010-12-01 . Проверено 5 января 2014 .
  66. ^ "Lingoes WordNet" . Lingoes.net. 2007-11-16 . Проверено 11 марта 2014 .

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • "Малаялам WordNet" . Компьютерные науки . Кочинский университет науки и технологий.
  • Пилат, Мария. "Тезаурус прилагательных, усилителей, отрицаний (AIN)" . Итальянские настроения .