Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Таксономия - это практика и наука категоризации или классификации, основанная на дискретных наборах .

Таксономия (или taxinomical классификации) является схемой классификации , особенно, иерархическая классификация, в которой вещи организованы в группы или типов. [1] [2] [3] [4] [5] [6] Помимо прочего, таксономия может использоваться для организации и индексации знаний (хранящихся в виде документов, статей, видео и т. Д.), Например в форме системы классификации библиотек или таксономии поисковых систем , чтобы пользователям было легче находить информацию, которую они ищут. Многие таксономии представляют собой иерархии (и, следовательно, имеют внутреннюю древовидную структуру ), но не все.

Слово таксономия берет свое начало в греческом языке τςξις , taxis (что означает «порядок», «порядок») и νόμος , nomos («закон» или «наука»).

Первоначально таксономия относилась только к категоризации организмов или определенной категоризации организмов. В более широком, более общем смысле это может относиться к категоризации вещей или концепций, а также к принципам, лежащим в основе такой категоризации. Таксономия организует таксономические единицы, известные как «таксоны» (единственное число «таксон»).

Таксономия отличается от мерономии , которая имеет дело с категоризацией частей целого.

Приложения [ править ]

Категории Википедии иллюстрируют таксономию [7], а полная таксономия категорий Википедии может быть извлечена автоматически. [8] По состоянию на 2009 год было показано, что таксономия, созданная вручную, такая как таковая из вычислительных лексиконов, таких как WordNet , может использоваться для улучшения и реструктуризации таксономии категорий Википедии. [9]

В более широком смысле таксономия также применяется к схемам отношений, отличным от иерархий родитель-потомок, таким как сетевые структуры . Тогда таксономии могут включать в себя одного дочернего элемента с несколькими родителями, например, «Автомобиль» может отображаться с обоими родителями «Транспортное средство» и «Стальные механизмы»; Однако для некоторых это просто означает, что «автомобиль» является частью нескольких различных таксономий. [10] Таксономия также может быть просто организацией разных вещей в группы или алфавитным списком; здесь, однако, более уместен термин «словарь». В настоящее время в рамках управления знаниями таксономии считаются более узкими, чем онтологии, поскольку онтологии применяют большее разнообразие типов отношений. [11]

Математически иерархическая таксономия - это древовидная структура классификаций для данного набора объектов. Это также называется иерархией включения . В верхней части этой структуры находится единая классификация, корневой узел, который применяется ко всем объектам. Узлы ниже этого корня представляют собой более конкретные классификации, которые применяются к подмножествам общего набора классифицированных объектов. Ход рассуждения идет от общего к более частному.

Напротив, в контексте юридической терминологии используется открытая контекстная таксономия - таксономия, относящаяся только к определенному контексту. В сценариях, взятых из правовой области, моделируется формальный учет открытой текстуры юридических терминов, который предлагает различные понятия «ядра» и «полутени» значений концепции. Ход рассуждения идет от частного к более общему. [12]

История [ править ]

Антропологи заметили, что налоги обычно взимаются с местных магазинов и социальных систем и выполняют различные социальные функции. Возможно, наиболее известным и влиятельным исследованием народных налогов является книга Эмиля Дюркгейма « Элементарные формы религиозных налогов» . Более новую трактовку народных таксономий (включая результаты нескольких десятилетий эмпирических исследований) и обсуждение их связи с научной таксономией можно найти в « Когнитивных основах естествознания» Скотта Атрана .Было обнаружено, что народные систематики организмов в значительной степени согласуются с научной классификацией, по крайней мере, для более крупных и очевидных видов, а это означает, что народные систематики не основаны исключительно на утилитарных характеристиках. [13]

В семнадцатом веке немецкий математик и философ Готфрид Лейбниц , следуя работе майорканского философа тринадцатого века Рамона Лулля над его Ars generalis ultima , системой для процедурной генерации концепций путем комбинирования фиксированного набора идей, стремился разработать алфавит человеческая мысль . Лейбниц задумал, что его характеристика universalis будет «алгеброй», способной выразить все концептуальные мысли. Идея создания такого « универсального языка » часто рассматривалась в 17 веке, в частности, английским философом Джоном Уилкинсом в его работе.Опыт о подлинной символике и философском языке (1668), из которых схема классификации в Roget «s тезауруса , в конечном счете черпает.

Использование таксономий в различных дисциплинах [ править ]

Таксономии в программной инженерии [ править ]

Vegas et al. [14] приводят убедительные доводы в пользу продвижения знаний в области разработки программного обеспечения за счет использования таксономий. Аналогичным образом Ore et al. [15] предоставляют систематическую методологию подхода к построению таксономии в вопросах, связанных с программной инженерией.

Таксономии тестирования программного обеспечения [ править ]

В исследовании тестирования программного обеспечения было предложено несколько таксономий для классификации методов, инструментов, концепций и артефактов. Ниже приведены некоторые примеры таксономий:

  1. Таксономия методов тестирования на основе моделей [16]
  2. Таксономия инструментов статического анализа кода [17]

Engström et al. [18] предлагают и оценивают использование таксономии для связи между исследователями и практиками, занятыми в области тестирования программного обеспечения. Они также разработали сетевой инструмент [19] для облегчения и поощрения использования таксономии. Инструмент и его исходный код доступны для публичного использования. [20]

Таксономии в публикациях исследований [ править ]

Ссылаясь на несоответствия существующей практике составления списков авторов статей в медицинских исследовательских журналах, Драммонд Ренни и соавторы опубликовали статью 1997 года в JAMA , Журнале Американской медицинской ассоциации для

радикальное концептуальное и систематическое изменение, чтобы отразить реалии множественного авторства и укрепить ответственность. Мы предлагаем отказаться от устаревшего понятия "автор" в пользу более полезного и реалистичного понятия "участник". [21] : 152

С 2012 года несколько крупных академических и научных издательств внедрили Project CRediT для разработки контролируемого словаря ролей участников. [22] Известная как CRediT (Таксономия ролей участников) , это пример плоской, неиерархической таксономии; тем не менее, он включает необязательную широкую классификацию степени вклада: ведущий , равный или поддерживающий . Эми Брэнд и соавторы резюмируют свой предполагаемый результат как:

Определение конкретных вкладов в опубликованные исследования приведет к соответствующему признанию, меньшему количеству споров между авторами и меньшим препятствиям для сотрудничества и обмена данными и кодом. [21] : 151

По состоянию на середину 2018 года эта таксономия, очевидно, ограничивает область применения результатов исследований , в частности журнальных статей; однако он весьма необычно «надеется… поддержать идентификацию рецензентов». [22] (Таким образом, в нем еще не определены термины для таких ролей, как редактор или автор главы в книге с результатами исследований.) Версия 1, созданная первой Рабочей группой (северной) осенью 2014 года, определяет 14 конкретных ролей участников, использующих следующие термины:

  • Концептуализация
  • Методология
  • Программного обеспечения
  • Проверка
  • Формальный анализ
  • Расследование
  • Ресурсы
  • Курирование данных
  • Письмо - оригинальный черновик
  • Написание - просмотр и редактирование
  • Визуализация
  • Надзор
  • Администрация проекта
  • Получение финансирования

Восприятие было неоднозначным: несколько крупных издателей и журналов планируют внедрить CRediT к концу 2018 года, в то время как почти столько же не убеждены в необходимости или ценности его использования. Например,

Национальная академия наук создала TACS (прозрачность в Авторе взносах в науке) веб - страницу в список журналов, совершающие в установлении стандартов авторства, определении обязанностей для соответствующих авторов, требующий ORCID IdS и принятий Кредитной таксономии. [23]

На той же веб-странице есть таблица со списком 21 журнала (или семейства журналов), из которых:

  • 5 внедрили или к концу 2018 года внедрили CRediT,
  • 6 требуется заявление автора и предлагается использовать CRediT,
  • 8 не используют CRediT, в 3 из которых приводятся причины, по которым это не следует делать, и
  • 2 малоинформативны.

Таксономия - это открытый стандарт, соответствующий принципам OpenStand , [24] и опубликованный под лицензией Creative Commons . [22]

Таксономия в Интернете [ править ]

Веб-сайты с хорошо продуманной таксономией или иерархией легко понимаются пользователями, поскольку пользователи могут разработать мысленную модель структуры сайта. [25]

Рекомендации по написанию таксономии для Интернета [ править ]

  • Взаимоисключающие категории могут быть полезными. Если категории появляются в нескольких местах, это называется перекрестным списком или полииерархическим. Иерархия потеряет свою ценность, если перекрестные списки будут появляться слишком часто. Перекрестный список часто появляется при работе с неоднозначными категориями, которые подходят более чем одному месту. [25]
  • Полезно иметь баланс между широтой и глубиной таксономии. Слишком много вариантов (широты) перегрузят пользователей, предоставив им слишком много вариантов. В то же время слишком узкая структура с более чем двумя или тремя уровнями перехода по клику вызовет разочарование у пользователей и они могут сдаться. [25]

Отношения "есть" и "есть", а также гипонимия [ править ]

Два преобладающих типа отношений в системах представления знаний - это предикация и универсально определяемое условное обозначение . Отношения предикации выражают представление о том, что отдельная сущность является примером определенного типа (например, Джон - холостяк ), в то время как универсальные количественные условия выражают представление о том, что тип является подтипом другого типа (например, « Собака - это млекопитающее » , что означает то же, что и« Все собаки - млекопитающие » ). [26]

Таксономии часто представлены как есть- иерархии , где каждый уровень является более конкретным (на математическом языке «подмножество») уровень выше него. Например, базовая биологическая таксономия может включать такие понятия, как млекопитающее , которое является подмножеством животных , и собаки и кошки , которые являются подмножествами млекопитающих . Таксономия такого типа называется «модель-модель», потому что конкретные объекты рассматриваются как экземпляры концепции. Например, Фидо - это пример концептуальной собаки, а Пушистик - это кошка . [27]

В лингвистике отношения is-a называются гипонимией . Слова, описывающие категории, называются гиперонимами, а слова, являющиеся примерами категорий, - гипонимами. В простом примере биологии собака - это гипероним, а Фидо - один из его гипонимов. Слово может быть как гипонимом, так и гиперонимом. Например, собака - это гипоним млекопитающего, а также гипероним Фидо .

Исследование [ править ]

Сравнение категорий малых и больших популяций

Исследователи сообщили, что большие группы населения постоянно развивают очень похожие системы категорий. Это может иметь отношение к лексическим аспектам крупных сетей связи и культур , таким как folksonomies и язык или человеческому общение, и чувственных решения в целом. [28] [29]

См. Также [ править ]

  • Классификация (общая теория)
  • Celestial Emporium of Benevolent Recognition , вымышленная китайская энциклопедия с «невозможной» таксономической схемой
  • Слияние
  • Фольксономия
  • Словарь английского языка Gellish , таксономия, в которой понятия организованы в виде иерархии подтипов и супертипов.
  • Hypernym
  • Представление знаний
  • Лексикон
  • Онтология (информатика)
  • Protégé (программное обеспечение)
  • Семантическая сеть
  • Сеть семантического сходства
  • Структурализм
  • Систематика
  • Таксономия для поисковых систем
  • Тезаурус (информационный поиск)
  • Типология (значения)

Заметки [ править ]

  1. ^ https://en.wiktionary.org/wiki/taxonomy
  2. ^ https://www.dictionary.com/browse/taxonomy
  3. ^ https://www.dataversity.net/what-is-taxonomy/
  4. ^ https://www.lexico.com/definition/taxonomy
  5. ^ https://www.webopedia.com/definitions/taxonomy/
  6. ^ https://www.macmillandictionary.com/dictionary/british/taxonomy
  7. ^ Zirn, Cäcilia, Виви Настаз и Майкл Strube. 2008. «Различение экземпляров и классов в таксономии Википедии» (видеолекция). 5-я ежегодная конференция по семантической паутине Европы (ESWC 2008).
  8. ^ С. Понцетто и М. Штрубе. 2007. «Получение крупномасштабной таксономии из Википедии» . Proc. 22-й конференции по развитию искусственного интеллекта, Ванкувер, Британская Колумбия, Канада, стр. 1440-1445.
  9. ^ С. Понцетто, Р. Навильи. 2009. «Крупномасштабное картографирование таксономии для реструктуризации и интеграции Википедии» . Proc. 21-й Международной совместной конференции по искусственному интеллекту (IJCAI 2009), Пасадена, Калифорния, стр. 2083-2088.
  10. ^ Джексон, Иоав. «Таксономия - это не просто дизайн, это искусство», - сообщает Government Computer News (Вашингтон, округ Колумбия). 2 сентября 2004 г.
  11. ^ Сурьянто, Хендра и Пол Комптон. «Изучение классификационных таксономий на основе системы классификационных знаний». Университет Карлсруэ ; «Определение« таксономии »», веб-сайт Straights Knowledge.
  12. ^ Гросси, Давиде, Фрэнк Дигнум и Джон-Жюль Чарльз Мейер. (2005). «Контекстные таксономии» в вычислительной логике в многоагентных системах, стр. 33-51 [ мертвая ссылка ] .
  13. ^ Кеннет Боулдинг; Элиас Халил (2002). Эволюция, порядок и сложность . Рутледж. ISBN 9780203013151.п. 9
  14. Перейти ↑ Vegas, S. (2009). «Зрелые знания программной инженерии с помощью классификаций: тематическое исследование по методам модульного тестирования». IEEE Transactions по разработке программного обеспечения . 35 (4): 551–565. CiteSeerX 10.1.1.221.7589 . DOI : 10.1109 / TSE.2009.13 . S2CID 574495 .  
  15. Перейти ↑ Ore, S. (2014). «Таксономия критических факторов успеха для развертывания программного процесса». Журнал качества программного обеспечения . 22 (1): 21–48. DOI : 10.1007 / s11219-012-9190-у . S2CID 18047921 . 
  16. ^ Уттинг, Марк (2012). «Таксономия подходов к тестированию на основе моделей» . Тестирование, проверка и надежность программного обеспечения . 22 (5): 297–312. DOI : 10.1002 / stvr.456 . S2CID 6782211 . 
  17. ^ Новак, Джерней. «Таксономия инструментов статического анализа кода» . Материалы 33-й Международной конвенции MIPRO: 418–422.
  18. ^ Engström, Emelie (2016). «SERP-тест: таксономия для поддержки коммуникации между отраслью и академическим сообществом». Журнал качества программного обеспечения . 25 (4): 1269–1305. DOI : 10.1007 / s11219-016-9322-х . S2CID 34795073 . 
  19. ^ "SERP-подключение" .
  20. ^ Энгстрем, Эмели. «SERP-подключение бэкэнда» .
  21. ^ a b Бренд, Эми ; Аллен, Лиз; Альтман, Мика ; Хлава, Марджори; Скотт, Джо (1 апреля 2015 г.). «Помимо авторства: авторство, вклад, сотрудничество и кредит» . Learned Publishing . 28 (2): 151–155. DOI : 10.1087 / 20150211 . S2CID 45167271 . 
  22. ^ a b c "CREDIT" . КАСРАЙ . КАСРАЙ . 2 мая 2018. Архивировано из оригинала (онлайн) 12 июня 2018 года . Проверено 13 июня 2018 .
  23. ^ «Прозрачность вклада авторов в науку (TACS)» (онлайн) . Национальная академия наук . Национальная академия наук. 2018 . Проверено 13 июня 2018 .
  24. ^ "OpenStand" . OpenStand . Проверено 13 июня 2018 .
  25. ^ a b c Питер., Морвилл (2007). Информационная архитектура для всемирной паутины . Розенфельд, Луис., Розенфельд, Луи. (3-е изд.). Севастополь, Калифорния: О'Рейли. ISBN 9780596527341. OCLC  86110226 .
  26. ^ Рональд Дж. Брахман ; Что такое IS-A, а что нет. Анализ таксономических связей в семантических сетях . IEEE Computer, 16 (10); Октябрь 1983 г.
  27. ^ Брахман, Рональд (октябрь 1983). «Что такое IS-A, а что нет. Анализ таксономических связей в семантических сетях». Компьютер IEEE . 16 (10): 30–36. DOI : 10,1109 / MC.1983.1654194 . S2CID 16650410 . 
  28. ^ «Почему независимые культуры думают одинаково, когда дело доходит до категорий: это не в мозгу» . Phys.org . Проверено 13 февраля 2021 года .
  29. ^ Гильбо, Дуглас; Барончелли, Андреа; Чентола, Дэймон (12 января 2021 г.). «Экспериментальные доказательства конвергенции категорий, вызванных шкалой в разных популяциях» . Nature Communications . 12 (1): 327. DOI : 10.1038 / s41467-020-20037-у . ISSN 2041-1723 . PMC 7804416 . PMID 33436581 .    Доступно по лицензии CC BY 4.0 .

Ссылки [ править ]

  • Атран, С. (1993) Когнитивные основы естествознания: к антропологии науки. Кембридж: Издательство Кембриджского университета . ISBN 978-0-521-43871-1 
  • Карбонелл, Дж. Г. и Дж. Зикманн, ред. (2005). Вычислительная логика в многоагентных системах, Vol. 3487. Берлин: Springer-Verlag . ISBN 978-3-540-28060-6 
  • Мэлоун, Джозеф Л. (1988). Наука лингвистики в искусстве перевода: некоторые инструменты лингвистики для анализа и практики перевода. Олбани, Нью-Йорк: Государственный университет Нью-Йорка . ISBN 978-0-887-06653-5 ; OCLC 15856738 
  • * Марчелло Чародей Келлер, «Проблема классификации в исследованиях народных песен: краткая история», Folklore , XCV (1984), no. 1, 100-104.
  • Честер Д. Роу и Стивен М. Дэвис, «Набор инструментов для двигателя Excellence»; ISBN 978-0-615-24850-9 
  • Härlin, M .; Сундберг, П. (1998). «Таксономия и философия имен». Биология и философия . 13 (2): 233–244. DOI : 10.1023 / а: 1006583910214 . S2CID  82878147 .
  • Lamberts, K .; Шанкс, Д.Р. (1997). Знания, концепции и категории . Психология Press. ISBN 9780863774911.

Внешние ссылки [ править ]

  • СМИ, связанные с таксономией, на Викискладе?
  • Словарное определение таксономии в Викисловаре
  • Таксономия 101: основы и начало работы с таксономиями