Это мини-эссе по проблеме в MediaWikiland: категориальная политика . Первоначально это обсуждалось на wikiEN-l .
NB Мне известно о предыдущих обсуждениях в Википедии: Категоризация . Это эссе представляет собой более тщательное и оправданное рассмотрение проблемы и подчеркивает ошибочность многих предыдущих аргументов.
Обновление от 4 июня 2005 г. Предлагаемое здесь правило «категории - это наборы / графики, а не деревья» теперь закреплено в политике =).
Вступление
Что такое категория? Никто не знает. Нет единого мнения о том, что такое категория (см. Обсуждение в Википедии: Категоризация ). Является ли это иерархическим деревом, в котором все категоризации представляют отношения « есть »? Или это просто набор , группа связанных статей, которые могут входить в один или несколько других наборов?
Это важный вопрос - просто посмотрите Википедию: Категории для удаления . Изменения в категориях имеют более широкие последствия, чем изменения в статьях, и могут больше раздражать редакторов.
Я считаю, что категории являются и должны быть наборами, а не иерархиями.
Категории - это наборы
Первоначальное назначение категорий
Какова была первоначальная цель системы категоризации? Разработка таксономии мирских знаний? Я не думаю, что разработчики настолько глупы (я подробно остановлюсь на этом ниже). AFAIK это был своего рода автоматический генератор списков для связанных статей. Списки - это наборы, а не иерархии. Списки «связанных статей» - это наборы, а не иерархии.
Текущее программное обеспечение
Способ разработки категорий в программном обеспечении поддерживает идею о том, что категории являются наборами. Существует неявная поддержка категорий как наборов, потому что ничто не мешает кому-либо использовать их таким образом. В категории программного обеспечения нет ограничений иерархической системы. Такое программное обеспечение - лучший способ реализовать идею иерархических категорий, и его было бы легко реализовать (например, не допускать произвольного родительского контроля категорий).
Пока политика не определена (и, желательно, не будет обновлено программное обеспечение для ее поддержки), категории будут по-прежнему использоваться как наборы. Поскольку наборы включают иерархии, а иерархии не включают наборы, текущая система категоризации является одной из наборов.
Категории должны быть установлены
Категории по своей сути POV
Система категоризации - это мировоззрение. Поэтому категориям очень сложно быть NPOV . Следующая цитата Клея Ширки расширяется:
- Многие сетевые проекты, в том числе такие, как рынки «бизнес-бизнес» и веб-сервисы, начинались с неоспоримой гипотезы о том, что общение было бы проще, если бы все описывали вещи одинаково. Отсюда сделать короткий, но фатальный шаг к выводу, что конкретная разновидность объединяющего описания будет широко и быстро принята (заблуждение «это сработает, потому что было бы хорошо, если бы оно сработало»).
- Любая попытка создания глобальной онтологии обречена на провал, потому что метаданные описывают мировоззрение. Создатели каталогизационной системы советской библиотеки утверждали о мире, создав первую категорию книг «Произведения классиков марксизма-ленинизма». Мелвил Дьюи утверждал о мире, когда он объединял все книги о нехристианских религиях в единую категорию, ставшую последней среди книг о религии. Невозможно аккуратно сопоставить эти две системы друг с другом или с другими схемами классификации - они описывают разные типы миров.
- Поскольку метаданные описывают мировоззрение, несовместимость - неизбежный побочный продукт энергичных споров. Было бы относительно легко, например, закодировать описание генов в XML, но было бы невозможно получить универсальный стандарт для такого описания, потому что биологи до сих пор спорят о том, что такое ген на самом деле. Существует несколько конкурирующих стандартов описания генетической информации, и семантическое расхождение является артефактом реального разговора между биологами. Вы не можете получить стандарт, пока не достигнете соглашения, и вы не можете заставить соглашение существовать там, где его на самом деле нет.
- Более того, когда мы видим попытки навязать семантику в человеческих ситуациях, это приводит к ухудшению семантики, а не к тому, что соединение становится более информативным. Социальные сетевые сервисы, такие как Friendster и LinkedIn, предполагают, что люди будут рассматривать ссылки друг на друга как внешние сигналы глубокой ассоциации, поэтому социальная сеть, представленная программным обеспечением, будет точной моделью реального мира. Фактически, понятие друга или даже тип и глубина связи, необходимые для того, чтобы сказать, что вы знаете кого-то, довольно скользкие, и в результате связи между людьми на Friendster потеряли большую часть своего предполагаемого значения. Попытка выразить неявные и нечеткие отношения явным и четким образом не проясняет смысл, а разрушает его.
Сама концепция всеобъемлющей иерархической системы категорий противоречит духу Википедии. Это всеобъемлющее мировоззрение или приписывание ценности размеченным (категоризированным) статьям.
Идея «категории - это иерархии» предполагает, что даже большая группа людей может прийти к соглашению о всеобъемлющей системе убеждений, нелепое понятие, полностью лишенное реализма, понятие, которое было экспериментально показано неверно во многих метаданных ИТ. проекты.
Категории, особенно иерархические категории, связаны с последователями одного определенного мировоззрения, неявно заявляющими: «Наш путь правильный, каждый должен следовать ему». Обратите внимание, что доля людей, которые следуют одному определенному мировоззрению во всех аспектах, очень мала.
Наборы намного меньше POV
Категоризация по множеству, очевидно, меньше POV. Статья может принадлежать к любому количеству наборов, к которым, по мнению сообщества, она должна принадлежать, напрямую или через множественное отцовство категории статьи (или предков).
Заключение
Преимущества иерархической категоризации
- уменьшенная избыточность
- более удобная навигация (для меньшинства с «правильным» мировоззрением)
перевешивают его затраты
- сообщество никогда не придет к согласию по системе
- более сложная навигация (для большинства, кто не находит статьи там, где они ожидают)
- пониженная точность (реальный мир не входит в большую иерархию, он просто имеет наборы метаданных, применяемые к нему разными людьми)
В этом эссе предполагается, что наборы используются в полной мере, позволяя множественное наследование и, возможно, даже циклы наследования, и поощряя предоставление статей и категорий множеству категорий, а не одной или двум.