Публикация метаданных - это процесс предоставления элементов данных метаданных доступным внешним пользователям, как людям, так и машинам, с использованием формального процесса проверки и приверженности процессам управления изменениями.
Публикация метаданных - это фундамент, на котором строятся расширенные функции распределенных вычислений . Но, как и при строительстве фундаментов, необходимо проявлять осторожность в системах публикации метаданных, чтобы обеспечить структурную целостность систем, построенных на них.
Определение публикации метаданных
Опубликованные метаданные имеют следующие характеристики:
- Структуры метаданных, доступные для широкой публики на общедоступном веб-сайте или для загрузки
- Существует документированный процесс проверки и утверждения для добавления или обновления элементов данных в систему.
- Новые выпуски доступны без нарушения предыдущих версий
- Издательская организация, которая берет на себя обязательства по контролю за изменениями
Преимущества публикации метаданных
При классификации преимуществ публикации метаданных обычно рассматриваются две группы. Внешние стороны обычно являются потребителями информации, которые не являются частью издательской организации. Внутренние стороны обычно представляют собой различные бизнес-единицы или отделы внутри организации.
Выгоды для внешних сторон
- Позволяет внешние системы (как люди и агентов) , чтобы иметь четкое представление о семантике из элементов данных в системе
- Позволяет третьим сторонам строить семантические карты между моделями данных, а также импортировать и экспортировать данные между системами.
- Продвигает сервис-ориентированные архитектуры и допускает горизонтальный обмен информацией между традиционными информационными хранилищами
- Позволяет системам участвовать в процессах точно проиндексированного и федеративного поиска.
Выгоды для внутренних сторон
- позволяет сторонам из разных бизнес-единиц согласовывать определения общих данных и определения отдельных отделов или функций
- делает операции извлечения, преобразования, загрузки (ETL) более точными для хранилищ данных
- позволяет дизайнерам пользовательского интерфейса получить доступ к общему пулу меток экрана и заголовков отчетов
- продвижение модельно-ориентированной архитектуры
Возражения против публикации метаданных
- Организации, публикующие свои метаданные, могут упростить неавторизованным людям поиск конфиденциальных данных, если они взломают брандмауэр организации.
- Поставщики, публикующие свои метаданные, рискуют создать у клиентов инструменты, которые позволят их клиентам экспортировать свои данные из компьютерных систем, тем самым облегчая миграцию с системы поставщика.
Основной процесс публикации метаданных
Ниже приведены некоторые из основных процессов публикации метаданных.
- Сбор требований к метаданным
- Выбор реестра метаданных и инструментов публикации метаданных
- Обучение участников проекта концепциям метаданных
- Формирование группы заинтересованных сторон
- Сбор метаданных
- Консолидация глоссария
- Начальное построение верхней онтологии (абстрактные элементы данных)
- Загрузка чернового элемента данных
- Процесс проверки элементов данных
- Публикация утвержденных элементов метаданных в различных форматах вывода (см. Ниже)
- Создание и поддержка версий и амортизация неиспользуемых или избыточных элементов данных
Публикация метаданных формата файла
Организации, которые создают приложения, хранящие данные в файловых системах, также могут публиковать определения метаданных. Один из распространенных способов сделать это - сохранить данные приложения в сжатом формате файла XML. Файлы XML можно распаковать и проверить на соответствие внешней схеме XML. Примером этого является инструмент FreeMind с открытым исходным кодом .
Форматы публикации метаданных
- HTML - используется для просмотра веб-сайтов и индексации текстовыми поисковыми системами.
- Язык веб-онтологий (OWL) - используется поисковыми системами по метаданным, такими как Swoogle
- XML Metadata Interchange (XMI) - стандарт OMG для обмена метаданными
- Метамодель Common Warehouse (CMW) - стандарт OMG для метаданных хранилища данных
- Тематические карты - стандарт ISO для представления и обмена знаниями с упором на возможность поиска информации.
- KM3 или мета-модель ядра, используемая в зоопарках метамоделей. AtlanticZoo является открытым исходным кодом библиотека из более чем 100 метамоделей по EPL лицензии. KM3 [ постоянная мертвая ссылка ] - это простой предметно- ориентированный язык для определения метамоделей. Доступен ряд преобразований для перевода из KM3 в другие обозначения, такие как XMI.
Смотрите также
Внешние ссылки
- Примеры MetaQuery предоставлены Ambient Webs LLC
- SWED-портал, предоставленный WordPressHelp
- Пример публикации метаданных Microsoft [ постоянная мертвая ссылка ]