Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Хранилище метаданных представляет собой базу данных , созданную для хранения метаданных . Метаданные - это информация о структурах, которые содержат фактические данные. Метаданные часто называют «данными о данных», но это вводит в заблуждение. Профили данных являются примером реальных «данных о данных». Метаданные добавляют к этому определению еще один уровень абстракции - это данные о структурах, содержащих данные. Метаданные могут описывать структуру любых данных любой тематики, хранящихся в любом формате.

Хорошо спроектированный репозиторий метаданных обычно содержит данные, выходящие далеко за рамки простых определений различных структур данных . Типичные репозитории хранят от десятков до сотен отдельных фрагментов информации о каждой структуре данных.

Сравнение метаданных пары элементов данных - одного цифрового и одного физического - проясняет, что такое метаданные:

Во-первых, цифровой: для данных, хранящихся в базе данных, может быть таблица с названием «Пациент» с множеством столбцов, каждая из которых содержит данные, описывающие разные атрибуты каждого пациента. Один из этих столбцов может называться «Имя_Пациента». Какие метаданные относятся к столбцу, который содержит фактические фамилии пациентов в базе данных? Мы уже использовали два элемента: имя столбца, содержащего данные (Patient_Last_Name) и имя таблицы, содержащей столбец (Patient). Другие метаданные могут включать максимальную длину фамилии, которая может быть введена, требуется ли фамилия (можно ли иметь пациента без Patient_Last_Name?), И преобразует ли база данных любые фамилии, введенные в нижнем регистре, в верхний регистр.Метаданные безопасности могут отображать ограничения, которые ограничивают круг лиц, которые могут просматривать эти имена.

Во-вторых, физический: данные, хранящиеся в обычной библиотеке, имеют много томов и могут иметь различные носители, включая книги. Метаданные о книгах будут включать ISBN, Binding_Type, Page_Count, Author и т. Д. В Binding_Type метаданные будут включать возможные привязки, материал и т. Д.

Эта контекстная информация бизнес-данных включает в себя значение и содержание, управляющие политики, технические атрибуты, преобразующие спецификации и программы, которыми управляют. [1] : 171

Определение [ править ]

Репозиторий метаданных отвечает за физическое хранение и каталогизацию метаданных. Данные в репозитории метаданных должны быть общими, интегрированными, текущими и историческими. Generic : метамодель должна хранить метаданные в виде общих терминов вместо того, чтобы хранить их определенным для конкретного приложения способом, чтобы при изменении стандарта вашей базы данных с одного продукта на другой физическая метамодель репозитория метаданных не нуждалась в изменении. Интеграция репозитория метаданных позволяет интегрировать метаданные всех областей бизнеса: охватывая все домены и предметные области организации. В репозитории метаданных должны быть доступны текущие и исторические метаданные. [2]Репозитории метаданных раньше назывались словарем данных . [1] : 239

С переходом потребности в использовании метаданных для бизнес-аналитики увеличились, так же как и объем хранилища метаданных. Более ранние словари данных - это самое близкое место для взаимодействия технологий с бизнесом. Словари данных - это совокупность репозитория метаданных на начальных этапах, но по мере увеличения объема бизнес-глоссарий и их тегов до различных флагов статуса появились в бизнес-части, в то время как потребление технологических метаданных, их происхождение и связи сделали репозиторий источником для ценные отчеты, которые объединяют бизнес и технологии и помогают упростить принятие решений по управлению данными, а также оценить стоимость изменений.

Хранилище метаданных исследует управление данными в масштабе предприятия, качество данных и управление основными данными (включая основные данные и справочные данные) и объединяет это богатство информации с интегрированными метаданными по всей организации, чтобы обеспечить систему поддержки принятия решений для структур данных, даже если он отражает только конструкции потребляются из различных систем.

Репозиторий против реестра [ править ]

Репозиторий имеет дополнительные функции по сравнению с реестром. Хранилище метаданных не только хранит метаданные, такие как реестр метаданных, но также добавляет связи со связанными типами метаданных. Метаданные, когда они связаны в потоке от точки входа в организацию до результатов, рассматриваются как происхождение этой точки данных. Метаданные, когда они связаны с другими связанными типами метаданных, называются связями. Предоставляя взаимосвязи со всеми точками метаданных в организации и поддерживая их целостность с архитектурой для обработки изменений, репозиторий метаданных предоставляет базовый материал для понимания всего потока данных, их определений и их влияния. Также важной особенностью является сохранение контроля версий, хотя это противопоставление открыто для обсуждения.Эти определения все еще развиваются, поэтому точность определений требует уточнения.

Цель реестра - определить элемент метаданных и поддерживать его в масштабах всей организации. А модели данных и другие группы управления данными обращаются к реестру для внесения любых изменений. В то время как репозиторий метаданных получает метаданные из различных систем метаданных в организациях и отражает то, что находится в восходящем направлении. Репозиторий никогда не выступает в качестве восходящего потока, в то время как реестр используется в качестве восходящего потока для изменений метаданных.

Причина использования [ править ]

Хранилище метаданных позволяет объединить всю структуру контейнеров данных организации в одно интегрированное место. Это открывает множество полезной информации для принятия взвешенных бизнес-решений. Этот инструмент использует одну общую форму модели данных для интеграции всех моделей, что позволяет объединить все приложения и программы организации в один формат. Кроме того, применение бизнес-определений и бизнес-процессов сближает бизнес и технологии, что помогает организациям составлять надежные дорожные карты с определенными целями. Обладая единой информацией, бизнес будет иметь больший контроль над изменениями и сможет проводить анализ воздействия инструмента.Обычно бизнес тратит много времени и денег на принятие решений, основанных на обнаружении и исследовании последствий для внесения изменений или добавления новых структур данных или удаления структур в управлении данными организации. Благодаря структурированному и хорошо обслуживаемому репозиторию перемещение продукта от идеи к доставке занимает минимум времени (учитывая, что другие переменные постоянны). Подвести итог:

  1. Интеграция метаданных в организации.
  2. Построение отношений между различными типами метаданных
  3. Стройте отношения между различными разрозненными системами .
  4. Определите бизнес золотую копию определений.
  5. Контроль версий изменений на уровне структуры.
  6. взаимодействие со Справочными данными
  7. связать представление с основными данными .
  8. автоматическая синхронизация с различными авторизованными системами источников метаданных.
  9. Больше контроля над бизнес-решениями.
  10. проверить структуры, перекрывая модели
  11. обнаружение несоответствий , пробелов , происхождения , показателей на уровне структуры данных.

Каждая система управления базами данных (СУБД) и инструменты баз данных имеют свой собственный язык для компонентов метаданных. Приложения баз данных уже имеют свои собственные репозитории или реестры, которые, как ожидается, обеспечат все необходимые функции для доступа к данным, хранящимся в них. Поставщики не хотят, чтобы другие компании могли легко переносить данные из их продуктов в продукты конкурентов, поэтому они являются собственностью в отношении того, как они обрабатывают метаданные. Инструменты CASE, словари СУБД, инструменты ETL, инструменты очистки данных, инструменты OLAP и инструменты интеллектуального анализа данных - все они обрабатывают и хранят метаданные по-разному. Только репозиторий метаданных может быть разработан для хранения компонентов метаданных из всех этих инструментов. [3]

Дизайн [ править ]

Репозитории метаданных должны хранить метаданные в четырех классификациях: владение, описательные характеристики, правила и политики, а также физические характеристики. Право собственности, показывающее владельца данных и владельца приложения. Описательные характеристики определяют имена, типы и длину, а также определения, описывающие бизнес-данные или бизнес-процессы. Правила и политики будут определять безопасность, чистоту данных, сроки для данных и отношения. Физические характеристики определяют происхождение или источник и физическое местонахождение. [1] : 176 Подобно построению логической модели данных для создания базы данных, логическая метамодель может помочь определить требования к метаданным для бизнес-данных. [1] : 185Хранилище метаданных будет централизованным, децентрализованным или распределенным. Централизованный дизайн означает, что существует одна база данных для репозитория метаданных, в которой хранятся метаданные для всех приложений в масштабах всего бизнеса. Централизованное хранилище метаданных имеет те же преимущества и недостатки, что и централизованная база данных . Легче управлять, потому что все данные находятся в одной базе данных, но недостатком является то, что могут возникнуть узкие места.

Децентрализованное хранилище метаданных хранит метаданные в нескольких базах данных, разделенных по местоположению и / или отделам бизнеса. Это делает управление репозиторием более сложным, чем централизованное хранилище метаданных, но преимущество состоит в том, что метаданные можно разбить на отдельные отделы.

Распределенный репозиторий метаданных использует децентрализованный метод, но в отличие от децентрализованного репозитория метаданных метаданные остаются в исходном приложении. Создан XML- шлюз [1] : 246, который действует как каталог для доступа к метаданным в каждом отдельном приложении. Преимущества и недостатки распределенного репозитория метаданных отражают репозиторий распределенной базы данных .

Дизайн информационной модели должен включать различные уровни типов метаданных, которые должны перекрываться для создания интегрированного представления данных. Различные типы метаданных должны быть объединены с соответствующими элементами метаданных в модели сверху вниз, связанной с бизнес-глоссарием.

Слои метаданных:

  1. Бизнес-глоссарий: содержит рекурсивную связь с бизнес-терминами.
  2. Бизнес-теги: содержат различную принадлежность к этому термину или терминам.
  3. Словарь данных: содержит информацию из инструментов модели данных для определения элементов метаданных и их технических определений, предоставляемых данными или архитектурой предприятия.
  4. Концептуальные модели данных:
  5. Логические модели данных
  6. Физические модели данных
  7. Базы данных
  8. правила проверки и правила качества данных
  9. ETL, бизнес-правила и их связь с атрибутами и сущностями
  10. Отчеты
  11. Источник к целевым артефактам сопоставления (отношения)
  12. Требования к отчетности (отношения)
  13. бизнес-процессы и их связь с технологиями
  14. иерархия людей и их отношения
  15. отношения собственника

Entity-Relationship / Object-Oriented [ править ]

Репозитории метаданных могут быть спроектированы как модель отношения сущностей или как объектно-ориентированный дизайн .

См. Также [ править ]

Ссылки [ править ]

  1. ^ a b c d e Мосс, LT; Атре, С. (2003). Дорожная карта бизнес-аналитики: полный жизненный цикл проекта для приложений поддержки принятия решений . Эддисон-Уэсли Профессионал. ISBN 0-201-78420-3.
  2. ^ Марко, D .; Дженнингс, М. (2004). Универсальные модели метаданных . Вайли. стр.  36 -43. ISBN 0-471-08177-9.
  3. ^ Марко, Д. (2000). Создание и управление репозиторием метаданных: полное руководство по жизненному циклу . Вайли. ISBN 978-0471355236.