Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обмен данными - это процесс взятия данных, структурированных в соответствии с исходной схемой, и их преобразования в целевую схему, так что целевые данные являются точным представлением исходных данных. [1] Обмен данными позволяет обмениваться данными между различными компьютерными программами.

Это похоже на связанную концепцию интеграции данных, за исключением того, что данные фактически реструктурируются (с возможной потерей содержимого) при обмене данными. Возможно, нет способа преобразовать экземпляр с учетом всех ограничений. И наоборот, может быть множество способов преобразования экземпляра (возможно, бесконечно много), и в этом случае необходимо определить и обосновать «лучший» выбор решений.

Однодоменный обмен данными [ править ]

В некоторых доменах может существовать несколько десятков различных исходных и целевых схем (проприетарные форматы данных). «Обмен» или «формат обмена» часто разрабатывается для одного домена, а затем записываются необходимые процедуры (сопоставления) для (косвенного) преобразования / преобразования каждой исходной схемы в каждую целевую схему с использованием формата обмена как промежуточный шаг. [2] Это требует гораздо меньше работы, чем написание и отладка сотен различных подпрограмм, которые потребовались бы для прямого преобразования каждой исходной схемы непосредственно в каждую целевую схему.

Примеры этих трансформирующих форматов обмена включают:

Языки обмена данными [ править ]

Язык / формат обмена (или обмена) данными - это язык, который не зависит от предметной области и может использоваться для данных из любой дисциплины. [9] Они «превратились из ориентированных на разметку и отображение для дальнейшей поддержки кодирования метаданных, описывающих структурные атрибуты информации». [10]

Практика показала, что одни типы формальных языков лучше подходят для этой задачи, чем другие, поскольку их спецификация определяется формальным процессом, а не конкретными потребностями реализации программного обеспечения. Например, XML - это язык разметки, который был разработан для создания диалектов (определение подъязыков, зависящих от предметной области). [11] Однако он не содержит тематических словарей или типов фактов. Для надежного обмена данными выгодно наличие стандартных словарей-таксономий и библиотек инструментов, таких как парсеры , валидаторы схем и инструменты преобразования. [ необходима цитата ]

Популярные языки, используемые для обмена данными [ править ]

Ниже приведен частичный список популярных общих языков, используемых для обмена данными в нескольких доменах.

Номенклатура

  • Схемы - Доступно ли определение языка в компьютерной интерпретируемой форме.
  • Гибкость - позволяет ли язык расширять возможности семантического выражения без изменения схемы.
  • Семантическая проверка - позволяет ли определение языка семантическую проверку правильности выражений на языке.
  • Словарь-Таксономия - включает ли язык словарь и таксономию (иерархию подтипов-супертипов) понятий с наследованием.
  • Синонимы и омонимы - включает ли язык и поддерживает ли использование синонимов и омонимов в выражениях.
  • Диалектирование - доступно ли определение языка на нескольких естественных языках или диалектах.
  • Интернет или стандарт ISO - Организация, одобрившая этот язык в качестве стандарта.
  • Преобразования - включает ли язык перевод на другие стандарты.
  • Облегченная - доступна ли облегченная версия в дополнение к полной версии.
  • Удобочитаемость - являются ли выражения на языке удобочитаемыми (читаемыми людьми без обучения) [12]
  • Совместимость - какие другие инструменты можно использовать или которые требуются при использовании языка

Заметки:

  1. ^ RDF - это язык с гибкой схемой.
  2. ^ Схема XML содержит очень ограниченный грамматический и словарный запас.
  3. ^ Доступно как расширение.
  4. ^ В формате по умолчанию, а не в компактном синтаксисе.
  5. ^ Синтаксис довольно прост (язык был разработан для удобства чтения); диалекты могут потребоватьзнания предметной области.
  6. ^ Стандартизированные типы фактов обозначаются стандартными английскими фразами, интерпретация и использование которых требует некоторого обучения.
  7. ^ Анализировать диалектиспользуется для определения, проверки и преобразования диалекты.
  8. ^ Английская версия включает Gellish English Dictionary-Taxonomy, которая также включает стандартизованные типы фактов (= виды отношений).

XML для обмена данными [ править ]

Популярность XML для обмена данными во всемирной паутине объясняется несколькими причинами. Прежде всего, он тесно связан с уже существующими стандартами Standard Generalized Markup Language (SGML) и Hypertext Markup Language (HTML), и поэтому синтаксический анализатор, написанный для поддержки этих двух языков, может быть легко расширен для поддержки XML. Например, XHTML был определен как формат, который является формальным XML, но правильно понимается большинством (если не всеми) анализаторами HTML. [11]

YAML для обмена данными [ править ]

YAML - это язык, который был разработан для удобства чтения (и поэтому его легко редактировать с помощью любого стандартного текстового редактора). Его понятие часто похоже на синтаксис reStructuredText или Wiki, которые также пытаются быть удобочитаемыми как для людей, так и для компьютеров. YAML 1.2 также включает сокращенное понятие, совместимое с JSON, и поэтому любой документ JSON также является допустимым YAML; это, однако, не работает по-другому. [13]

REBOL для обмена данными [ править ]

REBOL - это язык, который был разработан для удобства чтения и редактирования с помощью любого стандартного текстового редактора. Для этого используется простой синтаксис произвольной формы с минимальным количеством знаков препинания и богатым набором типов данных. Типы данных REBOL, такие как URL-адреса, электронные письма, значения даты и времени, кортежи, строки, теги и т. Д., Соответствуют общим стандартам. REBOL спроектирован так, чтобы не нуждаться в каком-либо дополнительном метаязыке, он разработан в метациркульной форме. Метациркулярность языка является причиной того, что, например, диалект Parse, используемый (не исключительно) для определений и преобразований диалектов REBOL, также сам является диалектом REBOL. [14] REBOL послужил источником вдохновения для JSON. [15]

Gellish для обмена данными [ править ]

Gellish English - это формализованное подмножество естественного английского языка, которое включает в себя простую грамматику и большой расширяемый словарь-таксономию английского языка, который определяет общую и специфическую для предметной области терминологию (термины для понятий), тогда как концепции расположены в иерархии подтипов-супертипов ( taxonomy), который поддерживает наследование знаний и требований. Словарь-таксономия также включает стандартизованные типы фактов (также называемые типами отношений). Термины и типы отношений вместе могут использоваться для создания и интерпретации выражений фактов, знаний, требований и другой информации. Gellish можно использовать в сочетании с SQL , RDF / XML , OWL.и различные другие метаязыки. Стандарт Gellish представляет собой комбинацию ISO 10303-221 (AP221) и ISO 15926. [16]

См. Также [ править ]

  • Atom (формат файла)
  • Легкий язык разметки
  • RSS

Ссылки [ править ]

  1. А. Доан, А. Халеви и З. Айвз. « Принципы интеграции данных », Морган Кауфманн, с. 2012 г., стр. 276
  2. ^ Arenas, M .; Barceló, P .; Либкин, Л .; Мурлак, Ф. (2014). Основы обмена данными . Издательство Кембриджского университета. С. 1–11. ISBN 9781107016163. Проверено 25 мая 2018 .
  3. Перейти ↑ Clancy, JJ (2012). «Глава 1: Направления обмена инженерными данными для автоматизированного проектирования и производства». В Ванге, PCC (ред.). Достижения в CAD / CAM: тематические исследования . Springer Science & Business Media. С. 1–36. ISBN 9781461328193. Проверено 25 мая 2018 .
  4. ^ Калиш, CE; Майер, М. Ф. (ноябрь 1981 г.). «DIF: формат для обмена данными между прикладными программами». Журнал BYTE : 174.
  5. ^ "О ODF" . Общество OpenDoc . Проверено 25 мая 2018 .
  6. Перейти ↑ Zhu, X. (2016). ГИС для экологических приложений: практический подход . Рутледж. ISBN 9781134094509. Проверено 25 мая 2018 .
  7. ^ «Справочник по KML» . Google Inc. 21 января 2016 . Проверено 25 мая 2018 .
  8. ^ Мартинс, RMF; Лоуренсу, NCC; Орта, NCG (2012). Создание схем аналоговых ИС с помощью LAYGEN II . Springer Science & Business Media. п. 34. ISBN 9783642331466. Проверено 25 мая 2018 .
  9. Перейти ↑ Billingsley, FC (1988). «Общий язык обмена данными» . Архивы ISPRS . 27 (B3): 80–91 . Проверено 25 мая 2018 . Подпрограммы преобразования будут представлять собой язык и синтаксис, которые должны быть дисциплинированными и независимыми от машины.
  10. ^ Нурсеитов, Н .; Полсон, М .; Reynolds, R .; Изуриета, К. (2009). «Сравнение форматов обмена данными JSON и XML: пример из практики». Сценарий : 157–162.
  11. ^ a b Льюис, Дж .; Московиц, М. (2009). Усовершенствованный CSS . АПресс. С. 5–6. ISBN 9781430219323. Проверено 25 мая 2018 .
  12. ^ "человекочитаемый" . Оксфордские словари . Издательство Оксфордского университета . Проверено 29 мая 2018 .
  13. ^ Бендерский, Е. (22 ноября 2008). «JSON - это YAML, но YAML - это не JSON» . Сайт Эли Бендерски . Проверено 29 мая 2018 .
  14. ^ Sassenrath, C. (2000). «Язык сценариев REBOL» . Журнал доктора Добба . 25 (314): 64–8 . Проверено 29 мая 2018 .
  15. ^ Sassenrath, C. (13 декабря 2012). «На JSON и REBOL» . REBOL.com . Проверено 29 мая 2018 .
  16. ^ van Renssen, A .; Vermaas, PE; Зварт, SD (2007). «Таксономия функций в Gellish English» . Труды Международной конференции по инженерному проектированию 2007 : DS42_P_230 . Проверено 29 мая 2018 .