Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

VACUUM [1] [2] [3] [4] - это набор нормативных руководящих принципов для достижения качества обучающих и тестовых наборов данных для структурированных наборов данных в науке о данных и машинном обучении . Принцип « мусор на входе - мусор на выходе» мотивирует решение проблемы качества данных, но не предлагает конкретного решения. В отличие от большинства специальных показателей оценки качества данных, часто используемых практиками [5], VACUUM определяет качественные принципы для управления качеством данных и служит основой для определения более подробных количественных показателей качества данных. [6]

ВАКУУМ - это аббревиатура , обозначающая:

  • действительный
  • точный
  • последовательный
  • униформа
  • единый
  • модель

Ссылки [ править ]

  1. ^ "ВАКУУМ" . www.enterprisedb.com . Проверено 27 апреля 2021 .
  2. ^ Джим Нэсби (2015), Вся грязь на VACUUM , PGCon - Конференция PostgreSQL для пользователей и разработчиков, Андреа Росс , получено 2021-04-27
  3. ^ «Внутреннее устройство PostgreSQL: Глава 6 Вакуумная обработка» . www.interdb.jp . Проверено 27 апреля 2021 .
  4. ^ "Обзор обработки VACUUM в PostgreSQL" . Несколько девяти . 2019-11-22 . Проверено 27 апреля 2021 .
  5. ^ Пипино, Лео Л .; Ли, Ян В .; Ван, Ричард Ю. (2002-04-01). «Оценка качества данных» . Коммуникации ACM . 45 (4): 211–218. DOI : 10.1145 / 505248.506010 . ISSN 0001-0782 . 
  6. ^ Ван, RY; Стори, ВК; Ферт, КП (август 1995 г.). «Основа для анализа качества данных исследования» . IEEE Transactions по разработке знаний и данных . 7 (4): 623–640. DOI : 10.1109 / 69.404034 .