Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример сбора данных в биологических науках: пингвины Адели идентифицируются и взвешиваются каждый раз, когда они пересекают автоматизированные весы на пути в море или из моря. [1]

Сбор данных - это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. Данные коллекции является исследование компонентов во всех исследуемых областях, в том числе физических и социальных наук , гуманитарных наук , [2] и бизнес. Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора остается неизменным. Целью сбора всех данных является сбор качественных доказательств, позволяющих анализировать и формулировать убедительные и достоверные ответы на поставленные вопросы.

Важность [ править ]

Независимо от области исследования или предпочтения определения данных ( количественных или качественных ), точный сбор данных необходим для поддержания целостности исследования. Выбор подходящих инструментов для сбора данных (существующих, модифицированных или вновь разработанных) и подробных инструкций по их правильному использованию снижает вероятность ошибок .

Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются как определенными, так и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. [3] Этот процесс обеспечивает как основу для измерения, так и в некоторых случаях указание на то, что следует улучшить.

Существует 5 распространенных методов сбора данных:

  1. закрытые опросы и викторины,
  2. открытые опросы и анкеты,
  3. 1-на-1 интервью,
  4. фокус-группы и
  5. прямое наблюдение. [4]

Проблемы с целостностью данных [5] [ править ]

Основная причина сохранения целостности данных - поддержка обнаружения ошибок в процессе сбора данных. Эти ошибки могут быть сделаны намеренно (преднамеренная фальсификация) или непреднамеренно ( случайные или систематические ошибки ).

Существует два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследований, изобретенных Крэддиком, Кроуфордом, Родсом, Редиканом, Рукенбродом и Лоусом в 2003 году:

  • Гарантия качества - все действия, выполняемые до сбора данных
  • Контроль качества - все действия, выполняемые во время и после сбора данных

Обеспечение качества [ править ]

Его основное внимание уделяется предотвращению, которое в первую очередь является рентабельной деятельностью по защите целостности сбора данных. Стандартизация протокола лучше всего демонстрирует эту рентабельную деятельность, которая разработана в виде всеобъемлющего и подробного руководства по процедурам сбора данных. Риск не выявить проблемы и ошибки в процессе исследования, очевидно, вызван плохо написанными инструкциями. Перечислены несколько примеров таких сбоев:

  • Неопределенность сроков, методов и идентификации ответственного лица
  • Частичный список предметов, которые необходимо было забрать
  • Нечеткое описание инструментов сбора данных вместо строгих пошаговых инструкций по проведению тестов
  • Неспособность распознать точное содержание и стратегии обучения и переподготовки сотрудников, ответственных за сбор данных
  • Неясные инструкции по использованию, настройке и калибровке оборудования для сбора данных
  • Нет заранее определенного механизма для документирования изменений в процедурах, которые происходят во время расследования

Контроль качества [ править ]

Поскольку действия по контролю качества происходят во время или после сбора данных, все детали тщательно документируются. Существует необходимость в четко определенной коммуникационной структуре в качестве предварительного условия для создания систем мониторинга. Неуверенность в потоке информации не рекомендуется, поскольку плохо организованная структура связи ведет к слабому мониторингу, а также может ограничивать возможности для обнаружения ошибок. Контроль качества также отвечает за определение действий, необходимых для исправления неправильных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда, скорее всего, не осознает необходимость выполнения этих действий, если их процедуры написаны расплывчато и не основаны на обратной связи или образовании.

Проблемы со сбором данных, требующие незамедлительных действий:

  • Систематические ошибки
  • Нарушение протокола
  • Мошенничество или нарушение научной этики
  • Ошибки в отдельных элементах данных
  • Проблемы с производительностью отдельных сотрудников или сайта

Сбор данных на z / OS [ править ]

z / OS - широко используемая операционная система для мэйнфреймов IBM . Он разработан, чтобы предложить стабильную, безопасную и постоянно доступную среду для приложений, работающих на мэйнфрейме. Рабочие данные - это данные, которые система z / OS производит при запуске. Эти данные указывают на работоспособность системы и могут использоваться для определения источников проблем с производительностью и доступностью в системе. Анализ операционных данных аналитическими платформами дает понимание и рекомендуемые действия для повышения эффективности работы системы, а также для решения или предотвращения проблем. IBM Z Common Data Provider собирает рабочие данные ИТ из систем z / OS, преобразует их в расходный формат и передает их на аналитические платформы. [6]

IBM Z Common Data Provider поддерживает сбор следующих рабочих данных: [7]

  • Данные средств управления системой (SMF)
  • Данные журнала из следующих источников:
    • Журнал заданий, вывод, который записывается в определение данных (DD) выполняющимся заданием.
    • Файл журнала z / OS UNIX, включая системный журнал системных служб UNIX (syslogd)
    • Кластер метода доступа к виртуальному хранилищу с последовательным входом (VSAM)
    • системный журнал z / OS (SYSLOG)
    • Сообщения IBM Tivoli NetView для z / OS
    • Журнал IBM WebSphere Application Server для z / OS High Performance Extensible Logging (HPEL)
    • Отчеты IBM Resource Measurement Facility (RMF) Monitor III
  • Данные пользовательского приложения, операционные данные из собственных приложений пользователей

DMP и сбор данных [ править ]

DMP - это аббревиатура от платформы управления данными. Это централизованная система хранения и анализа данных. В основном используемые маркетологами DMP существуют для компиляции и преобразования больших объемов данных в различимую информацию. [8] Маркетологи могут захотеть получать и использовать первые, вторые и сторонние данные. DMP позволяют это сделать, потому что они представляют собой совокупную систему DSP (платформа на стороне спроса) и SSP (платформа на стороне предложения). Что касается рекламы, DMP являются неотъемлемой частью оптимизации и направления маркетологов в будущих кампаниях. Эта система и ее эффективность являются доказательством того, что категоризированные, проанализированные и скомпилированные данные гораздо полезнее, чем необработанные данные.


Смотрите также

  • Архивирование научных данных
  • Курирование данных
  • Управление данными
  • Система сбора данных
  • Эксперимент
  • Наблюдательное исследование
  • Выборка (статистика)
  • Статистический обзор
  • Сбор данных опроса
  • Качественный метод
  • Количественный метод
  • Количественные методы в криминологии

Ссылки [ править ]

  1. ^ Lescroël, AL; Ballard, G .; Grémillet, D .; Authier, M .; Эйнли, Д.Г. (2014). Декамп, Себастьян (ред.). «Изменение климата Антарктики: экстремальные явления нарушают реакцию пластических фенотипов у пингвинов Адели» . PLoS ONE . 9 (1): e85291. DOI : 10.1371 / journal.pone.0085291 . PMC  3906005 . PMID  24489657 .
  2. ^ Вуонг, Куан-Хоанг; Ла, Вьет-Фыонг; Вуонг, Ту-Транг; Хо, Ман-Тоан; Нгуен, Гонконг Т.; Нгуен, Вьет-Ха; Фам, Хип-Хунг; Хо, Ман-Тунг (25 сентября 2018 г.). «Открытая база данных по продуктивности в области социальных и гуманитарных наук Вьетнама для общественного пользования» . Научные данные . 5 : 180188. дои : 10.1038 / sdata.2018.188 . PMC 6154282 . PMID 30251992 .  
  3. ^ Сбор и анализ данных Доктор Роджер Сапсфорд, ISBN Виктора Юппа 0-7619-5046-X 
  4. ^ Jovancic, Неманья. «5 методов сбора данных для получения количественных и качественных данных» . LeadQuizzes . LeadQuizzes . Проверено 23 февраля 2020 года .
  5. ^ Университет Северного Иллинойса (2005). «Сбор данных» . Ответственное поведение при управлении данными . Проверено 8 июня 2019 года .
  6. ^ IBM: поставщик общих данных IBM Z
  7. ^ IBM: Центр знаний общего поставщика данных IBM Z
  8. ^ Коллин, EM (2020-11-04). «Сбор данных: полное руководство» . Легко заработанные деньги . Проверено 5 ноября 2020 .

Внешние ссылки [ править ]

  • Статистическое бюро Гайаны , Арун Сукнарин