Повторяемость или надежность повторного тестирования [1] - это степень соответствия результатов последовательных измерений одного и того же показателя , проводимых в одних и тех же условиях измерения. [2] Другими словами, измерения выполняются одним человеком или прибором на одном и том же объекте, в одинаковых условиях и за короткий период времени. Неидеальная надежность теста-повторного тестирования вызывает изменчивость теста-повторного тестирования . Такая изменчивость может быть вызвано, например, внутри индивидуальной изменчивости и изменчивости внутри наблюдателя . Можно сказать, что измерениеповторяемость, когда это отклонение меньше заранее определенного критерия приемки.
Вариативность тест – ретест практически используется, например, в медицинском мониторинге состояния. В этих ситуациях часто существует заранее определенная «критическая разница», и для различий в контролируемых значениях, которые меньше, чем это критическое различие, возможность предтестовой изменчивости в качестве единственной причины различия может рассматриваться в дополнение к: примеры, изменения в заболеваниях или методах лечения. [3]
Условия
Следующие условия должны быть выполнены при установлении повторяемости: [2] [4]
- те же экспериментальные инструменты
- тот же наблюдатель
- один и тот же измерительный прибор, используемый в одинаковых условиях
- то же место
- повторение за короткий промежуток времени.
- те же цели
Методы повторяемости были разработаны Бландом и Альтманом (1986). [5]
Если корреляция между отдельными введениями теста высока (например, 0,7 или выше, как в этой альфа-внутренней таблице согласованности Кронбаха [6] ), то он имеет хорошую надежность теста-повторного тестирования.
Коэффициент повторяемости - это показатель точности, который представляет собой значение, ниже которого можно ожидать, что абсолютная разница между результатами двух повторных испытаний будет лежать с вероятностью 95%.
Стандартное отклонение в условиях повторяемости является частью точности и точности .
Анализ согласования атрибутов для баз данных дефектов
Анализ согласования атрибутов предназначен для одновременной оценки влияния повторяемости и воспроизводимости на точность. Это позволяет аналитику изучать ответы нескольких рецензентов, когда они рассматривают несколько сценариев несколько раз. Он производит статистику, которая оценивает способность оценщиков соглашаться с самими собой (повторяемость), друг с другом ( воспроизводимость ) и с известным основным или правильным значением (общая точность) для каждой характеристики - снова и снова. [7]
Психологическое тестирование
Поскольку один и тот же тест проводится дважды, и каждый тест является параллельным самому себе, различия между оценками теста и результатами повторного тестирования должны быть связаны исключительно с ошибкой измерения. Доводы такого рода вполне вероятно верны для многих физических измерений. Однако этот аргумент часто не подходит для психологического измерения, потому что часто невозможно рассматривать второе проведение теста в качестве меры, параллельной первому. [8]
Второе проведение психологического теста может давать систематически другие результаты, чем первое, по следующим причинам: [8]
- Атрибут, который измеряется, может измениться между первым тестом и повторным тестом. Например, тест по чтению, который проводится в сентябре для третьего класса, может дать другие результаты при повторной сдаче в июне. Можно было бы ожидать некоторого изменения способности детей к чтению за этот промежуток времени, низкая корреляция между тестами и повторными тестами может отражать реальные изменения самого атрибута.
- Опыт прохождения теста сам по себе может изменить истинную оценку человека. Например, заполнение списка тревожности может помочь повысить уровень тревожности человека.
- Эффект переноса , особенно если интервал между тестом и повторным тестом короткий. При повторном тестировании люди могут вспомнить свой первоначальный ответ, что может повлиять на ответы при втором введении.
Смотрите также
Рекомендации
- ^ Типы надежности База знаний о методах исследования. Последняя редакция: 20 октября 2006 г.
- ^ а б JCGM 100: 2008. Оценка данных измерений - Руководство по выражению неопределенности измерения (PDF) , Объединенный комитет руководств по метрологии, 2008 г.
- ^ Фрейзер, CG; Фогарти, Ю. (1989). «Интерпретация результатов лабораторных исследований» . BMJ (под ред. Клинических исследований) . 298 (6689): 1659–1660. DOI : 10.1136 / bmj.298.6689.1659 . PMC 1836738 . PMID 2503170 .
- ^ Тейлор, Барри Н .; Куятт, Крис Э. (1994), Руководство NIST по оценке и выражению неопределенности результатов измерений NIST , Гейтерсбург, Мэриленд, США: Национальный институт стандартов и технологий
- ^ «Статистические методы оценки соответствия между двумя методами клинического измерения» .
- ^ Джордж Д. & Маллери, P. (2003). Пошаговая инструкция по SPSS для Windows: простое руководство и справочник. 11.0 обновление (4-е изд.). Бостон: Аллин и Бэкон.
- ^ "Анализ согласования атрибутов для баз данных дефектов | iSixSigma" .
- ^ а б Давидсхофер, Кевин Р. Мерфи, Чарльз О. (2005). Психологическое тестирование: принципы и приложения (6-е изд.). Река Аппер Сэдл, Нью-Джерси: Пирсон / Прентис-Холл. ISBN 978-0-13-189172-2.
Внешние ссылки
- Практическое объяснение повторяемости и воспроизводимости с точки зрения того, как данные могут различаться между образцами. - пример нефтяной отрасли