Повторяемость

Повторяемость или надежность повторного тестирования ^[1] - это степень соответствия результатов последовательных измерений одного и того же показателя , проводимых в одних и тех же условиях измерения. ^[2] Другими словами, измерения выполняются одним человеком или прибором на одном и том же объекте, в одинаковых условиях и за короткий период времени. Неидеальная надежность теста-повторного тестирования вызывает изменчивость теста-повторного тестирования . Такая изменчивость может быть вызвано, например, внутри индивидуальной изменчивости и изменчивости внутри наблюдателя . Можно сказать, что измерениеповторяемость, когда это отклонение меньше заранее определенного критерия приемки.

Вариативность тест – ретест практически используется, например, в медицинском мониторинге состояния. В этих ситуациях часто существует заранее определенная «критическая разница», и для различий в контролируемых значениях, которые меньше, чем это критическое различие, возможность предтестовой изменчивости в качестве единственной причины различия может рассматриваться в дополнение к: примеры, изменения в заболеваниях или методах лечения. ^[3]

Условия

Следующие условия должны быть выполнены при установлении повторяемости: ^[2]^[4]

те же экспериментальные инструменты
тот же наблюдатель
один и тот же измерительный прибор, используемый в одинаковых условиях
то же место
повторение за короткий промежуток времени.
те же цели

Методы повторяемости были разработаны Бландом и Альтманом (1986). ^[5]

Если корреляция между отдельными введениями теста высока (например, 0,7 или выше, как в этой альфа-внутренней таблице согласованности Кронбаха ^[6] ), то он имеет хорошую надежность теста-повторного тестирования.

Коэффициент повторяемости - это показатель точности, который представляет собой значение, ниже которого можно ожидать, что абсолютная разница между результатами двух повторных испытаний будет лежать с вероятностью 95%.

Стандартное отклонение в условиях повторяемости является частью точности и точности .

Анализ согласования атрибутов для баз данных дефектов

Анализ согласования атрибутов предназначен для одновременной оценки влияния повторяемости и воспроизводимости на точность. Это позволяет аналитику изучать ответы нескольких рецензентов, когда они рассматривают несколько сценариев несколько раз. Он производит статистику, которая оценивает способность оценщиков соглашаться с самими собой (повторяемость), друг с другом ( воспроизводимость ) и с известным основным или правильным значением (общая точность) для каждой характеристики - снова и снова. ^[7]

Психологическое тестирование

Поскольку один и тот же тест проводится дважды, и каждый тест является параллельным самому себе, различия между оценками теста и результатами повторного тестирования должны быть связаны исключительно с ошибкой измерения. Доводы такого рода вполне вероятно верны для многих физических измерений. Однако этот аргумент часто не подходит для психологического измерения, потому что часто невозможно рассматривать второе проведение теста в качестве меры, параллельной первому. ^[8]

Второе проведение психологического теста может давать систематически другие результаты, чем первое, по следующим причинам: ^[8]

Атрибут, который измеряется, может измениться между первым тестом и повторным тестом. Например, тест по чтению, который проводится в сентябре для третьего класса, может дать другие результаты при повторной сдаче в июне. Можно было бы ожидать некоторого изменения способности детей к чтению за этот промежуток времени, низкая корреляция между тестами и повторными тестами может отражать реальные изменения самого атрибута.
Опыт прохождения теста сам по себе может изменить истинную оценку человека. Например, заполнение списка тревожности может помочь повысить уровень тревожности человека.
Эффект переноса , особенно если интервал между тестом и повторным тестом короткий. При повторном тестировании люди могут вспомнить свой первоначальный ответ, что может повлиять на ответы при втором введении.

Смотрите также

Внешние ссылки

Практическое объяснение повторяемости и воспроизводимости с точки зрения того, как данные могут различаться между образцами. - пример нефтяной отрасли

[1] Типы надежности База знаний о методах исследования. Последняя редакция: 20 октября 2006 г.

[GUM-2] а ^б JCGM 100: 2008. Оценка данных измерений - Руководство по выражению неопределенности измерения (PDF) , Объединенный комитет руководств по метрологии, 2008 г.

[Fraser1989-3] Фрейзер, CG; Фогарти, Ю. (1989). «Интерпретация результатов лабораторных исследований» . BMJ (под ред. Клинических исследований) . 298 (6689): 1659–1660. DOI : 10.1136 / bmj.298.6689.1659 . PMC 1836738 . PMID 2503170 .

[NIST-4] Тейлор, Барри Н .; Куятт, Крис Э. (1994), Руководство NIST по оценке и выражению неопределенности результатов измерений NIST , Гейтерсбург, Мэриленд, США: Национальный институт стандартов и технологий

[5] «Статистические методы оценки соответствия между двумя методами клинического измерения» .

[6] Джордж Д. & Маллери, P. (2003). Пошаговая инструкция по SPSS для Windows: простое руководство и справочник. 11.0 обновление (4-е изд.). Бостон: Аллин и Бэкон.

[7] "Анализ согласования атрибутов для баз данных дефектов | iSixSigma" .

[David-8] а б Давидсхофер, Кевин Р. Мерфи, Чарльз О. (2005). Психологическое тестирование: принципы и приложения (6-е изд.). Река Аппер Сэдл, Нью-Джерси: Пирсон / Прентис-Холл. ISBN 978-0-13-189172-2.

[1]