В психометрии , прогностическая валидность является степень , в которой балл по шкале или тест предсказывает результаты по какому - либо критерию меры. [1] [2]
Например, валидность когнитивного теста на эффективность работы - это корреляция между оценками теста и, например, оценками эффективности руководителя. Такой когнитивный тест имел бы прогностическую ценность, если бы наблюдаемая корреляция была статистически значимой.
Прогностическая валидность имеет сходство с одновременной валидностью в том смысле, что обе оценки обычно измеряются как корреляции между тестом и некоторой критериальной мерой. При исследовании одновременной валидности тест проводится одновременно со сбором критериев. Это общий метод разработки доказательств достоверности для испытаний занятости: тест А администрируется действующих сотрудников, а затем оценка этих работников производительность труда является, или уже, получены независимо от теста (часто, как было отмечено выше, в форма рейтинга супервайзера). Обратите внимание на возможность ограничения диапазона как в тестовых оценках, так и в оценках производительности: действующие сотрудники, вероятно, будут более однородной и более эффективной группой, чем пул кандидатов в целом.
При строгом изучении прогностической достоверности в первую очередь собираются результаты тестов; затем через некоторое время будет собрана мера критерия. Что касается прогностической достоверности, пример немного отличается: тесты проводятся, возможно, с кандидатами на работу, а затем, после того, как эти люди проработают на работе в течение года, их результаты тестов коррелируют с результатами их работы за первый год. Другим подходящим примером являются баллы SAT : они подтверждаются путем сбора баллов в течение старшего года обучения и старшей школы, а затем ожидания в течение года (или более), чтобы сопоставить баллы со средним баллом первого года обучения в колледже . Таким образом, прогностическая достоверность дает несколько более полезные данные о валидности теста, поскольку они более точно соответствуют реальной ситуации, в которой будет использоваться тест. В конце концов, большинство тестов проводится для того, чтобы узнать что-то о будущем поведении.
Как и во многих аспектах социальных наук, величина корреляций, полученных в результате исследований прогнозной достоверности, обычно невелика. Типичная прогностическая достоверность теста на трудоустройство может получить корреляцию около r = 0,35. Иногда наблюдаются более высокие значения, а более низкие значения очень распространены. Тем не менее полезность (то есть выгода, получаемая при принятии решений с использованием теста), обеспечиваемая тестом с корреляцией 0,35, может быть весьма значительной. Более подробную информацию и объяснение взаимосвязи между дисперсией и достоверностью прогнозов можно найти здесь. [3]
Прогностическая валидность в современной теории валидности
Последние стандарты образовательного и психологического тестирования [4] отражают модель валидности Сэмюэля Мессика [5] и не используют термин «прогностическая валидность». Скорее, Стандарты описывают подтверждающие валидность «доказательства, основанные на взаимосвязях [между результатами теста и] другими переменными».
Прогностическая достоверность включает тестирование группы субъектов на предмет определенной конструкции, а затем сравнение их с результатами, полученными в какой-то момент в будущем.
Рекомендации
- ^ Кронбах, LJ, & Meehl, ПЭ (1955). Построить валидность для психологических тестов. Психологический бюллетень , 52 , 281-302. [1]
- ^ Совет по стандартам маркетинговой ответственности (MASB) одобряет это определение как часть своего текущего проекта «Общий язык в маркетинге» .
- ^ "Работают ли психометрические тесты?" .
- ^ Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (1999). Стандарты педагогического и психологического тестирования . Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
- ^ Мессик, S. (1995). Достоверность психологической оценки: Подтверждение выводов, сделанных на основе ответов и действий людей, в качестве научного исследования значения баллов. Американский психолог, 50 , 741-749.