Дополнительная валидность

Инкрементная валидность - это тип валидности, который используется для определения того , повысит ли новая психометрическая оценка прогностическую способность по сравнению с той, которая обеспечивается существующим методом оценки. ^[1] Другими словами, инкрементная достоверность пытается ответить, добавляет ли новый тест много информации, которую можно было бы получить с помощью более простых, уже существующих методов. ^[2]

Определение и примеры [ править ]

Когда оценка используется с целью прогнозирования результата (возможно, другого результата теста или какой-либо другой поведенческой меры), новый инструмент должен показать, что он может расширить наши знания или прогнозирование переменной результата сверх того, что уже известно на основе существующие инструменты. ^[3]

Положительным примером может быть клиницист, который использует технику интервью, а также специальный вопросник, чтобы определить, есть ли у пациента психическое заболевание, и имеет больший успех в определении психического заболевания, чем клиницист, который использует только метод интервью. Таким образом, конкретный вопросник будет считаться действующим постепенно. Поскольку анкета в сочетании с интервью позволила получить более точные определения и добавить информацию для клинициста, анкета становится действительной постепенно.

Статистические тесты [ править ]

Дополнительная валидность обычно оценивается с использованием нескольких методов регрессии . Сначала к данным подбирается регрессионная модель с другими переменными, а затем к модели добавляется основная переменная. Существенное изменение в статистике R-квадрата (с использованием F-критерия для определения значимости) интерпретируется как указание на то, что вновь добавленная переменная предлагает значительные дополнительные возможности прогнозирования для зависимой переменной по сравнению с переменными, ранее включенными в регрессионную модель. Напомним, что статистика R-квадрата в множественной регрессииотражает процент дисперсии, учтенной в переменной Y с использованием всех переменных X. Таким образом, изменение R-квадрата будет отражать процент отклонения, объясняемый переменной, добавленной в модель. Изменение R-квадрата более уместно, чем просто смотреть на необработанные корреляции, потому что необработанные корреляции не отражают перекрытия вновь введенной меры и существующих мер. ^[3]

Примером этого метода является прогнозирование среднего балла колледжа ( GPA ), где средний балл средней школы и баллы вступительных экзаменов (например, SAT , ACT ) обычно составляют значительную долю дисперсии среднего балла колледжа. Использование вступительных испытаний подтверждается дополнительными доказательствами действительности. Например, SAT до 2000 года коррелировал 0,34 со средним баллом первокурсника, в то время как средний балл средней школы коррелировал 0,36 со средним баллом первокурсника. ^[4]Может показаться, что оба показателя являются сильными предикторами среднего балла первокурсника, но на самом деле средний балл средней школы и баллы SAT также сильно коррелированы, поэтому нам нужно проверить, какую прогностическую силу мы получаем от SAT, когда мы учитываем средний балл средней школы. На возрастающую достоверность указывает изменение R-квадрата, когда в модель включен средний балл средней школы. В этом случае средний академический балл средней школы составляет 13% дисперсии среднего балла первокурсника, а комбинация среднего балла средней школы плюс SAT составляет 20% дисперсии среднего балла первокурсника. Таким образом, SAT добавляет 7 процентных пунктов к нашей предсказательной способности. Если это значительное и считается важным улучшением, то мы можем сказать, что SAT имеет дополнительную ценность по сравнению с использованием только среднего школьного GPA для прогнозирования GPA новичка.Любой новый критерий приема или тест должны иметь дополнительную предсказательную силу (инкрементная валидность), чтобы их можно было использовать для прогнозирования среднего балла в колледже, когда средний балл средней школы и результаты тестов уже известны.

См. Также [ править ]

Ссылки [ править ]

^ Sackett, Paul R .; Ливенс, Филип (2008). «Подбор персонала». Ежегодный обзор психологии . 59 : 419–450. DOI : 10.1146 / annurev.psych.59.103006.093716 . PMID 17854285 .
^ Лилленфилд и др. 2005 "Что не так с этой картиной?" www.psychologicalscience.org http://www.psychologicalscience.org/newsresearch/publications/journals/sa1_2.pdf
^ ^а ^б Хейнс, С. Н.; Ленч, ХК (2003). «Дополнительная валидность новых мер клинической оценки» (PDF) . Психологическая оценка . 15 (4): 456–466. DOI : 10.1037 / 1040-3590.15.4.456 . PMID 14692842 . Проверено 13 декабря 2013 года .
^ Бриджмен, B .; McCamley-Jenkins, L .; Эрвин, Н. (2000). «Прогнозы среднего успеваемости первокурсника на основе пересмотренного и перецентрированного SAT® I: Reasoning Test» (PDF) . Ets Rr 00-1 . Служба образовательного тестирования, Принстон, штат Нью-Джерси . Проверено 13 декабря 2013 года .

[Sackett-1] Sackett, Paul R .; Ливенс, Филип (2008). «Подбор персонала». Ежегодный обзор психологии . 59 : 419–450. DOI : 10.1146 / annurev.psych.59.103006.093716 . PMID 17854285 .

[2] Лилленфилд и др. 2005 "Что не так с этой картиной?" www.psychologicalscience.org http://www.psychologicalscience.org/newsresearch/publications/journals/sa1_2.pdf

[Haynes-3] а ^б Хейнс, С. Н.; Ленч, ХК (2003). «Дополнительная валидность новых мер клинической оценки» (PDF) . Психологическая оценка . 15 (4): 456–466. DOI : 10.1037 / 1040-3590.15.4.456 . PMID 14692842 . Проверено 13 декабря 2013 года .

[Bridgeman-4] Бриджмен, B .; McCamley-Jenkins, L .; Эрвин, Н. (2000). «Прогнозы среднего успеваемости первокурсника на основе пересмотренного и перецентрированного SAT® I: Reasoning Test» (PDF) . Ets Rr 00-1 . Служба образовательного тестирования, Принстон, штат Нью-Джерси . Проверено 13 декабря 2013 года .

[1]