Теория отклика элемента

В психометрии теория отклика на задание ( IRT ) (также известная как теория латентных черт , теория сильной истинной оценки или современная теория умственных тестов ) представляет собой парадигму разработки, анализа и подсчета баллов в тестах , опросниках и подобных инструментах , измеряющих способности . отношение или другие переменные. Это теория тестирования, основанная на взаимосвязи между показателями отдельных лиц по элементу теста и уровнями результатов испытуемых по общему показателю способности, для измерения которого был разработан этот элемент. Несколько различных статистических моделей используются для представления характеристик как предметов, так и испытуемых.^[1] В отличие от более простых альтернатив для создания шкал и оценки ответов на вопросник, здесь не предполагается, что каждый пункт одинаково сложен. Это отличает IRT, например, от шкалы Лайкерта , в которой « все элементы считаются репликациями друг друга или, другими словами, элементы считаются параллельными инструментами»^[2] (стр. 197). В отличие от этого, теория отклика на задание рассматривает сложность каждого задания (характеристические кривые задания или ICC ) как информацию, которая должна быть включена в элементы шкалирования.

Он основан на применении соответствующих математических моделей к данным тестирования . Поскольку он часто рассматривается как превосходящий классическую теорию тестов , ^[3] это предпочтительный метод для разработки шкал в Соединенных Штатах, ^{[ необходима цитата ]} , особенно когда требуются оптимальные решения, как в так называемых тестах с высокими ставками , например , выпускной экзамен (GRE) и вступительный тест для выпускников (GMAT).

Теория отклика на название предмета связана с тем, что теория фокусируется на предмете, в отличие от фокуса на уровне теста классической теории тестирования. Таким образом, IRT моделирует реакцию каждого испытуемого с заданной способностью на каждый элемент теста. Термин « элемент » является общим и охватывает все виды информационных элементов. Это могут быть вопросы с несколькими вариантами ответов, которые имеют неправильные и правильные ответы, но также обычно представляют собой утверждения в анкетах, которые позволяют респондентам указать уровень согласия ( рейтинг или шкала Лайкерта ), или симптомы пациента, оцененные как наличие/отсутствие, или диагностическую информацию в комплексе . системы.

IRT основан на идее, что вероятность правильного/введенного ответа на вопрос является математической функцией параметров человека и пункта . (Выражение «математическая функция параметров человека и предмета» аналогично уравнению Курта Левина B = f(P, E) , которое утверждает, что поведение является функцией человека в его окружении.) Параметр человека понимается как ( обычно) одна скрытая черта или измерение. Примеры включают общий интеллектили сила отношения. Параметры, по которым характеризуются элементы, включают их сложность (известную как «местоположение» из-за их местоположения в диапазоне сложности); различение (наклон или корреляция), показывающее, насколько сильно степень успеха людей зависит от их способностей; и параметр псевдоугадывания, характеризующий (нижнюю) асимптоту , при которой даже наименее способные люди будут получать баллы благодаря угадыванию (например, 25% для чистой случайности в задании с множественным выбором с четырьмя возможными ответами).

Точно так же IRT можно использовать для измерения поведения человека в социальных сетях. Мнения, выраженные разными людьми, могут быть объединены для изучения с помощью IRT. Его использование для классификации информации как дезинформации или достоверной информации также было оценено.

Рисунок 1: Пример 3PL IRF с наложенными пунктирными линиями для демонстрации параметров.