Психометрическое программное обеспечение - это программное обеспечение, которое используется для психометрического анализа данных тестов , анкет или описей, отражающих скрытые психообразовательные переменные. Хотя некоторые психометрические анализы можно проводить с помощью стандартного статистического программного обеспечения, такого как SPSS , для большинства анализов требуются специальные инструменты. [ необходима цитата ]
Источники
Существует множество бесплатных инструментов, разработанных исследователями и преподавателями. Важные веб-сайты бесплатного психометрического программного обеспечения включают:
- CASMA в Университете Айовы, США
- REMP в Массачусетском университете, США
- Программное обеспечение от Гарольда Дорана
- Программное обеспечение от Брэда Хэнсона
- Программное обеспечение от John Uebersax
- Программное обеспечение от Дж. Патрика Мейера
- Каталог программного обеспечения в Институте объективных измерений
- Программное обеспечение от Lihua Yao
- Программное обеспечение от Ларри Нельсона
Кроме того, растет количество пакетов для R, которые можно найти в представлении задач CRAN: психометрические модели и методы.
Классическая теория тестирования
Классическая теория тестирования - это подход к психометрическому анализу, который имеет более слабые предположения, чем теория ответов на вопросы, и более применим к меньшим размерам выборки.
CITAS
CITAS (Таблица классических заданий и анализа тестов) - это бесплатная рабочая книга Excel, предназначенная для подсчета баллов и статистического анализа аудиторных тестов. Ответы на вопросы (ABCD) и ключи набираются или вставляются в книгу, а выходные данные заполняются автоматически; В отличие от некоторых других программ, CITAS не требует какого-либо «бега» или опыта психометрического анализа, что делает его доступным для школьных учителей и профессоров.
jMetrik
jMetrik - это бесплатное программное обеспечение с открытым исходным кодом для проведения всестороннего психометрического анализа. Он был разработан Дж. Патриком Мейером из Университета Вирджинии . Текущие методы включают классический анализ заданий, анализ дифференциального функционирования заданий (DIF), подтверждающий факторный анализ, теорию ответов заданий, IRT-уравнение и теорию непараметрических ответов заданий. Анализ элемента включает пропорциональную, точечную бисериальную и бисериальную статистику для всех вариантов ответа. Коэффициенты надежности включают альфа Кронбаха, лямбду Гуттмана, коэффициент Фельдта-Гилмера, коэффициент Фельдта-Бреннана, индексы согласованности решений, условную стандартную ошибку измерения и надежность в случае удаления элемента. Анализ DIF основан на непараметрических характеристических кривых элемента и процедуре Мантеля-Хензеля. Размеры эффекта DIF и классификации ETS DIF включены в результат. Подтверждающий факторный анализ ограничивается моделью общих факторов для конгенерических, тау-эквивалентных и параллельных мер. Статистика соответствия сообщается вместе с факторными нагрузками и дисперсиями ошибок. Методы IRT включают модели Раша, частичного кредита и рейтинговую шкалу. Методы приравнивания IRT включают в себя процедуры среднее / среднее, среднее / сигма, процедуры Haebara и Stocking-Lord.
jMetrik также включает иллюстратор IRT , базовую описательную статистику и графическое средство, которое создает гистограммы, круговые диаграммы, гистограммы, оценки плотности ядра и линейные графики.
jMetrik - это чистое приложение Java, работающее в 32-битных и 64-битных версиях операционных систем Windows, Mac и Linux. jMetrik требует Java 1.6 на главном компьютере.
Iteman
Iteman - это коммерческая программа для Windows, специально разработанная для анализа классических тестов. Он уникален тем, что он создает технические отчеты в формате Microsoft Word, а не в формате ASCII, с графикой, описаниями и встроенными таблицами. Он вычисляет пропорцию и точку бисериала каждого элемента, а также пропорции высокой / низкой подгруппы и подробные графики производительности элемента. Он также вычисляет типичную описательную статистику, включая среднее значение, стандартное отклонение, надежность и стандартную ошибку измерения, для каждого домена и общих тестов. Он доступен только в Assessment Systems Corporation .
Лертап
Lertap5 (пятая версия программы анализа тестов Лаборатории образовательных исследований) - это комплексный программный пакет для анализа классических тестов, разработанный для использования на компьютерах Windows и Macintosh с Microsoft Excel . Он включает в себя статистику тестов, предметов и опций, анализ согласованности классификации и мастерства, процедуры обнаружения мошенничества и обширные графики (например, линии трассировки для опций предметов, условные стандартные ошибки измерения, осыпные диаграммы , коробчатые диаграммы групповых различий, гистограммы и т. Д. диаграммы рассеяния).
DIF, функция дифференциального элемента, поддерживается в версиях Lertap5 для Excel 2010, Excel 2013, Excel 2016 и Excel 2019. Используются методы Мантеля-Хензеля; представлены графики результатов, включая эмпирические графики DIF.
Пользователи IRT, теории отклика элементов, могут использовать четыре специальных варианта: один будет создавать файлы данных и управления элементами, необходимые для Xcalibre; другой устанавливает файл ASCII для Bilog MG; третий подготавливает данные для обработки с помощью SAS и напишет подходящие строки кода SAS для использования с модулями SAS IRT; четвертый взаимодействует с версией пакета R для Excel под названием «RIRT», что позволяет пользователям калибровать элементы, не выходя из Excel.
Доступно несколько образцов наборов данных для использования с Lertap и / или другими программами анализа предметов и тестов; они включают как когнитивные тесты, так и аффективные (или рейтинговые) шкалы. Также доступны технические документы, связанные с применением Lertap5.
Lertap5 был разработан Ларри Нельсоном из Университета Кертина и доступен на Lertap5.com .
КРАН
TAP (Программа анализа тестов) - это бесплатная программа для Windows 9x / NT / 2000 / XP / 7, написанная на Delphi Pascal, которая выполняет анализ тестов и анализ элементов на основе классической теории тестирования. TAP - это классическая программа тестирования и анализа заданий. Он предоставляет отчеты об общих баллах экзаменуемых, статистику заданий (например, сложность задания, различение заданий, двухуровневый анализ), анализ вариантов и другую полезную информацию. TAP также предоставляет отдельные экзаменуемые отчеты об общих баллах и ответах на вопросы.
ViSta-CITA
ViSta-CITA (классический анализ заданий и тестов) - это модуль, включенный в систему визуальной статистики ( ViSta ), который фокусируется на графических методах, применяемых для психометрического анализа. Его разработали Рубен Ледесма, Дж. Габриэль Молина, Педро М. Валеро-Мора и Форрест В. Янг. ViSta не обновлялась с 2014 года.
психопат
Пакет R. Ряд процедур для личности, психометрии и экспериментальной психологии. Функции предназначены в первую очередь для построения шкалы с использованием факторного анализа, кластерного анализа и анализа надежности, хотя другие функции предоставляют основную описательную статистику. Теория отклика на предмет проводится с использованием факторного анализа тетрахорических и полихорических корреляций. Включены функции для моделирования конкретных элементов и структур тестов. Некоторые функции служат полезным интерфейсом для моделирования структурных уравнений. Графические изображения диаграмм путей, факторного анализа и структурных уравнений создаются с использованием базовой графики. Некоторые из функций написаны для поддержки книги по психометрии, а также публикаций по исследованиям личности. Для получения дополнительной информации посетите веб-страницу personal-project.org/r.
Калибровка теории отклика элемента
Теория отклика на предмет (IRT) - это психометрический подход, который предполагает, что вероятность определенного отклика является прямой функцией лежащей в основе черты или черт. Для моделирования этой взаимосвязи были предложены различные функции, и различные пакеты калибровки отражают это. Несколько программных пакетов были разработаны для дополнительного анализа, такого как приравнивание ; они перечислены в следующем разделе.
БИЛОГ-МГ
BILOG-MG - это программа для IRT-анализа дихотомических (правильных / неправильных) данных, включая соответствие и дифференциальное функционирование элементов . Он коммерческий и доступен только от Scientific Software International или Assessment Systems Corporation .
декстер
dexter , впервые опубликованный в феврале 2017 года, представляет собой пакет R, предназначенный как надежную и достаточно полную систему для управления и анализа данных испытаний, организованных в буклеты. Пакет включает средства для импорта и управления тестовыми данными, оценки и улучшения качества данных с помощью базового анализа тестов и заданий, подбора модели IRT и вычисления различных оценок способностей. Предоставляются многие психометрические методы, не встречающиеся в других местах, такие как модель взаимодействия Хабермана (2007), обобщенная для политомических элементов, эффективное генерирование правдоподобных значений или оценок, новые методы исследовательского и подтверждающего анализа DIF, поддержка метода стандартизации 3DC и многие другие. более. Центральная модель IRT является политомическим обобщением расширенной маргинальной модели Раша. Оценка выполняется с помощью CML или байесовских методов. Есть два дополнительных пакета: dextergui , впервые опубликованный в июне 2018 года и обеспечивающий простой графический интерфейс для наиболее широко используемых функций в dexter; и dexterMST , впервые опубликованный в июле 2018 года, для управления и анализа данных из многоэтапных тестов. Все пакеты подробно документированы как для новичков, так и для профессионалов (см. Также блог ).
Грани
Facets - это программа для анализа Рашем данных, полученных при посредничестве оценщика или судьи, таких как оценки за сочинения, соревнования по прыжкам в воду, опросы об удовлетворенности и данные о качестве жизни. Другие приложения включают данные о порядке ранжирования, биномиальные испытания и подсчеты Пуассона.
flexMIRT
Программное обеспечение flexMIRT IRT - это многоуровневый пакет программного обеспечения для нескольких групп для анализа элементов, калибровки элементов и оценки результатов испытаний. Программный пакет flexMIRT IRT подходит для множества одномерных и многомерных моделей теории отклика элементов (также известных как модели факторного анализа элементов) для одноуровневых и многоуровневых данных в любом количестве групп.
irtoys
irtoys - это пакет R, впервые опубликованный в 2007 году и поддерживающий почти все в книге, но ограниченный одним буклетом дихотомических элементов. Он хорош для обучения, небольших проектов, как швейцарский нож психометра и как источник строительных камней для других проектов. Файлы простого синтаксиса для ICL и BILOG-MG, которые он пишет, можно изучать и изменять для решения более сложных проблем.
ICL
ICL (командный язык IRT) выполняет калибровку IRT, включая модели логистики с 1, 2 и 3 параметрами, а также модель частичного кредита и обобщенную модель частичного кредита. Он также может генерировать данные ответа. Как следует из названия, он полностью управляется кодом команд и не имеет графического пользовательского интерфейса.
jMetrik
jMetrik - это бесплатное программное обеспечение с открытым исходным кодом для проведения всестороннего психометрического анализа. Он был разработан Дж. Патриком Мейером из Университета Вирджинии . Текущие методы включают классический анализ заданий, анализ дифференциального функционирования заданий (DIF), теорию ответов заданий, IRT-уравнение и теорию непараметрических ответов заданий. Анализ элемента включает пропорциональную, точечную бисериальную и бисериальную статистику для всех вариантов ответа. Коэффициенты надежности включают альфа Кронбаха, лямбду Гуттмана, коэффициент Фельдта-Гилмера, коэффициент Фельдта-Бреннана, индексы согласованности решений, условную стандартную ошибку измерения и надежность в случае удаления элемента. Анализ DIF основан на непараметрических характеристических кривых элемента и процедуре Мантеля-Хензеля. Размеры эффекта DIF и классификации ETS DIF включены в результат. Методы IRT включают модели Раша, частичного кредита и рейтинговую шкалу, оцениваемую с помощью JMLE. jMetrik также предоставляет модели 3PL, 4PL и обобщенные модели частичного кредита, оцениваемые через MMLE. Методы оценки личности включают MLE, MAP и EAP. Методы приравнивания IRT включают в себя процедуры среднее / среднее, среднее / сигма, процедуры Haebara и Stocking-Lord.
jMetrik также включает базовую описательную статистику и графическое средство, которое создает гистограммы, круговые диаграммы, гистограммы, оценки плотности ядра и линейные графики.
jMetrik - это чистое приложение Java, работающее в 32-битных и 64-битных версиях операционных систем Windows, Mac и Linux. jMetrik требует Java 1.6 на главном компьютере.
Lertap5
В основном это классическая программа теории тестирования, но Lertap5 поддерживает пользователей Xcalibre, Bilog-MG, подпрограмм IRT в SAS и «EIRT», эквивалента пакета «RIRT» для Excel. Lertap5 запускает «приложение» Excel, как и EIRT. Сочетание этих двух программ делает калибровку элементов очень возможной с использованием только Excel.
МУЛЬТИЛОГ
MULTILOG - это расширение BILOG для данных с политомическими (множественными) ответами. Он коммерческий и доступен только от Scientific Software International или Assessment Systems Corporation.
BMIRT
BMIRT - это бесплатная многоцелевая прикладная программа на Java, которая выполняет калибровку элементов и оценку способностей в рамках многомерной, многогрупповой модели реакции элементов (IRT); он может соответствовать дихотомическим или политомическим моделям, а также смешанным моделям. Он поддерживает как исследовательские, так и подтверждающие модели MIRT, как компенсаторные, так и некомпенсирующие.
ПАРСКАЛЬ
PARSCALE - это программа, разработанная специально для политомического IRT-анализа. Он коммерческий и доступен только от Scientific Software International или Assessment Systems Corporation .
ПАРАМ-3ПЛ
PARAM-3PL - бесплатная программа для калибровки 3-параметрической логистической модели IRT. Он был разработан Лоуренсом Руднером из Информационного центра образовательных ресурсов (ERIC). Последней версией была версия 0.93, выпущенная в августе 2012 года.
ТЕСТФакт
Возможности Testfact - Исследовательский факторный анализ с предельным максимальным правдоподобием (MML) и классический элементный анализ двоичных данных - Вычисляет тетрахорические корреляции, решение главного фактора, классическую описательную статистику элементов, таблицы и графики фрактилей - Обрабатывает до 10 факторов с использованием числовой квадратуры: до 5 для неадаптивных и до 10 для адаптивных квадратурных - Обработка до 15 факторов с использованием методов интеграции Монте-Карло - Varimax (ортогональная) и PROMAX (наклонная) ротация факторных нагрузок - Обработка важной формы подтверждающего факторного анализа, известного как «бифакторный» анализ: шаблон факторов состоит из одного основного фактора и групповых факторов - Моделирование ответов на элементы на основе параметров, заданных пользователем - Коррекция угаданных и недостигнутых элементов - Позволяет наложить ограничения на оценки параметров элемента - Обрабатывает пропущенные и не представленные элементы - Подробная онлайн-документация HELP включает синтаксис и аннотированные примеры.
WINMIRA 2001
WINMIRA 2001 - это программа для анализа с использованием модели Раша для дихотомических и политомических порядковых ответов, с анализом латентных классов и с моделью Раша распределения смеси для дихотомических и политомических ответов на вопросы. [1] [2] Программное обеспечение обеспечивает оценку условного максимального правдоподобия (CML) параметров элемента, а также оценки MLE и WLE параметров человека, статистику соответствия человека и элемента, а также информационные критерии (AIC, BIC, CAIC ) для выбора модели. Программа также выполняет параметрическую процедуру начальной загрузки для выбора количества компонентов смеси. Бесплатная версия для студентов доступна на веб-странице Матиаса фон Давьера, а также доступна коммерческая версия.
Winsteps
Winsteps - это программа, разработанная для анализа с помощью модели Раша , однопараметрической модели теории ответа элемента, которая отличается от модели 1PL тем, что каждый человек в выборке человека параметризован для оценки элемента, и он является предписывающим и ориентированным на критерии, а не описательный и нормативный по своей природе. [3] Он коммерчески доступен от Winsteps, Inc. Также доступна предыдущая версия для DOS, BIGSTEPS.
Xcalibre
Xcalibre - это коммерческая программа, которая выполняет оценку предельного максимального правдоподобия как дихотомических (1PL-Rasch, 2PL, 3PL), так и всех основных политомических моделей IRT. Интерфейс - наведи и щелкни; код команды не требуется. Его результаты включают в себя как электронные таблицы, так и подробный отчет с повествованием со встроенными таблицами и рисунками, который можно распечатать и передать экспертам в предметной области для анализа. Он доступен только в Assessment Systems Corporation .
ИАТА
IATA - это программный пакет для анализа данных психометрической и образовательной оценки. Интерфейс основан на принципах «укажи и щелкни», и все функциональные возможности предоставляются через интерфейсы в стиле мастера, основанные на различных рабочих процессах или целях анализа, таких как пилотное тестирование или приравнивание. IATA считывает и записывает файлы в форматах CSV, Excel и SPSS и создает экспортируемые графики для всех статистических анализов. Каждый анализ также включает эвристику, предлагающую соответствующую интерпретацию численных результатов. IATA выполняет факторный анализ, (1PL-Rasch, 2PL, 3PL) масштабирование и калибровку, анализ функционирования дифференциальных элементов (DIF), (базовую) разработку компьютерных тестов, приравнивание, установку стандартов на основе IRT, согласование оценок и создание правдоподобных значений. Его можно бесплатно получить в «Полиметрика Интернэшнл».
грязь
Пакет R. Анализ данных дихотомических и политомических ответов с использованием одномерных и многомерных моделей скрытых признаков в рамках парадигмы теории ответов на вопросы. Исследовательские и подтверждающие модели могут быть оценены квадратурными (EM) или стохастическими (MHRM) методами. Подтверждающий двухфакторный и двухуровневый анализы доступны для моделирования тестовых заданий. Также доступны множественный групповой анализ и схемы со смешанными эффектами для обнаружения различного функционирования элементов и моделирования ковариат элементов и людей.
ltm
Пакет R. Анализ многомерных дихотомических и политомических данных с использованием моделей скрытых признаков в рамках подхода Теории отклика на предмет. Он включает модели Раша, двухпараметрическую логистику, трехпараметрическую модель Бирнбаума, модели дифференцированного ответа и обобщенные модели частичного кредита.
ТАМ
Пакет R. Пакет включает в себя предельную и совместную оценку максимального правдоподобия одно- и многомерных моделей ответа на вопросы (Rasch, 2PL, Generalized Partial Credit, Rating Scale, Multi Facets), статистику соответствия, оценку стандартной ошибки, а также вменение правдоподобного значения и оценку взвешенного правдоподобия. способности.
ACER ConQuest
ACER ConQuest - это компьютерная программа для подбора как одномерных, так и многомерных ответов элемента и моделей латентной регрессии. Он обеспечивает анализ данных на основе всеобъемлющего и гибкого набора моделей ответа на вопросы (IRM), позволяя исследовать свойства оценок производительности, традиционных оценок и рейтинговых шкал. ACER ConQuest 4 также предлагает более широкие процедуры измерения и анализа исследовательского сообщества, основанные на самых современных психометрических методах многогранных моделей ответов на вопросы, многомерных моделей ответов на вопросы, моделей скрытой регрессии и построения правдоподобных значений.
irtplay
Пакет R. Подбирайте модели теории одномерных ответов (IRT) для смеси дихотомических и политомических данных, откалибруйте параметры онлайн-заданий, оцените скрытые способности испытуемых и изучите соответствие данных модели IRT на уровне заданий различными способами, а также предоставьте связанные полезные функции. к одномерному IRT.
МИРТ
Общая программа с открытым исходным кодом для анализа ответов на вопросы, разработанная в Службе образовательного тестирования. [4] Программа может обрабатывать независимые переменные, многомерные параметры способностей, неполные данные и сложную выборку. Переменные способностей могут быть политомическими или многомерными нормальными, а элементы могут быть дихотомическими или политомическими.
Дополнительное программное обеспечение теории отклика элементов
Из-за сложности IRT существует несколько программных пакетов, способных выполнять калибровку. Однако существует множество программ для специальных вспомогательных IRT-анализов, таких как уравнивание и масштабирование. Примеры такого программного обеспечения приведены ниже.
LinkMIRT
LinkMIRT - это бесплатная прикладная программа Java, которая связывает два набора параметров элементов в многомерной структуре IRT (MIRT). Программное обеспечение может реализовывать метод Stocking и Lord, метод среднего / среднего и метод среднего / сигма. Поддерживаются ссылки с помощью комментатора и случайных эквивалентных групп.
МЕТРИКИ
МЕТРИКИ (Методы приравнивания , тестирования, регрессии, теории ответов заданий и подсчета баллов) - это бесплатное веб-приложение для психометристов. Он был разработан Гарольдом Дораном из Американского исследовательского института. Программное обеспечение включает среду для использования интерактивных визуальных отображений данных вместе с различными инструментами исследования данных, вычисление надежности с использованием альфы Кронбаха, стратифицированной альфы и Фельдта-Раджу, а также дисперсий складного ножа, классического анализа тестовых заданий, статистики соответствия на основе IRT. включая графики соответствия заданий, статистику Йены за первый и третий кварталы, шесть различных методов приравнивания вместе с визуальным отображением характеристических кривых элементов после связывания и кривых характеристик теста, полный механизм оценки тестов на основе IRT для оценки одномерных и многомерных моделей с заданным набором параметров элемента , методы согласованности и точности классификации, модели линейной регрессии, включая линейные модели с фиксированными эффектами и смешанными эффектами, предназначенные для учета ошибок измерения в переменных-предикторах, а также процедуры прямой оценки, используемые в анализах в стиле NAEP.
СимуМИРТ
SimuMIRT - это программа, которая имитирует многомерные данные (способности испытуемого и ответы на вопросы) для теста фиксированной формы (например, бумага и карандаш) на основе заданного пользователем набора параметров. Поддерживается модель рейтингового эффекта.
SimuMCAT
SimuMCAT - это бесплатная прикладная программа Java, моделирующая многомерный компьютерный адаптивный тест (MCAT). Пользователь может выбрать одну из пяти различных процедур выбора элемента MCAT (объем, информация Кульбака-Лейблера, минимизация дисперсии ошибок линейной комбинации, минимальный угол и минимизация дисперсии ошибок составной оценки с оптимизированным весом). [5] Возможны два подхода к контролю экспозиции: традиционный подход Симпсона-Хеттера и подход максимального контроля экспозиции. Также возможно реализовать ограничения содержимого с помощью метода Priority Index. Различные правила остановки реализуются с тестом фиксированной длины и тестом переменной длины. Пользователь указывает истинные способности экзаменуемого, пулы заданий и процедуры выбора заданий, и программа выводит выбранные задания с ответами и оценками способностей. Пользователь может указать байесовские и небайесовские методы. Пулы способностей и предметов экзаменуемых также могут быть созданы из программы с помощью указанных пользователем дистрибутивов.
IRTEQ
IRTEQ - это бесплатное приложение с графическим интерфейсом пользователя для Windows, которое реализует масштабирование и уравнивание IRT, разработанное Кьюнгом (Крисом) Т. Ханом. В нем реализованы методы масштабирования / приравнивания IRT, которые широко используются с дизайном «Тест якоря для неэквивалентных групп»: методы Среднее / Среднее, Среднее / Сигма, Робастное Среднее / Сигма и методы TCC. [6] [7] [8] [9] [10] Для методов TCC IRTEQ предоставляет пользователю возможность выбирать различные распределения оценок для включения в функцию потерь. IRTEQ поддерживает различные популярные одномерные модели IRT: логистические модели для дихотомических ответов (с 1, 2 или 3 параметрами) и обобщенную модель частичного кредита (GPCM) (включая модель частичного кредита (PCM), которая является частным случаем GPCM) и Модель Graded Response Model (GRM) для политомических ответов. IRTEQ может также приравнять результаты тестов по шкале теста к шкале другого теста, используя приравнивание истинных баллов IRT. [11]
ResidPlots-2
ResidPlots-2 - бесплатная программа для графического анализа остатков IRT. Его разработали Тие Лян, Кьюнг (Крис) Т. Хан и Рональд К. Хэмблтон из Массачусетского университета в Амхерсте .
WinGen
WinGen - это бесплатная программа для Windows, которая генерирует параметры IRT и ответы на элементы. Кьюнг (Крис) Т. Хан из Массачусетского университета в Амхерсте . [12]
ST
ST проводит преобразование шкалы теории ответа элемента (IRT) для тестов с дихотомической оценкой.
ПОЛИСТ
POLYST выполняет преобразование шкалы IRT для тестов с дихотомической и политомической оценкой.
СТЮРТ
STUIRT выполняет преобразования шкалы IRT для тестов смешанного формата (тесты, которые включают некоторые элементы с множественным выбором и некоторые политомические элементы).
звенеть
Пакет R. Этот пакет использует методы теории отклика элемента для вычисления констант связывания и проведения цепной связи одномерных или многомерных тестов для нескольких групп в рамках общего дизайна элемента. Одномерные методы включают в себя методы Среднее / Среднее, Среднее / Сигма, Хаэбара и Методы Штокинга-Лорда для дихотомических (1PL, 2PL и 3PL) и / или политомических (дифференцированный ответ, частичная оценка / обобщенная частичная оценка, номинальная оценка и множественный выбор). модель) шт. Многомерные методы включают метод наименьших квадратов и расширения метода Хэбары и Стокинга-Лорда с использованием одного или нескольких параметров расширения для многомерных расширений всех одномерных дихотомических и политомических моделей ответа элемента. Пакет также включает функции для импорта параметров предметов и / или способностей из общего программного обеспечения IRT, проведения истинного балла IRT и приравнивания наблюдаемых баллов, а также построения кривых / поверхностей отклика предметов, векторных графиков и сравнительных графиков для изучения дрейфа параметров.
Последовательность решений
Методы согласованности решений применимы к тестам , основанным на критериях, таким как экзамены на получение лицензии и тестирование академического мастерства.
Iteman
Iteman обеспечивает индекс согласованности решений, а также классическую оценку условной стандартной ошибки измерения в cutscore, который часто требуется для аккредитации программы тестирования.
jMetrik
jMetrik - это бесплатное программное обеспечение с открытым исходным кодом для проведения всестороннего психометрического анализа. Подробная информация указана выше. jMetrik включает оценки согласованности решений Huynh, если сокращенные баллы представлены в анализе элемента.
Лертап
Лертап вычисляет несколько статистических данных, связанных с согласованностью решений и классификаций, включая коэффициент Ливингстона, индекс надежности Бреннана-Кейна, каппу и оценку p (0), количество правильных классификаций как пропорцию, полученную с использованием адаптации Пэн-Субковиака Метод Хюня. Более подробная информация о Lertap приведена выше в разделе «Классическая теория тестирования».
Прочие анализы
Большая часть психометрического программного обеспечения предназначена для анализа данных ответов для оценки выполнения заданий и тестов; большая часть приведенного выше программного обеспечения ориентирована на это. Некоторое программное обеспечение предназначено для других психометрических анализов.
ПРОСЕЯТЬ
SIFT предназначен для криминалистической экспертизы данных, а именно для поиска доказательств мошенничества или другого поведения, которое угрожает достоверности и целостности теста. Это программа для Windows с пользовательским интерфейсом «укажи и щелкни» и выводом Microsoft Excel .
Обнаружение копирования
CopyDetect - это пакет R, который разработан для криминалистической экспертизы данных, а именно для поиска доказательств мошенничества или другого поведения, которое угрожает достоверности и целостности теста.
TestAssembler
TestAssembler - это программа для Windows, которая выполняет автоматическую сборку тестов.
ATA
ATA - это пакет R для автоматизированной тестовой сборки.
Программное обеспечение для общего статистического анализа
Программное обеспечение, разработанное для общего статистического анализа, часто может использоваться для определенных типов психометрического анализа. Более того, часто доступен код для более сложных типов психометрического анализа.
р
R - это среда программирования, предназначенная для статистических вычислений и создания графики. Базовая функциональность R может быть расширена путем установки дополнительных «пакетов», а список пакетов, связанных с психометрией, поддерживается на веб-сайте CRAN . [13]
SAS
SAS - это коммерчески доступный пакет для статистического анализа и обработки данных. Он также основан на командах.
SPSS
SPSS , первоначально называвшаяся «Статистический пакет для социальных наук», представляет собой коммерческую программу общего статистического анализа, в которой данные представлены в виде электронной таблицы, а общий анализ управляется с помощью меню.
S-Plus
S-Plus представляет собой коммерческий пакет анализа , основанный на языке программирования S .
Stata
Stata - это коммерческий пакет. Реализация IRT в Stata включает в себя логистические модели с 1, 2 и 3 параметрами, модели дифференцированного ответа, модели частичного кредита и обобщенные модели частичного кредита, модели рейтинговой шкалы и модель номинального ответа для неупорядоченных категориальных ответов. Он управляется панелью управления, которая позволяет пользователю определять модель, проверять соответствие численно и графически и исследовать функционирование дифференциального элемента из единого интерфейса. [14]
Смотрите также
- Психологическое тестирование
- Автоматическая генерация предметов
Рекомендации
- ^ Рост, Дж. (1990). Модели Раша в скрытых классах: интеграция двух подходов к анализу элементов. Прикладное психологическое измерение, 14, 271-282.
- ^ фон Дэвье, М., & Рост, Дж. (1995). Политомические смешанные модели Раша . В GH Fischer & IW Molenaar (Eds.), Модели Раша, фонды, последние разработки и приложения (стр. 371-382). Нью-Йорк: Спрингер.
- ^ Дихотомическая модель Раша против однопараметрической логистической модели [1] . Rasch Measurement Transactions [2] , 2005, 19: 3 с. 1032
- ^ https://github.com/EducationalTestingService/MIRT
- ↑ Яо, Лихуа (17 мая 2012 г.). «Методы многомерного выбора пункта CAT для оценок предметной области и составных оценок: теория и приложения». Психометрика . 77 (3): 495–523. DOI : 10.1007 / s11336-012-9265-5 . ISSN 0033-3123 . PMID 27519778 .
- Перейти ↑ Loyd & Hoover, 1980
- ↑ Марко, 1977.
- ^ Linn, Levine, Гастингс, и Уордроп, 1981
- ^ Haebara, Т. (1980). Приравнивание шкал логистических возможностей методом взвешенных наименьших квадратов. Японские психологические исследования, 22 , 144-149.
- Перейти ↑ Stocking, ML, & Lord, FM (1983). Разработка общей метрики в теории ответов на вопросы. Прикладное психологическое измерение, 7 , 201-210.
- ^ Лорд, FM (1980). Применение теории отклика элемента к практическим задачам тестирования . Махва, Нью-Джерси: Lawrence Erlbaum Associates, Inc.
- Перейти ↑ Han, KT (2007). WinGen: программное обеспечение Windows, которое генерирует параметры IRT и ответы на элементы. Прикладное психологическое измерение, 31 , 457-459.
- ^ [3] Обзор задач CRAN: психометрические модели и методы
- ^ [4] Интернет-руководство Статы по IRT