Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В психометрики , достоверность содержания (также известная как логическое действие ) относится к степени , в которой мера представляет все аспекты данной конструкции. Например, шкале депрессии может не хватать достоверности содержания, если она оценивает только аффективный аспект депрессии, но не принимает во внимание поведенческий аспект. Элемент субъективности существует в отношении определения достоверности содержания, что требует определенной степени согласия в отношении того, что представляет собой конкретная черта личности, такая как экстраверсия . Разногласия по поводу черт личности не позволят получить высокую достоверность содержания. [1]

О достоверности содержания [ править ]

Валидность контента отличается от фактической валидности , которая относится не к тому, что на самом деле измеряет тест, а к тому, что он измеряет на первый взгляд. Фактическая валидность определяет, «выглядит ли тест действительным» для испытуемых, которые его сдают, административного персонала, принимающего решение о его использовании, и других технически неподготовленных наблюдателей. Валидность содержания требует привлечения признанных экспертов в предметной области для оценки того, оценивают ли тестовые задания определенное содержание и более строгие статистические тесты.чем оценка достоверности лица. Валидность содержания чаще всего рассматривается в академическом и профессиональном тестировании, когда тестовые задания должны отражать знания, фактически необходимые для данной области темы (например, история) или профессиональных навыков (например, бухгалтерского учета). В клинических условиях валидность содержания относится к соответствию между тестовыми заданиями и содержанием симптомов синдрома.

Один из широко используемых методов измерения валидности контента был разработан CH Lawshe. По сути, это метод оценки согласия между оценщиками или судьями относительно важности того или иного предмета. В статье о тестировании перед приемом на работу Lawshe (1975) [2] [3] предложили, чтобы каждый из экспертов-оценщиков (SME) в составе судейской комиссии ответил на следующий вопрос по каждому пункту: «Являются ли навыки или знания, измеряемые этим пунктом,« существенными »,« полезными, но не важными »или« нет ». необходимо для выполнения работы? " Согласно Лоше, если более половины участников указывают, что элемент является важным, этот элемент имеет хотя бы некоторую достоверность содержания. Существуют более высокие уровни достоверности контента, поскольку большее количество участников согласны с тем, что конкретный элемент является важным. Используя эти предположения, Лоше разработала формулу, называемую коэффициентом достоверности контента: где коэффициент достоверности контента - количество участников группы SME, указывающих «существенный»,общее количество участников панели малого и среднего бизнеса. Эта формула дает значения в диапазоне от +1 до -1; положительные значения указывают на то, что по крайней мере половина малых и средних предприятий оценила этот элемент как важный. Среднее значение CVR по элементам может использоваться как индикатор общей валидности содержания теста.

Lawshe (1975) представил таблицу критических значений CVR, с помощью которой оценщик теста мог определить для пула малых и средних предприятий заданного размера размер рассчитанного CVR, необходимого для превышения случайного ожидания. Эта таблица была рассчитана для Лоше его другом Лоуэллом Шиппером. Внимательное изучение этой опубликованной таблицы выявило аномалию. В таблице Шиппера критическое значение CVR монотонно увеличивается от случая 40 малых и средних предприятий (минимальное значение = 0,29) до случая 9 малых и средних предприятий (минимальное значение = 0,78), но неожиданно падает в случае 8 малых и средних предприятий (минимальное значение = 0,78). значение = 0,75) до достижения максимального значения в случае 7 малых и средних предприятий (минимальное значение = 0,99). Однако при применении формулы к 8 оценщикам результат 7 Essential и 1 другого рейтинга дает CVR 0,75. Если 0,75 не было критическим значением,тогда потребуется 8 из 8 оценщиков Essential, что даст CVR 1,00. В этом случае, чтобы соответствовать порядку возрастания CVR, значение для 8 оценщиков должно быть 1,00. Это нарушит тот же принцип, потому что у вас будет «идеальное» значение, требуемое для 8 оценщиков, но не для оценок с другим количеством оценщиков, либо выше, либо ниже 8 оценщиков. Неясно, было ли это отклонение от в противном случае монотонной прогрессии таблицы результатом ошибки вычислений со стороны Шиппера или ошибки набора или набора текста. Уилсон, Пан и Шумский (2012), пытаясь исправить ошибку, не нашли объяснений ни в трудах Лоше, ни в каких-либо публикациях Шиппера, описывающих, как рассчитывалась таблица критических значений.Уилсон и его коллеги определили, что значения Шиппера были близкими приближениями к нормальному приближению биномиального распределения. Сравнивая значения Шиппера с недавно вычисленными биномиальными значениями, они также обнаружили, что Лоше и Шиппер ошибочно пометили свою опубликованную таблицу как представляющую односторонний тест, хотя на самом деле значения отражали биномиальные значения для двустороннего теста. Уилсон и его коллеги опубликовали пересчет критических значений для коэффициента достоверности контента, предоставляя критические значения в единичных шагах на нескольких альфа-уровнях.они также обнаружили, что Лоше и Шиппер ошибочно обозначили свою опубликованную таблицу как представляющую односторонний тест, хотя на самом деле значения отражали биномиальные значения для двустороннего теста. Уилсон и его коллеги опубликовали пересчет критических значений для коэффициента достоверности контента, предоставляя критические значения в единичных шагах на нескольких альфа-уровнях.они также обнаружили, что Лоше и Шиппер ошибочно обозначили свою опубликованную таблицу как представляющую односторонний тест, хотя на самом деле значения отражали биномиальные значения для двустороннего теста. Уилсон и его коллеги опубликовали пересчет критических значений для коэффициента достоверности контента, предоставляя критические значения в единичных шагах на нескольких альфа-уровнях.

Таблица значений следующая:

Кол-во участников Мин. Значение

 5,99 6,99 7,99 8,75 9,78 10,62 11,59 12,56 20,42 30,33 40,29 От: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.460.9380&rep=rep1&type=pdf

См. Также [ править ]

Ссылки [ править ]

  1. ^ Пеннингтон, Дональд (2003). Существенная личность . Арнольд . п. 37. ISBN 0-340-76118-0.
  2. ^ Lawshe, Чарльз Х. (1975). «Количественный подход к достоверности содержания» . Психология персонала . 28 (4): 563–575. DOI : 10.1111 / j.1744-6570.1975.tb01393.x .
  3. ^ Lawshe, Чарльз Х. (1975). «Количественный подход к достоверности содержания» (PDF) . Психология персонала . 28 (4): 563–575. DOI : 10.1111 / j.1744-6570.1975.tb01393.x . Проверено 23 октября 2020 года .
  • Lawshe, CH (1975). Количественный подход к валидности контента. Психология персонала, 28 , 563–575. DOI: 10.1111 / j.1744-6570.1975.tb01393.x
  • Уилсон, Ф. Р., Пан, В., и Шумский, Д. А. (2012). Пересчет критических значений коэффициента достоверности содержания Лоше. Измерение и оценка в консультировании и развитии, 45 (3), 197-210. DOI: 10.1177 / 0748175612440286

Внешние ссылки [ править ]

  • Handbook of Management Scales , Wikibook, содержащий ранее использовавшиеся многопунктовые шкалы для измерения конструкций в литературе по эмпирическим исследованиям в области управления. Для многих шкал обсуждается валидность содержания.