Надежность, эквивалентная тау (), также известный как альфа Кронбаха или коэффициент альфа , является наиболее распространенным коэффициентом надежности результатов теста для однократного введения (т. е. надежности людей по сравнению с фиксированными предметами). [1] [2] [3]
Недавние исследования рекомендуют не использовать его безоговорочно. [4] [5] [6] [7] [8] [9] Коэффициенты надежности, основанные на моделировании структурным уравнением (SEM), часто рекомендуются в качестве альтернативы.
Формула и расчет
Систематическая и общепринятая формула
Позволять обозначают наблюдаемую оценку элемента а также обозначают сумму всех пунктов в тесте, состоящем из Предметы. Позволять обозначают ковариацию между а также , обозначают дисперсию , а также обозначают дисперсию . состоит из дисперсий по элементам и ковариаций по элементам. Это,. Позволятьобозначают среднее значение ковариаций между элементами. Это,.
"систематическая" [3] формула:
.
Наиболее часто используемый вариант формулы -
.
Пример расчета
Применительно к соответствующим данным
применяется к следующим данным, которые удовлетворяют условию тау-эквивалентности.
, ,
,
а также .
Применительно к несоответствующим данным
применяется к следующим данным, которые не удовлетворяют условию тау-эквивалентности.
, ,
,
а также .
Сравните это значение со значением применения одинаковой надежности к тем же данным.
Предпосылки для использования надежности тау-эквивалента
Чтобы использовать в качестве коэффициента надежности данные должны удовлетворять следующим условиям.
1) Одномерность
2) (Существенная) тау-эквивалентность
3) Независимость между ошибками
Условия параллельности, тау-эквивалентности и родства
Параллельное состояние
На уровне генеральной совокупности параллельные данные имеют равные межэлементные ковариации (т. Е. Недиагональные элементы ковариационной матрицы) и равные дисперсии (т. Е. Диагональные элементы ковариационной матрицы). Например, следующие данные удовлетворяют условию параллельности. В параллельных данных, даже если вместо ковариационной матрицы используется корреляционная матрица, потери информации не происходит. Все параллельные данные также эквивалентны тау, но обратное неверно. Таким образом, из трех условий выполнить параллельное условие труднее всего.
Тау-эквивалентное условие
На уровне популяции тау-эквивалентные данные имеют равные ковариации, но их дисперсии могут иметь разные значения. Например, следующие данные удовлетворяют условию тау-эквивалентности. Все элементы в данных, эквивалентных тау, имеют равную дискриминацию или важность. Все данные, эквивалентные тау, также являются родственными, но обратное неверно.
Врожденное состояние
На уровне популяции сходные данные не обязательно должны иметь равные дисперсии или ковариации при условии, что они одномерны. Например, следующие данные соответствуют условию родства. Все элементы в аналогичных данных могут иметь различную дискриминацию или важность.
Связь с другими коэффициентами надежности
Классификация коэффициентов надежности при однократном администрировании
Условные имена
Есть множество коэффициентов надежности. Среди них условные названия коэффициентов надежности, которые связаны и часто используются, резюмируются следующим образом: [3]
Разделить половину | Одномерный | Многомерный | |
---|---|---|---|
Параллельный | Формула Спирмена-Брауна | Стандартизированный | (Без условного названия) |
Тау-эквивалент | Формула Фланагана Формула Рулона Формула Фланагана-Рулона Формула Гуттмана | Кронбаха коэффициент Гутмана КР-20 Хойт надежность | Стратифицированный |
Родственный | Коэффициент Ангоффа-Фельдта Коэффициент Раджу (1970) | составная надежность; конструктивная надежность; совокупный коэффициент надежности. одномерный Коэффициент Раджу (1977) | коэффициент всего Макдональдс многомерный |
Объединение названий строк и столбцов дает предпосылки для соответствующего коэффициента надежности. Например, Кронбах и Гутмана - коэффициенты надежности, полученные при условии одномерности и тау-эквивалентности.
Систематические названия
Обычные имена беспорядочные и бессистемные. Обычные названия не дают информации о природе каждого коэффициента или вводят в заблуждение (например, совокупная надежность). Обычные имена несовместимы. Некоторые из них являются формулами, а другие - коэффициентами. Некоторые названы в честь первоначального разработчика, некоторые названы в честь кого-то, кто не является первоначальным разработчиком, а другие не содержат имени какого-либо человека. В то время как одна формула обозначается несколькими именами, несколько формул обозначаются одной нотацией (например, альфа и омега). Предлагаемые систематические названия и их обозначения для этих коэффициентов надежности следующие: [3]
Разделить половину | Одномерный | Многомерный | |
---|---|---|---|
Параллельный | раздельно-полупараллельная надежность () | параллельная надежность () | многомерная параллельная надежность () |
Тау-эквивалент | надежность, эквивалентная половине тау-эквивалента () | тау-эквивалентная надежность () | многомерная тау-эквивалентная надежность () |
Родственный | раздельно-половинная аналогичная надежность () | схожая надежность () | Бифакторная модель Бифакторная надежность () Факторная модель второго порядка Факторная надежность второго порядка () Коррелированная факторная модель Коррелированная факторная надежность () |
Связь с параллельной надежностью
часто называют коэффициентом альфа и часто называют стандартизированной альфа-версией. Из-за стандартизованного модификатора часто ошибочно принимают за более стандартную версию, чем . Нет никаких исторических оснований для ссылки накак стандартизированная альфа. Кронбах (1951) [10] не называл этот коэффициент альфой и не рекомендовал его использовать.редко использовался до 1970-х годов. Когда SPSS начал предоставлятьпод названием стандартизированной альфы этот коэффициент стали иногда использовать. [11] Использование не рекомендуется, поскольку условие параллельности трудно выполнить в реальных данных.
Связь с надежностью, эквивалентной половинному тау-эквиваленту
равняется среднему значению значения, полученные для всех возможных разделенных половин. Это соотношение, доказанное Кронбахом (1951), [10] , часто используется для объяснения интуитивного значения. Однако эта интерпретация не учитывает тот факт, чтонедооценивает надежность при применении к данным, не эквивалентным тау. На уровне населения максимум из всех возможных значения ближе к надежности, чем среднее из всех возможных значения. [7] Этот математический факт был известен еще до публикации Кронбаха (1951). [12] Сравнительное исследование [13] сообщает, что максимум - самый точный коэффициент надежности.
Revelle (1979) [14] ссылается на минимум всех возможных значения как коэффициент , и рекомендует предоставляет дополнительную информацию, которая не. [6]
Связь с одинаковой надежностью
Если выполнены предположения одномерности и тау-эквивалентности, равно .
Если одномерность удовлетворена, но тау-эквивалентность не выполняется, меньше чем . [7]
является наиболее часто используемым коэффициентом надежности после . Пользователи, как правило, представляют и то, и другое, а не заменяют с участием . [3]
Исследование, посвященное изучению исследований, в которых представлены оба коэффициента, сообщает, что на 0,02 меньше, чем в среднем. [15]
Связь с многомерными коэффициентами надежности и
Если применяется к многомерным данным, его значение меньше, чем коэффициенты многомерной надежности, и больше, чем . [3]
Связь с внутриклассовой корреляцией
считается равным версии с повышенной согласованностью коэффициента внутриклассовой корреляции , которая обычно используется в наблюдательных исследованиях. Но это лишь условно. Что касается компонентов дисперсии, это условие для выборки элемента: если и только если значение компонента дисперсии элемента (оценщика, в случае рейтинга) равно нулю. Если этот компонент дисперсии отрицательный,занижает повышенный коэффициент внутриклассовой корреляции ; если этот компонент дисперсии положительный,будет переоценивать этот повышенный коэффициент внутриклассовой корреляции .
История [11]
До 1937 г.
[16] [17] был единственным известным коэффициентом надежности. Проблема заключалась в том, что оценки надежности зависели от того, как элементы были разделены пополам (например, нечетные / четные или передние / задние). Против этой ненадежности была высказана критика, но более 20 лет не было найдено принципиального решения. [18]
Кудер и Ричардсон (1937)
Кудер и Ричардсон (1937) [19] разработали несколько коэффициентов надежности, которые могут решить проблему. Они не дали конкретных названий коэффициентам надежности. Уравнение 20 в их статье. Эту формулу часто называют формулой Кудера-Ричардсона 20 или KR-20. Они имели дело со случаями, когда наблюдаемые оценки были дихотомическими (например, правильные или неправильные), поэтому выражение KR-20 немного отличается от общепринятой формулы. Обзор этой статьи показывает, что они не представили общую формулу, потому что в этом не было необходимости, а не потому, что они не могли это сделать. Позволять Обозначьте соотношение правильных ответов по заданию , а также обозначают неправильное соотношение ответов на вопрос (). Формула КР-20 следующая.
С , КР-20 и имеют то же значение.
Между 1937 и 1951 гг.
В нескольких исследованиях опубликована общая формула KR-20.
Кудер и Ричардсон (1937) сделали ненужные предположения, чтобы вывести . Несколько исследований показали иначе, чем у Кудера и Ричардсона (1937).
Хойт (1941) [20] получилс использованием ANOVA (дисперсионный анализ). Сирила Хойта можно считать первым разработчиком общей формулы KR-20, но он не представил явно формулу.
Первое выражение современной формулы появляется у Джексона и Фергюсона (1941). [21] Представленная ими версия такова. Эджертон и Томпсон (1942) [22] использовали ту же версию.
Гутман (1945) [12] вывел шесть формул надежности, каждая из которых обозначена. Луи Гутман доказал, что все эти формулы всегда были меньше или равны надежности, и на основании этих характеристик он назвал эти формулы «нижними границами надежности». Гутмана является , а также является . Он доказал, что всегда больше или равно (т.е. точнее). В то время все расчеты производились бумагой и карандашом, а поскольку формула было проще вычислить, он упомянул, что был полезен при определенных условиях.
Гулликсен (1950) [23] получилс меньшим количеством предположений, чем в предыдущих исследованиях. Предположение, которое он использовал, является существенной тау-эквивалентностью в современных терминах.
Признание оригинальной формулы KR-20 и общей формулы того времени
Две формулы были признаны идентичными, и выражение общей формулы KR-20 не использовалось. Хойт [20] пояснил, что его метод «дает точно такой же результат», что и KR-20 (с.156). Джексон и Фергюсон [21] заявили, что эти две формулы «идентичны» (стр.74). Гутман [12] сказал"алгебраически идентичен" КР-20 (с.275). Гулликсен [23] также признал, что эти две формулы «идентичны» (с.224).
Даже исследования, критикующие KR-20, не указали, что исходная формула KR-20 может применяться только к дихотомическим данным. [24]
Критика недооценки КР-20
Разработчики [19] этой формулы сообщили, чтопостоянно недооценивает надежность. Хойт [25] утверждал, что одна эта характеристика делает более рекомендуемый, чем традиционный метод разделения половин, при котором неизвестно, стоит ли недооценивать или переоценивать надежность.
Кронбах (1943) [24] критически относился к недооценке. Он был обеспокоен тем, что неизвестно, сколькозаниженная надежность. Он критиковал, что недооценка, вероятно, была чрезмерно серьезной, так чтоиногда может приводить к отрицательным значениям. Из-за этих проблем он утверждал, что не может быть рекомендован в качестве альтернативы методике разделения половин.
Кронбах (1951)
Как и в предыдущих исследованиях, [20] [12] [21] [23] Кронбах (1951) [10] изобрел другой метод получения. Его интерпретация была интуитивно более привлекательной, чем у предыдущих исследований. То есть он доказал, что равно среднему значению значения, полученные для всех возможных разделенных половин. Он раскритиковал название KR-20 и предложил новое название, коэффициент альфа. Его подход имел огромный успех. Однако он не только опустил некоторые ключевые факты, но и дал неверное объяснение.
Во-первых, он позиционировал коэффициент альфа как общую формулу KR-20, но опустил объяснение, что существующие исследования опубликовали точно идентичную формулу. Те, кто читал только Кронбаха (1951) без предварительных знаний, могли неправильно понять, что он был первым, кто разработал общую формулу KR-20.
Во-вторых, он не объяснил, при каких условиях равняется надежности. Не эксперты могут неправильно понять, что был общим коэффициентом надежности, который можно было использовать для всех данных независимо от предпосылок.
В-третьих, он не объяснил, почему изменил свое отношение к . В частности, он не дал четкого ответа на проблему недооценки, которую он сам [24] раскритиковал.
В-четвертых, он утверждал, что высокая стоимость указал на однородность данных.
После 1951 г.
Новик и Льюис (1967) [26] доказали необходимое и достаточное условие для быть равным надежности, и назвал это условием по существу тау-эквивалентности.
Кронбах (1978) [2] упомянул, что причина, по которой Кронбах (1951) получил много цитат, была «главным образом потому, что [он] поставил название бренда на коэффициент общего места» (стр. 263). [3] Он пояснил, что изначально планировал назвать другие типы коэффициентов надежности (например, надежность между экспертами или надежность повторных тестов) последовательными греческими буквами (например,, , ), но позже передумал.
Кронбах и Шавелсон (2004) [27] рекомендовали читателям использовать теорию обобщаемости, а не. Он выступал против использования имени альфа Кронбаха. Он прямо отрицал существование существующих исследований, в которых была опубликована общая формула KR-20 до Кронбаха (1951).
Распространенные заблуждения о надежности тау-эквивалента [7]
Значение тау-эквивалентной надежности колеблется от нуля до единицы.
По определению надежность не может быть меньше нуля и не может быть больше единицы. Многие учебники ошибочно приравнивают с надежностью и дать неточное объяснение его диапазона. может быть меньше надежности при применении к данным, которые не являются тау-эквивалентами. Предположим, что скопировал значение как есть, и скопировано путем умножения значения на -1. Ковариационная матрица между элементами выглядит следующим образом:.
Отрицательный может произойти по таким причинам, как отрицательная дискриминация или ошибки при обработке элементов с обратной оценкой.
в отличие , Коэффициенты надежности на основе SEM (например, ) всегда больше или равняется нулю.
На эту аномалию впервые указал Кронбах (1943) [24], чтобы критиковать, но Кронбах (1951) [10] не комментировал эту проблему в своей статье, в которой обсуждались все мыслимые вопросы, связанные си он сам [27] охарактеризовал как «энциклопедический» (стр. 396).
Если нет ошибки измерения, значение тау-эквивалентной надежности равно единице.
Эта аномалия также происходит из-за того, что недооценивает надежность. Предположим, что скопировал значение как есть, и скопировано путем умножения значения на два. Ковариационная матрица между элементами выглядит следующим образом:.
Для приведенных выше данных оба а также имеют значение один.
Приведенный выше пример представлен Чо и Ким (2015). [7]
Высокое значение надежности тау-эквивалента указывает на однородность между элементами.
Многие учебники ссылаются на как показатель однородности между предметами. Это заблуждение проистекает из неточного объяснения Кронбаха (1951) [10], что высокаязначения показывают однородность между элементами. Однородность - это термин, который редко используется в современной литературе, и соответствующие исследования интерпретируют этот термин как относящийся к одномерности. Несколько исследований предоставили доказательства или контрпримеры того, чтозначения не указывают на одномерность. [28] [7] [29] [30] [31] [32] См. Контрпримеры ниже.
в одномерных данных выше.
в многомерных данных выше.
Приведенные выше данные имеют , но многомерны.
Приведенные выше данные имеют , но одномерны.
Одномерность - предпосылка для . Перед расчетом следует проверить одномерность., а не вычислять проверить одномерность. [3]
Высокое значение надежности тау-эквивалента указывает на внутреннюю согласованность.
Термин внутренняя согласованность обычно используется в литературе по надежности, но его значение четко не определено. Этот термин иногда используется для обозначения определенного вида надежности (например, надежности внутренней согласованности), но неясно, какие именно коэффициенты надежности включены здесь, помимо. Кронбах (1951) [10] использовал этот термин в нескольких смыслах без явного определения. Чо и Ким (2015) [7] показали, что не является индикатором любого из них.
Удаление элементов с помощью "альфа-версии, если элемент удален" всегда повышает надежность.
Удаление элемента с использованием «альфа, если элемент удален» может привести к «альфа-инфляции», когда надежность на уровне выборки выше, чем надежность на уровне генеральной совокупности. [33] Это также может снизить надежность на уровне популяции. [34] Исключение менее надежных элементов должно основываться не только на статистической, но также на теоретической и логической основе. Также рекомендуется разделить всю выборку на две части и провести перекрестную проверку. [33]
Идеальный уровень надежности и как повысить надежность
Рекомендации Nunnally по уровню надежности
Наиболее часто цитируемым источником информации о том, какими должны быть коэффициенты надежности, является книга Наннелли. [35] [36] [37] Однако его рекомендации цитируются вопреки его намерениям. Он имел в виду применение разных критериев в зависимости от цели или стадии исследования. Однако независимо от характера исследования, такого как поисковые исследования, прикладные исследования и исследования масштабных разработок, повсеместно используется критерий 0,7. [38] .7 - это критерий, который он рекомендовал для ранних стадий исследования, чего нет в большинстве исследований, опубликованных в журнале. Вместо 0,7 критерий 0,8, относящийся к прикладным исследованиям Наннелли, больше подходит для большинства эмпирических исследований. [38]
1-е издание [35] | 2-е [36] и 3-е [37] издания | |
---|---|---|
Ранний этап исследования | .5 или .6 | .7 |
Прикладное исследование | .8 | .8 |
При принятии важных решений | 0,95 (минимум 0,9) | 0,95 (минимум 0,9) |
Его уровень рекомендаций не означал точку отсечения. Если критерий означает точку отсечения, важно, соблюдена она или нет, но неважно, насколько она выше или ниже. Он не имел в виду, что это должно быть строго .8, когда речь идет о критериях .8. Если надежность имеет значение около 0,8 (например, 0,78), можно считать, что его рекомендация была выполнена. [39]
Его идея заключалась в том, что за повышение надежности приходится платить, поэтому нет необходимости пытаться добиться максимальной надежности в каждой ситуации.
Стоимость получения высокого уровня надежности
Во многих учебниках поясняется, что чем выше значение надежности, тем лучше. Потенциальные побочные эффекты высокой надежности редко обсуждаются. Однако принцип жертвовать чем-то, чтобы получить что-то, также применим к надежности.
Компромисс между надежностью и действительностью [7]
Измерения с абсолютной надежностью не являются достоверными. Например, человек, который сдает тест с точностью до единицы, получит идеальный или нулевой балл, потому что испытуемый, который даст правильный или неправильный ответ по одному пункту, даст правильный или неверный ответ по всем остальным пунктам. . Явление, в котором достоверность приносится в жертву повышению надежности, называется парадоксом затухания. [40] [41]
Высокое значение надежности может вступать в противоречие с достоверностью контента. Для высокой достоверности содержания каждый элемент должен быть сконструирован таким образом, чтобы иметь возможность всесторонне представлять содержание, которое необходимо измерить. Однако стратегия многократного измерения одного и того же вопроса разными способами часто используется только с целью повышения надежности. [42] [43]
Компромисс между надежностью и эффективностью
Когда другие условия равны, надежность возрастает по мере увеличения количества элементов. Однако увеличение количества элементов снижает эффективность измерений.
Способы повышения надежности
Несмотря на затраты, связанные с повышением надежности, рассмотренные выше, может потребоваться высокий уровень надежности. Следующие методы могут быть рассмотрены для повышения надежности.
Перед сбором данных
Устраните двусмысленность объекта измерения.
Не измеряйте то, чего не знают респонденты.
Увеличьте количество предметов. Однако следует проявлять осторожность, чтобы чрезмерно не снизить эффективность измерения.
Используйте весы, которые известны своей высокой надежностью. [44]
Проведите предварительную проверку. Заранее откройте для себя проблему надежности.
Исключить или изменить элементы, которые отличаются по содержанию или форме от других элементов (например, элементы с обратной оценкой).
После сбора данных
Удалите проблемные элементы, используя «альфа, если элемент удален». Однако это удаление должно сопровождаться теоретическим обоснованием.
Используйте более точный коэффициент надежности, чем . Например, 0,02 больше, чем в среднем. [15]
Какой коэффициент надежности использовать
Следует ли нам продолжать использовать надежность, эквивалентную тау?
используется в подавляющем большинстве случаев. По оценкам одного из исследований, примерно 97% исследований используюткак коэффициент надежности. [3]
Однако исследования моделирования, сравнивающие точность нескольких коэффициентов надежности, привели к общему результату: - неточный коэффициент надежности. [45] [13] [6] [46] [47]
Методологические исследования критически относятся к использованию . Выводы существующих исследований упрощаются и классифицируются следующим образом.
(1) Условное использование: использование только при соблюдении определенных условий. [3] [7] [9]
(2) Противодействие использованию: является неполноценным и не должен использоваться. [48] [5] [49] [6] [4] [50]
Альтернативы надежности тау-эквивалента
Существующие исследования практически единодушны в том, что они выступают против широко распространенной практики использования безоговорочно по всем данным. Однако высказываются разные мнения о том, какой коэффициент надежности следует использовать вместо.
Различные коэффициенты надежности занимают первое место в каждом исследовании моделирования [45] [13] [6] [46] [47] », сравнивая точность нескольких коэффициентов надежности. [7]
По мнению большинства, использовать коэффициенты надежности на основе SEM в качестве альтернативы . [3] [7] [48] [5] [49] [9] [6] [50]
Однако нет единого мнения о том, какой из нескольких коэффициентов надежности на основе SEM (например, одномерные или многомерные модели) лучше всего использовать.
Некоторые люди говорят [6] в качестве альтернативы, но показывает информацию, которая полностью отличается от достоверности. это тип коэффициента, сравнимый с коэффициентом Ревелла . [14] [6] Они не заменяют, а дополняют надежность. [3]
Среди коэффициентов надежности, основанных на SEM, многомерные коэффициенты надежности используются редко, и наиболее часто используется . [3]
Программное обеспечение для расчета коэффициентов надежности на основе SEM
Статистическое программное обеспечение общего назначения, такое как SPSS и SAS, включает функцию расчета . Пользователи, которые не знают формулы нет проблем с получением оценок всего несколькими щелчками мыши.
Программное обеспечение SEM, такое как AMOS, LISREL и MPLUS, не имеет функции для расчета коэффициентов надежности на основе SEM. Пользователям необходимо рассчитать результат, введя его в формулу. Чтобы избежать этого неудобства и возможной ошибки, даже исследования, сообщающие об использовании SEM, полагаются навместо коэффициентов надежности на основе SEM. [3] Есть несколько альтернатив для автоматического расчета коэффициентов надежности на основе SEM.
1) R (бесплатно): пакет Psy [51] вычисляет различные коэффициенты надежности.
2) EQS (платный): [52] Это программное обеспечение SEM имеет функцию для расчета коэффициентов надежности.
3) RelCalc (бесплатно): [3] Доступно с Microsoft Excel.может быть получен без использования программного обеспечения SEM. Различные многомерные коэффициенты надежности SEM и различные типы может быть рассчитан на основе результатов программного обеспечения SEM.
Вывод формулы [3]
Допущение 1. Наблюдаемая оценка задания состоит из истинной оценки задания и ошибки задания, которая не зависит от истинной оценки.
Лемма.
Предположение 2. Ошибки независимы друг от друга.
Предположение 3. (Предположение о том, что он является по существу тау-эквивалентом) Истинная оценка предмета состоит из истинной оценки, общей для всех предметов, и константы предмета.
Позволять обозначают сумму истинных баллов по пункту.
Дисперсия называется истинной дисперсией оценок.
Определение. Надежность - это отношение истинной дисперсии оценок к наблюдаемой дисперсии оценок.
Следующее соотношение устанавливается на основе сделанных выше предположений.
Следовательно, ковариационная матрица между элементами выглядит следующим образом.
Ты это видишь равно среднему значению ковариаций между элементами. Это,
Позволять обозначают надежность при выполнении вышеуказанных предположений. является:
Рекомендации
- ^ Кронбах, Ли Дж. (1951). "Коэффициент альфа и внутренняя структура тестов". Психометрика . ООО "Спрингер Сайенс энд Бизнес Медиа". 16 (3): 297–334. DOI : 10.1007 / bf02310555 . hdl : 10983/2196 . ISSN 0033-3123 .
- ^ а б Кронбах, LJ (1978). "Классика цитирования" (PDF) . Текущее содержание . 13 : 263.
- ^ Б с д е е г ч я J к л м п о р Чо, Ынсон (2016-07-08). «Сделаем надежность надежной». Организационные методы исследования . Публикации SAGE. 19 (4): 651–682. DOI : 10.1177 / 1094428116656239 . ISSN 1094-4281 .
- ^ a b Sijtsma, K. (2009). Об использовании, неправильном использовании и очень ограниченной полезности альфы Кронбаха. Психометрика, 74 (1), 107–120. https://doi.org/10.1007/s11336-008-9101-0
- ^ a b c Грин, С.Б., & Ян, Ю. (2009). Комментарий к коэффициенту альфа: поучительная история. Психометрика, 74 (1), 121–135. https://doi.org/10.1007/s11336-008-9098-4
- ^ a b c d e f g h Ревелл, W., & Zinbarg, RE (2009). Коэффициенты альфа, бета, омега и glb: комментарии к Sijtsma. Психометрика, 74 (1), 145–154. https://doi.org/10.1007/s11336-008-9102-z
- ^ Б с д е е г ч я J K чо, Е., & Ким, С. (2015). Коэффициент альфа Кронбаха: хорошо известен, но плохо изучен. Организационные методы исследования, 18 (2), 207–230. https://doi.org/10.1177/1094428114555994
- ^ McNeish, D. (2017). Спасибо коэффициенту альфа, будем брать его отсюда. Психологические методы, 23 (3), 412–433. https://doi.org/10.1037/met0000144
- ^ a b c Райков, Т., & Маркулидес, Г.А. (2017). Спасибо коэффициенту альфа, вы нам еще нужны! Образовательные и психологические измерения, 79 (1), 200–210. https://doi.org/10.1177/0013164417725127
- ^ Б с д е е Кронбахов, LJ (1951). Коэффициент альфа и внутренняя структура тестов. Психометрика, 16 (3), 297–334. https://doi.org/10.1007/BF02310555
- ^ a b Чо, Э. и Чун, С. (2018), Ремонт сломанных часов: исторический обзор создателей коэффициентов надежности, включая альфа Кронбаха. Обзорные исследования, 19 (2), 23–54.
- ^ а б в г Гуттман, Л. (1945). Основа для анализа надежности ретестов. Психометрика, 10 (4), 255–282. https://doi.org/10.1007/BF02288892
- ^ а б в Осберн, HG (2000). Коэффициент альфа и соответствующие коэффициенты надежности внутренней согласованности. Психологические методы, 5 (3), 343–355. https://doi.org/10.1037/1082-989X.5.3.343
- ^ a b Ревелль, W. (1979). Иерархический кластерный анализ и внутренняя структура тестов. Многомерные поведенческие исследования, 14 (1), 57–74. https://doi.org/10.1207/s15327906mbr1401_4
- ^ a b Петерсон, Р.А., и Ким, Ю. (2013). О связи между коэффициентом альфа и совокупной надежностью. Журнал прикладной психологии, 98 (1), 194–198. https://doi.org/10.1037/a0030767
- ^ Браун, W. (1910). Некоторые экспериментальные результаты в соотношении умственных способностей. Британский журнал психологии, 3 (3), 296–322. https://doi.org/10.1111/j.2044-8295.1910.tb00207.x
- Перейти ↑ Spearman, C. (1910). Корреляция рассчитана на основе ошибочных данных. Британский журнал психологии, 3 (3), 271–295. https://doi.org/10.1111/j.2044-8295.1910.tb00206.x
- Перейти ↑ Kelley, TL (1924). Примечание о надежности теста: ответ на критику доктора Крама. Журнал педагогической психологии, 15 (4), 193–204. https://doi.org/10.1037/h0072471
- ^ a b Kuder, GF, & Richardson, MW (1937). Теория оценки надежности тестов. Психометрика, 2 (3), 151–160. https://doi.org/10.1007/BF02288391
- ^ a b c Хойт, К. (1941). Надежность теста оценивается дисперсионным анализом. Психометрика, 6 (3), 153–160. https://doi.org/10.1007/BF02289270
- ^ a b c Джексон, RWB, и Фергюсон, Джорджия (1941). Исследования на надежность тестов. Бюллетень Департамента исследований в области образования Университета Торонто, 12, 132.
- Перейти ↑ Edgerton, HA, & Thomson, KF (1942). Результаты тестов, проверенные с помощью lexis ratio. Психометрика, 7 (4), 281–288. https://doi.org/10.1007/BF02288629
- ^ a b c Гулликсен, Х. (1950). Теория ментальных тестов. Джон Вили и сыновья. https://doi.org/10.1037/13240-000
- ^ а б в г Кронбах, LJ (1943). Об оценках надежности теста. Журнал педагогической психологии, 34 (8), 485–494. https://doi.org/10.1037/h0058608
- Перейти ↑ Hoyt, CJ (1941). Замечание об упрощенном методе вычисления надежности теста: Educational and Psychological Measurement, 1 (1). https://doi.org/10.1177/001316444100100109
- ^ Новик, М. Р., & Льюис, С. (1967). Коэффициент альфа и надежность сводных измерений. Психометрика, 32 (1), 1–13. https://doi.org/10.1007/BF02289400
- ^ а б Кронбах, LJ, & Shavelson, RJ (2004). Мои текущие мысли об альфа-коэффициенте и последующих процедурах. Образовательные и психологические измерения, 64 (3), 391–418. https://doi.org/10.1177/0013164404266386
- Перейти ↑ Cortina, JM (1993). Что такое коэффициент альфа? Изучение теории и приложений. Журнал прикладной психологии, 78 (1), 98–104. https://doi.org/10.1037/0021-9010.78.1.98
- ^ Зеленый, SB, Lissitz, RW, и Mulaik, SA (1977). Ограничения коэффициента альфа как показателя одномерности теста. Образовательные и психологические измерения, 37 (4), 827–838. https://doi.org/10.1177/001316447703700403
- Перейти ↑ McDonald, RP (1981). Размерность тестов и заданий. Британский журнал математической и статистической психологии, 34 (1), 100–117. https://doi.org/10.1111/j.2044-8317.1981.tb00621.x
- ^ Шмитт, Н. (1996). Использование и злоупотребление коэффициентом альфа. Психологическая оценка, 8 (4), 350–353. https://doi.org/10.1037/1040-3590.8.4.350
- ^ Тен Берге, JMF, и SOCAN, G. (2004). Наибольшая нижняя граница надежности теста и гипотезы одномерности. Психометрика, 69 (4), 613–625. https://doi.org/10.1007/BF02289858
- ^ a b Kopalle, PK, & Lehmann, DR (1997). Альфа-инфляция? Влияние исключения масштабных предметов на альфу Кронбаха. Организационное поведение и процессы принятия решений людьми, 70 (3), 189–197. https://doi.org/10.1006/obhd.1997.2702
- ^ Райков, Т. (2007). Надежность при удалении, а не «альфа при удалении»: оценка надежности шкалы после удаления компонента. Британский журнал математической и статистической психологии, 60 (2), 201–216. https://doi.org/10.1348/000711006X115954
- ^ a b Nunnally, JC (1967). Психометрическая теория. Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
- ^ a b Nunnally, JC (1978). Психометрическая теория (2-е изд.). Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
- ^ a b Nunnally, JC, & Bernstein, IH (1994). Психометрическая теория (3-е изд.). Нью-Йорк, штат Нью-Йорк: Макгроу-Хилл.
- ^ a b Лэнс, CE, Баттс, MM, & Michels, LC (2006). Что они на самом деле сказали? Организационные методы исследования, 9 (2), 202–220. https://doi.org/10.1177/1094428105284919
- ^ Чо, Э. (2020). Комплексный обзор так называемой альфы Кронбаха. Журнал исследований продуктов, 38 (1), 9–20.
- ^ Левинджер, J. (1954). Парадокс затухания в теории испытаний. Психологический бюллетень, 51 (5), 493–504. https://doi.org/10.1002/j.2333-8504.1954.tb00485.x
- Перейти ↑ Humphreys, L. (1956). Нормальная кривая и парадокс затухания в теории испытаний. Психологический бюллетень, 53 (6), 472–476. https://doi.org/10.1037/h0041091
- Перейти ↑ Boyle, GJ (1991). Указывает ли однородность заданий на внутреннюю непротиворечивость или избыточность в психометрических шкалах? Личность и индивидуальные различия, 12 (3), 291–294. https://doi.org/10.1016/0191-8869(91)90115-R
- ^ Streiner, DL (2003). Начиная с начала: введение в коэффициент альфа и внутреннюю согласованность. Журнал оценки личности, 80 (1), 99–103. https://doi.org/10.1207/S15327752JPA8001_18
- ^ Ли, Х. (2017). Методология исследования (2-е изд.), Hakhyunsa.
- ^ a b Камата А., Турхан А. и Дарандари Э. (2003). Оценка надежности многомерной составной шкалы баллов. Ежегодное собрание Американской ассоциации исследований в области образования, Чикаго, апрель 2003 г., 1–27 апреля.
- ^ a b Тан, W., & Cui, Y. (2012). Имитационное исследование для сравнения трех нижних оценок надежности. Документ, представленный 17 апреля 2012 г. в AERA Division D: Методология измерения и исследования, Раздел 1: Образовательные измерения, психометрия и оценка., 1–25.
- ^ a b van der Ark, LA, van der Palm, DW, & Sijtsma, K. (2011). Подход скрытого класса к оценке надежности результатов теста. Прикладное психологическое измерение, 35 (5), 380–392. https://doi.org/10.1177/0146621610392911
- ^ a b Данн, Т.Дж., Багули, Т., и Брансден, В. (2014). От альфы к омеге: практическое решение распространенной проблемы оценки внутренней согласованности. Британский журнал психологии, 105 (3), 399–412. https://doi.org/10.1111/bjop.12046
- ^ a b Петерс, GY (2014). Альфа и омега весов надежности и достоверности всесторонняя оценка качества весов. Европейский психолог здоровья, 1 (2), 56–69.
- ^ a b Янг, Ю., & Грин, С.Б. (2011). Коэффициент альфа: коэффициент надежности для 21 века? Журнал психообразовательной оценки, 29 (4), 377–392. https://doi.org/10.1177/0734282911406668
- ^ http://personality-project.org/r/overview.pdf
- ^ http://www.mvsoft.com/eqs60.htm
Внешние ссылки
- Альфа-учебник Кронбаха по SPSS
- Бесплатный веб-интерфейс и пакет R cocron позволяют статистически сравнивать два или более зависимых или независимых альфа-коэффициента Кронбаха.