Формула предсказания Спирмена – Брауна

Формула Спирмен-Браун , также известная как пророчество формула Спирмена-Браун , является формулой , связывающей психометрические надежности для длины испытательной и используется психометрией для прогнозирования надежности теста после изменения длины теста. ^[1] Метод был независимо опубликован Спирменом (1910) и Брауном (1910). ^[2]^[3]

Расчет

Прогнозируемая надежность, ${\ Displaystyle {\ rho} _ {хх '} ^ {*}}$ , оценивается как:

{\ displaystyle {\ rho} _ {xx '} ^ {*} = {\ frac {n {\ rho} _ {xx'}} {1+ (n-1) {\ rho} _ {xx '}} }}

где n - количество комбинированных "тестов" (см. ниже) и ${\ displaystyle {\ rho} _ {xx '}}$ это надежность текущего «теста». Формула предсказывает надежность нового теста, составленного путем повторения текущего теста n раз (или, что то же самое, создания теста с n параллельными формами текущего экзамена). Таким образом, n = 2 означает удвоение длины экзамена за счет добавления элементов с теми же свойствами, что и в текущем экзамене. Значения n меньше единицы могут использоваться для прогнозирования эффекта сокращения теста.

Прогнозирование продолжительности теста

Формулу также можно изменить, чтобы предсказать количество повторений, необходимых для достижения степени надежности:

{\ displaystyle n = {\ frac {{\ rho} _ {xx '} ^ {*} (1 - {\ rho} _ {xx'})} {{\ rho} _ {xx '} (1- { \ rho} _ {xx '} ^ {*})}}}

Разделенная надежность

До разработки тау-эквивалентной надежности единственным способом получить межпозиционную надежность была разделенная и половинная надежность с использованием формулы Спирмена-Брауна. ^[4] После разделения всего элемента на произвольные половины корреляцию между разделенными половинами можно преобразовать в надежность, применив формулу Спирмена-Брауна. Это,

${\ displaystyle {\ rho} _ {xx '} = {\ frac {2 {\ rho} _ {12}} {1 + {\ rho} _ {12}}}}$

,где ${\ displaystyle {\ rho} _ {12}}$ корреляция Пирсона между половинками. Несмотря на то, что формула Спирмена-Брауна редко используется в качестве коэффициента надежности, разделенного на половину, после разработки тау-эквивалента надежности , этот метод по-прежнему полезен для шкал с двумя пунктами. ^[5]

Его связь с другими коэффициентами надежности с разделением половин

Параллельная надежность с разделением на половину

Чо (2016) ^[6] предлагает использовать систематизированную номенклатуру и формульные выражения, критикуя то, что коэффициенты надежности были представлены неорганизованным и непоследовательным образом с исторически неточными и неинформативными названиями. Предположение формулы Спирмена-Брауна состоит в том, что разделенные половины параллельны, что означает, что дисперсии разделенных половин равны. Систематическое название, предложенное для формулы Спирмена-Брауна, - параллельная надежность с разделением половин. Кроме того, была предложена следующая систематическая формула.

${\ displaystyle {\ rho} _ {SP} = {\ frac {4 {\ rho} _ {12}} {4 {\ rho} _ {12} +2 (1 - {\ rho} _ {12}) }}}$

Надежность, эквивалентная половине тау-эквивалента

Надежность, эквивалентная тау-эквиваленту разделенной половины, - это коэффициент надежности, который можно использовать, когда дисперсии разделенных половин не равны. Фланаган-Рулон ^[7] ( ${\ displaystyle {\ rho} _ {FR1}}$ , ${\ displaystyle {\ rho} _ {FR2}}$ ), Гуттман ^[8] ( ${\ displaystyle {\ lambda _ {4}}}$ ) предложил следующие формулы-выражения: ${\ displaystyle {\ rho} _ {FR1} = {\ frac {4 {\ rho} _ {12} {\ sigma} _ {1} {\ sigma} _ {2}} {{\ sigma} _ {1 } ^ {2} + {\ sigma} _ {2} ^ {2} +2 {\ rho} _ {12} {\ sigma} _ {1} ^ {2} {\ sigma} _ {2} ^ { 2}}}}$ , ${\ displaystyle {\ rho} _ {FR2} = 1 - {\ frac {{\ sigma} _ {D} ^ {2}} {{\ sigma} _ {X} ^ {2}}}}$ , а также ${\ displaystyle {\ lambda} _ {4} = 2 (1 - {\ frac {{\ sigma} _ {1} ^ {2} + {\ sigma} _ {2} ^ {2}} {{\ sigma} } _ {X} ^ {2}}})}$ .

Где ${\ displaystyle {\ sigma} _ {1}}$ , ${\ displaystyle {\ sigma} _ {2}}$ , ${\ displaystyle {\ sigma} _ {X}}$ , а также ${\ displaystyle {\ sigma} _ {D}}$ - это дисперсия первой разделенной половины, второй половины, суммы двух разделенных половин и разницы двух разделенных половин, соответственно.

Все эти формулы алгебраически эквивалентны. Систематическая формула ^[9] выглядит следующим образом.

${\ displaystyle {\ rho} _ {ST} = {\ frac {4 {\ rho} _ {12}} {{\ sigma} _ {X} ^ {2}}}}$ .

Разделенная половина аналогичной надежности

Надежность, эквивалентная разделению половин и тау-эквиваленту, основана на предположении, что разделенные половины имеют одинаковую длину. Совместная надежность с разделением половин смягчает это предположение. Однако, поскольку существует больше параметров, которые необходимо оценить, чем заданная информация, необходимо другое предположение. Raju (1970) ^[10] исследовал коэффициент одинаковой надежности разделенных половин, когда была известна относительная длина каждой разделенной половины. Angoff (1953) ^[11] и Feldt (1975) ^[12] опубликовали конгенерическую надежность разделенных половин, предполагая, что длина каждой разделенной половины пропорциональна сумме дисперсий и ковариаций. ^[13]

История

Название Спирмен-Браун, кажется, подразумевает партнерство, но два автора соревновались друг с другом. Эта формула основана на двух статьях, опубликованных одновременно Брауном (1910) и Спирменом (1910) в British Journal of Psychology . У Чарльза Спирмена были враждебные отношения с Карлом Пирсоном, который вместе работал в Королевском колледже Лондона , и они обменивались бумагами, критиковавшими и высмеивающими друг друга. ^[14] Уильям Браун получил докторскую степень. под руководством Пирсона. Критике работы Спирмена была посвящена важная часть докторской диссертации Брауна ^[15] . ^[16] Спирмен появляется первым в этой формуле перед Брауном, потому что он более престижный ученый, чем Браун. ^[17] Например, Спирмен создал первую теорию надежности ^[18] и назван «отцом классической теории надежности». ^[19] Это пример эффекта Мэтью или закона эпонимии Стиглера .

Эту формулу следует называть формулой Брауна-Спирмена по следующим причинам: ^[20] Во-первых, формула, которую мы используем сегодня, - это не версия Спирмена (1910 г.), а версия Брауна (1910 г.). Браун (1910) явно представил эту формулу как коэффициент надежности, разделенный на половину, но Спирмен (1910) не сделал этого. Во-вторых, формальный вывод Брауна (1910) более лаконичен и элегантен, чем у Спирмена (1910). ^{[21] В-} третьих, вполне вероятно, что Браун (1910) был написан до Спирмена (1910). Браун (1910) основан на его докторской диссертации , которая уже была доступна на момент публикации. Спирмен (1910) критиковал Брауна (1910), но Браун (1910) критиковал только Спирмена (1904). В-четвертых, это стиль APA, когда авторы перечисляются в алфавитном порядке.

Использование и связанные темы

Эта формула обычно используется психометристами для прогнозирования надежности теста после изменения длины теста. Эта взаимосвязь особенно важна для методов оценки надежности с разделением половин и связанных с ними методов (где этот метод иногда называют формулой «Step Up»). ^[22]

Формула также полезна для понимания нелинейной связи между надежностью теста и длиной теста. Длина теста должна увеличиваться на все большие значения по мере приближения желаемой надежности к 1,0.

Если более длинный / более короткий тест не параллелен текущему, то прогноз не будет строго точным. Например, если высоконадежный тест был продлен за счет добавления множества плохих элементов, то достигнутая надежность, вероятно, будет намного ниже, чем предсказывается по этой формуле.

Для надежности двухпозиционного теста эта формула более подходит, чем альфа Кронбаха (используемую таким образом формулу Спирмена-Брауна также называют «стандартизированной альфой Кронбаха», поскольку она аналогична альфе Кронбаха, вычисляемой с использованием среднего взаимная корреляция элементов данных и дисперсия элементов данных, а не ковариация среднего элемента и дисперсия среднего элемента). ^[23]

Цитаты

^ Аллен, М .; Йен В. (1979). Введение в теорию измерений . Монтерей, Калифорния: Брукс / Коул. ISBN 0-8185-0283-5.
^ Стэнли, Дж. (1971). Надежность. В RL Thorndike (Ed.), Education Measurement . Второе издание. Вашингтон, округ Колумбия: Американский совет по образованию
^ Вайнер, H. , и Тиссен, D. (2001). Правдивая теория оценки: традиционный метод. В H. Wainer and D. Thissen, (Eds.), Test Scoring . Махва, Нью-Джерси: Лоуренс Эрлбаум
Перейти ↑ Kelley, TL (1924). Примечание о надежности теста: ответ на критику доктора Крама. Журнал педагогической психологии, 15, 193–204. DOI: 10,1037 / ч0072471.
Кудер, Г. Ф., и Ричардсон, М. В. (1937). Теория оценки надежности тестов. Психометрика, 2, 151-160. DOI: 10.1007 / BF02288391.
^ Eisinga, R .; Te Grotenhuis, M .; Пельцер, Б. (2013). «Надежность двухпозиционной шкалы: Пирсона, Кронбаха или Спирмена-Брауна?». Международный журнал общественного здравоохранения. 58 (4): 637-642. DOI: 10.1007 / s00038-012-0416-3
Перейти ↑ Cho, E. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
Перейти ↑ Flanagan, JC (1937). Предлагаемая процедура повышения эффективности объективных тестов. Журнал педагогической психологии, 28, 17-21. DOI: 10,1037 / h0057430. Рулон, П.Дж. (1939). Упрощенная процедура определения надежности теста по половинкам. Harvard Educational Review, 9, 99-103.
^ Гутман, Л. (1945). Основа для анализа надежности ретестов. Психометрика, 10, 255-282. DOI: 10.1007 / BF02288892.
Перейти ↑ Cho, E. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
Перейти ↑ Raju, NS (1970). Новая формула для оценки общей надежности теста по частям неравной длины. Труды 78-го Ежегодного съезда АПА, 5, 143-144.
^ Angoff, WH (1953). Надежность теста и эффективная длина теста. Психометрика, 18 (1), 1-14.
^ Feldt, LS (1975). Оценка надежности теста разделена на две части неравной длины. Психометрика, 40 (4), 557-561.
Перейти ↑ Cho, E. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. DOI: 10,1177 / 1094428116656239.
^ Коулз, М. (2005) Статистика в психологии: историческая перспектива. Нью-Йорк: Психология Пресс.
↑ Позже опубликовано в виде книги Brown W. (1911). Основы ментального измерения. Лондон: Издательство Кембриджского университета.
Перейти ↑ Spearman, C. (1904). Доказательство и измерение связи между двумя вещами. Американский журнал психологии, 15, 72-101.
Перейти ↑ Cho, E. & Chun, S. (2018). Ремонт сломанных часов: исторический обзор коэффициентов надежности создателей, включая альфа Кронбаха. Обзорное исследование, 19 (2), 23-54.
Перейти ↑ Spearman, C. (1904). Доказательство и измерение связи между двумя вещами. Американский журнал психологии, 15, 72-101.
^ Кронбах, LJ, Раджаратнама, Н., & Глезер, GC (1963). Теория обобщаемости: либерализация теории надежности. Британский журнал статистической психологии, 16, 137–163. DOI: 10.1111 / j.2044-8317.1963.tb00206.x.
Перейти ↑ Cho, E. & Chun, S. (2018). Ремонт сломанных часов: исторический обзор коэффициентов надежности создателей, включая альфа Кронбаха. Обзорное исследование, 19 (2), 23-54.
^ Трауб, RE (1997). Классическая теория испытаний в исторической перспективе. Образовательные измерения: проблемы и практика, 16, 8-14. DOI: 10.1111 / j.1745-3992.1997.tb00603.x.
^ Стэнли, Дж. (1971). Надежность. В RL Thorndike (Ed.), Education Measurement . Второе издание. Вашингтон, округ Колумбия: Американский совет по образованию
^ Eisinga, R .; Te Grotenhuis, M .; Пельцер, Б. (2013). «Надежность двухпозиционной шкалы: Пирсона, Кронбаха или Спирмена-Брауна?». Международный журнал общественного здравоохранения . 58 (4): 637–642. DOI : 10.1007 / s00038-012-0416-3 . hdl : 2066/116735 . PMID 23089674 .