Нормативный тест

Тест норма ссылки ( НЗТ ) представляет собой тип теста , оценки или оценки , которая дает оценку позиции тестируемого индивидуума в предопределенной населения, по отношению к измеряемой чертой. Присвоение баллов по таким тестам можно описать как относительную оценку , оценку на кривой ( BE ) или оценку на кривой ( AE , CE ) (также называемую оценкой по кривой , изгибом колокола или с использованием кривых оценки.). Это метод присвоения оценок учащимся в классе таким образом, чтобы получить или приблизиться к заранее заданному распределению этих оценок, имеющему определенное среднее значение и свойства деривации, такие как нормальное распределение (также называемое распределением Гаусса ). ^[1] Термин «кривая» относится к колоколообразной кривой , графическому представлению плотности вероятности нормального распределения, но этот метод можно использовать для достижения любого желаемого распределения оценок - например, равномерного распределения .

Оценка выводится на основе анализа результатов тестов и, возможно, других релевантных данных из выборки, взятой из населения. Таким образом, этот тип теста определяет, справился ли тестируемый лучше или хуже, чем другие тестируемые, а не знает ли тестируемый больше или меньше материала, чем необходимо для данной цели.

Термин « нормативная оценка» относится к процессу сравнения одного тестируемого с его или ее сверстниками.

Оценку, основанную на нормах, можно противопоставить оценке, основанной на критериях, и ипсативной оценке . В оценке, основанной на критериях, оценка показывает, хорошо или плохо тестируемые выполнили данное задание, а не то, как это сравнивается с другими тестируемыми; в ипсативной системе тестируемых сравнивают с предыдущими результатами.

Один и тот же тест можно использовать обоими способами. ^[2]

Роберт Глейзер первоначально ввел в употребление термины « тест, основанный на нормах» и « критерий» . ^[3]

Обычное использование [ править ]

Многие вступительные экзамены в колледжи и общепринятые школьные тесты используют нормативные тесты. СБ , Graduate Record Examination (GRE) и Векслера шкала интеллекта для детей (WISC) сравнить индивидуальные показатели студента к выполнению нормативного образца. Тестируемые не могут «провалить» нормативный тест, так как каждый тестируемый получает оценку, которая сравнивает индивидуума с другими, сдавшими тест, обычно присваиваемая процентилем. Это полезно, когда существует широкий диапазон приемлемых оценок, и цель состоит в том, чтобы выяснить, кто работает лучше.

Тесты на IQ - это тесты , основанные на нормах, потому что их цель - увидеть, кто из испытуемых умнее других. Для среднего IQ установлено значение 100, и все тестируемые оцениваются вверх или вниз по сравнению с этим уровнем.

Театральные прослушивания и собеседования - это тесты, основанные на нормах, потому что их цель - выявить лучшего кандидата по сравнению с другими кандидатами, а не определить, сколько из кандидатов соответствуют фиксированному списку стандартов.

Другие типы [ править ]

В качестве альтернативы нормативному тестированию тесты могут быть ипсативными оценками или оценками, основанными на критериях.

При ипсативной оценке производительность отдельных лиц сравнивается только с их предыдущими выступлениями. ^[4]^[5] Например, о человеке, соблюдающем диету для похудания, судят по тому, как его текущий вес сравнивается с его собственным предыдущим весом, а не по тому, как его вес сравнивается с идеальным или как он сравнивается с другим человеком.

На критерий ссылаются, когда производительность оценивается в соответствии с ожидаемым или желаемым поведением. Тесты, которые оценивают тестируемого на основе установленного стандарта (например, каждый должен быть в состоянии пробежать один километр менее чем за пять минут), являются тестами с указанием критериев. Цель критериального теста - выяснить, может ли человек бегать так быстро, как того хочет тестирующий, а не выяснить, быстрее он или медленнее, чем другие бегуны. Реформа образования на основе стандартов сосредоточена на тестировании по критериям. ^[6]^[7] Большинство повседневных тестов и викторин, которые проводятся в школе, а также большинство государственных тестов успеваемости и выпускных экзаменов средней школы., ссылаются на критерии. В этой модели все тестируемые могут сдать экзамен или все сдать экзамен.

Методы [ править ]

Один метод оценки кривой состоит из трех этапов:

Учащимся присваиваются числовые баллы (или, возможно, баллы по достаточно мелкой порядковой шкале ). Абсолютные значения менее актуальны при условии, что порядок выставления баллов соответствует относительной успеваемости каждого студента в рамках курса.
Эти оценки конвертируются в процентили (или в какую-либо другую систему квантилей ).
Значения процентилей преобразуются в оценки в соответствии с делением шкалы процентилей на интервалы, где ширина интервала каждой оценки указывает желаемую относительную частоту для этой оценки.

Например, если в конкретном университетском курсе пять оценок: A, B, C, D и F, где A зарезервировано для 20% лучших студентов, B - для следующих 30%, C - для следующих 30%. -40% и D или F для оставшихся 10% -20%, тогда оценки в интервале процентилей от 0% до 20% получат оценку D или F, оценки от 21% до 50% получат оценку C, баллы от 51% до 80% получают оценку B, а баллы от 81% до 100% дают оценку A.

В соответствии с примером, проиллюстрированным выше, кривая оценок позволяет академическим учреждениям обеспечивать распределение учащихся по определенным пороговым значениям среднего балла (GPA). Поскольку многие профессора устанавливают кривую для достижения среднего показателя по курсу на уровне С ^{[ требуется пояснение ]} , соответствующий эквивалент среднего балла будет равен 2,0 по стандартной шкале 4,0, используемой в большинстве университетов Северной Америки. ^[1] Аналогичным образом, средний балл 3,0 по шкале 4,0 означает, что ученик входит в 20% лучших учеников класса. Кривые оценки служат для того, чтобы придать этим цифрам дополнительную значимость, и конкретное используемое распределение может варьироваться между академическими учреждениями. ^[8]

Преимущества и ограничения [ править ]

Основным преимуществом эталонных тестов является то, что они могут предоставить информацию о том, как результаты одного человека на тесте сравниваются с результатами других в эталонной группе.

Серьезным ограничением норм-эталонных тестов является то, что эталонная группа может не представлять актуальную популяцию, представляющую интерес. Как отметили в НИИ Oregon «s International Personality Пункт Poolвеб-сайт: «Следует очень осторожно использовать стандартные« нормы », потому что не очевидно, что можно когда-либо найти популяцию, репрезентативной подмножеством которой является текущая выборка. Большинство« норм »вводят в заблуждение, и поэтому они не должны быть Гораздо более оправданными являются местные нормы, которые человек разрабатывает самостоятельно. Например, если кто-то хочет дать обратную связь членам класса учеников, он должен связать оценку каждого человека со средними и стандартными отклонениями, полученными от самого класса . Для максимальной информативности можно предоставить учащимся частотное распределение для каждой шкалы, основанное на этих местных нормах, а затем люди могут найти (и обвести) свои собственные оценки по этим релевантным распределениям ". ^[9]

Ссылка на нормы не гарантирует, что тест действителен (т. Е. Что он измеряет конструкт, который предназначен для измерения).

Еще один недостаток тестов, основанных на нормах, заключается в том, что они не могут измерить прогресс популяции в целом, а только там, где отдельные люди попадают в это целое. Скорее, нужно измерять по фиксированной цели, например, чтобы измерить успех программы образовательной реформы, которая направлена на повышение успеваемости всех учащихся.

При тестировании с привязкой к норме уровень оценки традиционно устанавливался на уровне средних 50 процентов баллов. ^[10] Напротив, Национальный фонд детского чтения считает, что важно обеспечить, чтобы практически все дети читали на уровне или выше к третьему классу - цель, которая не может быть достигнута с помощью нормального определения уровня обучения. ^[11]

Нормы не подразумевают автоматически стандарт. Нормативно-ориентированный тест не стремится к тому, чтобы обеспечить соблюдение каких-либо ожиданий относительно того, что испытуемые должны знать или уметь. Он измеряет текущий уровень тестируемых, сравнивая их с их сверстниками. Ранговая система дает только данные, которые говорят о том, какие ученики успевают на среднем уровне, какие ученики успевают лучше, а какие хуже. Он не определяет, какие тестируемые способны правильно выполнять задания на уровне, приемлемом для работы или дальнейшего образования.

Конечная цель оценочных кривых - минимизировать или исключить влияние различий между разными преподавателями одного и того же курса, гарантируя, что ученики в любом данном классе оцениваются по сравнению с их сверстниками. Это также позволяет обойти проблемы, связанные с использованием нескольких версий конкретного экзамена, метод, который часто используется, когда даты проведения теста различаются между разделами класса. Независимо от разницы в уровне сложности, реальной или предполагаемой, кривая оценок обеспечивает сбалансированное распределение академических результатов.

Однако изогнутая шкала оценок может повысить конкуренцию между студентами и повлиять на их чувство справедливости преподавателей в классе. Студенты, как правило, больше всего расстраиваются, если кривая занижает их оценку по сравнению с тем, что они получили бы, если бы кривая не использовалась. Чтобы этого не произошло, учителя обычно прилагают усилия к тому, чтобы сам тест был достаточно сложным, когда они намереваются использовать оценочную кривую, чтобы они ожидали, что средний ученик получит более низкий исходный балл, чем балл, предназначенный для использоваться в качестве среднего значения кривой, чтобы гарантировать, что все учащиеся извлекут пользу из кривой. Таким образом, криволинейные оценки не могут использоваться вслепую, и их необходимо тщательно рассматривать и обдумывать по сравнению с такими альтернативами, как сортировка по критерию. Более того,постоянное неправильное использование изогнутых оценок может привести к корректировке оценок за плохо спланированные тесты, тогда как оценки должны быть разработаны таким образом, чтобы точно отражать цели обучения, поставленные преподавателем.^[12]

См. Также [ править ]

Оценка в образовании
Жуткая константа
Инвентарь концепций
Образовательная оценка
Психометрия
Стандартизированный тест - все люди проходят один и тот же тест в одинаковых условиях. Используется как для тестов, основанных на нормах, так и на критериях.
Список кривых среднего балла юридической школы
Приравнивание

Ссылки [ править ]

^ a b Роэлл, Келли. "Что такое оценка по кривой?" . About.com . Проверено 13 ноября 2013 года .
^ Cronbach, LJ (1970). Основы психологического тестирования (3-е изд.). Нью-Йорк: Харпер и Роу.
Перейти ↑ Glaser, R. (1963). «Учебные технологии и измерение результатов обучения». Американский психолог . 18 : 510–522. DOI : 10.1037 / h0049294 .
^ Оценка
^ «PDF-презентация» (PDF) . Архивировано из оригинального (PDF) 24 сентября 2015 года . Проверено 21 июля 2006 .
^ Stories 5-01.html ^{[ постоянная мертвая ссылка ]} Fairtest.org: Times on Testing Тесты с «ссылками на критерии» измеряют учащихся по фиксированному критерию, а не друг с другом.
^ "Архивная копия" . Архивировано из оригинала на 2010-04-14 . Проверено 14 апреля 2010 .CS1 maint: заархивированная копия как заголовок ( ссылка ) Стандарты обучения Иллинойса
↑ Волох, Евгений (9 февраля 2015 г.). «Похвала выставлению оценок по кривой» . Вашингтон Пост . Дата обращения 18 мая 2017 . Как и демократия, выставление оценок по кривой может быть наихудшей из возможных систем - за исключением всех альтернатив.
^ Орегонский научно-исследовательский институт, веб-сайт IPIP, http://ipip.ori.org/newNorms.htm
^ [1] NCTM: News & Media: Assessment Issues (Newsbulletin April 2004) «по определению, половина учащихся страны в любой конкретный момент находится ниже уровня своего класса»
^ [2] Архивировано 11 марта 2007 г. навеб-сайте Национального фонда детского чтения Wayback Machine.
↑ Риз, Майкл (13 мая 2013 г.). «Изгибать или не изгибать» . Инновационный блог инструктора . Университет Джона Хопкинса . Проверено 13 мая 2013 года .

Внешние ссылки [ править ]

Всесторонний взгляд на типы кривых
Краткое примечание о статистике оценок или о том, как рассчитывается кривая
Как создать кривую колокола в Excel

[roell-1] Роэлл, Келли. "Что такое оценка по кривой?" . About.com . Проверено 13 ноября 2013 года .

[Cronbach-2] Cronbach, LJ (1970). Основы психологического тестирования (3-е изд.). Нью-Йорк: Харпер и Роу.

[Glaser-3] Перейти ↑ Glaser, R. (1963). «Учебные технологии и измерение результатов обучения». Американский психолог . 18 : 510–522. DOI : 10.1037 / h0049294 .

[teach-4] Оценка

[role-5] «PDF-презентация» (PDF) . Архивировано из оригинального (PDF) 24 сентября 2015 года . Проверено 21 июля 2006 .

[6] Stories 5-01.html ^{[ постоянная мертвая ссылка ]} Fairtest.org: Times on Testing Тесты с «ссылками на критерии» измеряют учащихся по фиксированному критерию, а не друг с другом.

[7] "Архивная копия" . Архивировано из оригинала на 2010-04-14 . Проверено 14 апреля 2010 .CS1 maint: заархивированная копия как заголовок ( ссылка ) Стандарты обучения Иллинойса

[8] Волох, Евгений (9 февраля 2015 г.). «Похвала выставлению оценок по кривой» . Вашингтон Пост . Дата обращения 18 мая 2017 . Как и демократия, выставление оценок по кривой может быть наихудшей из возможных систем - за исключением всех альтернатив.

[9] Орегонский научно-исследовательский институт, веб-сайт IPIP, http://ipip.ori.org/newNorms.htm

[10] [1] NCTM: News & Media: Assessment Issues (Newsbulletin April 2004) «по определению, половина учащихся страны в любой конкретный момент находится ниже уровня своего класса»

[11] [2] Архивировано 11 марта 2007 г. навеб-сайте Национального фонда детского чтения Wayback Machine.

[12] Риз, Майкл (13 мая 2013 г.). «Изгибать или не изгибать» . Инновационный блог инструктора . Университет Джона Хопкинса . Проверено 13 мая 2013 года .

[1]