Стандартизированный тест

Молодые люди в Польше сдают экзамены на аттестат зрелости . Аттестат зрелости стандартизирован, поэтому университеты могут легко сравнивать результаты студентов по всей стране.

Стандартизированы тест представляет собой тест , который вводят и набрал в целостном, или «стандартной», таким образом. Стандартизированные тесты разработаны таким образом, чтобы вопросы, условия проведения, процедуры выставления баллов и интерпретации были согласованными ^[1] и проводились и оценивались заранее определенным стандартным способом. ^[2]

Любой тест, в котором один и тот же тест проводится одинаково для всех участников и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , ограниченными по времени тестами или тестами с множественным выбором . Стандартизированный тест может быть любой тип теста: письменный тест, устный тест , или практических навыков тест производительности . Вопросы могут быть простыми или сложными. Учащимся школьного возраста часто требуются академические навыки, но стандартизированный тест можно сдать практически по любой теме, включая тесты по вождению , творческие способности , атлетизм , личность , профессиональную этику., или другие атрибуты.

Противоположностью стандартизованному тестированию является нестандартизованное тестирование , при котором разным испытуемым либо даются существенно разные тесты, либо один и тот же тест назначается в существенно разных условиях (например, одной группе разрешается гораздо меньше времени для завершения теста, чем другой. следующая группа) или оцениваются по-разному (например, один и тот же ответ считается правильным для одного учащегося, но неправильным для другого).

Большинство повседневных викторин и тестов, которые проходят ученики в школе, соответствуют определению стандартизированного теста: все в классе сдают один и тот же тест в одно и то же время и при одинаковых обстоятельствах, и все ученики выставляются учителем в одинаковых условиях. путь. Тем не менее, термин стандартизированный тест чаще всего используется для обозначения тестов, которые даются большим группам, например, теста, который сдают все взрослые, желающие получить лицензию на определенный вид работы, или все студенты определенного типа. возраст.

Поскольку все проходят один и тот же тест и одинаковую систему оценок, стандартизированные тесты часто считаются более справедливыми, чем нестандартные. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой одни учащиеся проходят более легкий тест, а другие - более сложный. Стандартизированные тесты предназначены для надежного сравнения результатов всех участников тестирования, поскольку все проходят один и тот же тест. ^[3] Однако некоторые люди критикуют как тестирование в целом, так и стандартизованное тестирование в частности. Например, некоторые люди считают несправедливым задавать всем учащимся одни и те же вопросы, если в некоторых школах учащихся не были одинаковые стандарты обучения .

Определение [ править ]

Двое мужчин принимают подлинный , не написанный , критерий ссылки стандартизированный тест. Если они выполняют сердечно - легочную реанимацию на манекене с правильной скоростью и давлением, они будут проходить этот экзамен.

Определение стандартизированного теста со временем несколько изменилось. ^[4] В 1960 году стандартизированные тесты были определены как тесты, в которых условия и содержание были одинаковыми для всех, кто проходил тест, независимо от того, когда, где и кем тест проводился или оценивался. Цель этой стандартизации - убедиться, что оценки достоверно указывают на измеряемые способности или навыки, а не на другие вещи, такие как различные инструкции о том, что делать, если тестируемый не знает ответа на вопрос. ^[4]

К началу 21 века акцент сместился с строгого равенства условий на равную справедливость условий. ^[4] Например, испытуемый со сломанным запястьем мог бы писать медленнее из-за травмы, и это было бы более справедливо и дало бы более надежное понимание фактических знаний испытуемого, если бы этому человеку дали еще несколько слов. минут, чтобы записать ответы на большинство тестов. Однако, если цель теста - увидеть, насколько быстро студент может писать, тогда это станет модификацией содержания, а не стандартизированным тестом.

Примеры стандартизованных и нестандартных тестов
Предмет	Формат	Стандартизированный тест	Нестандартизированный тест
История	Устный	Каждому ученику задаются одни и те же вопросы, и их ответы оцениваются одинаково.	Учитель ходит по комнате и задает каждому ученику разные вопросы. Некоторые вопросы сложнее других.
Вождение	Практические навыки	Каждого студента-водителя просят делать одно и то же, и все они оцениваются по одним и тем же стандартам.	Некоторым студентам-водителям приходится ездить по шоссе, а другим нужно только медленно объезжать квартал. Один сотрудник снимает баллы за «плохое отношение».
Математика	Написано	Каждому ученику задаются одни и те же вопросы, и их ответы оцениваются одинаково.	Учитель задает разные вопросы разным ученикам: простой тест для бедных учеников, другой тест для большинства учеников и сложный тест для лучших учеников.
Музыка	Прослушивание	Все музыканты исполняют одно и то же музыкальное произведение. Судьи заранее согласовали, насколько важны такие факторы, как время, экспрессия и музыкальность.	Каждый музыкант выбирает для исполнения свое музыкальное произведение. Судьи выбирают музыканта, который нравится больше всего. Один судья дает дополнительные баллы музыкантам в костюмах.

История [ править ]

Китай [ править ]

Самое раннее свидетельство стандартизированного тестирования было в Китае во времена династии Хань ^[5], где имперские экзамены охватывали шесть искусств, которые включали музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как государственных, так и частных части. Эти экзамены использовались для отбора сотрудников для государственной бюрократии.

Позже к тестированию были добавлены разделы по военным стратегиям, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В такой форме экзамены проводились более тысячелетия.

Сегодня стандартизованное тестирование по-прежнему широко используется, особенно в системе Гаокао .

Великобритания [ править ]

Стандартизированное тестирование было введено в Европе в начале 19 века по образцу китайских экзаменов на мандарин ^[6] благодаря поддержке британских колониальных администраторов, наиболее «настойчивым» из которых был консул Великобритании в Гуанчжоу , Китай , Томас Тейлор Медоуз. ^[6] Медоуз предупреждал о крахе Британской империи, если стандартизованное тестирование не будет немедленно внедрено по всей империи. ^[6]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западные академические круги предпочитали нестандартные оценки с использованием эссе, написанных студентами. Именно из-за этого первая европейская реализация стандартизированного тестирования произошла не в самой Европе, а в Британской Индии . ^[7] Вдохновленные использованием стандартизированного тестирования в Китае, в начале 19 века британские «менеджеры компаний нанимали и продвигали сотрудников на основе конкурсных экзаменов, чтобы предотвратить коррупцию и фаворитизм». ^[7]Эта практика стандартизированного тестирования была позже принята в конце 19 века на континентальной Британии. В ходе последовавших за этим парламентских дебатов было много упоминаний о «китайской мандариновой системе». ^[6]

Именно из Великобритании стандартизированные тесты распространились не только по Британскому Содружеству , но и в Европе, а затем и в Америке. ^[6] Его распространению способствовала промышленная революция . Увеличение числа школьников во время и после промышленной революции в результате принятия законов об обязательном образовании привело к сокращению использования открытого оценивания, которое было труднее производить массово и объективно оценивать из-за его внутренней субъективности.

Британские солдаты проходили стандартные тесты во время Второй мировой войны. Этот новобранец сортирует механические детали, чтобы проверить свое понимание механизмов. На его униформе нет имени, звания или других знаков, которые могли бы повлиять на оценку его работы.

Во время Второй мировой войны для британской армии были разработаны стандартизированные тесты, такие как отборочные доски военного министерства, чтобы отбирать кандидатов для обучения офицеров и других задач. ^[8] В тестах изучались умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы страдали предвзятостью и приводили к выбору неправильных солдат для обучения офицеров. ^[8]

Соединенные Штаты [ править ]

Стандартизированное тестирование было частью американского образования с 19 века, но повсеместное использование стандартизированного тестирования в школах США в значительной степени является феноменом 20 века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в Соединенных Штатах. ^[9] Стандартные тесты использовались, когда люди впервые въехали в США для проверки социальных ролей и определения социальной власти и статуса. ^[10]

Комиссия по вступительным экзаменам в колледжи не предлагала стандартизированных тестов для поступления в университеты и колледжи до 1900 года. Их первые экзамены были проведены в 1901 году по девяти предметам. Этот тест был реализован с целью создания стандартизированной системы приема в США в элитные университеты северо-востока. Изначально тест предназначался также для лучших школ-интернатов с целью стандартизации учебной программы. ^[11] Первоначально стандартизированный тест состоял из эссе и не предназначался для широкого тестирования. ^{[ необходима цитата ]}

Во время Первой мировой войны , то армия Альфа и Бета тесты были разработаны , чтобы помочь месту новобранцев в соответствующих заданиях на основе их начисленных уровней интеллекта. ^[12] Первое издание современного стандартизированного теста на IQ , Тест интеллекта Стэнфорда – Бине , появилось в 1916 году. Затем в 1926 году Совет колледжей разработал SAT (Scholar Aptitude Test). Первый тест SAT был основан на армейском IQ. тесты, с целью определения интеллекта тестируемого, навыков решения проблем и критического мышления . ^[13] В 1959 году Эверетт Линдквист предложилACT (American College Testing) впервые. ^[14] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского, математики, чтения и естественных наук, а также дополнительный раздел письма. ^[15]

Отдельные штаты начали тестирование большого числа детей и подростков через системы государственных школ в 1970-х годах. К 1980-м годам в американских школах проводились общенациональные оценки. ^[16] В 2012 году 45 штатов платили в среднем 27 долларов на студента и 669 миллионов долларов в целом за крупномасштабные ежегодные академические тесты. ^[17] Однако другие расходы, такие как оплата учителей за подготовку студентов к тестам и время в классе, потраченное на проведение тестов, значительно превышают стоимость самого теста. ^[17]

Необходимость для федерального правительства проводить значимые сравнения в сильно децентрализованной (контролируемой на местном уровне) системе государственного образования стимулировала использование крупномасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года, который требовал проведения некоторых стандартных тестов в государственных школах. Закон 2001 года « Ни одного отстающего ребенка» дополнительно привязал некоторые виды финансирования государственных школ к результатам стандартизированного тестирования.

Целью программы «Ни одного отстающего ребенка» было улучшение системы образования в Соединенных Штатах путем привлечения школ и учителей к ответственности за успеваемость учащихся, включая разрыв в образовательной успеваемости между детьми из числа меньшинств и не из числа меньшинств в государственных школах . Дополнительным фактором в системе образования США является социально-экономическое положение тестируемых учащихся. По данным Национального центра помощи детям в бедности , 41 процент детей в возрасте до 18 лет происходят из малообеспеченных семей. ^[18] Этим учащимся требуется особое внимание, чтобы хорошо учиться в школе и сдавать стандартные тесты. ^[19]

В соответствии с этими федеральными законами школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало, чтобы штаты оценивали, насколько хорошо школы и учителя преподают выбранный штатом материал с помощью стандартных тестов. ^[20] Результаты учащихся на крупномасштабных стандартизированных тестах использовались для выделения средств и других ресурсов школам, а также для закрытия школ с плохой успеваемостью. Закон « Каждый учащийся достигает успеха» заменил NCLB в конце 2015 года. ^[21] К тому моменту эти крупномасштабные стандартизированные тесты стали вызывать споры в Соединенных Штатах, потому что они были важными тестами для школьной системы и учителей. ^[22]

Австралия [ править ]

Стандартизованное тестирование Австралийской национальной программы оценки грамотности и навыков счета (NAPLAN) было начато в 2008 году Австралийским органом по учебным программам, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных. и программа отчетности, которая поддерживает обучение в 21 веке для всех австралийских студентов ". ^[23]

В тестировании участвуют все учащиеся 3, 5, 7 и 9 классов австралийских школ, которые будут оцениваться с помощью национальных тестов. Эти тесты охватывают следующие предметы: чтение, письмо, языковые стандарты (орфография, грамматика и пунктуация) и умение считать.

Программа представляет отчеты об уровне учащихся, предназначенные для того, чтобы родители могли видеть прогресс своего ребенка в течение его школьной жизни, а также помочь учителям улучшить индивидуальные возможности обучения для своих учеников. Данные об учащихся и уровне школы также предоставляются соответствующей школьной системе при том понимании, что их можно использовать для целевой поддержки и ресурсов школ, которые в них больше всего нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо их ученики успевают, и выявить любые области, в которых требуется помощь.

Концепция проверки достижений учащихся не нова, хотя можно сказать, что нынешний австралийский подход берет свое начало в нынешних структурах образовательной политики как в США, так и в Великобритании. Между австралийской стратегией NAPLAN и стратегиями Великобритании и США есть несколько ключевых отличий. Школам, которые оказались недостаточно эффективными в условиях Австралии, будет предложена финансовая помощь в соответствии с действующей политикой федерального правительства.

Колумбия [ править ]

В 1968 году для регулирования высшего образования был создан Колумбийский институт оценки образования - ICFES. Была внедрена прежняя система общественной оценки для авторизации деятельности и юридического признания институтов и университетских программ.

В Колумбии есть несколько стандартизированных тестов, оценивающих уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьего, пятого и девятого классов сдают экзамен «Сабля 3 ° 5 ° 9 °». Этот тест в настоящее время представлен на компьютере в контролируемых выборках и выборках переписи.

По окончании школы ученики вручают «Саблю 11», которая позволяет им поступать в разные вузы страны. Студенты, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить свидетельство о степени и диплом.

Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».

Канада [ править ]

Канада оставляет образование и стандартизированное тестирование, как результат, под юрисдикцией провинций. Каждая провинция имеет свой собственный стандартизированный режим тестирования на уровне провинции, от отсутствия обязательных стандартизированных тестов для учащихся в Онтарио до экзаменов на 50% от итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. ^{[ необходима цитата ]}

Дизайн и оценка [ править ]

Дизайн [ править ]

Чаще всего основной академический тест включает разделы с оценкой как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с несколькими вариантами ответов, вопросов «верно-неверно», вопросов для сочинения, аутентичных оценок или практически любой другой формы оценки. Задания с множественным выбором и вопросы «верно-неверно» часто выбираются для тестов, которые сдают тысячи людей, потому что они могут быть выданы и оценены недорого, быстро и надежно с помощью специальных листов ответов, которые можно прочитать на компьютере или с помощью компьютерно-адаптивных тестирование . Некоторые стандартизированные тесты содержат компоненты краткого ответа или написания эссе, которым присваивается оценка независимыми оценщиками, которые используют рубрики (правила или рекомендации) и контрольные работы (примеры статей для каждой возможной оценки) для определения оценки, которая будет дана за ответ.

Любая тема [ править ]

Бланк выставления оценок для экзаменов по вождению в Великобритании Все, кто хочет получить водительские права, сдают одинаковый тест и получают одинаковые баллы.

Не все стандартные тесты включают ответы на вопросы. Аутентичная оценка для спортивных навыков может принимать форму работы в течение заданного промежутка времени или дриблинг мяча на определенное расстояние. Медицинские работники должны пройти тесты, подтверждающие, что они могут выполнять медицинские процедуры. Кандидаты на получение водительских прав должны пройти стандартный тест, подтверждающий, что они могут водить автомобиль. Канадский стандартизированный тест фитнеса используется в медицинских исследованиях, чтобы определить , как физически подходит к Тестируемым. ^[24]^[25]

Машинный и человеческий подсчет [ править ]

Некоторые стандартизированные тесты используют тесты с несколькими вариантами ответов, которые относительно недороги для оценки, но можно использовать любую форму оценки.

Со второй половины 20-го века крупномасштабное стандартизованное тестирование отчасти сформировалось из-за простоты и низкой стоимости компьютерной оценки тестов с множественным выбором. Большинство национальных и международных оценок не полностью оцениваются людьми.

Люди привыкли оценивать предметы, которые не могут быть легко оценены компьютером (например, эссе). Например, выпускной экзамен - это компьютерно-адаптивное оценивание, которое не требует выставления оценок людьми, за исключением письменной части. ^[26]

Оценка людей относительно дорога и часто варьируется, поэтому компьютерная оценка предпочтительнее, когда это возможно. Например, некоторые критики говорят, что плохо оплачиваемые сотрудники будут плохо проходить тесты. ^[27] Согласованность между оценками может варьироваться от 60 до 85 процентов, в зависимости от теста и сессии подсчета очков. При проведении крупномасштабных тестов в школах некоторые тестируемые платят за то, чтобы два или более человека читали каждую работу; если их оценки не совпадают, то работа передается дополнительным оценкам. ^[27]

Хотя этот процесс сложнее, чем электронная оценка тестов с несколькими вариантами ответов, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются подготовленными оценщиками в соответствии с заранее установленной рубрикой оценивания. Например, в Pearson все учащиеся, оценивающие эссе, имеют четырехлетнее высшее образование, и большинство из них являются нынешними или бывшими классными учителями. ^[28]

Часто колледжи предоставляют стипендии студентам, которые хорошо сдали стандартные тесты, такие как ACT или SAT. Интеллектуальный уровень учащихся оценивается по набранным ими баллам, но проблема в том, что даже если учащийся получает хорошие баллы по стандартизированному тесту, по которому он поступает в колледж, это не означает, что он умен. Учащийся может хорошо сдать тест и не окончить колледж. Это не лучший показатель того, насколько хорошо ученик действительно успевает, но насколько хорошо он тестирует.

Использование рубрик для справедливости [ править ]

Использование рубрики предназначено для повышения справедливости при оценке успеваемости учащегося. При стандартизированном тестировании ошибку измерения (постоянный образец ошибок и систематических ошибок при оценке теста) легко определить с помощью стандартизованного тестирования. При нестандартном оценивании оценщики обладают большей свободой усмотрения и, следовательно, с большей вероятностью будут давать несправедливые результаты из-за неосознанной предвзятости.. Когда оценка зависит от индивидуальных предпочтений оценивающих, то результат, который получает отдельный учащийся, зависит от того, кто ставит оценку за тест. Стандартизированные тесты также устраняют предвзятость учителя в оценке. Исследования показывают, что учителя создают своего рода самореализующиеся пророчества в своих оценках учащихся, предоставляя тем, кто, как они ожидают, получат более высокие баллы, и ставя тем, кто, как они ожидают, не успеют, более низкие оценки. ^[29]

Примерная оценка для открытого вопроса истории: что вызвало Вторую мировую войну ?
Ответы студентов	Стандартизированная оценка	Нестандартизированная оценка
	Градация рубрики : Ответы должны быть маркированы правильно , если они упоминают по крайней мере , одно из следующих действий : вторжение Германии в Польшу, вторжение Японии в Китай, или экономические проблемы.	Нет стандартов оценки. Каждый учитель ставит оценки так, как он хочет, с учетом любых факторов, которые выбирает учитель, таких как ответ, количество усилий, академическое образование ученика, языковые способности или отношение.
Студент №1: Вторая мировая война была вызвана вторжением Гитлера и Германии в Польшу.	Учитель №1: В этом ответе упоминается один из обязательных пунктов, поэтому он правильный. Учитель №2: Это правильный ответ.	Учитель №1: Я считаю, что этот ответ достаточно хорош, поэтому отмечу его как правильный. Учитель №2: Это правильный ответ, но этот хороший ученик должен быть в состоянии добиться большего, поэтому я поставлю только частичную оценку.
Студент № 2: Вторая мировая война была вызвана множеством факторов, включая Великую депрессию и общую экономическую ситуацию, подъем национал-социализма, фашизма и империалистического экспансионизма, а также нерешенные недовольства, связанные с Первой мировой войной. Война в Европе началась с немецкого вторжения в Польшу.	Учитель №1: В этом ответе упоминается один из обязательных пунктов, поэтому он правильный. Учитель №2: Это правильный ответ.	Учитель №1: Мне кажется, что это правильный и полный ответ, поэтому я отдаю ему должное. Учитель №2: Это правильный ответ, поэтому я поставлю полные баллы.
Студент № 3: Вторая мировая война была вызвана убийством эрцгерцога Фердинанда.	Учитель №1: В этом ответе не упоминается ни один из обязательных предметов. Нет очков. Учитель №2: Это неправильный ответ. Нет кредита.	Учитель №1: Это неправильный ответ. Нет очков. Учитель №2: Это неправильный ответ, но этот ученик очень старался, и предложение грамматически правильное, поэтому я поставлю один балл за усилия.

Использование оценок для сравнений [ править ]

Существует два типа стандартизированных интерпретаций результатов тестов: интерпретация оценок по норме или интерпретация оценок по критериям .

Интерпретация результатов с привязкой к нормам сравнивает испытуемых с выборкой сверстников . Цель состоит в том, чтобы оценить учащихся как лучше или хуже других. Интерпретация результатов тестов с привязкой к нормам связана с традиционным образованием . Учащиеся, которые успевают лучше других, сдают тест, а ученики, которые показывают худшие результаты, не проходят тест.
Интерпретация оценок с привязкой к критериям сравнивает тестируемых с критерием (формальным определением содержания), независимо от оценок других экзаменуемых. Их также можно назвать оценками на основе стандартов , поскольку они согласуются с движением за реформу образования, основанного на стандартах . ^[30] Интерпретация оценок по критериям связана исключительно с тем, является ли ответ конкретного учащегося правильным и полным. Согласно системам, основанным на критериях, все учащиеся могут пройти тест или все учащиеся не пройдут тест.

Любую из этих систем можно использовать в стандартизированных тестах. Что важно для стандартизированного тестирования, так это то, задаются ли всем учащимся одинаковые вопросы при одинаковых обстоятельствах и выставляются ли они одинаково. В стандартизированном тесте, если данный ответ верен для одного ученика, он верен для всех учеников. Оценщики не принимают ответ как достаточно хороший для одного ученика, но отвергают тот же ответ как неадекватный для другого ученика.

Термин « нормативная оценка» относится к процессу сравнения одного тестируемого с его или ее сверстниками. Тест норма ссылки (НЗТ) представляет собой тип теста, оценки или оценки , которая дает оценку позиции тестируемого индивидуума в предопределенной населения. Оценка выводится на основе анализа результатов тестов и других соответствующих данных из выборки, взятой из населения. Этот тип теста определяет, справился ли тестируемый лучше или хуже, чем другие учащиеся, проходящие этот тест. Тест критерия ссылки (CRT) является стилем теста , который использует тестбаллы, чтобы показать, хорошо ли тестируемые выполнили данное задание, а не насколько хорошо они справились с другими тестируемыми. Большинство тестов и викторин, написанных школьными учителями, основаны на критериях. В этом случае цель состоит в том, чтобы просто увидеть, сможет ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнивать результаты каждого ученика с результатами других учеников.

Это делает стандартные тесты полезными при приеме в высшие учебные заведения, когда школа пытается сравнить студентов со всей страны или со всего мира. Примеры таких международных эталонных тестов включают «Тенденции в международных исследованиях математики и естествознания» ( TIMMS ) и «Прогресс в международном исследовании грамотности чтения» ( PIRLS ). Предполагается, что результаты этих экзаменов будут меняться в зависимости от того, как стандарты, такие как Common Core State Standards (CCSS), совпадают с ведущими странами мира.

Поскольку результаты можно сравнивать в разных школах, результаты национального стандартизированного теста можно использовать для определения того, какие области нуждаются в улучшении. Тесты, которые сдают каждый, могут помочь правительству определить, какие школы и учащиеся испытывают наибольшие трудности. ^[31] Обладая этой информацией, они могут внедрять решения для устранения проблемы, позволяя учащимся учиться и расти в академической среде. ^[31]

Стандарты [ править ]

Соображения валидности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизованного теста. Однако профессиональные ассоциации и ассоциации практикующих часто помещают эти опасения в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в рамках данного контекста.

Стандарты оценки [ править ]

В области оценки , в частности оценки образования , Объединенный комитет по стандартам оценки образования ^[32] опубликовал три набора стандартов оценки. Стандарты оценки персонала ^[33] были опубликованы в 1988 году, Стандарты оценки программ (2-е издание) ^[34] были опубликованы в 1994 году, а Стандарты оценки студентов ^[35] были опубликованы в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию установленной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Тем не менее, тесты призваны гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся; Стандартные тесты предлагают ограниченную информацию о многих формах интеллекта, и полагаться на них вредит учащимся, поскольку они неточно измеряют потенциал учащегося к успеху.^[36]

Стандарты тестирования [ править ]

В области психометрии , что стандарты образования и психологическое тестирование ^[37] место стандартов о валидности и надежности, наряду с ошибками измерений и вопросами , связанными с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, относящиеся к тестированию приложений, учетным данным , а также к тестированию при оценке программ и государственной политике .

Статистическая достоверность [ править ]

Одним из основных преимуществ стандартизированного тестирования является то, что результаты могут быть задокументированы эмпирически; Таким образом, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также результаты, которые можно обобщить и воспроизвести. ^[38] Это часто контрастирует с оценками в школьной справке, которые выставляются отдельными учителями. Может быть трудно учесть различия в образовательной культуре в разных школах, сложность учебной программы конкретного учителя, различия в стиле преподавания, а также методы и предубеждения, влияющие на выставление оценок.

Еще одно преимущество - агрегирование. Хорошо разработанный стандартизированный тест обеспечивает оценку уровня владения человеком определенной областью знаний или навыков, которая на определенном уровне агрегирования предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние оценки классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за уменьшения ошибки, достигаемой за счет увеличения размера выборки.

Тестируемые [ править ]

Сами студенты критикуют тесты, хотя и стандартизированные, но несправедливые по отношению к отдельному учащемуся. Некоторые учащиеся плохо сдают тесты, что означает, что они нервничают и не сосредотачиваются на тестах. Таким образом, хотя тест является стандартным и должен давать справедливые результаты, участники тестирования находятся в невыгодном положении, но не имеют возможности доказать свои знания в противном случае, поскольку нет другой альтернативы тестирования, которая позволяет учащимся подтвердить свои знания и навыки решения проблем. .

Некоторые студенты страдают от теста тревожности . Тестовая тревога также применима к стандартным тестам, когда студенты, у которых может не быть тестовой тревожности, регулярно испытывают огромное давление, заставляя выполнять их, когда ставки так высоки. Стандартизованное тестирование с высокими ставками включает в себя такие экзамены, как SAT, PARCC и ACT, где для успешной сдачи оценок или поступления в колледж требуется хорошая успеваемость.

Ежегодные стандартизированные тесты в школе [ править ]

Стандартизированное тестирование - это очень распространенный способ определения академических достижений учащегося в прошлом и его будущего потенциала. Однако тесты с высокими ставками (стандартизованные или нестандартные) могут вызывать беспокойство. Когда учителя или школы награждаются за лучшую успеваемость на тестах, эти награды побуждают учителей « преподавать на экзаменах » вместо того, чтобы предоставлять богатую и обширную учебную программу. Термин «обучение к тесту» обычно имеет негативный оттенок. Учителя хотят предложить своим ученикам больше знаний, но когда дело доходит до этого, если они не знают, что находится на тесте, им будет сложно достичь того, чего они хотят. ^[39]В 2007 году качественное исследование, проведенное Au Wayne, показало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя. ^[40]

Несмотря на их широкое использование, валидность, качество или использование тестов, особенно стандартизированных тестов в образовании, по-прежнему широко поддерживаются или критикуются. Как и сами тесты, поддержка и критика тестов часто бывают разными и могут исходить из самых разных источников, таких как родители, тестируемые, инструкторы, бизнес-группы, университеты или государственные наблюдатели.

Сторонники стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

Обратная связь или диагностика работы тестируемого ^[41]
Справедливо и эффективно ^[42]
Способствует подотчетности ^[41]^[42]
Прогнозирование и выбор ^[41]
Повышает производительность ^[41]

Критики стандартизированных тестов в образовании часто приводят следующие причины для пересмотра или удаления стандартизированных тестов в образовании:

Сужает учебный формат и поощряет преподавание к тесту . ^[43]
Низкое качество прогнозов. ^[44]^[45]
Повышение оценок за тестовые баллы или оценки. ^[46]^[47]^[48]
Культурно или социально-экономически предвзято. ^[49]^[50]
Психологически разрушительно. ^[51]
Плохой показатель интеллекта или способностей. ^[52]^[53]^[54]^[55]

Воздействие на школы [ править ]

Прошлый стандартизированный тестовый документ, в котором используются вопросы с несколькими вариантами ответов и ответы на них в форме, показанной выше.

Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер подотчетности в сфере государственного образования . В то время как Национальная оценка прогресса в образовании (NAEP) служила образовательным барометром в течение примерно тридцати лет, проводя стандартизированные тесты на регулярной основе в случайных школах по всей территории Соединенных Штатов, усилия за последнее десятилетие на уровне штатов и федеральном уровне предписывали ежегодно стандартизированное администрирование тестов для всех государственных школ по всей стране. ^[56]

Идея, лежащая в основе движения за политику стандартизированного тестирования, заключается в том, что тестирование - это первый шаг к улучшению школ, практики преподавания и методов обучения посредством сбора данных. Сторонники утверждают, что данные, полученные в результате стандартизированных тестов, действуют как табель успеваемости для сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, возникающие в результате нынешней государственной стандартизированной практики тестирования, включая проблемы с валидностью и надежностью тестов и ложными корреляциями (см . Парадокс Симпсона ).

Наряду с проведением и выставлением оценок за фактические тесты, в некоторых случаях учителя оценивают, насколько хорошо их собственные ученики справляются с тестами. Учителя сталкиваются с невероятным давлением, заставляющим постоянно повышать оценки, чтобы судить о том, достойны ли они продолжать свою работу. Было много дискуссий о том, насколько точен способ оценки успехов учителей, потому что существует множество факторов, влияющих на то, насколько хорошо его или ее ученики работают. ^[36]

Некоторые учителя серьезно влияют на успеваемость своих учеников. В некоторых случаях они всю свою карьеру ставят на карту того, насколько хорошо их ученики проходят тестирование. До половины зарплаты учителя будет привязано к тому, как ее ученики справятся с тестами. ^[57]

Губернатор Нью-Джерси Крис Кристи предложил образовательную реформу в Нью-Джерси, которая заставляет учителей не только «преподавать на экзаменах», но и заставлять своих учеников успевать за счет потенциальной стоимости их зарплаты и гарантий занятости. Реформа призывает к оплате труда, зависящей от успеваемости учащихся на стандартных тестах и их успеваемости. Однако учащиеся различаются в зависимости от когнитивных, развивающих и психологических способностей, поэтому это несправедливо по отношению к учителям, у которых учащиеся испытывают трудности на тесте. ^[58]

Школы, получившие низкие баллы, в конечном итоге подлежат закрытию или сокращению, что дает прямое влияние на администрацию, что приводит к опасным тактикам, таким как запугивание, обман и использование информации для повышения баллов. ^[57]

Некритическое использование стандартизированных результатов тестов для оценки успеваемости учителя и школы неуместно, потому что на оценки учеников влияют три вещи: то, что ученики изучают в школе, что ученики изучают вне школы, и врожденный интеллект учеников . ^[59] Школа контролирует только один из этих трех факторов. Было предложено моделирование добавленной стоимости , чтобы справиться с этой критикой путем статистического учета врожденных способностей и контекстуальных факторов вне школы. ^[60]В системе с добавленной стоимостью интерпретации результатов тестов аналитики оценивают ожидаемую оценку для каждого учащегося на основе таких факторов, как собственные предыдущие оценки учащегося, основной язык или социально-экономический статус. Предполагается, что разница между ожидаемой и фактической оценкой ученика в первую очередь связана с усилиями учителя.

Влияние на то, чему учат [ править ]

Предлагает руководство для учителей. Стандартизированные тесты позволят учителям увидеть, как их ученики успевают по сравнению с другими в стране. Это поможет им пересмотреть свои методы обучения, если необходимо, чтобы помочь своим ученикам соответствовать стандартам. ^[31]
Позволяет студентам видеть собственный прогресс. Студентам будет предоставлена возможность поразмышлять над своими оценками и увидеть, в чем заключаются их сильные и слабые стороны. ^[31]
Предоставьте родителям информацию об их ребенке. Оценки могут позволить родителям составить представление о том, как их ребенок успевает в учебе по сравнению со всеми остальными его сверстниками в стране. ^[61]

Критики также заявляют, что стандартизированные тесты поощряют « обучение к тесту » за счет творческого подхода и глубокого охвата предметов, не включенных в тест. Тесты с несколькими вариантами ответов критикуются за то, что не оценивают такие навыки, как письмо. Более того, успех ученика отслеживается по относительной успеваемости учителя, поэтому продвижение учителя зависит от его успехов в учебе ученика. У учителей возникают этические и экономические вопросы, когда они сталкиваются с явно недостаточно успевающими или недостаточно квалифицированными учениками и стандартным тестом.

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению из-за сужения учебной программы. По данным группы FairTest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты для узкого определения учебной программы и целевого обучения. Подотчетность создает огромное давление для выполнения, что может привести к неправильному использованию и неверной интерпретации стандартизированных тестов. ^[62]

Критики говорят, что « обучение для проверки » не способствует обучению более высокого уровня; он трансформирует то, что учителям разрешено преподавать, и сильно ограничивает объем другой информации, которую студенты изучают на протяжении многих лет. ^[57] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебный план и инструкции, часто то, что не проверяется, не преподается, и то, как тестируется предмет, часто становится образцом для преподавания этого предмета.

Критики также возражают против материалов, которые обычно проверяются школами. Хотя существуют стандартизованные тесты на неакадемические атрибуты, такие как Тесты творческого мышления Торранса , школы редко проводят стандартизированные тесты для измерения инициативы, творчества, воображения, любопытства, доброй воли, этического мышления или множества других ценных склонностей и качеств. ^[63] Вместо этого тесты, проводимые школами, как правило, меньше фокусируются на моральном развитии или развитии характера, а больше на индивидуальных академических навыках.

В своей книге, теперь вы видите его , Кэти Дэвидсон критикует стандартизированные тесты. Она описывает нашу молодежь как «детей с конвейера на модели конвейера», имея в виду использование стандартизированного теста как части универсальной образовательной модели. Она также критикует ограниченность проверяемых навыков и называет детей без этих навыков неудачниками или учащимися с ограниченными возможностями. ^[64] Широко распространенный и организованный обман - это растущая культура. ^[65]

Теоретик образования Билл Айерс прокомментировал ограничения стандартизированного теста, написав, что «Стандартные тесты не могут измерить инициативу, творчество, воображение, концептуальное мышление, любопытство, усилия, иронию, суждение, приверженность, нюансы, доброжелательность, этическое мышление, или множество других ценных диспозиций и атрибутов. То, что они могут измерить и подсчитать, - это отдельные навыки, конкретные факты и функции, знания содержания, наименее интересные и наименее значимые аспекты обучения ». ^[66] В своей книге Позор нации , Джонатан Козолутверждает, что учащиеся, прошедшие стандартизированное тестирование, становятся жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, у которых нет пространственной памяти о времени, временных периодах и исторических событиях. Это особенно характерно для школ, где из-за нехватки финансирования и политики строгой отчетности школы отказались от таких предметов, как искусство, история и география; чтобы сосредоточиться на конкурсе обязательных тестов. ^[67]

Есть три показателя, по которым оцениваются страны с лучшими показателями в TIMMS («страны A +»): целенаправленность, согласованность и строгость. Фокус определяется как количество тем, охваченных в каждом классе; идея состоит в том, что чем меньше тем освещается в каждом классе, тем больше внимания можно уделять каждой теме. Определение согласованности - это соблюдение последовательности затронутых тем, которая соответствует естественному развитию или логической структуре математики. CCSSM сравнивали с обоих действующих государственных стандартов и стандартов A + страны. Поскольку в среднем освещается наибольшее количество тем, текущие государственные стандарты имеют наименьшую направленность. ^[68]Общие основные стандарты призваны исправить это несоответствие, помогая преподавателям сосредоточиться на том, что ученикам нужно изучить, вместо того, чтобы отвлекаться на посторонние темы. Они побуждают образовательные материалы переходить от поверхностного освещения широкого круга тем к нескольким темам более глубоко. ^[69]

Время и деньги [ править ]

Стандартизированные тесты - это способ измерить уровень образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учеников проходят обязательные тесты. За это время средний ученик сдает 112 стандартных тестов, что соответствует примерно 10 тестам в год. ^[70] В этом случае средний объем тестирования занимает около 2,3% от общего времени в классе. ^[71]

Проведение стандартных тестов дорогое. Сообщается, что Соединенные Штаты ежегодно тратят на эти испытания около 1,7 миллиарда долларов. ^[72] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на уровне штата. ^[73]

Образовательные решения [ править ]

В некоторых случаях результаты тестов используются в качестве единственного, обязательного или основного критерия для допуска или сертификации. Например, в некоторых штатах США требуется выпускные экзамены в средней школе . Для окончания средней школы требуются соответствующие баллы на этих выпускных экзаменах. Тест общеобразовательного развития часто используется как альтернатива аттестату средней школы.

Другие приложения включают отслеживание (принятие решения о зачислении студента на «быстрый» или «медленный» вариант курса) и присуждение стипендий. В Соединенных Штатах многие колледжи и университеты автоматически переводят баллы по тестам Advanced Placement в кредиты колледжа, соответствие требованиям окончания или зачисление на более продвинутые курсы. Обобщенные тесты, такие как SAT или GRE , чаще используются в качестве одного из нескольких критериев при принятии решения о приеме. В некоторых государственных учреждениях есть пороговые значения для SAT, GPA или классного рейтинга для создания классов кандидатов, которые будут автоматически принимать или отклонять.

Сильная зависимость от стандартизированных тестов для принятия решений часто вызывает споры по причинам, указанным выше. Критики часто предлагают акцентировать внимание на совокупных или даже нечисловых показателях, таких как оценки в классе или краткие индивидуальные оценки (написанные прозой) учителей. Сторонники утверждают, что результаты тестов представляют собой четкий и объективный стандарт, который служит ценным средством контроля над повышением оценок . ^[74]

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на единственном результате теста. ^[75] Использование минимальных сокращенных баллов при поступлении или выпуске не подразумевает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, предварительные курсы, посещаемость и т. Д. Часто воспринимаются баллы за тесты. в качестве «единственных критериев» просто потому, что они самые трудные, или автоматически предполагается выполнение других критериев. Единственным исключением из этого правила является GED , который позволил многим людям получить признание своих навыков, даже если они не соответствовали традиционным критериям. ^{[ необходима цитата ]}

Некоторые учителя утверждают, что единый стандартизированный тест измеряет только текущие знания ученика и не отражает успеваемость ученика с начала года. ^[76] Результат, созданный людьми, которые не участвуют в обычном обучении учащихся, а профессионалами, которые определяют, что учащиеся должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучший составитель и ведущий тестов - это они сами. Они утверждают, что лучше всех осведомлены о способностях, способностях и потребностях учащихся, что позволяет им дольше изучать предметы или продолжать обучение по обычной учебной программе.

Воздействие на студентов из неблагополучных семей [ править ]

Монти Нил, директор Национального центра честного и открытого тестирования, утверждает, что учащимся, говорящим на английском как втором языке, инвалидам или из малообеспеченных семей, непропорционально отказывают в дипломе из-за результатов теста. что несправедливо и вредно. Например, в конце 1970-х годов, когда в Соединенных Штатах начался выпускной экзамен, судебный процесс задержался, так как многие чернокожие студенты не имели справедливой возможности ознакомиться с материалом, который они тестировали на выпускном экзамене, потому что они посещали школы, сегрегированные по закону. «Взаимодействие школ с ограниченными ресурсами и тестирования сильнее всего сказывается на цветных учениках», - утверждает Нил, - «Им непропорционально отказывают в дипломах или повышении в классе, а школы, в которых они учатся, чаще всего плохо справляются с тестами и сталкиваются санкции, такие как реструктуризация ».^[77]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Как содиректор Образовательного центра Университета Райса и профессор образования Линда М. Макнейл в своей книге « Противоречия школьной реформы: затраты на стандартизованное тестирование на образование.пишет: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе ограничивает образование по расе и классу». Макнил считает, что реформа образования на основе тестов устанавливает более высокие стандарты для цветных учащихся. По словам Майнера, Макнил «показывает, как реформа, основанная на тестах, централизует власть в руках корпоративной и политической элиты - особенно пугающее событие в наше время усиления корпоративного и консервативного влияния на реформу образования». Такая реформа, основанная на тестах, упала на обучение, особенно для цветных учащихся. ^[78]

FairTest утверждает, что негативные последствия неправильного использования тестов включают в себя вытеснение учеников из школы, вытеснение учителей из профессии, а также подрыв вовлеченности учеников и школьного климата. ^[62]

Использование стандартизированных тестов при приеме в университеты [ править ]

Использование стандартизированных тестов как части заявки, наряду с другими подтверждающими доказательствами, такими как личное заявление , средний балл успеваемости и рекомендательное письмо , рассматривается университетом. Натан Кунсел, ученый с высшим образованием, заметил, что при поступлении в колледж SAT, CAT и другие стандартизированные тесты «помогают перегруженным сотрудникам приемной комиссии разделить огромное количество абитуриентов на пулы для дальнейшей оценки. Высокие баллы не гарантируют зачисление куда-либо, а низкие не исключают этого, но школы серьезно относятся к тестам ». ^[79]

Тесты предсказывают больше, чем оценки за первый год обучения

Исследования показывают, что тесты предсказывают не только оценку за первый год обучения, но и уровень курсов, которые студент, вероятно, будет изучать. Продольное исследование , проведенное учеными , показывает , что студенты с высокими баллами тестов, скорее всего , принять оспаривая маршрут через колледж. ^[80] Тесты также могут указывать на результаты студентов вне колледжа, включая оценки преподавателей, исследовательские достижения, получение ученой степени, успеваемость на комплексных экзаменах и профессиональную лицензию. ^[81]

Поскольку средний балл успеваемости различается в разных школах и даже для двух учеников в одной школе, общий показатель, предоставляемый результатами теста, более полезен.

Однако в апрельском «метаанализе», опубликованном в Журнале педагогических и психологических измерений, Тодд Моррисон и Мелани Моррисон изучили два десятка исследований валидности теста, необходимого для поступления практически в любую программу магистратуры или доктора философии в Америке: выпускник Рекордный экзамен (GRE). В этом исследовании за последние 30 лет приняли участие более 5000 человек. Авторы обнаружили, что на результаты GRE приходится всего 6 процентов разброса оценок в аспирантуре. Авторы писали, что GRE кажется «практически бесполезным с точки зрения прогнозирования». Повторные прохождения вступительного экзамена на юридическую школу (LSAT) показывают то же самое.

Тесты связаны с успехом в реальном мире

Ведутся споры о том, укажет ли тест на долгосрочный успех в работе и жизни, поскольку существует множество других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с производительностью работы.

Проведенное в 2007 году лонгитюдное исследование показало, что важные жизненные достижения, такие как публикация нового романа или патентование технологии, также связаны с результатами тестов, даже после учета возможностей получения образования. Существует даже значительное количество свидетельств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их, а также сильные количественные рассуждения имеют решающее значение в современной информационной экономике . ^[81]

После определенного момента более высокие баллы все еще имеют значение

Многие аргументы предполагают, что навыки, полученные в результате тестов, полезны, но только до определенной степени.

Тем не менее, в замечательном лонгитюдном исследовании, опубликованном в 2008 году в журнале Psychological Science, были изучены студенты, которые попали в 1% лучших в возрасте 13 лет. Двадцать лет спустя они были в среднем очень успешными, с высокими доходами, крупными наградами и карьерные достижения, которыми любой родитель мог бы гордиться. ^[82]

Обычные альтернативы тестам не более полезны

Офицеры приемной комиссии полагаются на комбинацию материалов заявки , включая рекомендательные письма , интервью, студенческие эссе, средний балл, тесты и личные заявления, чтобы всесторонне оценить студента. Однако большинство этих инструментов не являются гарантией будущего успеха. Проблемы с традиционными собеседованиями и рекомендательными письмами настолько распространены, что многие школы ищут лучшие варианты. ^[83]

Тесты - это не только показатель социального класса.

Существует корреляция между результатами тестов и социальным классом, но успех на стандартных тестах и в колледже зависит не только от класса. Исследования показывают, что «тесты были действительны даже при учете социально-экономического класса. Независимо от семейного происхождения, учащиеся с хорошими результатами тестов и средней школы успевают в колледже лучше, чем учащиеся с более низкими оценками и более слабой успеваемостью ». ^[84]

Подготовка к тестам и коучинг имеют ограниченное влияние

Еще одна критика, касающаяся социального класса и стандартизации, заключается в том, что только состоятельные люди могут проходить подготовку к экзаменам и обучение. Однако «исследователи провели ряд экспериментальных и контролируемых полевых исследований, чтобы проверить этот вопрос. В целом они пришли к выводу, что выигрыш от подготовки к тесту составляет порядка 5–20 баллов, а не 100–200 баллов, заявленных некоторыми компаниями, занимающимися подготовкой к испытаниям ». ^[85]

Тесты не препятствуют разнообразию при поступлении

Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие при поступлении, поскольку меньшинства имеют более низкие баллы в тестах по сравнению с другими представленными группами. В исследовании 2012 года изучаются школы, в которых вступительные испытания не являются обязательными для поступающих, и сравниваются их со школами, в которых они проводятся. И результат показывает, что «недавнее исследование демонстрирует, что школы с факультативным тестированием набирают все больше и больше учащихся. Но то же самое можно сказать и о школах, где требуется тестирование ». ^[86]

Противники утверждают, что стандартизированные тесты - это неправильное использование и некритическое суждение об интеллекте и производительности, но сторонники утверждают, что это не отрицание стандартизированных тестов, а критика плохо спроектированных режимов тестирования. Они утверждают, что тестирование должно фокусировать образовательные ресурсы на наиболее важных аспектах образования - передаче заранее определенного набора знаний и навыков - и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что темнокожие и латиноамериканские студенты в среднем получают меньше баллов, чем белые и азиаты. Таким образом, стандартные тесты по математике и чтению, такие как SAT, сталкиваются с нарастающими атаками со стороны прогрессистов. Однако исчерпывающий отчет сената факультета Калифорнийского университета, подготовленный по заказу г-жи Наполитано и выпущенный в 2020 году, показал, что тесты не являются дискриминационными и играют важную роль в защите качества образования. ^[87]

В отчете говорится, что ухудшение инфляции оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. ^[87]

Что касается намерения школ UC отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, то субъективный и индивидуальный тест, такой как эссе и внеклассные занятия, может быть легко адаптирован и бесполезен для учащихся, которые не знакомы с процессом. Прием без тестирования может быть еще более предпочтительным в пользу людей с хорошими связями. ^[88]

Отчет на 228 страницах, заполненный в январе 2020 года сенатом факультета Калифорнийского университета, рекомендует, чтобы система UC сохранила стандартизированные тесты в качестве требований для приема. ^[87] Отчет развенчивает миф о том, что стандартные тесты по математике и чтению бесполезны для прогнозирования успеваемости в колледже. Основываясь на данных, полученных от учащихся системы UC, в отчете делается вывод о том, что «результаты тестов в настоящее время являются лучшими показателями среднего балла за первый год обучения, чем средний балл в старшей школе». ^[87] Далее в отчете говорится: баллы также позволяют предсказать общий средний балл колледжа и вероятность того, что студент закончит учебу. В то время как «прогностическая сила результатов тестов выросла», - добавлено в отчете, «прогностическая сила оценок в средней школе снизилась». ^[87]

Результаты тестов позволяют школам UC «выбирать из недостаточно представленных групп тех учащихся , которые с большей вероятностью получат более высокие оценки и закончат обучение вовремя». ^[87] «Первоначальная цель теста SAT заключалась в том, чтобы выявить студентов, пришедших из относительно привилегированных кругов, которые могли бы иметь потенциал для успешной учебы в университете», - говорится в отчете. ^[87] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT - это не тест на «способности», а скорее оценка «развитых способностей». ^[89]

См. Также [ править ]

Основные темы [ править ]

Инвентаризация концепций - инструмент оценки знаний
Образовательная оценка - систематический процесс документирования и использования эмпирических данных о знаниях, навыках, отношениях и убеждениях для уточнения программ и улучшения обучения учащихся.
Оценка - систематическое определение достоинств, ценности и значимости предмета,
Список стандартизированных тестов в Соединенных Штатах - статья со списком в Википедии
Психометрия - теория и методика психологического измерения
На основе стандартов оценки - оценка на основе указанных стандартов
Тест (оценка) - Процедура измерения знаний, навыков, способностей, физической подготовки или других характеристик субъекта.

Другие темы [ править ]

Альтернативная оценка
Закон Кэмпбелла
Критерийный тест
Выпускной экзамен средней школы
Машина для подсчета результатов теста IBM 805
Нормативный тест
Реформа образования на основе стандартов
Эффект Volvo

Ссылки [ править ]

Не ^ Сильван обучения глоссарий, извлекаться онлайн, источник больше не доступен
^ Popham, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
^ Фелпс, Ричард П. «Роль и важность тестирования» . nonpartisaneducation.org . Проверено 17 мая 2016 .
^ a b c Олсон, Эми М .; Сабли, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В хорошем, Томас Л. (ред.). Образование 21 века: Справочник . Публикации SAGE. С. 423–430. DOI : 10.4135 / 9781412964012.n46 . ISBN 9781452265995.
^ "Китайская государственная служба" . Британская энциклопедия . Дата обращения 2 мая 2015 .
^ a b c d e Марк и Бойер (1996), 9–10.
^ а б Казин, Эдвардс и Ротман (2010), 142.
^ a b Trahair, Ричард (2015-06-01). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт . Издатели транзакций. ISBN 9781412855495.
^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
^ Гаррисон, Марк Дж. Мера неудач: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
^ Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедия для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .
^ Gould, SJ, "Нация дебилов", New Scientist (6 мая 1982), 349-352.
^ Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .
^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Web. 09 марта 2014 г.
^ "Что на ACT." Разделы теста ACT. Np, nd Web. 05 мая 2014
^ Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Дельта Пхи Каппан . 83 (10): 758–765. DOI : 10.1177 / 003172170208301010 . S2CID 145683785 .
^ a b Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизованное тестирование не прекращается» . Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 года .
^ Kobal, Х. и Цзян, Y., 2018
^ Кобаль, Х. и Цзян, Ю., (2018) Основные факты о детях с низким доходом. Получено с http://www.nccp.org/publications/pub_1194.html
^ «История и предыстория ни одного ребенка, оставленного позади». Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
^ «Закон о достижении каждым студентом успеха (ESSA) | Министерство образования США» .
^ Claiborn, Чарльз. «Тестирование по-крупному». Энциклопедия одаренности, творчества и таланта. SAGE Publications, 2009. 9 апреля 2014 г.
^ «Главная - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 .
^ Горовиц, MR; Монтгомери, DL (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263 . PMID 8500058 .
^ Канадский стандартизированный тест на пригодность (CSTF): для детей от 15 до 69 лет: руководство по толкованию и консультированию . Канадская ассоциация спортивных наук, Программа сертификации и аккредитации фитнес-аттестации, Канадское общество физиологии упражнений, Fitness Canada. Глостер, Онтарио: Канадское общество физиологии упражнений. 1987. ISBN. 0-662-15736-2. OCLC 16048356 .CS1 maint: другие ( ссылка )
^ Веб-сайт ETS о выставлении оценок GRE.
^ Б Houtz, Jolayne (27 августа 2000) «Temps потратить всего несколько минут , чтобы набрать состояние тест А Уошл математическую задачу может занять 20 секунд, эссе, 2 +1 / +2 минуты» . Сиэтл Таймс "За считанные минуты временный служащий в размере 10 долларов в час выставит оценку вашему ребенку"
^ Рич, Мотоко (2015-06-22). «Оценка общего ядра: опыт преподавания не требуется» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 6 октября 2015 .
^ Ли, Jussim (1989). «Ожидания учителя: сбывающиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. DOI : 10.1037 / 0022-3514.57.3.469 .
^ Где мы стоим: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1]. Архивировано 24 августа 2006 г., в Wayback Machine.
^ a b c d «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 2014-10-29 . Проверено 19 февраля 2018 .
^ «Объединенный комитет по стандартам оценки образования» . Архивировано из оригинального 15 октября 2009 года . Дата обращения 2 мая 2015 .
^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки педагогов. Архивировано 2005-12-12 в Вайбак машины Ньюбери Парк,Калифорния: Sage Publications.
^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в парке Wayback Machine в Ньюбери, Калифорния: Sage Publications.
^ Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Архивировано 24 мая 2006 года в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.
^ a b Морган, Хани (2016). «Опора на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. DOI : 10.1080 / 00098655.2016.1156628 . S2CID 148015644 .
^ «Стандарты образовательного и психологического тестирования» . www.apa.org . Дата обращения 2 мая 2015 .
^ Kuncel, NR; Хезлетт, С.А. (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успехи аспирантов». Наука . 315 (5815): 1080–81. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .
^ «Ни один ребенок не остался позади». - Исследовательский центр "Неделя образования". Np, 19 сентября 2011 г. Web. 6 июля 2014 г. < http://www.edweek.org/ew/issues/no-child-left-behind/ >. «Проблемы со стандартизированным тестированием». Education.com. Np, 3 ноября 2013 г. Web. 1 июля 2014 г. < http://www.education.com/reference/article/Ref_Test_Problems_Seven/ Архивировано 20 июня 2014 г. на Wayback Machine >.
^ Ау, Уэйн (2007-06-01). «Тестирование с высокими ставками и контроль учебных программ: качественный метасинтез». Педагогический исследователь . 36 (5): 258–267. DOI : 10.3102 / 0013189X07306523 . ISSN 0013-189X . S2CID 507582 .
^ a b c d Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Психология Пресс. ISBN 978-0-8058-4912-7.
^ a b Хирш-младший, Эрик (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN 978-0-385-49524-0.
^ «Госвами У (1991) подвергли испытанию: влияние внешнего тестирования на учителей. Исследователь в области образования 20: 8-11» . Архивировано из оригинала на 2013-02-02.
^ "FairTest критика SAT" . fairtest.org.
^ «Стандартизированные тесты не всегда лучший показатель успеха» .
Перейти ↑ Paton, Graeme (6 июля 2010 г.). «Университеты критикуют экзамен„инфляцию класса “ » . Дейли телеграф . Лондон.
^ Vasagar, Дживан (2 августа 2010). «Опасения за государственных учеников, поскольку лучшие университеты настаивают на оценке A * на A-level» . Хранитель . Лондон.
Перейти ↑ Finch, Julia (10 марта 2010 г.). «Они не умеют читать, писать, следить за временем и быть аккуратными: приговор директора Tesco выпускникам школ» . Хранитель . Лондон.
^ Хеджес, Ларри В .; Laine, Ричард Д .; Гринвальд, Роб (1994). "Hedges LV (1994) Обмен: Часть I *: Имеют ли значение деньги? Метаанализ исследований влияния различного школьного вклада на результаты учащихся" . Педагогический исследователь . 23 (3): 5–14. DOI : 10.3102 / 0013189X023003005 . S2CID 36771659 .
^ Кофлан, Шон. Яркие бедняки «сдерживались десятилетиями» , BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.
^ "Нейробиология стандартизированного проведения тестов" .
^ «Стандартизированные тесты не показывают того, что знают дети» .
^ «Стандартизированные тесты не являются хорошим показателем жидкого интеллекта согласно новым исследованиям» .
^ «Стандартизированные тесты не измеряют интеллект или способности» .
^ «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся» .
^ "Табель успеваемости NAEP - Национальная оценка образовательного прогресса - NAEP" . nces.ed.gov . Проверено 19 февраля 2018 .
^ a b c Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению студентов» . go.galegroup.com . Проверено 28 марта 2018 года .
↑ Арко, Мэтт (12 июня 2015 г.). «Выступление Christie Education в Айове» . NJ.com . Проверено 25 июля, 2016 .
^ Popham, WJ (1999). «Почему результаты стандартизированных тестов не измеряют качество образования» . Образовательное лидерство . 56 (6): 8–15.
↑ Hassel, B. & Rosch, J. (2008) «Праймер с добавленной стоимостью в Огайо». Фонд Фордхэма. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf ^{[ постоянная мертвая ссылка ]}
^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013. Архивировано из оригинального (PDF) 27 января 2018 года . Проверено 19 февраля 2018 года .
^ a b Холлоуэй, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
Перейти ↑ Kohn, Alfie (2000). Дело против стандартизированного тестирования: повышение результатов, разрушение школ . 361 Hanover Street Portsmouth, NH 03801-3912: Heinemann. ISBN 978-0325003252.CS1 maint: location ( ссылка )
^ Дэвидсон, Кэти (2011). Теперь вы видите: как наука о внимании изменит наш образ жизни, работы и обучения . Нью-Йорк: Викинг.
^ Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли замену для сдачи аттестационных тестов» . NBC News . Дата обращения 2 мая 2015 .
^ Чтобы преподавать: путешествие учителя, Уильям Айерс, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116
^ Козол, Джонатан (2005). Позор нации: восстановление школы апартеида в Америке . Печать: Random House. С. 118–119. ISBN 9781415924167.
^ Шмидт, Уильям Х .; Хоуанг, Ричард Т. (2012). «Согласованность учебной программы и общие основные стандарты математики». Педагогический исследователь . 41 (8): 294–308. DOI : 10.3102 / 0013189x12464517 . S2CID 121779439 .
^ Портер, А .; McMaken, J .; Hwang, J .; Ян Р. (2011). «Общие базовые стандарты: новый учебный план США» . Педагогический исследователь . 40 (7): 103–116. DOI : 10.3102 / 0013189x11405038 . S2CID 51453603 .
Рианна Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование проводится в подавляющем большинстве государственных школ страны» . Вашингтон Пост . Проверено 26 июля 2015 года .
^ Деринг, Кристофер (25 октября 2015). «План Обамы ограничивает стандартизованное тестирование не более чем 2% учебного времени» . USA Today . Проверено 26 июля, 2016 .
^ Kuczynski-Brown, Алекс. «Стандартизированные затраты на тестирование составляют 1,7 миллиарда долларов в год, результаты исследования». The Huffington Post. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.
^ "Большая четверка тестовой индустрии" . PBS Frontline . PBS. 2001 . Проверено 21 января 2015 .
^ Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж , Балтимор: издательство Университета Джона Хопкинса, стр. 344, ISBN 9781421424965
^ «Обзор всех тем - The National Academies Press» . Архивировано из оригинала на 2008-04-18 . Дата обращения 2 мая 2015 .
^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017.
^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны . Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. С. 28–35. ISBN 9780737747812. Проверено 4 декабря +2016 .
^ Шахтер, Барбара (август 2000). «Стандартизированные умы: высокая цена американской культуры тестирования и что мы можем сделать, чтобы ее изменить / Противоречия школьной реформы: затраты на стандартизованное тестирование на образование». Прогрессивный . 64 : 40–43. ProQuest 231959849 .
^ Кунсел, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . The Wall Street Journal .
^ Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успехи аспирантов» . Наука . 315 (5815): 1080–1. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .
^ а б Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успехи аспирантов» . Наука . 315 : 1080–1081. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .
^ Парк, Грегори; Любински, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соразмерную степень важности для научного творчества». Психологическая наука . 19 (10): 957–961. DOI : 10.1111 / j.1467-9280.2008.02182.x . PMID 19000201 . S2CID 6443429 .
^ Мерфи, Сара C; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунсел, Натан Р. (2009). «Прогностическая сила личных заявлений при поступлении: метаанализ и предостерегающий рассказ» . Колледж и университет . 84 : 83–86, 88.
^ Кунсел, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус связь между вступительными испытаниями и успеваемостью после окончания средней школы?» . Психологический бюллетень : 1–22.
^ Коннелли, Брайан С .; Кунсел, Натан (3 ноября 2012 г.). «Уравновешивание групп лечения и контроля в квази-экспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. DOI : 10.1111 / peps.12020 .
^ Кунсел, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с учащимися SAT и в решениях о приеме в колледж». Психологическая наука . 23 (9): 1000–7. DOI : 10.1177 / 0956797612438732 . PMID 22858524 . S2CID 22703783 .
^ a b c d e f g КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет рабочей группы по стандартизированному тестированию Ученого совета Калифорнийского университета» (PDF) .
↑ Редакционная коллегия (17 мая 2020 г.). «Калифорния определяет испытания вниз» . The Wall Street Journal .
^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической достоверности ...» Журнал педагогических и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.

Дальнейшее чтение [ править ]

FairTest, "Что не так со стандартными тестами", Информационный бюллетень. (Нью-Йорк: Basic Books, 1985), стр. 172–181.
Харрис, Смит и Харрис Мифы о стандартизированных тестах: почему они не говорят вам, что, по вашему мнению, они делают, Rowman & Littlefield 2011 * Хаддлстон, Марк У. Бойер, Уильям У. Высшая государственная служба в США: поиски реформа . (Университет Питтсбурга, 1996)
Фелпс, Ричард П. Влияние тестирования на успеваемость учащихся, 1910–2010 гг. , Международный журнал тестирования, 10 (1), 2012 г.
Фелпс, Ричард П., изд. Исправление заблуждений об образовательном и психологическом тестировании . (Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008 г.)
Фелпс, Ричард П., Учебник по стандартизированному тестированию. (Нью-Йорк, Нью-Йорк: Питер Лэнг, 2007)
Фелпс, Ричард П. Роль и важность стандартизированного тестирования в мире преподавания и обучения
Рэвич, Дайан , «Использование и неправильное использование тестов» , в «Школах, которых мы заслуживаем» * Штраус, Валери. Подтверждено: стандартизированные тесты прошли в наших школах. Но кто виноват?

Внешние ссылки [ править ]

Объединенный комитет по стандартам оценки образования
Стандартизированное тестирование в школе
Стандарты педагогического и психологического тестирования
Определение стандартизированного теста Национального совета по измерениям в образовании

[Sylvan-1] Не ^ Сильван обучения глоссарий, извлекаться онлайн, источник больше не доступен

[Popham-2] Popham, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.

[Phelps-3] Фелпс, Ричард П. «Роль и важность тестирования» . nonpartisaneducation.org . Проверено 17 мая 2016 .

[:0-4] Олсон, Эми М .; Сабли, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В хорошем, Томас Л. (ред.). Образование 21 века: Справочник . Публикации SAGE. С. 423–430. DOI : 10.4135 / 9781412964012.n46 . ISBN 9781452265995.

[5] "Китайская государственная служба" . Британская энциклопедия . Дата обращения 2 мая 2015 .

[MB-6] Марк и Бойер (1996), 9–10.

[APH-7] а б Казин, Эдвардс и Ротман (2010), 142.

[Trahair-8] Trahair, Ричард (2015-06-01). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт . Издатели транзакций. ISBN 9781412855495.

[9] Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.

[10] Гаррисон, Марк Дж. Мера неудач: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.

[11] Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедия для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .

[12] Gould, SJ, "Нация дебилов", New Scientist (6 мая 1982), 349-352.

[13] Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .

[14] Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Web. 09 марта 2014 г.

[15] "Что на ACT." Разделы теста ACT. Np, nd Web. 05 мая 2014

[16] Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Дельта Пхи Каппан . 83 (10): 758–765. DOI : 10.1177 / 003172170208301010 . S2CID 145683785 .

[:3-17] Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизованное тестирование не прекращается» . Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 года .

[18] Kobal, Х. и Цзян, Y., 2018

[19] Кобаль, Х. и Цзян, Ю., (2018) Основные факты о детях с низким доходом. Получено с http://www.nccp.org/publications/pub_1194.html

[20] «История и предыстория ни одного ребенка, оставленного позади». Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/

[21] «Закон о достижении каждым студентом успеха (ESSA) | Министерство образования США» .

[22] Claiborn, Чарльз. «Тестирование по-крупному». Энциклопедия одаренности, творчества и таланта. SAGE Publications, 2009. 9 апреля 2014 г.

[23] «Главная - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 .

[24] Горовиц, MR; Монтгомери, DL (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263 . PMID 8500058 .

[25] Канадский стандартизированный тест на пригодность (CSTF): для детей от 15 до 69 лет: руководство по толкованию и консультированию . Канадская ассоциация спортивных наук, Программа сертификации и аккредитации фитнес-аттестации, Канадское общество физиологии упражнений, Fitness Canada. Глостер, Онтарио: Канадское общество физиологии упражнений. 1987. ISBN. 0-662-15736-2. OCLC 16048356 .CS1 maint: другие ( ссылка )

[26] Веб-сайт ETS о выставлении оценок GRE.

[Houtz-27] Б Houtz, Jolayne (27 августа 2000) «Temps потратить всего несколько минут , чтобы набрать состояние тест А Уошл математическую задачу может занять 20 секунд, эссе, 2 +1 / +2 минуты» . Сиэтл Таймс "За считанные минуты временный служащий в размере 10 долларов в час выставит оценку вашему ребенку"

[28] Рич, Мотоко (2015-06-22). «Оценка общего ядра: опыт преподавания не требуется» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 6 октября 2015 .

[29] Ли, Jussim (1989). «Ожидания учителя: сбывающиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. DOI : 10.1037 / 0022-3514.57.3.469 .

[30] Где мы стоим: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1]. Архивировано 24 августа 2006 г., в Wayback Machine.

[:1-31] «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 2014-10-29 . Проверено 19 февраля 2018 .

[32] «Объединенный комитет по стандартам оценки образования» . Архивировано из оригинального 15 октября 2009 года . Дата обращения 2 мая 2015 .

[33] Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки педагогов. Архивировано 2005-12-12 в Вайбак машины Ньюбери Парк,Калифорния: Sage Publications.

[34] Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в парке Wayback Machine в Ньюбери, Калифорния: Sage Publications.

[35] Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Архивировано 24 мая 2006 года в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.

[auto-36] Морган, Хани (2016). «Опора на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. DOI : 10.1080 / 00098655.2016.1156628 . S2CID 148015644 .

[37] «Стандарты образовательного и психологического тестирования» . www.apa.org . Дата обращения 2 мая 2015 .

[38] Kuncel, NR; Хезлетт, С.А. (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успехи аспирантов». Наука . 315 (5815): 1080–81. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .

[39] «Ни один ребенок не остался позади». - Исследовательский центр "Неделя образования". Np, 19 сентября 2011 г. Web. 6 июля 2014 г. < http://www.edweek.org/ew/issues/no-child-left-behind/ >. «Проблемы со стандартизированным тестированием». Education.com. Np, 3 ноября 2013 г. Web. 1 июля 2014 г. < http://www.education.com/reference/article/Ref_Test_Problems_Seven/ Архивировано 20 июня 2014 г. на Wayback Machine >.

[40] Ау, Уэйн (2007-06-01). «Тестирование с высокими ставками и контроль учебных программ: качественный метасинтез». Педагогический исследователь . 36 (5): 258–267. DOI : 10.3102 / 0013189X07306523 . ISSN 0013-189X . S2CID 507582 .

[Defending_standardized_testing-41] Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Психология Пресс. ISBN 978-0-8058-4912-7.

[The_Schools_We_Need:_And_Why_We_Don't_Have_Them-42] Хирш-младший, Эрик (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN 978-0-385-49524-0.

[Put_to_the_Test:_The_Effects_of_External_Testing_on_Teachers._Educational_Researcher-43] «Госвами У (1991) подвергли испытанию: влияние внешнего тестирования на учителей. Исследователь в области образования 20: 8-11» . Архивировано из оригинала на 2013-02-02.

[44] "FairTest критика SAT" . fairtest.org.

[45] «Стандартизированные тесты не всегда лучший показатель успеха» .

[46] Перейти ↑ Paton, Graeme (6 июля 2010 г.). «Университеты критикуют экзамен„инфляцию класса “ » . Дейли телеграф . Лондон.

[47] Vasagar, Дживан (2 августа 2010). «Опасения за государственных учеников, поскольку лучшие университеты настаивают на оценке A * на A-level» . Хранитель . Лондон.

[48] Перейти ↑ Finch, Julia (10 марта 2010 г.). «Они не умеют читать, писать, следить за временем и быть аккуратными: приговор директора Tesco выпускникам школ» . Хранитель . Лондон.

[49] Хеджес, Ларри В .; Laine, Ричард Д .; Гринвальд, Роб (1994). "Hedges LV (1994) Обмен: Часть I *: Имеют ли значение деньги? Метаанализ исследований влияния различного школьного вклада на результаты учащихся" . Педагогический исследователь . 23 (3): 5–14. DOI : 10.3102 / 0013189X023003005 . S2CID 36771659 .

[Sean_Coughlan-50] Кофлан, Шон. Яркие бедняки «сдерживались десятилетиями» , BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.

[51] "Нейробиология стандартизированного проведения тестов" .

[52] «Стандартизированные тесты не показывают того, что знают дети» .

[53] «Стандартизированные тесты не являются хорошим показателем жидкого интеллекта согласно новым исследованиям» .

[54] «Стандартизированные тесты не измеряют интеллект или способности» .

[55] «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся» .

[56] "Табель успеваемости NAEP - Национальная оценка образовательного прогресса - NAEP" . nces.ed.gov . Проверено 19 февраля 2018 .

[:2-57] Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению студентов» . go.galegroup.com . Проверено 28 марта 2018 года .

[58] Арко, Мэтт (12 июня 2015 г.). «Выступление Christie Education в Айове» . NJ.com . Проверено 25 июля, 2016 .

[59] Popham, WJ (1999). «Почему результаты стандартизированных тестов не измеряют качество образования» . Образовательное лидерство . 56 (6): 8–15.

[60] Hassel, B. & Rosch, J. (2008) «Праймер с добавленной стоимостью в Огайо». Фонд Фордхэма. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf ^{[ постоянная мертвая ссылка ]}

[61] «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013. Архивировано из оригинального (PDF) 27 января 2018 года . Проверено 19 февраля 2018 года .

[:4-62] Холлоуэй, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.

[63] Перейти ↑ Kohn, Alfie (2000). Дело против стандартизированного тестирования: повышение результатов, разрушение школ . 361 Hanover Street Portsmouth, NH 03801-3912: Heinemann. ISBN 978-0325003252.CS1 maint: location ( ссылка )

[64] Дэвидсон, Кэти (2011). Теперь вы видите: как наука о внимании изменит наш образ жизни, работы и обучения . Нью-Йорк: Викинг.

[65] Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли замену для сдачи аттестационных тестов» . NBC News . Дата обращения 2 мая 2015 .

[66] Чтобы преподавать: путешествие учителя, Уильям Айерс, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116

[67] Козол, Джонатан (2005). Позор нации: восстановление школы апартеида в Америке . Печать: Random House. С. 118–119. ISBN 9781415924167.

[68] Шмидт, Уильям Х .; Хоуанг, Ричард Т. (2012). «Согласованность учебной программы и общие основные стандарты математики». Педагогический исследователь . 41 (8): 294–308. DOI : 10.3102 / 0013189x12464517 . S2CID 121779439 .

[69] Портер, А .; McMaken, J .; Hwang, J .; Ян Р. (2011). «Общие базовые стандарты: новый учебный план США» . Педагогический исследователь . 40 (7): 103–116. DOI : 10.3102 / 0013189x11405038 . S2CID 51453603 .

[70] Рианна Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование проводится в подавляющем большинстве государственных школ страны» . Вашингтон Пост . Проверено 26 июля 2015 года .

[71] Деринг, Кристофер (25 октября 2015). «План Обамы ограничивает стандартизованное тестирование не более чем 2% учебного времени» . USA Today . Проверено 26 июля, 2016 .

[72] Kuczynski-Brown, Алекс. «Стандартизированные затраты на тестирование составляют 1,7 миллиарда долларов в год, результаты исследования». The Huffington Post. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.

[73] "Большая четверка тестовой индустрии" . PBS Frontline . PBS. 2001 . Проверено 21 января 2015 .

[74] Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж , Балтимор: издательство Университета Джона Хопкинса, стр. 344, ISBN 9781421424965

[75] «Обзор всех тем - The National Academies Press» . Архивировано из оригинала на 2008-04-18 . Дата обращения 2 мая 2015 .

[76] «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017.

[77] Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны . Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. С. 28–35. ISBN 9780737747812. Проверено 4 декабря +2016 .

[78] Шахтер, Барбара (август 2000). «Стандартизированные умы: высокая цена американской культуры тестирования и что мы можем сделать, чтобы ее изменить / Противоречия школьной реформы: затраты на стандартизованное тестирование на образование». Прогрессивный . 64 : 40–43. ProQuest 231959849 .

[79] Кунсел, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . The Wall Street Journal .

[80] Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успехи аспирантов» . Наука . 315 (5815): 1080–1. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .

[science.sciencemag.org-81] а б Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успехи аспирантов» . Наука . 315 : 1080–1081. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .

[82] Парк, Грегори; Любински, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соразмерную степень важности для научного творчества». Психологическая наука . 19 (10): 957–961. DOI : 10.1111 / j.1467-9280.2008.02182.x . PMID 19000201 . S2CID 6443429 .

[83] Мерфи, Сара C; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунсел, Натан Р. (2009). «Прогностическая сила личных заявлений при поступлении: метаанализ и предостерегающий рассказ» . Колледж и университет . 84 : 83–86, 88.

[84] Кунсел, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус связь между вступительными испытаниями и успеваемостью после окончания средней школы?» . Психологический бюллетень : 1–22.

[85] Коннелли, Брайан С .; Кунсел, Натан (3 ноября 2012 г.). «Уравновешивание групп лечения и контроля в квази-экспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. DOI : 10.1111 / peps.12020 .

[86] Кунсел, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с учащимися SAT и в решениях о приеме в колледж». Психологическая наука . 23 (9): 1000–7. DOI : 10.1177 / 0956797612438732 . PMID 22858524 . S2CID 22703783 .

[UNIVERSITY_OF_CALIFORNIA,_ACADEMIC_SENATE-87] КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет рабочей группы по стандартизированному тестированию Ученого совета Калифорнийского университета» (PDF) .

[88] Редакционная коллегия (17 мая 2020 г.). «Калифорния определяет испытания вниз» . The Wall Street Journal .

[89] Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической достоверности ...» Журнал педагогических и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.

[1]

vтеРеформа образования на основе стандартов
Физическим лицам	Бенджамин Блум Джером Брунер Рета ДеВрис Калеб Гаттеньо Констанс Камии Мария Монтессори Жан Пиаже Уильям Спади Марк Такер Лев Выготский
Теории	Активное изучение Планирование блоков Познавательная нагрузка Конструктивизм Соответствующая с точки зрения развития практика Открытие обучения Целостное образование Целостная оценка Включение Обучение на основе запросов Изобретательное правописание Школа открытого космоса Образование, ориентированное на результат Проблемно-ориентированное обучение Движение малых школ
Значения	Разрыв в достижениях Совершенство и справедливость
Стандарты обучения	Адекватный годовой прогресс Свидетельство о начальном образовании Голы 2000 Национальная группа по чтению Национальные стандарты научного образования Национальный совет по стандартам навыков Ни один ребенок не остался без внимания Принципы и стандарты школьной математики
Оценка на основе стандартов	Аутентичная оценка Критерийный тест Нормативный тест Выпускной экзамен средней школы
Стандартизированные тесты	Список стандартизированных тестов в США Стандартизированное тестирование и государственная политика
Стандартизированная учебная программа	Декодируемый текст Прямая инструкция Оценки Чтение с гидом Лекция Акустика Зубрежки Стандартные алгоритмы Отслеживание (образование) Традиционное образование Традиционная математика Весь язык