Из Википедии, бесплатной энциклопедии
  (Перенаправлено из General Learning Ability )
Перейти к навигации Перейти к поиску
Молодые люди в Польше сдают экзамены на аттестат зрелости . Аттестат зрелости стандартизирован, поэтому университеты могут легко сравнивать результаты студентов по всей стране.

Стандартизированы тест представляет собой тест , который вводят и набрал в целостном, или «стандартной», таким образом. Стандартизированные тесты разработаны таким образом, чтобы вопросы, условия проведения, процедуры выставления баллов и интерпретации были согласованными [1] и проводились и оценивались заранее определенным стандартным способом. [2]

Любой тест, в котором один и тот же тест проводится одинаково для всех испытуемых и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , ограниченными по времени тестами или тестами с множественным выбором . Стандартизированный тест может быть любой тип теста: письменный тест, устный тест , или практических навыков тест производительности . Вопросы могут быть простыми или сложными. Учащимся школьного возраста часто требуются академические навыки, но стандартизированный тест можно сдать практически по любой теме, включая тесты по вождению , креативность, атлетизм , личность , профессиональную этику., или другие атрибуты.

Противоположностью стандартизованному тестированию является нестандартизованное тестирование , при котором разным испытуемым либо даются существенно разные тесты, либо один и тот же тест назначается в существенно разных условиях (например, одной группе разрешается гораздо меньше времени для завершения теста, чем другой. следующая группа) или оцениваются по-разному (например, один и тот же ответ считается правильным для одного студента, но неправильным для другого).

Большинство повседневных викторин и тестов, которые проходят ученики во время школы, соответствуют определению стандартизированного теста: все в классе сдают один и тот же тест в одно и то же время и при одинаковых обстоятельствах, и все ученики оцениваются учителем в одинаковых условиях. путь. Тем не менее, термин стандартизированный тест чаще всего используется для обозначения тестов, которые проводятся для более крупных групп, таких как тест, который проходят все взрослые, желающие получить лицензию на работу определенного типа, или все студенты определенного типа. возраст.

Поскольку все проходят один и тот же тест и одинаковую систему оценок, стандартизированные тесты часто воспринимаются как более справедливые, чем нестандартные. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой одни учащиеся проходят более легкий тест, а другие - более сложный. Стандартизованные тесты предназначены для надежного сравнения результатов всех участников тестирования, поскольку все проходят один и тот же тест. [3] Однако некоторые люди критикуют как тестирование в целом, так и стандартизированное тестирование в частности. Например, некоторые люди считают несправедливым задавать всем учащимся одни и те же вопросы, если в некоторых школах учащихся не были одинаковые стандарты обучения .

Определение [ править ]

Двое мужчин принимают подлинный , не написанный , критерий ссылки стандартизированный тест. Если они выполняют сердечно - легочную реанимацию на манекене с правильной скоростью и давлением, они будут проходить этот экзамен.

Определение стандартизированного теста со временем несколько изменилось. [4] В 1960 году стандартизированные тесты были определены как тесты, в которых условия и содержание были одинаковыми для всех, кто проходил тест, независимо от того, когда, где и кем тест проводился или оценивался. Цель этой стандартизации - убедиться, что баллы достоверно указывают на измеряемые способности или навыки, а не на другие вещи, такие как различные инструкции о том, что делать, если тестируемый не знает ответа на вопрос. [4]

К началу 21 века акцент сместился с строгого равенства условий на равную справедливость условий. [4] Например, испытуемый со сломанным запястьем мог бы писать медленнее из-за травмы, и это было бы более справедливо и дало бы более надежное понимание фактических знаний испытуемого, если бы этому человеку дали еще несколько минут, чтобы записать ответы на большинство тестов. Однако, если цель теста - увидеть, насколько быстро ученик может писать, то это станет модификацией содержания, а не стандартизированным тестом.

История [ править ]

Китай [ править ]

Самое раннее свидетельство стандартизированного тестирования было в Китае во времена династии Хань [5], где имперские экзамены охватывали шесть искусств, которые включали музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как государственных, так и частных части. Эти экзамены использовались для отбора сотрудников для государственной бюрократии.

Позже к тестированию были добавлены разделы по военным стратегиям, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В такой форме экзамены были институционализированы более чем на тысячелетие.

Сегодня стандартизированное тестирование по-прежнему широко используется, особенно в системе Гаокао .

Великобритания [ править ]

Стандартизированное тестирование было введено в Европе в начале 19 века по образцу китайских экзаменов на мандарин [6] благодаря поддержке британских колониальных администраторов, самым «настойчивым» из которых был британский консул в Гуанчжоу , Китай , Томас Тейлор Медоуз. [6] Медоуз предупредил о крахе Британской империи, если стандартизованное тестирование не будет немедленно внедрено по всей империи. [6]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западные академические круги предпочитали нестандартные оценки с использованием эссе, написанных студентами. Именно по этой причине первое европейское внедрение стандартизированного тестирования произошло не в самой Европе, а в Британской Индии . [7] Вдохновленные использованием стандартизированного тестирования в Китае, в начале 19 века британские «менеджеры компаний нанимали и продвигали сотрудников на основе конкурсных экзаменов с целью предотвращения коррупции и фаворитизма». [7]Эта практика стандартизированного тестирования была позже принята в конце 19 века на континентальной Британии. В ходе последовавших за этим парламентских дебатов было много упоминаний о «китайской мандариновой системе». [6]

Именно из Великобритании стандартизированные тесты распространились не только по Британскому Содружеству , но и в Европе, а затем и в Америке. [6] Его распространение было вызвано промышленной революцией . Увеличение числа школьников во время и после промышленной революции в результате принятия законов об обязательном образовании привело к сокращению использования неограниченного оценивания, которое было труднее производить массово и объективно оценивать из-за его внутренней субъективности.

Британские солдаты проходили стандартные тесты во время Второй мировой войны. Этот новобранец сортирует механические детали, чтобы проверить свое понимание механизмов. На его униформе нет имени, звания или других знаков, которые могли бы повлиять на оценку его работы.

Во время Второй мировой войны для британской армии были разработаны стандартизированные тесты, такие как отборочные доски военного министерства, чтобы отбирать кандидатов для обучения офицеров и других задач. [8] В ходе испытаний оценивались умственные способности солдат, механические навыки, способность работать с другими людьми и другие качества. Предыдущие методы страдали от предвзятости и приводили к выбору неправильных солдат для обучения офицеров. [8]

Соединенные Штаты [ править ]

Стандартизированное тестирование было частью американского образования с 19 века, но повсеместное использование стандартизированного тестирования в школах США в значительной степени является явлением 20 века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в Соединенных Штатах. [9] Стандартные тесты использовались, когда люди впервые приехали в США, чтобы проверить социальные роли и найти социальную власть и статус. [10]

Комиссия по вступительным экзаменам в колледжи не предлагала стандартизированных тестов для поступления в университеты и колледжи до 1900 года. Их первые экзамены были проведены в 1901 году по девяти предметам. Этот тест был реализован с целью создания стандартизированной системы приема в США в элитные университеты северо-востока. Изначально тест предназначался также для ведущих школ-интернатов с целью стандартизации учебной программы. [11] Изначально стандартизированный тест состоял из эссе и не предназначался для широкого тестирования. [ необходима цитата ]

Во время Первой мировой войны , то армия Альфа и Бета тесты были разработаны , чтобы помочь месту новобранцев в соответствующих заданиях на основе их начисленных уровней интеллекта. [12] Первое издание современного стандартизированного теста на IQ , Тест интеллекта Стэнфорда-Бине , появилось в 1916 году. Затем в 1926 году Совет колледжа разработал SAT (Scholar Aptitude Test). Первый тест SAT был основан на армейском IQ. тесты с целью определения интеллекта тестируемого, навыков решения проблем и критического мышления . [13] В 1959 году Эверетт Линдквист предложилACT (American College Testing) впервые. [14] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского, математики, чтения и естественных наук, а также дополнительный раздел письма. [15]

Отдельные штаты начали тестирование большого числа детей и подростков через системы государственных школ в 1970-х годах. К 1980-м годам в американских школах проводились общенациональные оценки. [16] В 2012 году 45 штатов платили в среднем 27 долларов на студента и 669 миллионов долларов в целом за крупномасштабные ежегодные академические тесты. [17] Однако другие расходы, такие как оплата учителей за подготовку студентов к тестам и время в классе, потраченное на проведение тестов, значительно превышают стоимость самого теста. [17]

Необходимость для федерального правительства проводить значимые сравнения в сильно децентрализованной (контролируемой на местном уровне) системе государственного образования стимулировала использование крупномасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года , требующий проведения некоторых стандартных тестов в государственных школах. Закон 2001 года « Ни одного отстающего ребенка» еще больше привязал некоторые виды финансирования государственных школ к результатам стандартизированного тестирования.

Целью программы «Ни одного отстающего ребенка» было улучшение системы образования в Соединенных Штатах путем привлечения школ и учителей к ответственности за успеваемость учащихся, включая разрыв в образовательной успеваемости между детьми из числа меньшинств и не из числа меньшинств в государственных школах . Дополнительным фактором в системе образования Соединенных Штатов является социально-экономическое положение тестируемых учащихся. По данным Национального центра помощи детям в бедности , 41 процент детей в возрасте до 18 лет происходят из малообеспеченных семей. [18] Этим учащимся требуется особое внимание, чтобы хорошо учиться в школе и сдавать стандартные тесты. [19]

В соответствии с этими федеральными законами школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало, чтобы штаты оценивали, насколько хорошо школы и учителя преподают выбранный штатом материал, с помощью стандартных тестов. [20] Результаты учащихся по крупномасштабным стандартным тестам использовались для выделения средств и других ресурсов школам, а также для закрытия школ с низкой успеваемостью. Закон « Каждый учащийся достигает успеха» заменил NCLB в конце 2015 года. [21] К тому моменту эти крупномасштабные стандартизированные тесты стали вызывать споры в Соединенных Штатах, потому что они были тестами с высокими ставками для школьной системы и учителей. [22]

Австралия [ править ]

Стандартизованное тестирование Австралийской национальной программы оценки грамотности и навыков счета (NAPLAN) было начато в 2008 году Австралийским органом по учебным программам, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных. и программа отчетности, которая поддерживает обучение в 21 веке для всех австралийских студентов ". [23]

В тестировании участвуют все учащиеся 3, 5, 7 и 9 классов австралийских школ, которые будут оцениваться с помощью национальных тестов. Эти тесты охватывают такие предметы, как чтение, письмо, языковые условности (орфография, грамматика и пунктуация) и математика.

Программа представляет отчеты об уровне учащихся, предназначенные для того, чтобы родители могли видеть успехи своего ребенка в течение школьной жизни, а также помочь учителям улучшить индивидуальные возможности обучения для своих учеников. Данные об учащихся и уровне школы также предоставляются соответствующей школьной системе при том понимании, что их можно использовать для целевой поддержки и ресурсов школ, которые в них больше всего нуждаются. Учителя и школы используют эту информацию вместе с другой информацией, чтобы определить, насколько хорошо их ученики успевают, и определить любые области, в которых требуется помощь.

Концепция проверки достижений учащихся не нова, хотя можно сказать, что нынешний австралийский подход берет свое начало в текущих структурах образовательной политики как в США, так и в Великобритании. Между стратегиями австралийского NAPLAN и Великобритании и США есть несколько ключевых различий. Школам, которые оказались недостаточно эффективными в условиях Австралии, будет предложена финансовая помощь в соответствии с действующей политикой федерального правительства.

Колумбия [ править ]

В 1968 году был создан Колумбийский институт оценки образования - ICFES, призванный регулировать высшее образование. Была внедрена прежняя система общественной оценки для авторизации деятельности и юридического признания институтов и университетских программ.

В Колумбии есть несколько стандартизированных тестов, которые оценивают уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьего, пятого и девятого классов сдают экзамен «Сабля 3 ° 5 ° 9 °». Этот тест в настоящее время представлен на компьютере в контролируемых выборках и выборках переписи.

По окончании школы ученики вручают «Саблю 11», которая позволяет им поступать в разные вузы страны. Студенты, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить свидетельство об ученой степени и диплом.

Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».

Канада [ править ]

Канада оставляет образование и стандартизированное тестирование, как результат, под юрисдикцией провинций. Каждая провинция имеет свой собственный стандартизированный режим тестирования, охватывающий всю провинцию, от отсутствия обязательных стандартизированных тестов для учащихся в Онтарио до экзаменов на 50% от итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. [ необходима цитата ]

Дизайн и оценка [ править ]

Дизайн [ править ]

Чаще всего основной академический тест включает разделы с оценкой как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с несколькими вариантами ответов, вопросов «правда-ложь», вопросов для сочинения, аутентичных оценок или практически любой другой формы оценки. Задания с множественным выбором и вопросы «верно-неверно» часто выбираются для тестов, которые проходят тысячи людей, потому что они могут быть выданы и оценены недорого, быстро и надежно с помощью специальных листов ответов, которые могут быть прочитаны с помощью компьютера или с помощью компьютерной адаптивной системы. тестирование . Некоторые стандартизированные тесты содержат компоненты краткого ответа или написания эссе, которым присваивается оценка независимыми оценщиками, которые используют рубрики (правила или рекомендации) и контрольные работы (примеры статей для каждой возможной оценки) для определения оценки, которая будет выставлена ​​за ответ.

Любая тема [ править ]

Форма для выставления оценок на экзаменах по вождению в Великобритании. Все, кто хочет получить водительские права, сдают одинаковый тест и получают одинаковые баллы.

Не все стандартные тесты включают ответы на вопросы. Аутентичная оценка для спортивных навыков может принимать форму работы в течение заданного промежутка времени или дриблинг мяча на определенное расстояние. Медицинские работники должны пройти тесты, подтверждающие, что они могут выполнять медицинские процедуры. Кандидаты на получение водительских прав должны пройти стандартизированный тест, подтверждающий, что они могут водить автомобиль. Канадский стандартизированный тест фитнеса используется в медицинских исследованиях, чтобы определить , как физически подходит к Тестируемым. [24] [25]

Машинный и человеческий подсчет [ править ]

Некоторые стандартизированные тесты используют тесты с несколькими вариантами ответов, которые относительно недороги для оценки, но можно использовать любую форму оценки.

Со второй половины 20-го века крупномасштабное стандартизированное тестирование отчасти сформировалось из-за простоты и низкой стоимости компьютерной оценки тестов с множественным выбором. Большинство национальных и международных оценок не полностью оцениваются людьми.

Люди привыкли оценивать предметы, которые не могут быть легко оценены компьютером (например, эссе). Например, выпускной экзамен - это компьютерно-адаптивное оценивание, которое не требует выставления оценок людьми, за исключением письменной части. [26]

Оценка людей относительно дорога и часто варьируется, поэтому компьютерная оценка предпочтительнее, когда это возможно. Например, некоторые критики говорят, что плохо оплачиваемые сотрудники будут плохо проходить тесты. [27] Согласие между оценками может варьироваться от 60 до 85 процентов, в зависимости от теста и сессии подсчета очков. При проведении крупномасштабных тестов в школах некоторые тестируемые платят за то, чтобы два или более человека читали каждую работу; если их оценки не совпадают, тогда работа передается дополнительным оценкам. [27]

Хотя этот процесс сложнее, чем электронная оценка тестов с несколькими вариантами ответов, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются подготовленными оценщиками в соответствии с заранее определенной оценочной рубрикой. Например, в Pearson все оценивающие сочинения имеют четырехлетнее высшее образование, и большинство из них являются нынешними или бывшими классными учителями. [28]

Часто колледжи предоставляют стипендии студентам, которые хорошо сдали стандартные тесты, такие как ACT или SAT. Интеллектуальный уровень учащихся оценивается по полученным ими баллам, но проблема в том, что даже если учащийся получает хорошие баллы по стандартизированному тесту, по которому он поступает в колледж, это не означает, что он умен. Студент может хорошо сдать тест и не окончить колледж. Это не лучший показатель того, насколько хорошо ученик действительно успевает, но насколько хорошо он тестирует.

Использование рубрик для справедливости [ править ]

Использование рубрики предназначено для повышения справедливости при оценке успеваемости учащегося. При стандартизированном тестировании ошибку измерения (постоянный образец ошибок и систематических ошибок при оценке теста) легко определить с помощью стандартизованного тестирования. При нестандартном оценивании оценщики обладают большей свободой усмотрения и, следовательно, с большей вероятностью будут давать несправедливые результаты из-за бессознательной предвзятости.. Когда оценка зависит от индивидуальных предпочтений оценщиков, то результат, получаемый отдельным учеником, зависит от того, кто ставит оценку за тест. Стандартизированные тесты также устраняют предвзятость учителя в оценке. Исследования показывают, что учителя создают своего рода самореализующиеся пророчества в своих оценках учащихся, предоставляя тем, кто, как они ожидают, получат более высокие баллы, и давая тем, кто, как они ожидают, не смогут получить более низкие оценки. [29]

Использование оценок для сравнений [ править ]

Существует два типа стандартизированных интерпретаций результатов тестов: интерпретация оценок по норме или интерпретация оценок по критериям .

  • Интерпретация результатов с привязкой к норме сравнивает тестируемых с выборкой сверстников . Цель состоит в том, чтобы оценить учащихся как лучше или хуже других. Интерпретация результатов тестов с привязкой к нормам связана с традиционным образованием . Учащиеся, которые успевают лучше других, сдают тест, а ученики, которые успевают хуже других, не проходят его.
  • Интерпретация оценок с привязкой к критериям сравнивает тестируемых с критерием (формальным определением содержания), независимо от оценок других экзаменуемых. Их также можно назвать оценками на основе стандартов , поскольку они соответствуют движению за реформу образования, основанного на стандартах . [30] Интерпретация оценок с привязкой к критериям связана исключительно с тем, является ли ответ конкретного учащегося правильным и полным. Согласно системам, основанным на критериях, все учащиеся могут пройти тест или все учащиеся не пройдут тест.

Любую из этих систем можно использовать в стандартизированном тестировании. Что важно для стандартизированного тестирования, так это то, задаются ли всем учащимся одинаковые вопросы при одинаковых обстоятельствах и выставляются ли они одинаково. В стандартизированном тесте, если данный ответ верен для одного ученика, он верен для всех учеников. Оценщики не принимают ответ как достаточно хороший для одного ученика, но отклоняют тот же ответ как неадекватный для другого ученика.

Термин « нормативная оценка» относится к процессу сравнения одного тестируемого с его или ее сверстниками. Тест норма ссылки (НЗТ) представляет собой тип теста, оценки или оценки , которая дает оценку позиции тестируемого индивидуума в предопределенной населения. Оценка выводится на основе анализа результатов тестов и других соответствующих данных из выборки, взятой из населения. Этот тип теста определяет, справился ли тестируемый лучше или хуже, чем другие учащиеся, проходящие этот тест. Тест критерия ссылки (CRT) является стилем теста , который использует тестоценки, чтобы показать, хорошо ли тестируемые выполнили данное задание, а не насколько хорошо они справились с другими тестируемыми. Большинство тестов и викторин, написанных школьными учителями, основаны на критериях. В этом случае цель состоит в том, чтобы просто проверить, сможет ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнивать результаты каждого ученика с результатами других учеников.

Это делает стандартные тесты полезными при приеме в высшие учебные заведения, когда школа пытается сравнить студентов со всей страны или со всего мира. Примеры таких международных эталонных тестов включают «Тенденции в международных исследованиях математики и естественных наук» ( TIMMS ) и «Прогресс в международном исследовании грамотности чтения» ( PIRLS ). Предполагается, что результаты этих экзаменов будут меняться в зависимости от того, как стандарты, такие как Common Core State Standards (CCSS), соответствуют ведущим странам мира.

Поскольку результаты можно сравнить в разных школах, результаты национального стандартизированного теста можно использовать для определения того, какие области нуждаются в улучшении. Тесты, которые сдают каждый, могут помочь правительству определить, какие школы и учащиеся испытывают наибольшие трудности. [31] Обладая этой информацией, они могут внедрять решения для устранения проблемы, позволяя учащимся учиться и расти в академической среде. [31]

Стандарты [ править ]

Соображения валидности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Однако профессиональные ассоциации и ассоциации практикующих часто помещают эти опасения в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в данном контексте.

Стандарты оценки [ править ]

В области оценки , и в частности оценки образования , Объединенный комитет по стандартам оценки образования [32] опубликовал три набора стандартов оценки. Стандарты оценки персонала [33] были опубликованы в 1988 году, Стандарты оценки программ (2-е издание) [34] были опубликованы в 1994 году, а Стандарты оценки студентов [35] были опубликованы в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат руководящие указания по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Однако тесты нацелены на то, чтобы оценки учащихся предоставляли надежную, точную и достоверную информацию об обучении и успеваемости учащихся; Стандартные тесты предлагают ограниченную информацию о многих формах интеллекта, и полагаться на них вредит студентам, поскольку они неточно измеряют потенциал ученика к успеху.[36]

Стандарты тестирования [ править ]

В области психометрии , что стандарты образования и психологическое тестирование [37] место стандартов о валидности и надежности, наряду с ошибками измерений и вопросами , связанными с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, относящиеся к тестированию приложений, учетным данным , а также к тестированию при оценке программ и государственной политике .

Статистическая достоверность [ править ]

Одним из основных преимуществ стандартизированного тестирования является то, что результаты могут быть задокументированы эмпирически; Таким образом, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также результаты, которые можно обобщить и воспроизвести. [38] Это часто контрастирует с оценками в школьной справке, которые выставляются отдельными учителями. Может быть трудно учесть различия в образовательной культуре в разных школах, сложность учебной программы конкретного учителя, различия в стиле обучения, а также методы и предубеждения, влияющие на выставление оценок.

Еще одно преимущество - агрегирование. Хорошо разработанный стандартизированный тест обеспечивает оценку уровня владения человеком определенной областью знаний или навыков, которая на определенном уровне агрегирования предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние оценки классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за уменьшения ошибки, достигаемой за счет увеличения размера выборки.

Участники теста [ править ]

Сами студенты критикуют тесты, хотя и стандартизированные, но несправедливые по отношению к отдельному учащемуся. Некоторые учащиеся плохо сдают тесты, что означает, что они нервничают и не сосредотачиваются на тестах. Таким образом, хотя тест является стандартным и должен обеспечивать справедливые результаты, участники тестирования находятся в невыгодном положении, но не имеют возможности доказать свои знания в противном случае, поскольку нет другой альтернативы тестирования, которая позволяет учащимся подтвердить свои знания и навыки решения проблем. .

Некоторые студенты страдают тревожностью перед тестами . Тестовая тревога также применима к стандартным тестам, когда студенты, у которых может не быть тестовой тревожности, регулярно испытывают огромное давление, заставляя выполнять их, когда ставки так высоки. Стандартизованное тестирование с высокими ставками включает в себя такие экзамены, как SAT, PARCC и ACT, где для успешной сдачи оценок или поступления в колледж требуется хорошая успеваемость.

Ежегодные стандартизированные тесты в школе [ править ]

Стандартизированное тестирование - это очень распространенный способ определения академических достижений учащегося в прошлом и его будущего потенциала. Однако тесты с высокими ставками (стандартизованные или нестандартные) могут вызывать беспокойство. Когда учителя или школы награждаются за лучшую успеваемость на тестах, тогда эти награды побуждают учителей « преподавать на экзаменах » вместо того, чтобы предоставлять богатую и обширную учебную программу. Термин «обучение к тесту» обычно имеет негативный оттенок. Учителя хотят предложить своим ученикам больше знаний, но когда дело доходит до этого, если они не знают, что находится на тесте, им будет сложно достичь того, чего они хотят. [39]В 2007 году качественное исследование, проведенное Au Wayne, показало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя. [40]

Несмотря на их широкое использование, валидность, качество или использование тестов, особенно стандартизированных тестов в образовании, по-прежнему широко поддерживались или критиковались. Как и сами тесты, поддержка и критика тестов часто бывают разными и могут исходить из самых разных источников, таких как родители, тестируемые, инструкторы, бизнес-группы, университеты или государственные наблюдатели.

Сторонники стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

  • Обратная связь или диагностика работы тестируемого [41]
  • Справедливо и эффективно [42]
  • Способствует подотчетности [41] [42]
  • Прогнозирование и выбор [41]
  • Повышает производительность [41]

Критики стандартизированных тестов в образовании часто приводят следующие причины для пересмотра или удаления стандартизированных тестов в образовании:

  • Сужает учебный формат и поощряет обучение к тесту . [43]
  • Низкое качество прогнозов. [44] [45]
  • Повышение оценок за тестовые баллы или оценки. [46] [47] [48]
  • Культурно или социально-экономически предвзято. [49] [50]
  • Психологически разрушительно. [51]
  • Плохой показатель интеллекта или способностей. [52] [53] [54] [55]

Воздействие на школы [ править ]

Прошлый стандартизированный тестовый документ, в котором используются вопросы с несколькими вариантами ответов и ответы на них в форме, указанной выше.

Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер подотчетности в сфере государственного образования . В то время как Национальная оценка прогресса в образовании (NAEP) служила образовательным барометром в течение примерно тридцати лет, проводя стандартные тесты на регулярной основе в случайных школах по всей территории Соединенных Штатов, усилия за последнее десятилетие на уровне штатов и федеральном уровне предписывали ежегодно стандартизированное управление тестами для всех государственных школ по всей стране. [56]

Идея, лежащая в основе движения за политику стандартизированного тестирования, заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и методов обучения посредством сбора данных. Сторонники утверждают, что данные, полученные в результате стандартизированных тестов, действуют как табель успеваемости для сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, возникающие в результате нынешней государственной стандартизированной практики тестирования, включая проблемы с валидностью и надежностью тестов и ложными корреляциями (см . Парадокс Симпсона ).

Наряду с проведением и выставлением оценок за фактические тесты, в некоторых случаях учителя оценивают, насколько хорошо их собственные ученики выполняют тесты. Учителя сталкиваются с невероятным давлением, заставляющим постоянно повышать оценки, чтобы судить о том, достойны ли они продолжать свою работу. Было много дискуссий о том, насколько точен способ оценки успехов учителей, потому что существует так много факторов, которые влияют на то, насколько хорошо его или ее ученики работают. [36]

Некоторые учителя серьезно влияют на успеваемость своих учеников. В некоторых случаях они всю свою карьеру ставят на карту того, насколько хорошо их ученики проходят тестирование. До половины зарплаты учителя будет привязано к тому, как ее ученики справятся с тестами. [57]

Губернатор Нью-Джерси Крис Кристи предложил образовательную реформу в Нью-Джерси, которая заставляет учителей не только «преподавать на экзаменах», но и заставлять своих учеников успевать за потенциальной ценой их зарплаты и гарантий занятости. Реформа призывает к оплате труда, зависящей от успеваемости учащихся на стандартных тестах и ​​их образовательных достижений. Однако учащиеся различаются в зависимости от когнитивных, развивающих и психологических способностей, поэтому это несправедливо по отношению к учителям с учащимися, у которых есть трудности с тестом. [58]

Школы, получившие низкие баллы, закрываются или сокращаются, что дает прямое влияние на администрацию и приводит к таким опасным приемам, как запугивание, обман и использование информации для повышения баллов. [57]

Некритическое использование стандартизированных результатов тестов для оценки успеваемости учителя и школы неуместно, потому что на оценки учеников влияют три вещи: то, что ученики изучают в школе, что ученики изучают вне школы, и врожденный интеллект учеников . [59] Школа может контролировать только один из этих трех факторов. Было предложено моделирование добавленной стоимости , чтобы справиться с этой критикой путем статистического контроля врожденных способностей и контекстуальных факторов вне школы. [60]В системе с добавленной стоимостью интерпретации результатов тестов аналитики оценивают ожидаемую оценку для каждого учащегося на основе таких факторов, как собственные предыдущие оценки учащегося, основной язык или социально-экономический статус. Предполагается, что разница между ожидаемым баллом ученика и фактическим баллом в основном связана с усилиями учителя.

Влияние на то, чему учат [ править ]

  • Предлагает руководство для учителей. Стандартизированные тесты позволят учителям увидеть, как их ученики успевают по сравнению с другими в стране. Это поможет им при необходимости пересмотреть свои методы обучения, чтобы помочь своим ученикам соответствовать стандартам. [31]
  • Позволяет учащимся видеть собственный прогресс. Учащимся будет предоставлена ​​возможность поразмышлять над своими оценками и увидеть свои сильные и слабые стороны. [31]
  • Предоставьте родителям информацию об их ребенке. Баллы могут позволить родителям составить представление о том, как их ребенок успевает в учебе по сравнению со всеми его сверстниками в стране. [61]

Критики также утверждают, что стандартизированные тесты поощряют « обучение до теста » за счет творчества и глубокого охвата предметов, не включенных в тест. Тесты с множественным выбором подвергаются критике за то, что не оценивают такие навыки, как письмо. Более того, успех ученика отслеживается по относительной успеваемости учителя, поэтому продвижение учителя зависит от его успехов и успеваемости ученика. У учителей возникают этические и экономические вопросы, когда они сталкиваются с явно отстающими или недостаточно квалифицированными учениками и стандартным тестом.

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению из-за сужения учебной программы. Согласно группе FairTest , когда стандартизованные тесты являются основным фактором подотчетности, школы используют тесты для узкого определения учебной программы и целевого обучения. Подотчетность создает огромное давление для выполнения, и это может привести к неправильному использованию и неверной интерпретации стандартизированных тестов. [62]

Критики говорят, что « преподавание для проверки » не способствует обучению более высокого уровня; он трансформирует то, что учителям разрешено преподавать, и сильно ограничивает объем другой информации, которую студенты изучают в течение многих лет. [57] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебный план и инструкции, часто то, что не проверяется, не преподается, и то, как тестируется предмет, часто становится образцом того, как преподавать предмет.

Критики также возражают против материалов, которые обычно проверяются школами. Хотя существуют стандартизированные тесты на неакадемические атрибуты, такие как Тесты творческого мышления Торранса , школы редко проводят стандартизированные тесты для измерения инициативы, творчества, воображения, любопытства, доброй воли, этического мышления или множества других ценных склонностей и качеств. [63] Вместо этого тесты, проводимые школами, как правило, меньше фокусируются на моральном развитии или развитии характера, а больше на индивидуальных академических навыках.

В своей книге, теперь вы видите его , Кэти Дэвидсон критикует стандартизированные тесты. Она описывает нашу молодежь как «дети с конвейера на модели конвейера», имея в виду использование стандартизированного теста как части универсальной образовательной модели. Она также критикует ограниченность проверяемых навыков и называет детей без этих навыков неудачниками или учениками с ограниченными возможностями. [64] Широко распространенный и организованный обман - это растущая культура. [65]

Теоретик образования Билл Эйерс прокомментировал ограничения стандартизированного теста, написав, что «Стандартные тесты не могут измерить инициативу, творчество, воображение, концептуальное мышление, любопытство, усилия, иронию, суждение, приверженность, нюансы, доброжелательность, этическое размышление, или множество других ценных диспозиций и атрибутов. То, что они могут измерить и подсчитать, - это отдельные навыки, конкретные факты и функции, знания содержания, наименее интересные и наименее значимые аспекты обучения ». [66] В своей книге Позор нации , Джонатан Козолутверждает, что учащиеся, прошедшие стандартизированное тестирование, становятся жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, у которых нет пространственной памяти о времени, временных периодах и исторических событиях. Это особенно верно в отношении школ, где из-за нехватки финансирования и политики строгой отчетности школы отказались от таких предметов, как искусство, история и география; чтобы сосредоточиться на конкурсе обязательных тестов. [67]

Есть три показателя, по которым оцениваются страны с лучшими показателями в TIMMS («страны A +»): целенаправленность, согласованность и строгость. Фокус определяется как количество тем, охваченных в каждом классе; идея состоит в том, что чем меньше тем освещается в каждом классе, тем больше внимания можно уделять каждой теме. Определение согласованности - это соблюдение последовательности затронутых тем, которая соответствует естественному развитию или логической структуре математики. CCSSM сравнивали с обоих действующих государственных стандартов и стандартов A + страны. Поскольку в среднем освещается наибольшее количество тем, текущие государственные стандарты имеют наименьшую направленность. [68]Общие основные стандарты призваны исправить это несоответствие, помогая преподавателям сосредоточиться на том, что ученикам нужно изучить, вместо того, чтобы отвлекаться на посторонние темы. Они побуждают образовательные материалы переходить от поверхностного освещения широкого круга тем к нескольким темам более глубоко. [69]

Время и деньги [ править ]

Стандартизированные тесты - это способ измерить уровень образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учеников проходят обязательные тесты. За это время средний ученик сдает 112 стандартных тестов, что соответствует примерно 10 тестам в год. [70] В этом случае средний объем тестирования занимает около 2,3% от общего времени занятий. [71]

Проведение стандартных тестов дорогое. Сообщается, что Соединенные Штаты ежегодно тратят на эти испытания около 1,7 миллиарда долларов. [72] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на уровне штата. [73]

Образовательные решения [ править ]

В некоторых случаях результаты тестов используются в качестве единственного, обязательного или основного критерия для допуска или сертификации. Например, в некоторых штатах США требуется выпускные экзамены в средней школе . Для окончания средней школы требуются соответствующие баллы на этих выпускных экзаменах. Тест общеобразовательного развития часто используется как альтернатива аттестату средней школы.

Другие приложения включают отслеживание (принятие решения о зачислении студента на «быстрый» или «медленный» вариант курса) и присуждение стипендий. В Соединенных Штатах многие колледжи и университеты автоматически переводят баллы по тестам Advanced Placement в кредиты колледжа, соответствие выпускным требованиям или зачисление на более продвинутые курсы. Обобщенные тесты, такие как SAT или GRE , чаще используются в качестве одного из нескольких критериев при принятии решений о приеме. В некоторых государственных учреждениях есть пороговые значения для SAT, GPA или классного рейтинга для создания классов кандидатов, которые будут автоматически принимать или отклонять.

Сильная зависимость от стандартизированных тестов для принятия решений часто вызывает споры по причинам, указанным выше. Критики часто предлагают выделить совокупные или даже нечисловые меры, такие как оценки в классе или краткие индивидуальные оценки (написанные прозой) учителей. Сторонники утверждают, что результаты тестов представляют собой четкий и объективный стандарт, который служит ценным средством проверки повышения оценок . [74]

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на единственном результате теста. [75] Использование минимальных сокращенных баллов при поступлении или выпуске не подразумевает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, предварительные курсы, посещаемость и т. Д. Часто воспринимаются баллы за тесты. в качестве «единственных критериев» просто потому, что они самые трудные, или автоматически предполагается выполнение других критериев. Единственным исключением из этого правила является GED , который позволил многим людям получить признание своих навыков, даже если они не соответствовали традиционным критериям. [ необходима цитата ]

Некоторые учителя утверждают, что единый стандартизированный тест измеряет только текущие знания учащегося и не отражает успеваемость учащихся с начала года. [76] Результат, созданный людьми, которые не являются частью обычного обучения ученика, а профессионалами, которые определяют, что ученики должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучший составитель и ведущий тестов - это они сами. Они утверждают, что лучше всех осведомлены о способностях, способностях и потребностях учащихся, что позволяет им дольше изучать предметы или продолжать обучение по обычной учебной программе.

Воздействие на студентов из неблагополучных семей [ править ]

Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что учащимся, которые говорят на английском как втором языке, имеют инвалидность или выходцы из малообеспеченных семей, непропорционально отказывают в дипломе из-за результатов теста. что несправедливо и вредно. В конце 1970-х годов, когда в Соединенных Штатах начался выпускной экзамен, например, судебный процесс задержался, так как многие чернокожие студенты не имели справедливой возможности ознакомиться с материалом, который они тестировали на выпускном экзамене, потому что они посещали школы, разделенные по закону. «Взаимодействие школ с ограниченными ресурсами и тестирования сильнее всего сказывается на цветных учениках», - утверждает Нил, - «Им непропорционально отказывают в дипломах или повышении в классе, а школы, в которых они учатся, чаще всего плохо справляются с тестами и сталкиваются с трудностями. санкции, такие как реструктуризация ».[77]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Как содиректор Образовательного центра Университета Райса и профессор образования Линда М. Макнейл в своей книге « Противоречия школьной реформы: затраты на стандартизованное тестирование на образование.пишет: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе ограничивает образование по расе и классу». Макнил считает, что реформа образования на основе тестов устанавливает более высокие стандарты для цветных учащихся. По словам Майнера, Макнил «показывает, как реформа, основанная на тестах, централизует власть в руках корпоративной и политической элиты - особенно пугающее событие в наше время усиления корпоративного и консервативного влияния на реформу образования». Такая реформа, основанная на тестах, сделала процесс обучения более простым, особенно для цветных студентов. [78]

FairTest утверждает, что негативные последствия неправильного использования тестов включают в себя вытеснение учеников из школы, вытеснение учителей из профессии, а также подрыв вовлеченности учеников и школьного климата. [62]

Использование стандартизированных тестов при приеме в университеты [ править ]

Использование стандартизированных тестов как части заявки, наряду с другими подтверждающими доказательствами, такими как личное заявление , средний балл и рекомендательное письмо, проверяется университетом. Натан Кунсел, ученый с высшим образованием, заметил, что при поступлении в колледж SAT, CAT и другие стандартизированные тесты «помогают перегруженным сотрудникам приемной комиссии разделить огромное количество абитуриентов на пулы для дальнейшей оценки. Высокие баллы не гарантируют зачисление куда-либо, а низкие не исключают этого, но школы серьезно относятся к тестам ». [79]

  • Тесты предсказывают больше, чем оценки за первый год обучения

Исследования показывают, что тесты позволяют прогнозировать не только оценку за первый год обучения и уровень курсов, которые студент, вероятно, будет изучать. Продольное исследование , проведенное учеными , показывает , что студенты с высокими баллами тестов, скорее всего , принять оспаривая маршрут через колледж. [80] Тесты также могут указывать на результаты студентов вне колледжа, включая оценки преподавателей, исследовательские достижения, получение ученой степени, успеваемость на комплексных экзаменах и профессиональную лицензию. [81]

Поскольку средний балл успеваемости различается в разных школах и даже для двух учеников в одной школе, общий показатель, предоставляемый результатами теста, более полезен.

Однако в апрельском «метаанализе», опубликованном в Журнале педагогических и психологических измерений, Тодд Моррисон и Мелани Моррисон изучили два десятка исследований валидности теста, необходимого для поступления практически в любую программу магистратуры или доктора философии в Америке: выпускник Рекордный экзамен (GRE). В этом исследовании за последние 30 лет приняли участие более 5000 человек. Авторы обнаружили, что на результаты GRE приходится всего 6 процентов разброса оценок в аспирантуре. Авторы писали, что GRE кажется «практически бесполезным с точки зрения прогнозов». Повторное прохождение вступительного теста юридической школы (LSAT) обнаруживает то же самое.

  • Тесты связаны с успехом в реальном мире

Ведутся споры о том, укажет ли тест на долгосрочный успех в работе и жизни, поскольку есть много других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с производительностью работы.

Проведенное в 2007 году лонгитюдное исследование показало, что важные жизненные достижения, такие как публикация нового романа или патентование технологии, также связаны с результатами тестов, даже после учета возможностей получения образования. Существует даже значительное количество свидетельств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их, а также сильные количественные рассуждения имеют решающее значение в современной информационной экономике . [81]

  • После определенного момента более высокие баллы все еще имеют значение

Многие аргументы предполагают, что навыки, полученные в результате тестов, полезны, но только до определенной степени.

Тем не менее, в замечательном лонгитюдном исследовании, опубликованном в 2008 году в журнале Psychological Science, были изучены студенты, которые попали в 1% лучших в возрасте 13 лет. Двадцать лет спустя они были в среднем очень успешными, с высокими доходами, крупными наградами и карьерные достижения, которыми любой родитель мог бы гордиться. [82]

  • Обычные альтернативы тестам не более полезны

Офицеры приемной комиссии полагаются на комбинацию материалов заявки , включая рекомендательные письма , собеседования, эссе студентов, средний балл, тесты и личные заявления, чтобы всесторонне оценить студента. Однако большинство этих инструментов не являются гарантией будущего успеха. Проблемы с традиционными собеседованиями и рекомендательными письмами настолько распространены, что многие школы ищут лучшие варианты. [83]

  • Тесты - это не только показатель социального класса

Существует корреляция между результатами тестов и социальным классом, но этот успех на стандартных тестах и ​​в колледже не зависит просто от класса. Исследования показывают, что «тесты были действительными даже с учетом социально-экономического класса. Независимо от их семейного происхождения, учащиеся с хорошими результатами тестов и средней школы успевают в колледже лучше, чем учащиеся с более низкими оценками и более слабой успеваемостью ». [84]

  • Подготовка к тестам и коучинг имеют ограниченное влияние

Еще одна критика, касающаяся социального класса и стандартизации, заключается в том, что только богатые люди могут проходить подготовку к экзаменам и обучение. Однако «исследователи провели ряд экспериментальных и контролируемых полевых исследований, чтобы проверить этот вопрос. В целом они пришли к выводу, что выигрыш от подготовки к тесту составляет порядка 5–20 баллов, а не 100–200 баллов, заявленных некоторыми компаниями по подготовке к тестированию » [85]

  • Тесты не препятствуют разнообразию при поступлении

Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие при поступлении, поскольку меньшинства имеют более низкие баллы в тестах по сравнению с другими представленными группами. В исследовании 2012 года рассматриваются школы, в которых вступительные испытания являются необязательными для поступающих, и сравнивается их со школами, в которых они проводятся. И результат показывает, что «недавнее исследование показывает, что школы с факультативным тестированием набирают все больше и больше учащихся. Но то же самое можно сказать и о школах, где требуется тестирование ». [86]

Противники утверждают, что стандартизированные тесты - это неправильное использование и некритическое суждение об интеллекте и производительности, но сторонники утверждают, что это не отрицание стандартизированных тестов, а критика плохо спроектированных режимов тестирования. Они утверждают, что тестирование должно и действительно фокусирует образовательные ресурсы на наиболее важных аспектах образования - передаче заранее определенного набора знаний и навыков - и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что темнокожие и латиноамериканские студенты в среднем получают меньше баллов, чем белые и азиаты. Таким образом, стандартные тесты по математике и чтению, такие как SAT, сталкиваются с нарастающими атаками со стороны прогрессистов. Однако исчерпывающий отчет сената факультета Калифорнийского университета, подготовленный по заказу г-жи Наполитано и выпущенный в 2020 году, показал, что тесты не являются дискриминационными и играют важную роль в защите качества образования. [87]

В отчете говорится, что ухудшение инфляции оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. [87]

Что касается намерения школ UC отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, субъективный и индивидуальный тест, такой как эссе и внеклассные занятия, может быть легко адаптирован и бесполезен для учащихся, которые не знакомы с процессом. Прием без тестирования может быть еще более предпочтительным в пользу людей с хорошими связями. [88]

Отчет на 228 страницах, составленный в январе 2020 года сенатом факультета Калифорнийского университета, рекомендует, чтобы система UC сохранила стандартизированные тесты в качестве требований для приема. [87] Отчет развенчивает миф о том, что стандартные тесты по математике и чтению бесполезны для прогнозирования успеваемости в колледже. Основываясь на данных, полученных от учащихся системы UC, в отчете делается вывод о том, что «результаты тестов в настоящее время являются лучшими показателями среднего балла за первый год обучения, чем средний балл в средней школе». [87] Далее в отчете говорится: баллы также позволяют предсказать общий средний балл колледжа и вероятность того, что студент закончит учебу. В то время как «прогностическая сила результатов тестов выросла», - добавлено в отчете, «прогностическая сила оценок в старшей школе снизилась». [87]

Результаты тестов позволяют школам UC «выбирать из недостаточно представленных групп тех учащихся , которые с большей вероятностью получат более высокие оценки и закончат обучение вовремя». [87] «Первоначальная цель теста SAT состояла в том, чтобы выявить студентов, пришедших из относительно привилегированных кругов, которые могут иметь потенциал преуспеть в университете», - говорится в отчете. [87] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT - это не тест на «способности», а скорее оценка «развитых способностей». [89]

См. Также [ править ]

Основные темы [ править ]

  • Инвентаризация концепций  - инструмент оценки знаний
  • Образовательная оценка  - систематический процесс документирования и использования эмпирических данных о знаниях, навыках, отношениях и убеждениях для уточнения программ и улучшения обучения учащихся.
  • Оценка  - систематическое определение достоинств, ценности и значимости предмета,
  • Список стандартизированных тестов в Соединенных Штатах  - статья со списком в Википедии
  • Психометрия  - теория и методика психологического измерения
  • На основе стандартов оценки  - оценка на основе указанных стандартов
  • Тест (оценка)  - Процедура измерения знаний, навыков, способностей, физической подготовки или других характеристик субъекта.

Другие темы [ править ]

  • Альтернативная оценка
  • Закон Кэмпбелла
  • Критерийный тест
  • Выпускной экзамен средней школы
  • Машина для подсчета результатов теста IBM 805
  • Нормативный тест
  • Реформа образования на основе стандартов
  • Эффект Volvo

Ссылки [ править ]

  1. Не ^ Сильван обучения глоссарий, извлекаться онлайн, источник больше не доступен
  2. ^ Popham, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
  3. ^ Фелпс, Ричард П. «Роль и важность тестирования» . nonpartisaneducation.org . Проверено 17 мая 2016 .
  4. ^ a b c Олсон, Эми М .; Сабли, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В хорошем, Томас Л. (ред.). Образование 21 века: Справочник . Публикации SAGE. С. 423–430. DOI : 10.4135 / 9781412964012.n46 . ISBN 9781452265995.
  5. ^ "Китайская государственная служба" . Encyclopdia Britannica . Дата обращения 2 мая 2015 .
  6. ^ a b c d e Марк и Бойер (1996), 9–10.
  7. ^ а б Казин, Эдвардс и Ротман (2010), 142.
  8. ^ a b Trahair, Ричард (2015-06-01). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт . Издатели транзакций. ISBN 9781412855495.
  9. ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
  10. ^ Гаррисон, Марк Дж. Мера неудач: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
  11. ^ Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедия для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .
  12. ^ Gould, SJ, "Нация дебилов", New Scientist (6 мая 1982), 349-352.
  13. ^ Дарти младший, Уильям. «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Gale Cengage Learning . Проверено 25 января 2017 года .
  14. ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Web. 09 марта 2014 г.
  15. ^ "Что на ACT." Разделы теста ACT. Np, nd Web. 05 мая 2014
  16. ^ Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Дельта Пхи Каппан . 83 (10): 758–765. DOI : 10.1177 / 003172170208301010 . S2CID 145683785 .  
  17. ^ a b Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизованное тестирование не прекращается» . Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 года .
  18. ^ Kobal, Х. и Цзян, Y., 2018
  19. ^ Кобаль, Х. и Цзян, Ю., (2018) Основные факты о детях с низким доходом. Получено с http://www.nccp.org/publications/pub_1194.html
  20. ^ «История и предыстория ни одного ребенка, оставленного позади». Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  21. ^ "Закон о достижении каждым студентом успеха (ESSA) | Министерство образования США" .
  22. ^ Claiborn, Чарльз. «Тестирование по-крупному». Энциклопедия одаренности, творчества и таланта. SAGE Publications, 2009. 9 апреля 2014 г.
  23. ^ «Главная - Австралийский учебный план v8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 .
  24. ^ Горовиц, MR; Монтгомери, DL (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263 . PMID 8500058 .  
  25. ^ Канадский стандартизированный тест на пригодность (CSTF): для детей от 15 до 69 лет: руководство по интерпретации и консультированию . Канадская ассоциация спортивных наук, Программа сертификации и аккредитации фитнес-аттестации, Канадское общество физиологии упражнений, Fitness Canada. Глостер, Онтарио: Канадское общество физиологии упражнений. 1987. ISBN. 0-662-15736-2. OCLC  16048356 .CS1 maint: другие ( ссылка )
  26. ^ Веб-сайт ETS о выставлении оценок GRE.
  27. ^ Б Houtz, Jolayne (27 августа 2000) «Temps потратить всего несколько минут , чтобы набрать состояние тест А Уошл математическую задачу может занять 20 секунд, эссе, 2 1 / 2 минуты» . Сиэтл Таймс "За считанные минуты временный служащий в размере 10 долларов в час выставит оценку вашему ребенку"
  28. ^ Рич, Мотоко (2015-06-22). «Оценка общего ядра: опыт преподавания не требуется» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 6 октября 2015 . 
  29. ^ Ли, Джуссим (1989). «Ожидания учителя: самоисполняющиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. DOI : 10.1037 / 0022-3514.57.3.469 .
  30. ^ Где мы стоим: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1]. Архивировано 24 августа 2006 г., в Wayback Machine.
  31. ^ a b c d «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 2014-10-29 . Проверено 19 февраля 2018 .
  32. ^ «Объединенный комитет по стандартам оценки образования» . Архивировано из оригинального 15 октября 2009 года . Дата обращения 2 мая 2015 .
  33. ^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки педагогов. Архивировано 2005-12-12 в Вайбак машины Ньюбери Парк,Калифорния: Sage Publications.
  34. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 года в парке Wayback Machine в Ньюбери, Калифорния: Sage Publications.
  35. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Архивировано 24 мая 2006 года в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.
  36. ^ a b Морган, Хани (2016). «Опора на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. DOI : 10.1080 / 00098655.2016.1156628 . S2CID 148015644 . 
  37. ^ «Стандарты образовательного и психологического тестирования» . www.apa.org . Дата обращения 2 мая 2015 .
  38. ^ Kuncel, NR; Хезлетт, С.А. (2007). «ОЦЕНКА: Стандартные тесты предсказывают успехи аспирантов». Наука . 315 (5815): 1080–81. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .  
  39. ^ «Ни один ребенок не остался позади». - Исследовательский центр "Неделя образования". Np, 19 сентября 2011 г. Web. 6 июля 2014 г. < http://www.edweek.org/ew/issues/no-child-left-behind/ >. «Проблемы со стандартизированным тестированием». Education.com. Np, 3 ноября 2013 г. Web. 1 июля 2014 г. < http://www.education.com/reference/article/Ref_Test_Problems_Seven/ Архивировано 20 июня 2014 г. на Wayback Machine >.
  40. ^ Ау, Уэйн (2007-06-01). «Тестирование с высокими ставками и контроль учебных программ: качественный метасинтез». Педагогический исследователь . 36 (5): 258–267. DOI : 10.3102 / 0013189X07306523 . ISSN 0013-189X . S2CID 507582 .  
  41. ^ a b c d Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7.
  42. ^ a b Хирш-младший, Эрик (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN 978-0-385-49524-0.
  43. ^ «Госвами У (1991) подвергли испытанию: влияние внешнего тестирования на учителей. Исследователь в области образования 20: 8-11» . Архивировано из оригинала на 2013-02-02.
  44. ^ "FairTest критика SAT" . fairtest.org.
  45. ^ «Стандартизированные тесты не всегда лучший показатель успеха» .
  46. Перейти ↑ Paton, Graeme (6 июля 2010 г.). «Университеты критикуют экзамен„инфляцию класса » . Дейли телеграф . Лондон.
  47. ^ Vasagar, Дживан (2 августа 2010). «Опасения за государственных учеников, поскольку лучшие университеты настаивают на оценке A * на уровне A-level» . Хранитель . Лондон.
  48. Перейти ↑ Finch, Julia (10 марта 2010 г.). «Они не умеют читать, писать, следить за временем и быть аккуратными: вердикт директора Tesco выпускникам школ» . Хранитель . Лондон.
  49. ^ Хеджес, Ларри В .; Laine, Ричард Д .; Гринвальд, Роб (1994). "Hedges LV (1994) Обмен: Часть I *: Имеют ли значение деньги? Метаанализ исследований влияния различного школьного вклада на результаты учащихся" . Педагогический исследователь . 23 (3): 5–14. DOI : 10.3102 / 0013189X023003005 . S2CID 36771659 . 
  50. ^ Coughlan, Шон. Яркие бедняки «сдерживались десятилетиями» , BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.
  51. ^ «Неврология стандартизированного проведения тестов» .
  52. ^ «Стандартные тесты не показывают того, что знают дети» .
  53. ^ «Стандартизированные тесты не являются хорошим показателем жидкого интеллекта согласно новым исследованиям» .
  54. ^ «Стандартизированные тесты не измеряют интеллект или способности» .
  55. ^ «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся» .
  56. ^ "Табель успеваемости NAEP - Национальная оценка образовательного прогресса - NAEP" . nces.ed.gov . Проверено 19 февраля 2018 .
  57. ^ a b c Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению студентов» . go.galegroup.com . Проверено 28 марта 2018 года .
  58. Арко, Мэтт (12 июня 2015 г.). «Выступление Christie Education в Айове» . NJ.com . Проверено 25 июля, 2016 .
  59. ^ Popham, WJ (1999). «Почему результаты стандартизированных тестов не измеряют качество образования» . Образовательное лидерство . 56 (6): 8–15.
  60. Hassel, B. & Rosch, J. (2008) «Праймер с добавленной стоимостью в Огайо». Фонд Фордхэма. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf [ постоянная мертвая ссылка ]
  61. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013. Архивировано из оригинального (PDF) 27 января 2018 года . Проверено 19 февраля 2018 года .
  62. ^ a b Холлоуэй, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
  63. Перейти ↑ Kohn, Alfie (2000). Дело против стандартизированного тестирования: повышение результатов, разрушение школ . 361 Hanover Street Portsmouth, NH 03801-3912: Heinemann. ISBN 978-0325003252.CS1 maint: location ( ссылка )
  64. ^ Дэвидсон, Кэти (2011). Теперь вы видите: как наука о внимании изменит наш образ жизни, работы и обучения . Нью-Йорк: Викинг.
  65. ^ Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли замену для сдачи аттестационных тестов» . NBC News . Дата обращения 2 мая 2015 .
  66. ^ Чтобы преподавать: путешествие учителя, Уильям Айерс, Teachers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116  
  67. ^ Козол, Джонатан (2005). Позор нации: восстановление школы апартеида в Америке . Печать: Random House. С. 118–119. ISBN 9781415924167.
  68. ^ Шмидт, Уильям Х .; Хоуанг, Ричард Т. (2012). «Последовательность учебных программ и общие основные стандарты математики». Педагогический исследователь . 41 (8): 294–308. DOI : 10.3102 / 0013189x12464517 . S2CID 121779439 . 
  69. ^ Портер, А .; McMaken, J .; Hwang, J .; Ян Р. (2011). «Общие базовые стандарты: новый учебный план США» . Педагогический исследователь . 40 (7): 103–116. DOI : 10.3102 / 0013189x11405038 . S2CID 51453603 . 
  70. Рианна Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование проводится в подавляющем большинстве государственных школ страны» . Вашингтон Пост . Проверено 26 июля 2015 года .
  71. ^ Деринг, Кристофер (25 октября 2015). «План Обамы ограничивает стандартизированное тестирование не более чем 2% учебного времени» . USA Today . Проверено 26 июля, 2016 .
  72. ^ Кучинский-Браун, Алекс. «Стандартизированные затраты на тестирование составляют 1,7 миллиарда долларов в год, результаты исследования». The Huffington Post. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.
  73. ^ "Большая четверка тестовой индустрии" . PBS Frontline . PBS. 2001 . Проверено 21 января 2015 .
  74. ^ Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледжи , Балтимор: издательство Университета Джона Хопкинса, стр. 344, ISBN 9781421424965
  75. ^ "Обзор всех тем - Национальная пресса академий" . Архивировано из оригинала на 2008-04-18 . Дата обращения 2 мая 2015 .
  76. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017.
  77. ^ Нил, Монти (осень 2009 г.). Стандартные тесты несправедливы и вредны . Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. С. 28–35. ISBN 9780737747812. Дата обращения 4 декабря 2016 .
  78. ^ Шахтер, Барбара (август 2000). «Стандартизированные умы: высокая цена американской культуры тестирования и то, что мы можем сделать, чтобы ее изменить / Противоречия школьной реформы: стоимость стандартизированного тестирования на образование». Прогрессивный . 64 : 40–43. ProQuest 231959849 . 
  79. ^ Кунсел, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . The Wall Street Journal .
  80. ^ Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .  
  81. ^ а б Кунсел, Натан; Хезлетт, Сара А. (2007). «Стандартные тесты предсказывают успех аспирантов» . Наука . 315 : 1080–1081. DOI : 10.1126 / science.1136618 . PMID 17322046 . S2CID 143260128 .  
  82. ^ Парк, Грегори; Любински, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соразмерную степень важности для научного творчества». Психологическая наука . 19 (10): 957–961. DOI : 10.1111 / j.1467-9280.2008.02182.x . PMID 19000201 . S2CID 6443429 .  
  83. ^ Мерфи, Сара C; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунсел, Натан Р. (2009). «Прогностическая сила личных заявлений при поступлении: метаанализ и предостерегающий рассказ» . Колледж и университет . 84 : 83–86, 88.
  84. ^ Кунсел, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус связь между вступительными испытаниями и успеваемостью после окончания средней школы?» . Психологический бюллетень : 1–22.
  85. ^ Коннелли, Брайан С .; Кунсел, Натан (3 ноября 2012 г.). «Уравновешивание групп лечения и контроля в квази-экспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. DOI : 10.1111 / peps.12020 .
  86. ^ Кунсел, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с учащимися SAT и в решениях о приеме в колледж». Психологическая наука . 23 (9): 1000–7. DOI : 10.1177 / 0956797612438732 . PMID 22858524 . S2CID 22703783 .  
  87. ^ a b c d e f g КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, АКАДЕМИЧЕСКИЙ СЕНАТ (январь 2020 г.). «Отчет рабочей группы по стандартизированному тестированию Ученого совета UC» (PDF) .
  88. Редакционная коллегия (17 мая 2020 г.). «Калифорния определяет испытания вниз» . The Wall Street Journal .
  89. ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической достоверности ...» Журнал педагогических и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.

Дальнейшее чтение [ править ]

  • FairTest, "Что не так со стандартными тестами", Информационный бюллетень. (Нью-Йорк: Basic Books, 1985), стр. 172–181.
  • Харрис, Смит и Харрис Мифы о стандартизированных тестах: почему они не говорят вам, что, по вашему мнению, они делают, Rowman & Littlefield 2011 * Хаддлстон, Марк У. Бойер, Уильям У. Высшая государственная служба в США: поиски реформа . (University of Pittsburgh Press, 1996)
  • Фелпс, Ричард П. Влияние тестирования на успеваемость учащихся, 1910–2010 гг. , Международный журнал тестирования, 10 (1), 2012 г.
  • Фелпс, Ричард П., изд. Исправление заблуждений об образовательном и психологическом тестировании . (Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008 г.)
  • Фелпс, Ричард П., Учебник по стандартизированному тестированию. (Нью-Йорк, Нью-Йорк: Питер Лэнг, 2007)
  • Фелпс, Ричард П. Роль и важность стандартизированного тестирования в мире преподавания и обучения
  • Рэвич, Дайан , «Использование и неправильное использование тестов» , в «Школах, которых мы заслуживаем» * Штраус, Валери. Подтверждено: стандартизированные тесты прошли в наших школах. Но кто виноват?

Внешние ссылки [ править ]

  • Объединенный комитет по стандартам оценки образования
  • Стандартизированное тестирование в школе
  • Стандарты педагогического и психологического тестирования
  • Определение стандартизированного теста Национального совета по измерениям в образовании