Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Образовательная оценка или образовательная оценка [1] - это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях и убеждениях для уточнения программ и улучшения обучения учащихся. [2] Данные оценки могут быть получены путем непосредственного изучения работ учащихся для оценки достижений результатов обучения или могут быть основаны на данных, из которых можно сделать выводы об обучении. [3] Оценка часто используется как синоним теста, но не ограничивается тестами. [4]Оценка может быть сосредоточена на отдельном учащемся, учебном сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учреждении или образовательной системе в целом (также известная как степень детализации). Слово «оценка» стало использоваться в образовательном контексте после Второй мировой войны. [5]

Как непрерывный процесс, оценка устанавливает измеримые и четкие результаты обучения учащихся для обучения, обеспечивая достаточное количество возможностей обучения для достижения этих результатов, внедряя систематический способ сбора, анализа и интерпретации данных, чтобы определить, насколько хорошо обучение учащихся соответствует ожиданиям, и используя собранная информация для улучшения обучения студентов. [6]

Конечная цель оценочных практик в образовании зависит от теоретической базы практикующих специалистов и исследователей, их предположений и убеждений о природе человеческого разума, происхождения знаний и процесса обучения.

Типы [ править ]

Термин « оценка» обычно используется для обозначения всех действий, которые учителя используют для помощи ученикам в учебе и для оценки успеваемости учеников. [7] Оценку для удобства можно разделить на следующие категории:

  1. Размещение, формирующая, итоговая и диагностическая оценка
  2. Объективно и субъективно
  3. Ссылка (ссылка на критерий, ссылка на норму и ипсативный (принудительный выбор) )
  4. Неформальный и формальный
  5. Внутренний и наружный
  6. Сжигание учебников учеников в саду за домом (это радикально новый подход Стюарта Танстолла, доказавший, что он снижает нагрузку на учителей и повышает оценки учеников до тех, которые были поставлены перед БПФ)

Размещение, формирующее, суммативное и диагностическое [ править ]

Оценка часто делится на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценивания.

  • Оценка размещения - оценка размещения используется для размещения учащихся в соответствии с предыдущими достижениями или личными характеристиками, в наиболее подходящий момент в учебной последовательности, с использованием уникальной учебной стратегии или с подходящим учителем [8], проводимым путем тестирования размещения., т. е. тесты, которые колледжи и университеты используют для оценки готовности студентов к поступлению в колледж и размещения студентов в начальных классах. Оценка размещения, также называемая предварительной оценкой или начальной оценкой, проводится перед инструктажем или вмешательством, чтобы установить исходный уровень, по которому можно измерить индивидуальный рост учащегося. Этот тип оценки используется, чтобы узнать, каков уровень знаний учащегося по предмету. Это помогает учителю более эффективно объяснять материал. Эти оценки не выставляются на оценку. [9]
  • Формирующее оценивание - Формирующее оценивание обычно проводится на протяжении всего курса или проекта. Формирующая оценка, также называемая «образовательной оценкой», используется для помощи в обучении. В образовательной среде формирующая оценка может осуществляться учителем (или сверстником ) или учащимся, обеспечивая обратную связь о работе учащегося, и не обязательно будет использоваться для целей выставления оценок. Формирующие оценки могут принимать форму диагностических, стандартных тестов, викторин, устных вопросов или черновиков. Формирующие оценки проводятся одновременно с инструкциями. Результат можно засчитать. Формирующие оценки направлены на то, чтобы увидеть, понимают ли учащиеся инструкции, прежде чем выполнять итоговую оценку. [9]
  • Суммативная оценка - Суммативная оценка обычно проводится в конце курса или проекта. В образовательной среде итоговые оценки обычно используются для присвоения студентам оценок за курс. Суммативные оценки носят оценочный характер. Итоговые оценки предназначены для обобщения того, что студенты узнали, чтобы определить, хорошо ли они понимают предмет. Этот тип оценки обычно выставляется по шкале (например, сдан / не пройден, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание часто используется для определения того, сдал ли ученик урок или нет. Итоговые оценки критикуют за то, что они редуктивны, и учащиеся обнаруживают, насколько хорошо они приобрели знания, слишком поздно, чтобы их можно было использовать. [9]
  • Диагностическая оценка - Диагностическая оценка касается всех трудностей, возникающих в конце процесса обучения.

Джей МакТиг и Кен О'Коннор предложили семь практик эффективного обучения. [9] Один из них - показать критерии оценки перед тестом. Другой - о важности предварительной оценки, чтобы узнать, каков уровень навыков ученика, прежде чем давать инструкции. Другая практика - давать много отзывов и поощрять.

Исследователь в области образования Роберт Стейк [10] объясняет разницу между формирующим и итоговым оцениванием следующей аналогией:

Когда повар пробует суп, это формирует. Когда гости пробуют суп, это итог. [11]

Итоговое и формирующее оценивание часто упоминается в контексте обучения как оценка обучения и оценка обучения соответственно. Оценка обучения, как правило, носит итоговый характер и предназначена для измерения результатов обучения и сообщения об этих результатах учащимся, родителям и администраторам. Оценка успеваемости обычно проводится по завершении урока, курса, семестра или учебного года. Оценка для обучения обычно носит формирующий характер и используется учителями для рассмотрения подходов к обучению и следующих шагов для отдельных учащихся и класса. [12]

Распространенной формой формирующей оценки является диагностическая оценка . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка - это форма диагностической оценки, при которой учащиеся оценивают себя. Перспективная оценка просит оцениваемых рассматривать себя в гипотетических будущих ситуациях. [13]

Оценка, основанная на результатах, похожа на итоговую оценку, поскольку она фокусируется на достижениях. Его часто увязывают с реформой образования, основанного на стандартах, и движением за образование, основанное на результатах . Хотя в идеале они значительно отличаются от традиционного теста с множественным выбором, они чаще всего связаны со стандартным оцениванием.в которых используются ответы в свободной форме на стандартные вопросы, оцениваемые людьми по шкале, основанной на стандартах, отвечающие, падающие ниже или превышающие стандарт эффективности, а не ранжируемые по кривой. Определяется четко определенная задача, и учащихся просят что-то создать, произвести или сделать, часто в условиях, требующих реального применения знаний и навыков. Профессионализм демонстрируется предоставлением расширенного ответа. Форматы исполнения дополнительно подразделяются на продукты и выступления. Результатом выступления может стать произведение, например картина, портфолио, бумага или выставка, или оно может состоять из выступления, например выступления, спортивных навыков, музыкального выступления или чтения.

Объективное и субъективное [ править ]

Оценка (итоговая или формирующая) часто подразделяется на объективную или субъективную. Объективная оценка - это форма вопросов, на которые есть единственный правильный ответ. Субъективная оценка - это форма вопросов, на которые может быть указано более одного правильного ответа (или более одного способа выразить правильный ответ). Есть разные типы объективных и субъективных вопросов. Типы объективных вопросов включают истинные / ложные ответы, множественный выбор , множественные ответы и вопросы на соответствие. Субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективное оценивание хорошо подходит для все более популярного компьютеризированного или онлайн- формата оценивания .

Некоторые утверждали, что различие между объективными и субъективными оценками бесполезно и не является точным, поскольку в действительности не существует такой вещи, как «объективная» оценка. Фактически, все оценки создаются с присущими им предубеждениями, встроенными в решения о соответствующем предмете и содержании, а также с культурными (классовыми, этническими и гендерными) предубеждениями. [14]

Основа сравнения [ править ]

Результаты теста можно сравнить с установленным критерием, или с успеваемостью других учеников, или с предыдущими показателями:

  • Оценка , основанная на критериях , обычно с использованием критериальной проверки , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериальное оценивание часто, но не всегда, используется для определения компетентности человека (может ли он / она что-то делать). Самым известным примером оценки, основанной на критериях, является экзамен по вождению, когда учащиеся водители оцениваются по ряду явных критериев (например, «Не подвергать опасности других участников дорожного движения»).
  • Оценка, основанная на нормах (в просторечии известная как « оценка по кривой »), обычно с использованием теста, основанного на нормах., не измеряется по определенным критериям. Этот тип оценки относится к студенческому сообществу, проводящему оценку. Это эффективный способ сравнения студентов. Тест IQ - самый известный пример оценки, основанной на нормах. Многие вступительные испытания (в престижные школы или университеты) основаны на нормах, что позволяет пройти фиксированную долю учащихся («сдача» в данном контексте означает принятие в школу или университет, а не явный уровень способностей). Это означает, что стандарты могут меняться из года в год в зависимости от качества когорты; оценка, основанная на критериях, не меняется из года в год (если критерии не меняются). [15]
  • Ипсативная оценка - это самостоятельное сравнение либо в одной и той же области с течением времени, либо в сравнении с другими областями в пределах того же студента.

Неформальный и формальный [ править ]

Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, такой как тест, викторина или работа. Формальной оценке присваивается числовой балл или оценка, основанная на успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно происходит в более непринужденной манере и может включать наблюдение, инвентаризацию, контрольные списки, рейтинговые шкалы, рубрики , оценки эффективности и портфолио, участие, коллегиальную и самооценку, а также обсуждение. [16]

Внутренний и внешний [ править ]

Внутренняя оценка устанавливается и отмечается школой (т.е. учителями). Студенты получают оценку и отзывы об оценке. Внешняя оценка устанавливается руководящим органом и проводится непредвзятым персоналом. Некоторые внешние оценки дают гораздо более ограниченную обратную связь при выставлении оценок. Однако в тестах, таких как австралийский NAPLAN, критерий, к которому обращаются учащиеся, получает подробную обратную связь, чтобы их учителя могли рассмотреть и сравнить учебные достижения учащихся, а также составить планы на будущее.

Стандарты качества [ править ]

Как правило, качественные оценки считаются оценками с высоким уровнем надежности и достоверности . Однако подходы к надежности и достоверности различаются.

Надежность [ править ]

Надежность относится к последовательности оценки. Надежная оценка - это оценка, которая неизменно дает одни и те же результаты с одной и той же (или подобной) группой студентов. На надежность влияют различные факторы, в том числе неоднозначные вопросы, слишком много вариантов в вопроснике, расплывчатые инструкции по выставлению оценок и плохо обученные маркеры. Традиционно надежность оценки основана на следующем:

  1. Временная стабильность: производительность в тесте сравнима в двух или более отдельных случаях.
  2. Эквивалентность форм: результаты экзаменов одинаковы по разным формам теста на основе одного и того же содержания.
  3. Внутренняя согласованность: ответы на вопросы теста единообразны. Например: в опросе, в котором респондентов просят оценить отношение к технологиям, можно ожидать единообразия в ответах на следующие вопросы:
    • «Я очень негативно отношусь к компьютерам в целом».
    • «Мне нравится пользоваться компьютерами». [17]

Надежность измерения x также может быть определена количественно как: где - надежность наблюдаемого (тестового) балла x; и - вариативность «истинных» (т. е. врожденных способностей кандидата) и измеренных результатов теста соответственно. может варьироваться от 0 (совершенно ненадежно) до 1 (полностью надежно).

Срок действия [ править ]

Достоверная оценка - это оценка, измеряющая то, что она предназначена для измерения. Например, нельзя оценивать навыки вождения только с помощью письменного теста. Более действенным способом оценки навыков вождения была бы комбинация тестов, которые помогают определить, что водитель знает, например, с помощью письменного теста на знание вождения, и того, что водитель может делать, например, с помощью оценки фактических результатов. вождение. Учителя часто жалуются, что на некоторых экзаменах неправильно оценивается программа, на которой основан экзамен; они, по сути, ставят под сомнение достоверность экзамена.

Достоверность оценки обычно оценивается путем изучения доказательств по следующим категориям:

  1. Содержание - соответствует ли содержание теста заявленным целям?
  2. Критерий - Коррелируют ли баллы с внешней ссылкой? (например: Точно ли высокие баллы на тесте по чтению в 4-м классе предсказывают навыки чтения в будущих классах?)
  3. Построить - Соответствует ли оценка другим значимым переменным? (например: учащиеся ESL стабильно показывают отличные результаты на письменном экзамене по сравнению с носителями английского языка?) [18]

Хорошая оценка имеет как достоверность, так и надежность, а также другие атрибуты качества, указанные выше для конкретного контекста и цели. На практике оценка редко бывает полностью достоверной или абсолютно надежной. Линейка с неправильной маркировкой всегда будет давать одинаковые (неправильные) измерения. Это очень надежно, но не очень актуально. Попросить случайных людей назвать время, не глядя на часы или часы, иногда используется в качестве примера оценки, которая является действительной, но ненадежной. Ответы будут разными у разных людей, но средний ответ, вероятно, близок к реальному времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто приходится искать компромисс между надежностью и достоверностью. В тесте по истории, написанном для высокой степени достоверности, будет много вопросов для сочинения и заполнения пустых полей.Это будет хорошая мера владения предметом, но трудно дать точную оценку. Исторический тест, написанный для высокой надежности, будет иметь несколько вариантов выбора. Он не так хорош для измерения знаний по истории, но может быть легко оценен с большой точностью. Мы можем сделать из этого обобщения. Чем надежнее наша оценка того, что мы хотим измерить, тем меньше мы уверены в том, что действительно измеряем этот аспект достижения.тем менее уверены, что мы действительно измеряем этот аспект достижения.тем менее уверены, что мы действительно измеряем этот аспект достижения.

Хорошо провести различие между достоверностью «предметной» и «предсказательной». Первый, широко используемый в образовании, позволяет определить, какой балл получит студент за аналогичный тест, но с другими вопросами. Последний, широко используемый на рабочем месте, позволяет прогнозировать производительность. Таким образом, уместен предметный тест на знание правил вождения, в то время как прогнозируемый тест позволит оценить, может ли потенциальный водитель следовать этим правилам.

Стандарты оценки [ править ]

В области оценивания , и в частности оценки образования , Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. Персонал Стандарты оценки были опубликованы в 1988 год [19] Стандарты оценки программы (второе издание) были опубликованы в 1994 году, [20] и Стандарты Учащихся оценок были опубликованы в 2003 году [21]

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат руководящие указания по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании присуждается награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовую практику в отношении оценки образования в контексте обучения взрослых, дальнейшего и производственного образования и обучения. [22]

Сводная таблица основных теоретических основ [ править ]

В следующей таблице приведены основные теоретические основы, лежащие в основе почти всей теоретической и исследовательской работы, а также практические методы обучения в образовании (одна из которых, конечно же, практика оценивания). Эти различные подходы вызвали интересные дискуссии среди ученых.

Противоречие [ править ]

Обеспокоенность по поводу того, как лучше всего применять методы оценивания в системах государственных школ, в основном сосредоточена на вопросах об использовании тестов с высокими ставками и стандартизированных тестов, которые часто используются для измерения успеваемости учащихся, качества учителей и успеваемости в школе, округе или штате. .

Ни одного отстающего ребенка [ править ]

Для большинства исследователей и практиков вопрос не в том, следует ли вообще проводить тесты - существует общее мнение, что, если их проводить с пользой, тесты могут предоставить полезную информацию об успеваемости учащихся и реализации учебной программы, а также могут быть использованы для форматирования. ученики. [23] Таким образом, реальная проблема заключается в том, могут ли методы тестирования, применяемые в настоящее время, предоставить эти услуги преподавателям и студентам.

8 января 2002 года президент Буш подписал Закон «Ни одного отстающего ребенка» (NCLB). Закон NCLB повторно санкционировал Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с войной с бедностью и финансировать начальную и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требует, чтобы государства разрабатывали оценки основных навыков. Чтобы получить федеральное школьное финансирование, штаты должны были дать эти оценки всем учащимся на выбранном уровне обучения.

В США Закон « Ни одного отстающего ребенка» требует стандартизированного тестирования по всей стране. Эти тесты согласуются с учебной программой штата и связывают ответственность учителей, учащихся, округов и штата с результатами этих тестов. Сторонники NCLB утверждают, что он предлагает ощутимый метод измерения успеваемости, привлечения учителей и школ к ответственности за плохие оценки и устранения разрыва в успеваемости по классам и этнической принадлежности. [24]

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение преподавателей к ответственности за результаты тестов ведет к практике « обучения тесту ». Кроме того, многие утверждают, что акцент на стандартизированном тестировании побуждает учителей вооружать учащихся узким набором навыков, которые улучшают выполнение тестов, фактически не способствуя более глубокому пониманию предмета или ключевых принципов в области знаний. [25]

Тестирование с высокими ставками [ править ]

Оценки, которые вызвали наибольшие споры в США, - это использование выпускных экзаменов средней школы , которые используются для отказа в дипломах учащимся, которые учились в средней школе в течение четырех лет, но не могут продемонстрировать, что они усвоили необходимый материал при написании экзаменов. . Противники говорят, что ни одному ученику, отработавшему четыре года места, не следует отказывать в аттестате о среднем образовании только за то, что он неоднократно не сдал экзамен, или даже за незнание необходимого материала. [26] [27] [28]

Тесты с высокими ставками обвиняли в том, что они вызывают болезнь и тревогу при тестировании у учащихся и учителей, а также в том, что учителя решили сузить учебный план до того, что, по мнению учителя, будет проверяться. В одной из газет в Спокане, штат Вашингтон, было опубликовано упражнение, призванное помочь детям почувствовать себя комфортно при тестировании. Это чудовище, которое питается страхом. [29] Опубликованное изображение якобы является ответом ученицы, которую попросили нарисовать картину того, что она думает о государственной оценке.

Другие критики, такие как Дон Орлич из Университета штата Вашингтон , ставят под сомнение использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для возраста учащихся. [30]

По сравнению с оценкой портфолио, простые тесты с несколькими вариантами ответов намного дешевле, менее подвержены разногласиям между участниками и могут быть выставлены достаточно быстро, чтобы их можно было сдать до конца учебного года. По этим причинам в стандартизированных тестах (все учащиеся проходят один и тот же тест в одинаковых условиях) часто используются тесты с несколькими вариантами ответов. Орлич критикует использование дорогих, целостных тестов вместо недорогих «пузырьковых тестов» с множественным выбором для измерения качества как системы, так и отдельных лиц для очень большого числа студентов. [30] Среди других известных критиков тестирования с высокими ставками - Fairtest и Алфи Кон .

Использование тестов IQ было запрещено в некоторых штатах для принятия образовательных решений, а тесты , основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», критиковались за предвзятость по отношению к меньшинствам. Большинство должностных лиц системы образования поддерживают критерии критериев (оценка каждого отдельного учащегося зависит исключительно от того, правильно ли он ответил на вопросы, независимо от того, справились ли его соседи лучше или хуже) для принятия решений с высокими ставками.

Оценка 21 века [ править ]

Широко отмечалось, что с появлением социальных сетей и технологий и мировоззрений Web 2.0 обучение становится все более совместным, а знания все чаще распределяются между многими членами обучающегося сообщества. Однако традиционные методы оценки ориентированы в основном на человека и не учитывают накопление знаний и обучение в контексте. По мере того как исследователи в области оценивания рассматривают культурные сдвиги, которые возникают в результате появления культуры большего участия , им необходимо будет найти новые методы применения оценивания к учащимся. [31]

Масштабная оценка обучения [ править ]

Масштабные оценки обучения (LSLA) - это оценки на уровне системы, которые предоставляют моментальный снимок успеваемости для группы учащихся за данный год и в ограниченном количестве областей. Они часто классифицируются как национальные или межнациональные оценки и привлекают внимание к вопросам, связанным с уровнями обучения и детерминантами обучения, включая квалификацию учителя ; качество школьной среды; родительская поддержка и руководство; социальное и эмоциональное здоровье в школе и за ее пределами. [32]

Оценка в демократической школе [ править ]

Модель Садбери школы демократического образования не работает и не предлагает оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей, и что школа не является судьей; сравнение учеников друг с другом или с некоторыми установленными стандартами является для них нарушением права ученика на неприкосновенность частной жизни и самоопределение. Студенты сами решают, как измерить свой прогресс в качестве самостоятельных учеников, в процессе самооценки: по их словам, реальное обучение на протяжении всей жизни и надлежащая образовательная оценка для 21 века. [33]

Согласно школам Садбери, эта политика не причиняет вреда их ученикам, поскольку они переходят к жизни за пределами школы. Однако они признают, что это усложняет процесс, но что такие трудности являются частью учащихся, которые учатся делать свой собственный путь, устанавливать собственные стандарты и достигать своих целей.

Политика отсутствия оценок и оценок помогает создать атмосферу, свободную от конкуренции между учащимися или борьбы за одобрение взрослых, а также способствует созданию благоприятной атмосферы сотрудничества между студентами. [34]

Заключительным этапом обучения в Садбери, если студент решит его пройти, является выпускная диссертация. Каждый студент пишет о том, как они подготовились к взрослой жизни и вступили в сообщество в целом. Этот тезис передается в Собрание, которое его рассматривает. Заключительный этап процесса диссертации - это устная защита, которую дает студент, во время которой он открывает слово для вопросов, проблем и комментариев от всех членов Ассамблеи. В конце Собрание тайным голосованием голосует, присуждать ли диплом. [35]

Оценка учащихся ELL [ править ]

Основной проблемой при использовании образовательных оценок является общая достоверность, точность и справедливость, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая неадекватно отражает популяции ELL. [36] Следовательно, во многих случаях было бы неточно и неуместно делать выводы из нормативных оценок студентов ELL. Исследования показывают, что большинство школ не модифицируют оценки должным образом, чтобы приспособить учеников с уникальным культурным происхождением. [36]Это привело к чрезмерному направлению студентов ELL на специальное образование, в результате чего они были непропорционально представлены в программах специального образования. Хотя некоторые могут рассматривать это несоответствующее размещение в системе специального образования как поддерживающее и полезное, исследования показали, что учащиеся, размещенные неправильно, фактически регрессировали в процессе обучения. [36]

Часто бывает необходимо воспользоваться услугами переводчика, чтобы провести экзамен на родном языке учащегося ELL; однако при переводе заданий оценки возникает несколько проблем. Одна из проблем заключается в том, что переводы часто могут предлагать правильный или ожидаемый ответ, изменяя сложность задания. [37] Кроме того, перевод тестовых заданий иногда может исказить исходное значение задания. [37] Наконец, многие переводчики не имеют квалификации или должной подготовки для работы со студентами ELL в условиях оценивания. [36]Все эти факторы ставят под угрозу достоверность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминирующими для учащихся ELL, однако некоторые по-прежнему содержат культурные предубеждения в тестовых заданиях. [37]

При рассмотрении учащегося ELL для получения специального образования группа оценки должна объединить и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятый вывод. [37] Решение должно быть основано на многомерных источниках данных, включая интервью учителей и родителей, а также наблюдения в классе. [37] Решения должны учитывать уникальные культурные, языковые и практические особенности учащихся и не должны строго основываться на результатах оценки.

Универсальный просмотр [ править ]

Оценка может быть связана с неравенством, когда учащиеся из традиционно недопредставленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с программами для одаренных . Одним из способов борьбы с этим неравенством является универсальный скрининг, который включает тестирование всех учащихся (например, на одаренность) вместо тестирования только некоторых учащихся на основе рекомендаций учителей или родителей. Универсальный скрининг приводит к значительному увеличению числа традиционно недостаточно обслуживаемых групп (таких как темнокожие, латиноамериканцы, бедные, женщины и ELL), выбранных для одаренных программ, без какого-либо изменения стандартов идентификации. [38]

См. Также [ править ]

  • Компьютерная оценка
  • Инвентарь концепций
  • Уверенное обучение точно измеряет качество знаний учащегося, измеряя как правильность его или ее знаний, так и уверенность человека в этих знаниях.
  • E-scape - технология и подход, специально предназначенные для оценки творчества и сотрудничества.
  • Образовательные цели и задачи
  • Образовательная оценка имеет дело конкретно с оценкой применительно к образовательной среде. В качестве примера его можно использовать в правительственной программе « Ни одного отстающего ребенка» (NCLB), учрежденной правительством США.
  • Электронное портфолио - это личная цифровая запись, содержащая такую ​​информацию, как собрание артефактов или свидетельств, демонстрирующих то, что человек знает и может делать.
  • Оценка - это процесс рассмотрения того, что оценивается, чтобы убедиться, что рассматриваются правильные области.
  • Оценка - это процесс присвоения учащимся рейтинга (возможно, взаимоисключающего).
  • Оценка воздействия на здоровье рассматривает потенциальное воздействие политики, программ и проектов на здоровье.
  • Жуткая константа - теоретический уклон в оценке образования
  • Измерение - это процесс оценки или оценки, целью которой является количественная оценка уровня достижений или компетентности в определенной области. См. Модель Раша для измерения, где подробно описаны концептуальные требования к таким процессам, включая те, которые относятся к выставлению оценок и использованию исходных баллов из оценок.
  • Оценка программы - это, по сути, набор принципов и методов, позволяющих определить, «работает» ли программа.
  • Прогресс-тестирование
  • Психометрия , наука об измерении психологических характеристик.
  • Рубрики для оценки
  • Образование в области науки, технологий, общества и окружающей среды
  • Оценка социального воздействия рассматривает возможные социальные воздействия предлагаемых новых инфраструктурных проектов, проектов в области природных ресурсов или деятельности по развитию.
  • Стандартизированное тестирование - это любой тест, который используется в различных школах или в других ситуациях.
  • Оценка на основе стандартов
  • Роберт Э. Стейк - исследователь в области оценки учебных программ.
  • Письменная оценка

Источники [ править ]

 Эта статья включает текст из бесплатного контента . Лицензия CC BY-SA 3.0 IGO. Текст взят из Обещание крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей , ЮНЕСКО, ЮНЕСКО. ЮНЕСКО. Чтобы узнать, как добавить текст открытой лицензии в статьи Википедии, см. Эту страницу с инструкциями . Информацию о повторном использовании текста из Википедии см. В условиях использования .

Ссылки [ править ]

  1. ^ Некоторые преподаватели и теоретики образования используют термины оценка и оценка для обозначения различных концепций тестирования во время учебного процесса с целью его улучшения (для которыхпредпочтительныодинаково однозначные термины формирующая оценка или формирующая оценка ) и тестирования после завершения обучения. процесс (для которого одинаково однозначные термины итоговая оценка или итоговая оценкаявляются предпочтительными), но на самом деле они являются синонимами и по сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но также используют их для определения друг друга. Если термины используются для разных концепций, тщательное редактирование требует как объяснения того, что они обычно являются синонимами, так и пояснения, что они используются для обозначения различных концепций в текущем тексте.
  2. ^ Аллен, MJ (2004). Оценка академических программ высшего образования . Сан-Франциско: Джосси-Басс.
  3. ^ Kuh, GD; Янковский, Н .; Икенберри, СО (2014). Знание того, что студенты знают и могут делать: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF) . Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.
  4. ^ Национальный совет по измерениям в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA Архивировано 07.07.2017 -22 у Wayback Machine
  5. ^ Нельсон, Роберт; Доусон, Филлип (2014). «Вклад в историю оценивания: как симулятор разговора заменяет метод Сократа». Оценка и оценка в высшем образовании . 39 (2): 195–204. DOI : 10.1080 / 02602938.2013.798394 . S2CID 56445840 . 
  6. ^ Suskie, Linda (2004). Оценка обучения студентов . Болтон, Массачусетс: Анкер.
  7. ^ Блэк, Пол и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценивания в классе». Фи Бета Каппан. Доступно по адресу http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1= & lname_2 = & fname_2 = & kw_1 = & kw_2 = & kw_3 = & kw_4 = & mn1 = & yr1 = & mn2 = & yr2 = & c1 = [ постоянная мертвая ссылка ] PDKintl.org]. Проверено 28 января 2009 года.
  8. ^ Мадаус, Джордж Ф .; Айрасян, Питер В. (1969-11-30). «Размещение, формирующая, диагностическая и итоговая оценка обучения в классе» . Cite journal requires |journal= (help)
  9. ^ a b c d Мактиг, Джей; О'Коннор, Кен (ноябрь 2005 г.). «Семь практик для эффективного обучения» . Образовательное лидерство . 63 (3): 10–17 . Дата обращения 3 марта 2017 .
  10. ^ "Архивная копия" . Архивировано из оригинала на 2009-02-08 . Проверено 29 января 2009 .CS1 maint: archived copy as title (link)
  11. ^ Скривен, М. (1991). Оценочный тезаурус. 4-е изд. Ньюбери-Парк, Калифорния: Sage Publications . ISBN 0-8039-4364-4 . 
  12. ^ Эрл, Лорна (2003). Оценка как обучение: использование оценки в классе для максимального обучения учащихся. Таузенд-Оукс, Калифорния, Corwin Press. ISBN 0-7619-4626-8 
  13. ^ Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языков». Центр языкового образования и исследований, доступно на Google.com. Заархивировано 14сентября 2011 г. на Wayback Machine . Проверено 28 января 2009 года.
  14. ^ Объединенный комитет информационных систем (JISC). «Что мы подразумеваем под электронным оцениванием?» JISC InfoNet. Получено 29 января 2009 г. с http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf Архивировано 16января2017 г. в Wayback Machine.
  15. ^ Образовательные технологии в Технологическом университете Вирджинии. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного преподавания, доступно на Edtech.vt.edu. Архивировано 26 февраля 2009 г. на Wayback Machine . Проверено 29 января 2009 года.
  16. ^ Валенсия, Шейла В. "Каковы различные формы аутентичной оценки?" Понимание аутентичной оценки грамотности в классе (1997), доступно на Eduplace.com . Проверено 29 января 2009 года.
  17. Yu, Chong Ho (2005). "Надежность и достоверность." Образовательная оценка. Доступно на Creative-wisdom.com . Проверено 29 января 2009 года.
  18. ^ Москаля, Барбара М., & Leydens, Джон А (2000). «Разработка скоринговой рубрики: обоснованность и надежность». Практическая оценка, исследования и оценка, 7 (10). Проверено 30 января 2009 года.
  19. ^ Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки педагогов». Ньюбери-Парк, Калифорния: Sage Publications
  20. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ , 2-е издание. Ньюбери-Парк, Калифорния: Sage Publications
  21. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов . Ньюбери-Парк, Калифорния: Corwin Press
  22. ^ City & Guilds, Understanding the Principles and Practice of Assessment: Qualification Factsheet , по состоянию на 26 февраля 2020 г.
  23. ^ Американская психологическая ассоциация. «Надлежащее использование тестирования с высокими ставками в школах нашей страны». APA Online, доступно на APA.org , проверено 24 января 2010 г.
  24. ^ (nd) Повторная авторизация NCLB . Отдел образования. Проверено 29.01.09.
  25. ^ (nd) Что не так со стандартизированным тестированием? FairTest.org. Проверено 29 января 2009 года.
  26. ^ Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены» . Daily Bruin . Одна из распространенных жалоб от неудачников - то, что им не преподавали проверенный материал в школе. Здесь виноват не экзамен, а неадекватное обучение. Обвинять тест в провале - все равно что обвинять станцию ​​обслуживания в неудачной проверке на смог; он игнорирует основные проблемы «школьного автомобиля».[ постоянная мертвая ссылка ]
  27. ^ Weinkopf, Крис (2002). «Во всем виноват тест: LAUSD отрицает ответственность за низкие оценки» . Ежедневные новости . Виноваты «тесты с высокими ставками», такие как Стэнфордский 9 и выпускной экзамен в средней школе Калифорнии. Правление ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не были предоставлены академические инструменты, позволяющие раскрыть свой наивысший потенциал на этих тестах».
  28. ^ «Обвиняя тест» . Ежедневник инвестора . 11 мая 2006 года . Судья в Калифорнии намерен отменить выпускной экзамен этого штата в средней школе. Почему? Потому что это работает. Это говорит студентам, что им нужно узнать больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования для окончания учебы, это нечто другое: свидетельство неравного обращения ... выпускной экзамен был сочтен несправедливым, потому что слишком много студентов, которые не прошли тест, имели слишком мало дипломированных учителей. Что ж, может быть, они это сделали, но предоставление им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный лист бумаги ".[ постоянная мертвая ссылка ]
  29. ^ "ASD.wednet.edu" . Архивировано из оригинала на 2007-02-25 . Проверено 22 сентября 2006 .
  30. ^ a b Бах, Дебора и Бланшар, Джессика (19 апреля 2005 г.). «WASL беспокоит стресс детей, школ». Сиэтл Пост-Интеллидженсер. Получено 30 января 2009 г. с сайта Seattlepi.nwsource.com .
  31. ^ Fadel, Чарльз, Honey, Маргарет, и Pasnik, Shelley (18 мая 2007). «Оценка в эпоху инноваций». Неделя образования. Получено 29 января 2009 г. с сайта http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html.
  32. ^ ЮНЕСКО (2019). Обещание крупномасштабных оценок обучения: признание ограничений для открытия возможностей . ЮНЕСКО. ISBN 978-92-3-100333-2.
  33. ^ Гринберг, Д. (2000). Школы 21-го века, отредактированная стенограмма выступления на апрельской 2000 г. Международной конференции по обучению в 21-м веке.
  34. ^ Гринберг, Д. (1987). Глава 20, Оценка, наконец-то бесплатно - Школа Садбери-Вэлли.
  35. ^ Процедура дипломной работы , школа Mountain Laurel Sudbury.
  36. ^ а б в г http://ehis.ebscohost.com.libdata.lib.ua.edu/eds/pdfviewer/pdfviewer?sid=221ae7c6-6895-4b02-bc69-759936218fba%40sessionmgr104&vid=12&hid=20 [ мертвая ссылка ]
  37. ^ a b c d e «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 29 мая 2012 года . Проверено 11 апреля 2012 . CS1 maint: archived copy as title (link)
  38. Перейти ↑ Card, D., & Giuliano, L. (2015). Может ли всеобщий скрининг увеличить представленность учащихся с низким доходом и меньшинств среди одаренных детей? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519.

Дальнейшее чтение [ править ]

  • Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (2014). Стандарты педагогического и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
  • Беннет, RE (2015). Меняющийся характер образовательной оценки. Обзор исследований в образовании, 39 (1), 370-407.
  • Браун, GTL (2018). Оценка успеваемости студентов. Нью-Йорк: Рутледж.
  • Карлесс, Дэвид. Превосходство в оценке университетов: уроки отмеченной наградами практики . Лондон: Рутледж, 2015.
  • Клингер, Д., МакДивитт, П., Ховард, Б., Роджерс, Т., Муньос, М., и Уайли, К. (2015). Стандарты оценки в классе для учителей PreK-12: Объединенный комитет по стандартам оценки образования.
  • Кубишин, Т., и Борич, Г.Д. (2012). Образовательное тестирование и измерение: применение и практика в классе (10-е изд.). Нью-Йорк: Джон Вили и сыновья.
  • Миллер, Д.М., Линн, Р.Л., и Гронлунд, NE (2013). Измерение и оценка в обучении (11-е изд.). Бостон, Массачусетс: Пирсон.
  • Национальный исследовательский совет. (2001). Зная, что знают студенты: наука и дизайн образовательной оценки. Вашингтон, округ Колумбия: Национальная академия прессы.
  • Нитко, AJ (2001). Образовательная оценка студентов (3-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Меррилл.
  • Фелпс, Ричард П., изд. Исправление заблуждений об образовательном и психологическом тестировании . Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008 г.
  • Фелпс, Ричард П., Учебник по стандартизированному тестированию . Нью-Йорк: Питер Лэнг, 2007.
  • Рассел, М.К., и Айрасиан, П.В. (2012). Классная оценка: концепции и приложения (7-е изд.). Нью-Йорк: Макгроу Хилл.
  • Шепард, Лос-Анджелес (2006). Классная оценка. В RL Brennan (Ed.), Educational Measurement (4-е изд., Стр. 623-646). Вестпорт, Коннектикут: Praeger.