Образовательная оценка - Educational assessment

Образовательная оценка или же образовательная оценка[1] это систематический процесс документирование и используя эмпирические данные о знание, навык, отношения и верования для уточнения программ и улучшения обучения студентов.[2] Данные оценки могут быть получены путем непосредственного изучения работы учащихся для оценки достижения результатов обучения или могут быть основаны на данных, из которых можно сделать выводы об обучении.[3] Оценка часто используется как синоним теста, но не ограничивается тестами.[4] Оценка может быть сосредоточена на отдельном учащемся, учебном сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учреждении или образовательной системе в целом (также известная как степень детализации). Слово «оценка» стало использоваться в образовательном контексте после Второй мировой войны.[5]

Как непрерывный процесс, оценка устанавливает измеримые и четкие результаты обучения учащихся для обучения, предоставляя достаточное количество возможностей обучения для достижения этих результатов, внедряя систематический способ сбора, анализа и интерпретации данных, чтобы определить, насколько хорошо обучение учащихся соответствует ожиданиям, и собранная информация для улучшения обучения студентов.[6]

Конечная цель оценочных практик в образовании зависит от Теоретическая основа практикующих и исследователей, их предположений и убеждений о природе человеческого разума, происхождении знаний и процессе обучения.

Типы

Период, термин оценка обычно используется для обозначения всех действий, которые учителя используют, чтобы помочь учащимся учиться и оценивать их успехи.[7] Для удобства оценивание можно разделить на следующие категории:

  1. Размещение, формирующая, итоговая и диагностическая оценка
  2. Объективно и субъективно
  3. Ссылка (ссылка на критерий, ссылка на норму и ипсативный (принудительный выбор) )
  4. Неформальный и формальный
  5. Внутренний и наружный

Размещение, формирующее, суммативное и диагностическое

Оценка часто делится на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценивания.

  • Оценка размещения - оценка размещения используется для размещения студентов в соответствии с предыдущими достижениями или личными характеристиками, в наиболее подходящий момент в учебной последовательности, в уникальной учебной стратегии или с подходящим учителем.[8] проводится через тестирование размещения, то есть тесты, которые колледжи и университеты используют для оценки готовности студентов к поступлению в колледж и размещения студентов в начальных классах. Оценка размещения, также называемая предварительной оценкой или начальной оценкой, проводится перед инструктажем или вмешательством, чтобы установить исходный уровень, по которому можно измерить индивидуальный рост учащегося. Этот тип оценки используется, чтобы узнать, каков уровень знаний учащегося по предмету. Это помогает учителю более эффективно объяснять материал. Эти оценки не выставляются на оценку.[9]
  • Формирующая оценка - Формирующее оценивание обычно проводится на протяжении всего курса или проекта. Формирующая оценка, также называемая «образовательной оценкой», используется для помощи в обучении. В образовательной среде формирующим оцениванием может быть учитель (или вглядеться ) или учащийся, предоставляя отзывы о работе учащегося и не обязательно использующийся для выставления оценок. Формирующие оценки могут принимать форму диагностических, стандартных тестов, викторин, устных вопросов или черновиков. Формирующие оценки проводятся одновременно с инструкциями. Результат можно засчитать. Формирующие оценки направлены на то, чтобы увидеть, понимают ли учащиеся инструкции, прежде чем выполнять итоговую оценку.[9]
  • Итоговая оценка - Суммативное оценивание обычно проводится в конце курса или проекта. В образовательной среде итоговые оценки обычно используются для присвоения студентам оценок за курс. Суммативные оценки носят оценочный характер. Итоговые оценки предназначены для обобщения того, что студенты узнали, чтобы определить, хорошо ли они понимают предмет. Этот тип оценивания обычно выставляется по шкале (например, сдал / не прошел, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание часто используется для определения того, сдал ли ученик урок или нет. Итоговые оценки критикуют за то, что они редуктивны, и учащиеся обнаруживают, насколько хорошо они приобрели знания, слишком поздно, чтобы их можно было использовать.[9]
  • Диагностическая оценка - Диагностическая оценка касается всех трудностей, возникающих в конце процесса обучения.

Джей МакТиг и Кен О'Коннор предложили семь практик эффективного обучения.[9] Один из них - показать критерии оценки перед тестом. Другой - о важности предварительной оценки, чтобы узнать, каков уровень навыков ученика, прежде чем давать инструкции. Другая практика - давать много отзывов и поощрять.

Исследователь в области образования Роберт Стейк[10] объясняет разницу между формативным и итоговым оцениванием следующей аналогией:

Когда повар пробует суп, это формирует. Когда гости пробуют суп, это итог.[11]

Итоговое и формирующее оценивание часто упоминается в контексте обучения как оценка обучения и оценка для обучения соответственно. Оценка обучения, как правило, носит итоговый характер и предназначена для измерения результатов обучения и сообщения об этих результатах учащимся, родителям и администраторам. Оценка успеваемости обычно проводится в конце класса, курса, семестра или учебного года. Оценка для обучения обычно носит формирующий характер и используется учителями для рассмотрения подходов к обучению и следующих шагов для отдельных учащихся и класса.[12]

Распространенной формой формирующего оценивания является диагностическая оценка. Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка это форма диагностической оценки, при которой студенты оценивают себя. Перспективная оценка просит оцениваемых рассматривать себя в гипотетических будущих ситуациях.[13]

Оценка по результатам похожа на итоговую оценку, поскольку фокусируется на достижении. Часто это совпадает с реформа образования на основе стандартов и образование, ориентированное на результат движение. Хотя в идеале они значительно отличаются от традиционного теста с множественным выбором, они чаще всего связаны с стандартная оценка в которых используются ответы в свободной форме на стандартные вопросы, оцениваемые людьми по шкале, основанной на стандартах, отвечающие, падающие ниже или превышающие стандарт эффективности, а не ранжируемые по кривой. Определяется четко определенная задача, и учащихся просят что-то создать, произвести или сделать, часто в условиях, требующих реального применения знаний и навыков. Профессионализм демонстрируется предоставлением расширенного ответа. Форматы исполнения дополнительно подразделяются на продукты и выступления. Результатом выступления может стать произведение, например картина, портфолио, бумага или выставка, или оно может состоять из выступления, например выступления, спортивных навыков, музыкального выступления или чтения.

Объективно и субъективно

Оценка (итоговая или формирующая) часто подразделяется на объективную или субъективную. Объективная оценка - это форма вопросов, на которые есть единственный правильный ответ. Субъективная оценка - это форма вопросов, на которые может быть указано более одного правильного ответа (или более одного способа выразить правильный ответ). Есть разные типы объективных и субъективных вопросов. Типы объективных вопросов включают истинные / ложные ответы, множественный выбор, множественные ответы и вопросы на соответствие. Субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективная оценка хорошо подходит для набирающих популярность компьютеризированных или онлайн-оценка формат.

Некоторые утверждали, что различие между объективными и субъективными оценками бесполезно и не является точным, поскольку в действительности не существует такой вещи, как «объективная» оценка. Фактически, все оценки создаются с присущими им предубеждениями, встроенными в решения о соответствующем предмете и содержании, а также с культурными (классовыми, этническими и гендерными) предубеждениями.[14]

Основа сравнения

Результаты теста можно сравнить с установленным критерием, или с успеваемостью других учеников, или с предыдущими показателями:

  • Оценка по критериям, обычно используя критериальный тест, как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериальное оценивание часто, но не всегда, используется для определения компетентности человека (может ли он / она что-то делать). Самым известным примером оценки, основанной на критериях, является экзамен по вождению, когда учащиеся водители оцениваются по ряду явных критериев (например, «Не подвергать опасности других участников дорожного движения»).
  • Нормативная оценка (в просторечии известный как "оценка по кривой "), обычно используя нормативный тест, не измеряется по определенным критериям. Этот тип оценки относится к студенческому сообществу, проводящему оценку. Это эффективный способ сравнения студентов. Тест IQ - самый известный пример оценки, основанной на нормах. Многие вступительные испытания (в престижные школы или университеты) основаны на нормах, что позволяет пройти фиксированную долю учащихся («сдача» в данном контексте означает принятие в школу или университет, а не явный уровень способностей). Это означает, что стандарты могут меняться из года в год, в зависимости от качества когорты; оценка, основанная на критериях, не меняется из года в год (если критерии не меняются).[15]
  • Ипсативная оценка является самостоятельным сравнением либо в той же области во времени, либо в сравнении с другими областями в пределах того же студента.

Неформальный и формальный

Оценка может быть либо формальный или же неофициальный. Формальная оценка обычно подразумевает письменный документ, такой как тест, викторина или работа. Формальной оценке присваивается числовой балл или оценка, основанная на успеваемости учащегося, в то время как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно проводится в более непринужденной манере и может включать наблюдение, инвентаризацию, контрольные списки, шкалы оценок и т. Д. рубрики, оценка производительности и портфолио, участие, коллегиальная и самооценка, а также обсуждение.[16]

Внутренний и наружный

Внутреннее оценивание устанавливается и отмечается школой (т.е. учителями). Студенты получают оценку и отзывы об оценке. Внешняя оценка устанавливается руководящим органом и проводится непредвзятым персоналом. Некоторые внешние оценки дают гораздо более ограниченную обратную связь при выставлении оценок. Однако в тестах, таких как австралийский NAPLAN, критерий, к которому обращаются учащиеся, получает подробную обратную связь, чтобы их учителя могли рассмотреть и сравнить учебные достижения учащихся, а также составить планы на будущее.

Стандарты качества

Как правило, качественными оценками считаются оценки с высоким уровнем надежность и срок действия. Однако подходы к надежности и достоверности различаются.

Надежность

Надежность относится к последовательности оценки. Надежная оценка - это оценка, которая неизменно дает одни и те же результаты с одной и той же (или подобной) группой студентов. На надежность влияют различные факторы, в том числе неоднозначные вопросы, слишком много вариантов в вопроснике, расплывчатые инструкции по выставлению оценок и плохо обученные маркеры. Традиционно надежность оценки основана на следующем:

  1. Временная стабильность: производительность в тесте сравнима в двух или более отдельных случаях.
  2. Эквивалентность форм: результаты экзаменов одинаковы по разным формам теста на основе одного и того же содержания.
  3. Внутренняя согласованность: ответы на вопросы теста единообразны. Например: в опросе, в котором респондентов просят оценить отношение к технологиям, можно ожидать единообразия в ответах на следующие вопросы:
    • «Я очень негативно отношусь к компьютерам в целом».
    • «Мне нравится пользоваться компьютерами».[17]

Надежность измерения x также можно количественно определить как: куда - надежность в наблюдаемом (тестовом) балле, x; и - это вариативность в «истинных» (т. е. врожденных способностях кандидата) и измеренных результатах тестов соответственно. может варьироваться от 0 (совершенно ненадежно) до 1 (полностью надежно).

Срок действия

Действительный оценка - это оценка, которая измеряет то, что предназначено для измерения. Например, нельзя оценивать навыки вождения только с помощью письменного теста. Более действенным способом оценки навыков вождения была бы комбинация тестов, которые помогают определить, что водитель знает, например, с помощью письменного теста на знание вождения, и того, что водитель может делать, например, с помощью оценки фактических результатов. вождение. Учителя часто жалуются, что некоторые экзамены неправильно оценивают учебный план на которых основывается экзамен; они, по сути, ставят под сомнение достоверность экзамена.

Достоверность оценки обычно определяется путем изучения доказательств по следующим категориям:

  1. Содержание - соответствует ли содержание теста заявленным целям?
  2. Критерий - Коррелируют ли баллы с внешней ссылкой? (например: Точно ли высокие баллы на тесте по чтению в 4-м классе предсказывают навыки чтения в будущих классах?)
  3. Построить - Соответствует ли оценка другим значимым переменным? (например: делать ESL на письменном экзамене учащиеся постоянно показывают разные результаты, чем носители английского языка?)[18]

Хорошая оценка имеет как достоверность, так и надежность, а также другие атрибуты качества, указанные выше для конкретного контекста и цели. На практике оценка редко бывает полностью достоверной или абсолютно надежной. Линейка с неправильной маркировкой всегда будет давать одинаковые (неправильные) измерения. Это очень надежно, но не очень актуально. Попросить случайных людей назвать время, не глядя на часы или часы, иногда используется в качестве примера оценки, которая является действительной, но ненадежной. Ответы будут разными у разных людей, но средний ответ, вероятно, близок к реальному времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто приходится искать компромисс между надежностью и достоверностью. В тесте по истории, написанном для высокой степени достоверности, будет много вопросов для сочинения и ответов. Это будет хорошая мера владения предметом, но трудно дать точную оценку. Исторический тест, написанный для высокой надежности, будет иметь несколько вариантов выбора. Он не так хорош для измерения знаний по истории, но может быть легко оценен с большой точностью. Мы можем сделать из этого обобщения. Чем надежнее наша оценка того, что мы хотим измерить, тем меньше мы уверены в том, что действительно измеряем этот аспект достижения.

Хорошо провести различие между достоверностью «предметной» и «предсказательной». Первый, широко используемый в образовании, позволяет определить, какой балл получит студент за аналогичный тест, но с другими вопросами. Последний, широко используемый на рабочем месте, позволяет прогнозировать производительность. Таким образом, уместен предметный тест на знание правил вождения, в то время как прогнозируемый тест позволит оценить, может ли потенциальный водитель следовать этим правилам.

Стандарты оценки

В области оценка, и в частности образовательная оценка, то Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. В Стандарты оценки персонала были опубликованы в 1988 г.,[19] Стандарты оценки программ (2-е издание) были опубликованы в 1994 г.,[20] и Стандарты оценки студентов были опубликованы в 2003 году.[21]

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию установленной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании присуждается награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовую практику в отношении оценки образования в контексте обучения взрослых, дальнейшего и производственного образования и обучения.[22]

Сводная таблица основных теоретических основ

В следующей таблице приведены основные теоретические основы позади почти всей теоретической и исследовательской работы, а также педагогической практики в образовании (одна из которых, конечно же, практика оценивания). Эти различные подходы вызвали интересные дискуссии среди ученых.

ТЕМЫЭМПИРИЗМРАЦИОНАЛИЗМСОЦИОКУЛЬТУРАЛИЗМ
Философская ориентацияЮм: Британский эмпиризмКант, Декарт: Континентальный рационализмГегель, Маркса: культурная диалектика
Метафорическая ориентацияМеханика / работа машины или компьютераОрганизм / рост растенияКонтекстуалист / Исследование исторического события
Ведущие теоретикиБ. Ф. Скиннер (бихевиоризм )/ Херб Саймон, Джон Андерсон, Роберт Ганье: (когнитивизм )Жан Пиаже /Робби ДелоЛев Выготский, Лурия, Брунер / Алан Коллинз, Джим Грино, Энн Браун, Джон Брансфорд
Природа разумаИзначально пустое устройство, которое обнаруживает закономерности в мире и оперирует ими. Качественно идентичен низшим животным, но количественно лучше.Орган, который эволюционировал, чтобы приобретать знания, осмысливая мир. Уникально человек, качественно отличный от низших животных.Уникальный среди видов для развития языка, инструментов и образования.
Природа знания

(эпистемология)

Иерархически организованные ассоциации, которые представляют точное, но неполное представление о мире. Предполагается, что сумма компонентов знания такая же, как и целое. Поскольку знания точно представлены компонентами, предполагается, что тот, кто демонстрирует эти компоненты, знаетОбщие и / или конкретные когнитивные и концептуальные структуры, построенные разумом и в соответствии с рациональными критериями. По сути, это структуры более высокого уровня, которые созданы для ассимиляции новой информации с существующей структурой и по мере того, как структуры вмещают больше новой информации. Знания представляют собой способность решать новые проблемы.Распространяется среди людей, сообществ и физического окружения. Представляет культуру сообщества, которое продолжает ее создавать. Знать - значит быть настроенным на ограничения и возможности систем, в которых происходит деятельность. Знания представлены в закономерностях успешной деятельности.
Природа обучения (процесс увеличения или изменения знаний)Формирование и укрепление когнитивных или S-R ассоциаций. Генерация знаний посредством (1) воздействия на шаблон, (2) эффективного распознавания и реагирования на шаблон (3) распознавания шаблонов в других контекстах.Участие в активном процессе осмысления («рационализации») окружающей среды. Разум применяет существующую структуру к новому опыту, чтобы рационализировать его. На самом деле вы не изучаете компоненты, а только структуры, необходимые для работы с этими компонентами позже.Повышение способности участвовать в конкретном сообществе практикующих. Посвящение в жизнь группы, усиление способности к участию за счет адаптации к ограничениям и возможностям.
Особенности достоверной оценкиОцените компоненты знаний. Сосредоточьтесь на овладении многими компонентами и беглости. Используйте психометрию для стандартизации.Оцените расширенную производительность при решении новых задач. Признание разновидностей передового опыта.Оцените участие в опросе и социальные практики обучения (например, портфолио, наблюдения). Студенты должны участвовать в процессе оценки. Оценки должны быть интегрированы в более крупную среду.

Полемика

Обеспокоенность по поводу того, как лучше всего применять методы оценивания в системах государственных школ, в основном сосредоточена на вопросах об использовании тестов с высокими ставками и стандартизированных тестов, которые часто используются для измерения успеваемости учащихся, качества учителей и успеваемости в школе, округе или штате. .

Ни один ребенок не остался позади

Для большинства исследователей и практиков вопрос не в том, следует ли вообще проводить тесты - существует общее мнение, что, если их проводить с пользой, тесты могут предоставить полезную информацию об успеваемости учащихся и реализации учебной программы, а также могут быть использованы для форматирования. ученики.[23] Таким образом, реальный вопрос заключается в том, могут ли методы тестирования, применяемые в настоящее время, предоставить эти услуги преподавателям и студентам.

8 января 2002 года президент Буш подписал Закон «Ни одного отстающего ребенка» (NCLB). Закон NCLB повторно санкционировал Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с войной с бедностью и финансировать начальную и средние школы. Целью президента Джонсона было сделать упор на равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требует, чтобы государства разрабатывали оценки основных навыков. Чтобы получить федеральное финансирование школы, штаты должны были дать эти оценки всем учащимся в выбранном классе.

В США Ни один ребенок не останется без внимания требует стандартизированного тестирования по всей стране. Эти тесты согласуются с учебной программой штата и связывают ответственность учителей, учащихся, округов и штата с результатами этих тестов. Сторонники NCLB утверждают, что он предлагает ощутимый метод оценки успеваемости, привлечения учителей и школ к ответственности за плохие оценки и закрытия разрыв в достижениях вне зависимости от класса и этнической принадлежности.[24]

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение преподавателей к ответственности за результаты тестирования ведет к практике "обучение к тесту. »Кроме того, многие утверждают, что акцент на стандартизированном тестировании побуждает учителей вооружать учащихся узким набором навыков, которые повышают эффективность тестирования, не способствуя на самом деле более глубокому пониманию предмета или ключевых принципов в области знаний.[25]

Тестирование с высокими ставками

Оценки, которые вызвали наибольшие споры в США, связаны с использованием выпускные экзамены средней школы, которые используются для отказа в выдаче дипломов учащимся, которые учились в средней школе в течение четырех лет, но не могут продемонстрировать, что они усвоили необходимый материал при написании экзаменов. Противники говорят, что ни один студент, проработавший четыре года время сидения в аттестате об окончании средней школы должно быть отказано только из-за того, что он неоднократно не сдал экзамен, или даже из-за незнания необходимого материала.[26][27][28]

Тесты с высокими ставками были обвинены в том, что вызывают болезни и тестовая тревога для студентов и учителей, а также для учителей, решивших сузить учебную программу до того, что, по мнению учителя, будет проверяться. В упражнении, предназначенном для того, чтобы дети чувствовали себя комфортно при тестировании, Спокан, Вашингтон газета опубликовала фотографию монстр который питается страхом.[29] Опубликованное изображение якобы является ответом ученицы, которую попросили нарисовать картину того, что она думает о государственной оценке.

Другие критики, такие как Университет штата Вашингтон Дон Орлич, ставьте под сомнение использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для возраста учащихся.[30]

По сравнению с оценкой портфолио, простые тесты с несколькими вариантами ответов намного дешевле, менее подвержены разногласиям между участниками и могут быть выставлены достаточно быстро, чтобы их можно было сдать до конца учебного года. Стандартизированные тесты (все учащиеся проходят один и тот же тест в одинаковых условиях) по этим причинам часто используют тесты с несколькими вариантами ответов. Орлич критикует использование дорогих, целостных тестов вместо недорогих «пузырьковых тестов» с множественным выбором для измерения качества как системы, так и отдельных лиц для очень большого количества студентов.[30] Среди других выдающихся критиков тестирования с высокими ставками: Честный и Альфи Кон.

Использование IQ тесты был запрещен в некоторых штатах за образовательные решения, и нормативные тесты, которые ранжируют студентов от «лучших» до «худших», подвергались критике за предвзятое отношение к меньшинствам. Большинство чиновников сферы образования поддерживают критериальные тесты (Оценка каждого отдельного учащегося зависит исключительно от того, правильно ли он ответил на вопросы, независимо от того, лучше или хуже справились его соседи) для принятия решений с высокими ставками.

Оценка 21 века

Широко отмечалось, что с появлением социальные медиа и Веб 2.0 технологий и мышления, обучение становится все более совместным, а знания все чаще распределяются между многими членами учебного сообщества. Однако традиционные методы оценки ориентированы в основном на человека и не учитывают накопление знаний и обучение в контексте. Поскольку исследователи в области оценки рассматривают культурные сдвиги, возникающие в результате появления более культура участия, им нужно будет найти новые методы применения оценок к учащимся.[31]

Масштабная оценка обучения

Основная статья: Масштабная оценка обучения

Масштабные оценки обучения (LSLA) - это оценки на уровне системы, которые позволяют получить представление об успеваемости группы учащихся за определенный год и в ограниченном количестве областей. Они часто классифицируются как национальные или межнациональные оценки и привлекают внимание к вопросам, связанным с уровнями обучения и детерминантами обучения, в том числе: учитель квалификация; качество школа среды; родительский поддержка и руководство; и социальные и эмоциональные здоровье в школе и за ее пределами.[32]

Оценка в демократической школе

В Модель Садбери школ демократического образования не работают и не предлагают оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей, и что школа не является судьей; сравнение учеников друг с другом или с каким-то установленным стандартом для них является нарушением ученического право на неприкосновенность частной жизни и к самоопределению. Студенты сами решают, как измерить свой прогресс в качестве самостоятельных учеников, в процессе самооценки: по их словам, реальное обучение на протяжении всей жизни и надлежащая образовательная оценка для 21 века. [33]

Согласно школам Садбери, эта политика не причиняет вреда их ученикам, поскольку они переходят к жизни за пределами школы. Однако они признают, что это усложняет процесс, но что такие трудности являются частью учащихся, которые учатся делать свой собственный путь, устанавливать собственные стандарты и достигать своих целей.

Политика отсутствия оценок и оценок помогает создать атмосферу, свободную от конкуренции между учащимися или борьбы за одобрение взрослых, а также способствует созданию благоприятной атмосферы сотрудничества между студентами.[34]

Заключительным этапом обучения в Садбери, если студент решит его пройти, является выпускная диссертация. Каждый студент пишет о том, как они подготовились к взрослой жизни и вступили в сообщество в целом. Этот тезис передается в Собрание, которое его рассматривает. Заключительный этап процесса диссертации - это устная защита, которую дает студент, во время которой он открывает слово для вопросов, проблем и комментариев от всех членов Ассамблеи. В конце Собрание тайным голосованием голосует, присуждать ли диплом.[35]

Оценка студентов ELL

Основной проблемой при использовании образовательных оценок является общая достоверность, точность и справедливость, когда речь идет об оценке изучающих английский язык (ELL).Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая неадекватно отражает популяции ELL.[36] Следовательно, во многих случаях было бы неточно и неуместно делать выводы на основании нормативных оценок студентов ELL. Исследования показывают, что большинство школ не модифицируют оценки должным образом, чтобы приспособить учеников с уникальным культурным происхождением.[36] Это привело к чрезмерному направлению студентов ELL на специальное образование, в результате чего они были непропорционально представлены в программах специального образования. Хотя некоторые могут рассматривать это несоответствующее размещение в системе специального образования как поддерживающее и полезное, исследования показали, что учащиеся, размещенные неправильно, фактически регрессировали в процессе обучения.[36]

Часто бывает необходимо воспользоваться услугами переводчика, чтобы провести экзамен на родном языке учащегося ELL; однако при переводе заданий оценки возникает несколько проблем. Одна из проблем заключается в том, что переводы часто могут предлагать правильный или ожидаемый ответ, изменяя сложность задания.[37] Кроме того, перевод заданий оценки иногда может исказить исходное значение задания.[37] Наконец, многие переводчики не имеют квалификации или должной подготовки для работы со студентами ELL в условиях оценивания.[36] Все эти факторы ставят под угрозу достоверность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминирующими для учащихся ELL, однако некоторые по-прежнему содержат культурные предубеждения в тестовых заданиях.[37]

При рассмотрении учащегося ELL для получения специального образования группа оценки должна объединить и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятый вывод.[37] Решение должно быть основано на многомерных источниках данных, включая интервью учителей и родителей, а также наблюдения в классе.[37] Решения должны учитывать уникальные культурные, языковые и практические особенности учащихся и не должны строго основываться на результатах оценки.

Универсальный скрининг

Оценка может быть связана с неравенством, когда учащиеся из традиционно недопредставленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае одаренный программы. Одним из способов борьбы с этим неравенством является всеобщий отбор, который включает тестирование всех учащихся (например, на одаренность) вместо тестирования только некоторых учащихся на основе рекомендаций учителей или родителей. Универсальный скрининг приводит к значительному увеличению числа традиционно недостаточно обслуживаемых групп (таких как темнокожие, латиноамериканцы, бедные, женщины и ELL), выбранных для одаренных программ, без какого-либо изменения стандартов идентификации.[38]

Смотрите также

Источники

Определение логотипа бесплатных произведений культуры notext.svg Эта статья включает текст из бесплатный контент работай. Под лицензией CC BY-SA 3.0 IGO. Текст взят из Обещание крупномасштабных оценок обучения: признание ограничений для открытия возможностей, ЮНЕСКО, ЮНЕСКО. ЮНЕСКО. Чтобы узнать, как добавить открытая лицензия текст статей в Википедии, см. эта страница с инструкциями. Для получения информации о повторное использование текста из Википедии, посмотри пожалуйста условия использования.

Рекомендации

  1. ^ Некоторые преподаватели и теоретики образования используют термины оценка и оценка для обозначения различных концепций тестирования в процессе обучения с целью его улучшения (для которых одинаково однозначные термины формирующая оценка или же формирующая оценка являются предпочтительными) и тестирования после завершения процесса обучения (для которых одинаково однозначные термины итоговая оценка или же итоговая оценка являются предпочтительными), но на самом деле они являются синонимами и по сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но также используют их для определения друг друга. Если термины используются для разных концепций, тщательное редактирование требует как объяснения того, что они обычно являются синонимами, так и пояснения, что они используются для обозначения различных концепций в текущем тексте.
  2. ^ Аллен, М.Дж. (2004). Оценка академических программ высшего образования. Сан-Франциско: Джосси-Басс.
  3. ^ Kuh, G.D .; Янковский, Н .; Икенберри, С.О. (2014). Знание того, что студенты знают и могут делать: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF). Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.
  4. ^ Национальный совет по измерениям в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA В архиве 2017-07-22 в Wayback Machine
  5. ^ Нельсон, Роберт; Доусон, Филлип (2014). «Вклад в историю оценивания: как симулятор разговора заменяет метод Сократа». Оценка и оценка в высшем образовании. 39 (2): 195–204. Дои:10.1080/02602938.2013.798394. S2CID  56445840.
  6. ^ Suskie, Линда (2004). Оценка обучения студентов. Болтон, Массачусетс: Анкер.
  7. ^ Блэк, Пол и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценивания в классе». Фи Бета Каппан. Доступны на http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1=&lname_2= & fname_2 = & kw_1 = & kw_2 = & kw_3 = & kw_4 = & mn1 = & yr1 = & mn2 = & yr2 = & c1 =[постоянная мертвая ссылка ] PDKintl.org]. Проверено 28 января 2009 года.
  8. ^ Мадаус, Джордж Ф .; Айрасян, Питер В. (1969-11-30). «Размещение, формативная, диагностическая и итоговая оценка обучения в классе». Цитировать журнал требует | журнал = (помощь)
  9. ^ а б c d Мактиг, Джей; О'Коннор, Кен (ноябрь 2005 г.). «Семь практик для эффективного обучения». Образовательное лидерство. 63 (3): 10–17. Получено 3 марта 2017.
  10. ^ «Архивная копия». Архивировано из оригинал на 2009-02-08. Получено 2009-01-29.CS1 maint: заархивированная копия как заголовок (связь)
  11. ^ Скривен, М. (1991). Оценочный тезаурус. 4-е изд. Ньюбери-Парк, Калифорния:Публикации Sage. ISBN  0-8039-4364-4.
  12. ^ Эрл, Лорна (2003). Оценка как обучение: использование оценивания в классе для максимизации обучения учащихся. Таузенд-Оукс, Калифорния, Corwin Press. ISBN  0-7619-4626-8
  13. ^ Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языков». Центр языкового образования и исследований, доступен по адресу Google.com В архиве 2011-09-14 на Wayback Machine. Проверено 28 января 2009 года.
  14. ^ Объединенный комитет информационных систем (JISC). «Что мы подразумеваем под электронным оцениванием?» JISC InfoNet. Получено 29 января 2009 г. из http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf В архиве 2017-01-16 в Wayback Machine
  15. ^ Образовательные технологии в Технологическом университете Вирджинии. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного преподавания, доступно по адресу Edtech.vt.edu В архиве 2009-02-26 в Wayback Machine. Проверено 29 января 2009 года.
  16. ^ Валенсия, Шейла В. "Какие существуют формы аутентичной оценки?" Понимание аутентичной оценки грамотности в классе (1997), доступно по адресу Eduplace.com. Проверено 29 января 2009 года.
  17. ^ Ю, Чонг Хо (2005). "Надежность и достоверность." Образовательная оценка. Доступны на Creative-wisdom.com. Проверено 29 января 2009 года.
  18. ^ Москаль, Барбара М., и Лейденс, Джон А. (2000). «Разработка скоринговой рубрики: обоснованность и надежность». Практическая оценка, исследования и оценка, 7 (10). Проверено 30 января 2009 года.
  19. ^ Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки педагогов». Ньюбери-Парк, Калифорния: Sage Publications
  20. ^ Объединенный комитет по стандартам оценки образования. (1994).Стандарты оценки программ, 2-е издание. Ньюбери-Парк, Калифорния: Sage Publications
  21. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Ньюбери-Парк, Калифорния: Corwin Press
  22. ^ Город и гильдии, Понимание принципов и практики оценки: квалификационный информационный бюллетень, по состоянию на 26 февраля 2020 г.
  23. ^ Американская психологическая ассоциация. «Надлежащее использование тестирования с высокими ставками в школах нашей страны». APA Online, доступно по адресу APA.org, Проверено 24 января 2010 г.
  24. ^ (nd) Повторная авторизация NCLB. Отдел образования. Проверено 29.01.09.
  25. ^ (nd) Что не так со стандартизированным тестированием? FairTest.org. Проверено 29 января 2009 года.
  26. ^ Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены». Daily Bruin. Одна из распространенных жалоб от неудачников - то, что им не преподавали проверенный материал в школе. Здесь виноват не экзамен, а неадекватное обучение. Обвинять тест в провале - все равно что обвинять станцию ​​обслуживания в неудачной проверке на смог; он игнорирует основные проблемы «школьного автомобиля».[постоянная мертвая ссылка ]
  27. ^ Вайнкопф, Крис (2002). «Во всем виноват тест: LAUSD не несет ответственности за низкие оценки». Ежедневные новости. Виноваты «тесты с высокими ставками», такие как Стэнфордский 9 и выпускной экзамен в средней школе Калифорнии. Правление ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не были предоставлены академические инструменты, позволяющие реализовать свой наивысший потенциал на этих тестах».
  28. ^ "Обвинение в испытании". Ежедневник инвестора. 11 мая 2006 г. Судья в Калифорнии намерен отменить выпускной экзамен этого штата в средней школе. Почему? Потому что это работает. Это говорит студентам, что им нужно узнать больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования для окончания учебы, это нечто другое: свидетельство неравного обращения ... выпускной экзамен был сочтен несправедливым, потому что слишком много студентов, которые не прошли тест, имели слишком мало дипломированных учителей. Что ж, может быть, они это сделали, но предоставление им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный лист бумаги ".[постоянная мертвая ссылка ]
  29. ^ "ASD.wednet.edu". Архивировано из оригинал на 2007-02-25. Получено 2006-09-22.
  30. ^ а б Бах, Дебора и Бланшар, Джессика (19 апреля 2005 г.). «WASL беспокоит стресс детей, школ». Сиэтл Пост-Интеллидженсер. Получено 30 января 2009 г. из Seattlepi.nwsource.com.
  31. ^ Фадель, Чарльз, Хани, Маргарет и Пасник, Шелли (18 мая 2007 г.). «Оценка в эпоху инноваций». Неделя образования. Получено 29 января 2009 г. из http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html
  32. ^ ЮНЕСКО (2019). Обещание крупномасштабных оценок обучения: признание ограничений для открытия возможностей. ЮНЕСКО. ISBN  978-92-3-100333-2.
  33. ^ Гринберг, Д. (2000). Школы 21 века, отредактировал стенограмму выступления на апрельской 2000 г. Международной конференции по обучению в 21 веке.
  34. ^ Гринберг, Д. (1987). Глава 20,Оценка, Наконец-то бесплатно - школа Садбери-Вэлли.
  35. ^ Процедура выпускной работы, Школа Горной Лорел Садбери.
  36. ^ а б c d http://ehis.ebscohost.com.libdata.lib.ua.edu/eds/pdfviewer/pdfviewer?sid=221ae7c6-6895-4b02-bc69-759936218fba%40sessionmgr104&vid=12&hid=20[мертвая ссылка ]
  37. ^ а б c d е «Архивная копия» (PDF). Архивировано из оригинал (PDF) на 2012-05-29. Получено 2012-04-11.CS1 maint: заархивированная копия как заголовок (связь)
  38. ^ Кард Д. и Джулиано Л. (2015). Может ли всеобщий скрининг увеличить представленность учащихся с низкими доходами и меньшинств среди одаренных детей? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519.

дальнейшее чтение

  • Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (2014). Стандарты педагогического и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
  • Беннетт Р. Э. (2015). Меняющийся характер образовательной оценки. Обзор исследований в образовании, 39 (1), 370-407.
  • Браун, Г. Т. Л. (2018). Оценка успеваемости студентов. Нью-Йорк: Рутледж.
  • Карлесс, Дэвид. Превосходство в оценке университетов: уроки отмеченной наградами практики. Лондон: Рутледж, 2015.
  • Клингер, Д., МакДивитт, П., Ховард, Б., Роджерс, Т., Муньос, М., и Уайли, К. (2015). Стандарты оценивания в классе для учителей PreK-12: Объединенный комитет по стандартам оценки образования.
  • Кубишин, Т., и Борич, Г. Д. (2012). Образовательное тестирование и измерение: применение и практика в классе (10-е изд.). Нью-Йорк: Джон Вили и сыновья.
  • Миллер, Д. М., Линн, Р. Л., и Гронлунд, Н. Э. (2013). Измерение и оценка в обучении (11-е изд.). Бостон, Массачусетс: Пирсон.
  • Национальный исследовательский совет. (2001). Зная, что знают студенты: наука и дизайн образовательной оценки. Вашингтон, округ Колумбия: Национальная академия прессы.
  • Нитко, А. Дж. (2001). Образовательная оценка студентов (3-е изд.). Верхняя Сэдл-Ривер, Нью-Джерси: Меррилл.
  • Фелпс, Ричард П., изд. Исправление заблуждений об образовательном и психологическом тестировании. Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008 г.
  • Фелпс, Ричард П., Стандартизированный праймер для испытаний. Нью-Йорк: Питер Лэнг, 2007.
  • Рассел, М. К., и Айрасиан, П. В. (2012). Классная оценка: концепции и приложения (7-е изд.). Нью-Йорк: Макгроу Хилл.
  • Шепард, Л. А. (2006). Классная оценка. В R. L. Brennan (Ed.), Educational Measurement (4-е изд., Стр. 623-646). Вестпорт, Коннектикут: Praeger.