Home » Сравнивать, согласовывать, отслеживать: основная задача данных обучения

Сравнивать, согласовывать, отслеживать: основная задача данных обучения

Сильвия Монтойя, директор Статистического института ЮНЕСКО, и Луис Крауч, 1ул. Заместитель председателя правления СИЮ

ЦУР дают стимул к использованию или разработке высококачественных программ оценки для отчетности. Формулировка ЦУР требует, чтобы «глобальный мониторинг в максимально возможной степени основывался на сопоставимых и стандартизированных национальных данных…». Глобальный показатель ЦУР 4.1.1, «Доля детей и молодежи (а) во 2/3 классах; (б) в конце начальной школы; и (c) в конце первого этапа средней школы достижение хотя бы минимального уровня владения (i) чтением и (ii) математикой в ​​разбивке по полу», основное внимание уделяется изучению прогресса в обучении от начального до начального среднего уровня с использованием общепринятых во всем мире критериев обучения. области, которые повсеместно считаются критическими.

В процессе реализации ЦУР и вскоре после этого Статистический институт ЮНЕСКО (СИЮ) и другие представители образовательного сообщества столкнулись с дилеммой с двумя очевидными крайностями, каждая из которых имела своих сторонников. С одной стороны, были те, кто полагал, что можно разработать и применить единую глобальную оценку. Например, задолго до ЦУР и даже ЦРТ, ЮНЕСКО выдвинула такую ​​идею в 1990-х годах. проект MLA).

С другой стороны, другие члены сообщества выступали за то, чтобы каждая страна (или, возможно, регион) измеряла обучение самостоятельно и что измерения, позволяющие проводить сравнения, по своей сути вводят в заблуждение. СИЮ выбрал гораздо более трудный средний путь, поскольку считал, что это единственный технически правильный и политически разумный путь.

Задача подразумевала создание набора глобальных стандартов в ходе трудоемкого, но необходимого процесса. Это позволит при проведении разрозненных оценок ссылаться на стандарты без необходимости проведения одной и той же оценки. Следующее набор инструментов сделало бы это возможным:

Несмотря на эти и другие усилия СИЮ сделать доступными вспомогательные инструменты, таких как информация о стоимости оценки, пригодности для целей, калиброванных модулях, таких как AMPL, и растущем банке элементов, которые могут использовать страны, доступность данных о результатах обучения остается низкой. Существуют финансовые и технические причины, но также, что немаловажно, функционирование рынок оценки обучения остается неэффективным и несправедливым: отсутствует достаточная ясность альтернатив донорам и, особенно, странам, что препятствует осознанному выбору. Маловероятно, что те, кто участвует в индустрии оценки, коллективно или индивидуально решат, по сути, экосистемные проблемы координации и предоставления общественного блага.

Read more:  Отсутствие полных данных о лекарственной чувствительности больных туберкулезом может привести к усилению резистентности: исследование

Несмотря на то, что данных о прогрессе для 4.1.1a недостаточно.

Информация о показателе ЦУР 4.1.1 сообщается с использованием различных межнациональных исследований, которые являются международными (ЖЕМЧУГ, ТИМСС) или региональный (ПОЛНЫЙ, МОРЕ-ПЛМ, ПАЭС, ЛЛЕСЕ, САКМЕК) и поделиться единым инструментом для стран-участниц. Эти инструменты не были разработаны для отчетности по ЦУР, но в 2018 году Глобальный альянс по мониторингу обучения (ГАМЛ) и Группа технического сотрудничества по показателям ЦУР 4 (ТКГ) согласились, что эти оценки можно использовать для составления отчета об обучении на основе их уровней квалификации, которые лучше всего «сопоставляются» с глобальным MPL. Для примерMPL по показателю 4.1.1a по чтению во 2 или 3 классах определяется следующим образом:

  • Учащиеся точно читают и понимают письменные слова из знакомого контекста.
  • Они извлекают явную информацию из очень коротких текстов.
  • Слушая чуть более длинные тексты, они делают простые выводы.

Информацию о национальных и других программах оценки можно увидеть на странице инвентаризация оценок обучения. Для младших классов только две региональные оценки (PASEC в Африке и ERCE в Латинской Америке) могут использоваться для отчета об обучении, в то время как недавняя попытка СИЮ, AMPLa, только завершает пилотный этап с четырьмя странами Африки и одной страной Азии ( Индия). в конце начальной школы и в конце неполной средней школы проводится гораздо больше оценок. Методы использования других оценок для отчетности еще не являются достаточно надежными и адекватными.

Программы оценки по классам или возрасту и их использование для отчетности по показателю 4.1.1 ЦУР.

Оценка Международная программа оценки
На базе школы
ЦУР 4.1.1a: Начальные классы
2 ЭГМА, ДИКИЙ, ПАЭС
3 ЭГМА, ДИКИЙ, ЭРСЕ, AMPLa
ЦУР 4.1.1b: Окончание начальной школы
4 ПОЛНЫЙ, ЛаНА, ЖЕМЧУГ, ТИМСС
5 МОРЕ-ПЛМ
6 ЛаНА, ПАЭС, ПОЛНЫЙ, САКМЕК, ЭРСЕ, AMPLb
ЦУР 4.1.1c: Окончание неполного среднего образования
8 ТИМСС
Возраст
15 лет ПИЗА
Бытовой
5-16 лет АСЭР, СПОСОБНОСТЬ
7-14 лет МИКС
Read more:  Китай публикует экономические данные, но отсутствие данных о безработице среди молодежи вызовет беспокойство | Мировые новости

Примечание: Оценки, выделенные жирным шрифтом, используются для отчетности по показателю ЦУР 4.1.1.

Производство сопоставимых результатов обучения не прогрессирует быстро и недостаточно равномерно. Независимо от критерия охвата (количество стран или населения), охват в конце начальной школы и в конце первого этапа средней школы намного выше, чем во 2 или 3 классах.

Охват оценок обучения по уровням образования

Что можно сделать, чтобы улучшить отчетность в младших классах?

Другие оценки в младших классах, которые применялись во всем мире, не могут использоваться для глобальной отчетности, главным образом потому, что они не предназначены для получения сопоставимых данных: оценка по чтению/математике в младших классах (EGRA/EGMA), оценки под руководством граждан сети PAL и оценки ЮНИСЕФ. Модуль базового обучения обследования домохозяйств MICS).

Во-первых, они были разработаны для национальной диагностики, пропаганды, разработки программ, отслеживания и оценки программ. Однако со временем они стали использоваться в сотнях стран/языковых комбинаций, часто с достаточной адаптацией к орфографии языков, чего не делают крупные международные и региональные оценки. Это важно, поскольку во 2 и 3 классах язык тестирования имеет большое значение.

Во-вторых, оценки сетей EGRA/EGMA и PAL часто проводятся среди подгрупп населения, и используемые выборки не должны были быть репрезентативными на национальном уровне. Напротив, международные и региональные оценки используют сложные выборки для того, чтобы сделать выводы на национальном уровне.

В-третьих, выборка, расчеты отклонений для кластерной выборки, хранение данных, надзор, аудит данных и другие административные аспекты оценок EGRA/EGMA, PAL Network и MICS не всегда хорошо документированы в одном месте. Если нет централизованной и четкой документации процедур, трудно узнать, соблюдались ли процедуры. Напротив, международные и региональные оценки централизуют и упорядочивают документацию, делая ее легкодоступной.

Read more:  Прямой эфир: Израиль и ХАМАС в состоянии войны | Израиль: большинство заложников ХАМАСа живы, протест против УВА - Het Parool

Тем не менее, эти оценки потенциально могут быть использованы для отчетности. Если выборка была субнациональной, выводы можно было сделать для всего населения. Если измерение было разовым, возможно, можно будет повторить оценку и связать их для измерения прогресса с течением времени. Даже тот факт, что их связь с MPL не была ясна, можно решить в ходе дальнейшей работы, либо путем внесения дополнений в эти оценки, либо путем разработки MPL с поднавыками, позволяющими связывать их. Короче говоря, взаимосвязь между общими областями EGRA, оценками сети PAL или MICS (т. е. беглость, точность и понимание) и MPL может быть установлена ​​с использованием методов, учитывающих особенности каждого языка.

Но эти проблемы возникают из более глубокой и фундаментальной проблемы: неэффективности рынка оценки. Оценки были разработаны НПО, некоммерческими организациями и агентством ООН для конкретных целей, соответствующих конкретной нише или рыночному спросу. Эти цели, возможно, не требовали, чтобы образцы были национальными. Или им, возможно, не требовалась обширная документация. У каждого теперь есть определенная инерция. Учитывая скудность официальных отчетных данных, которыми оперирует СИЮ, было бы очень плохо, если бы энергия и богатство, которые они представляют, не могли быть использованы для существенного увеличения объема отчетности.

Объединение этих разрозненных усилий по оценке обучения требует, чтобы арбитр или брокер сравнил различные оценки, предложил способы улучшения документации и заказал дальнейшее исследование того, как связать их с MPL. Единственным известным арбитром или посредником в такого рода работе является СИЮ и созданные им процессы ТКГ.

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.