ChatGPT проваливает тесты 6-го класса по математике и естественным наукам, но быстро учится

ChatGPT от OpenAI провалил тесты по математике и естественным наукам, которые сдают шестиклассники в Сингапуре.
Согласно The Straits Times, он делал ошибки при простом сложении и не мог понять ни одной диаграммы.
Но ChatGPT, похоже, научился на своих ошибках. У него возникло несколько вопросов, когда Insider протестировал его.

Когда вирусного бота ChatGPT с искусственным интеллектом попросили решить вопросы из сингапурских экзаменов за шестой класс, он с треском провалился.

Во время эксперимента в феврале сингапурское новостное издание The Straits Times попросило ChatGPT ответить на вопросы выпускного экзамена в начальной школе. PSLE — это экзамен, который должны сдать все 12-летние сингапурцы, и он определяет, в какую среднюю школу они пойдут.

ChatGPT задавали вопросы из статей PSLE 2020, 2021 и 2022 годов по математике, естественным наукам и английскому языку.

По данным The Straits Times, он набрал в среднем 16 из 100 баллов за три экзамена по математике. Во время теста он не мог понять или ответить ни на один вопрос, связанный с диаграммами или графиками, и получил за эти вопросы нулевые баллы.

Но ChatGPT допускал ошибки и с простыми текстовыми вопросами. Когда его спросили о сумме 60 000, 5 000, 400 и 3, ответ был 65 503, сообщает The Straits Times.

Правильный ответ: 65 403.

Однако, когда Insider задал тот же вопрос, ответ ChatGPT оказался правильным.

ChatGPT немного лучше справился с научными работами, получив в среднем 21 балл из 100.

Но в понедельник, когда Insider протестировал ChatGPT на двух научных вопросах PSLE — один от 2020 года, а другой от 2022 года — он ответил правильно на оба вопроса.

Как сообщает The Straits Times, ChatGPT удалось пройти тесты по английскому языку и набрать в среднем 11 из 20 баллов по трем экзаменам. Во время теста по английскому ChatGPT все еще сталкивался с проблемами — на этот раз с вопросами, содержащими слова, которые имеют несколько значений.

Одним из примеров, приведенных The Straits Times, было слово «ценность». ChatGPT проигнорировал контекст вопроса, где «ценность» относилась к чьим-либо моральным принципам, и ответил так, как будто это имело в виду денежную ценность.

ChatGPT был разработан компанией OpenAI, занимающейся искусственным интеллектом, и запущен в ноябре. К концу января у него было 100 миллионов пользователей.

Неспособность бота сдать сингапурские экзамены в шестой класс удивительна — ему удалось сдать выпускной экзамен в бизнес-школе Wharton, пройти тесты на четырех курсах юридической школы и без труда сдать экзамен на получение медицинской лицензии в США.

В настоящее время университеты пересматривают экзамены из-за опасений, что боты с искусственным интеллектом могут использоваться для мошенничества, сообщила The New York Times в январе. Этот поворот в тестировании включает в себя больше устных экзаменов, групповой работы и рукописных оценок вместо печатных материалов, согласно The Times.

Представители OpenAI и Министерства образования Сингапура не сразу ответили на запрос Insider о комментариях.

ChatGPT проваливает тесты 6-го класса по математике и естественным наукам, но быстро учится

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply