GPT-4 уверенно сдается на радиологическом обследовании

Когда эксперты повторяли эксперимент через разные промежутки времени и настраивали подсказки, GPT-4 все равно с трудом справлялся с успеваемостью студентов. Даже после тонкой настройки ответы GPT-4 не улучшились. Фактически, когда вопросы повторялись, он менял свой ответ более чем в 25% случаев без улучшения точности. GPT-4 действительно точно диагностировал множество критических состояний, но не смог выявить … Read more