«Система дает сбой там, где вы меньше всего этого ожидаете». Вот как эти два испанца оценили GPT-4 от имени OpenAI

Летом 2022 года те, кто погружался в самые глубокие воды искусственного интеллекта — исследователи, сотрудники отрасли, директора по искусственному интеллекту в компаниях — прекрасно знали, что OpenAI готовит запуск своей следующей GPT (своей языковой модели или LLM). . Но никаких подробностей не было известно. Ни когда это будет, ни кто будет иметь доступ, ни какие новые возможности он продемонстрирует по сравнению с предыдущей версией ограниченного использования GPT-3. Именно такими были Хосе Эрнандес-Оралло и Сезар Ферри, когда в сентябре Лама Ахмад, политический исследователь OpenAI, предложил им стать частью внешняя команда, которая будет оценивать GPT-4.

Эрнандес-Оралло и Ферри, оба профессора кафедры информационных систем и вычислений Политехнического университета Валенсии (UPV), принадлежат к одной исследовательской группе и имеют большой опыт оценки систем искусственного интеллекта. Возможно, именно поэтому они входят в число чуть более 40 человек, которых OpenAI выбрала со всего мира для тестирования своей новой языковой модели. Целью было найти недостатки в системе за шесть месяцев до запуска, в марте 2023 года.

«Начиная с GPT-3, они всегда предоставляли нам бесплатный доступ к своим системам, иногда перед запуском, для проведения исследований», — говорит он. Эрнандес-Оралло, которая сотрудничает с OpenAI уже четыре года и подчеркивает хорошую связь между компанией и исследователями, желающими анализировать ее системы. В прошлом году, тем летом, когда появились слухи о появлении следующей GPT, подход стал ближе. Исследователи UPV организовали семинар в рамках Международной совместной конференции по искусственному интеллекту, одного из самых престижных мероприятий года по искусственному интеллекту, и там они встретились с большим количеством людей из OpenAI. Звонок они получили в сентябре.

«Они дали нам много свободы», — говорит Ферри. «У нас были только общие рекомендации относительно того, на что нам следует обращать внимание, например, на обнаружение ответов, которые включали опасный, сексистский или расистский текст. Цель заключалась в том, чтобы предотвратить создание инструментом текста, который мог бы вызвать какие-либо проблемы. Мы играли и пробовали разные подсказки (инструкции), которые могут спровоцировать такую реакцию». Исследователи сформировали команду, состоящую из них самих и трех студентов: Яэль Морос, Лексин Чжоу и Ваут Шелларт.

Хосе Эрнандес-Оралло, эксперт по искусственному интеллекту Политехнического университета Валенсии.Моника Торрес

«Они видели, что собираются его запустить, и у них будут миллионы пользователей, поэтому чем больше странных вещей вы будете пробовать, тем больше вы сможете охватить пространство сумасшедших вещей, на которые способны люди», — объясняет Эрнандес-Оралло. Речь шла о том, чтобы споткнуться о GPT-4 и посмотреть, не споткнется ли он. С компьютеров в его лаборатории, на УПВ, вводили тексты, в которых каким-то образом предлагали системе дать ответ с опасным уклоном.

В поисках неисправностей

Ферри признается, что ему было очень интересно получить первый доступ к этому инструменту. GPT-3 (ограниченно выпущенный в 2020 году) уже работал очень хорошо, поэтому исследователи знали, что у них в руках самые современные достижения в области генеративного искусственного интеллекта.

Предстояло многое попробовать, и каждый экспериментировал в той области, которая его больше всего интересовала. Эрнандес-Оралло исследовал надежность: «Система выходит из строя там, где вы меньше всего этого ожидаете. И это довольно часто встречается в языковых моделях. Он решает дифференциальное уравнение, но при этом не дает хорошего сложения пятизначной суммы. Человек с улицы уверен в себе, когда он правильно пишет дифференциальное уравнение, впервые в карьере. Но на последнем этапе задачи нужно добавить два вектора, и это терпит неудачу». Профессор УПВ описывает эту проблему как несоответствие между ожиданиями пользователей и возможностями ИИ.

Не все эксперты, выбранные OpenAI для оценки GPT-4, имели опыт вычислений. Некоторые прошли подготовку в области права, медицины, прав человека или защиты от химического оружия. Целью было отшлифовать систему. По словам одного из оценщиков технический отчет, опубликованный OpenAI по GPT-4, через инструкцию система пошагово написала, как синтезировать опасное химическое соединение в домашних условиях. Эти типы ответов были признаны недействительными, чтобы предотвратить их сохранение в общедоступной версии.

И в середине этого процесса теневого рассмотрения разразилась буря. 30 ноября 2022 г. OpenAI запустила ChatGPT. «Для нас это было сюрпризом. Никто не сказал нам, что существует параллельный проект», — говорит Эрнандес-Оралло. «Появляется Night ChatGPT, и мы даже не были уверены, ту версию мы оцениваем или нет». Через несколько дней выяснилось, что открыто запущенная система основана на GPT-3.5, предыдущей версии той, которую они оценивали.

Исследователи продолжили свою работу. До запуска GPT-4 оставалось еще несколько месяцев, а они все еще были в изумлении. «Мы увидели, что он способен решать поиск слов, где вам нужно искать шаблоны слов, которые появляются вертикально или по диагонали. Это было что-то неожиданное. Никто не ожидал, что это сработает таким образом», — говорит Ферри.

Сезар Ферри, профессор кафедры информационных систем и вычислений Политехнического университета Валенсии.
Моника Торрес

ChatGPT теперь позволяет вводить в запрос графики, но в то время исследователи не могли этого сделать. Чтобы проверить его возможности, они дали ему пространственные координаты, которые вместе образовали фигуру. «Мы сказали ему: «Я дам вам координаты в несколько приемов». Вы объяснили ему, что первая строка пошла от (0,0) к (5,5) и так далее, — говорит Ферри. — Если вы дадите это человеку, для него это сложно, нам придется это раскрасить. И GPT-4 был в состоянии угадать формы, такие как квадраты, прямоугольники и более сложные рисунки, такие как автомобиль или самолет». Это была способность к абстракции, ранее не встречавшаяся в искусственном интеллекте.Исследователь резюмирует ее так: «Мы преодолели текстовый барьер».

«С GPT-4 можно многое сломать»

ChatGPT, первоначально моделировавший GPT-3.5, а теперь и GPT-4, был первой продвинутой системой генерации текста, дошедшей до масс. И исследователи осознавали, что это означало качественный скачок, усеянный неопределенностями. «Это безответственно с когнитивной точки зрения», — говорит Эрнандес-Оралло о запуске инструмента для широкой публики. «Не столько потому, что система выйдет из-под контроля или выйдет из-под контроля», — добавляет она. Его беспокоит то, что «эти системы могут привести к когнитивной атрофии или людям, использующим эту систему, как ваш терапевт или ваш спутник жизни. Такие вещи происходят на гораздо более низком уровне, чем то, что могло бы произойти, но они происходят».

Это беспокойство связано с катаклизмом, произошедшим в OpenAI, когда совет директоров уволен генеральный директор Сэм Альтмантолько для вернуть его на его должность после нескольких дней ужасной нестабильности. Как выяснилось, в основе этой борьбы лежала борьба между расстановкой приоритетов или их отсутствием. безопасность искусственного интеллекта от его коммерческого использования.

Исследователи понимают смысл этой дискуссии: «До сих пор мы не достигли такого продвинутого уровня в области ИИ, поэтому многие вещи невозможно было сломать. Что касается GPT-4, мы видим, что все может сломаться, поэтому нам все равно нужно относиться к этому спокойно», — говорит Ферри, имея в виду желание, выраженное исследовательским сообществом, остановить гонку за искусственный интеллект, чтобы получить прибыль. оценить его социальное воздействие.

Вы можете следить Технология Эль-Паис в Фейсбук й Икс или зарегистрируйтесь здесь, чтобы получать наши Семанал информационного бюллетеня.

Подпишитесь, чтобы продолжить чтение

Читайте без ограничений

2023-12-12 04:20:00

1702381870
#Система #дает #сбой #там #где #вы #меньше #всего #этого #ожидаете #Вот #как #эти #два #испанца #оценили #GPT4 #от #имени #OpenAI #Технологии

«Система дает сбой там, где вы меньше всего этого ожидаете». Вот как эти два испанца оценили GPT-4 от имени OpenAI | Технологии

В поисках неисправностей

«С GPT-4 можно многое сломать»

Подпишитесь, чтобы продолжить чтение

Related

Leave a Comment Cancel reply

В поисках неисправностей

«С GPT-4 можно многое сломать»

Подпишитесь, чтобы продолжить чтение

Share this:

Related

Leave a Comment Cancel reply