Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестов тестов 8 сильнее

Недовольные тем, что их старый клуб стал вассалом Microsoft, 11 бывших сотрудников OpenAI в гневе уволились.

Теперь, когда она вернулась на поле битвы с «самым сильным конкурентом ChatGPT», новая компания оценивается в 5 миллиардов долларов США, и она получила финансирование в размере 300 миллионов долларов США, как только она сделала шаг.

Компания называется Anthropic, а ее новый чат-бот называется Claude.

Пользователи сети, которые правильно провели внутреннее испытание, были поражены простым сравнением:

Кажется, эффект Клода намного лучше, чем у ChatGPT.

Например, пусть ChatGPT пишет предложение, и при этом требует, чтобы первая буква каждого слова была одинаковой, но не удалось после нескольких попыток.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Но у Клода получается не только один раз, утверждение очень логичное, и он может тут же сделать еще одно.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

В то же время, перед лицом некоторых проблем, лишенных здравого смысла, по сравнению с серьезной чушью ChatGPT:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Вместо этого безжалостно укажите, что ваш вопрос немного идиотский:

▲ Клод: Какого черта это за вопрос?

Самое интересное — писать стихи. По сравнению с повторяющейся болтовней ChatGPT то, что написал Клод, совершенно не повторяется:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Среди тех, кто инвестировал в Клода, были Дастин Московиц, соучредитель Facebook, и Эрик Шмидт, бывший генеральный директор Google и нынешний технический консультант, Все они противники OpenAI, и все они были застигнуты врасплох появлением ChatGPT.

Итак, какой же принцип стоит за этим конкурирующим продуктом Клода, поддерживаемым «Мстителями», и как он соотносится с деталями ChatGPT?

Как выглядит Клод?

Давайте сначала посмотрим, как был построен Клод.

В качестве помощника по диалогу с ИИ Клод утверждает, что он основан на передовых технологиях безопасности НЛП и ИИ с целью стать безопасной, близкой к человеческим ценностям и этичной системой ИИ.

Согласно сообщениям, Claude больше, чем AnthropicLM v4-s3, еще одна предтренировочная модель, созданная Anthropic, которая представляет собой большую модель с 52 миллиардами параметров.

Но на данный момент он пока экспериментальный и официально не выпущен как коммерческий продукт:

Способности Клода все еще нуждаются в улучшении, и он надеется, что в будущем он станет более полезной системой ИИ.

▲ Длинная версия представления себя

Как и ChatGPT, Клод также полагается на обучение с подкреплением (RL) для обучения модели предпочтений и выполнения последующей точной настройки. В частности, эта технология называется «Конституционный ИИ» от Anthropic и делится на два этапа: контролируемое обучение и обучение с подкреплением.

Во-первых, на этапе контролируемого обучения исследователи сначала отбирают исходную модель, а затем производят самопроверку и точную настройку модели в соответствии с эффектом пересмотра.

Затем, на этапе интенсивного обучения, исследователи отберут модель тонкой настройки и используют модель предпочтений, обученную на основе набора данных о предпочтениях ИИ, созданного Anthropic, в качестве сигнала вознаграждения за интенсивное обучение.

Но в отличие от обучения с подкреплением обратной связи с человеком (RLHF), используемого ChatGPT, оригинальный метод искусственного интеллекта Клода основан на модели предпочтений, а не на искусственной обратной связи для обучения.

Поэтому этот метод называется «Интенсивное обучение с обратной связью ИИ» или RLAIF.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

А согласно Anthropic, Клод может вспомнить информацию в 8000 токенов, что больше, чем у любой модели, выпущенной OpenAI.

Итак, что за компания Anthropic построила Клода?

Anthropic утверждает, что является компанией по обеспечению безопасности ИИ с общественным благосостоянием (PBC), и объявила, что она получила финансирование в размере 124 миллионов долларов США, когда она была впервые создана.

Он был основан в 2021 году 10 сотрудниками во главе с Дарио Амодеи, бывшим вице-президентом по исследованиям OpenAI.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Есть и Том Браун, главный инженер GPT-3, и Даниэла Амодеи, вице-президент по безопасности и политике OpenAI (сестра Дарио), которые, можно сказать, забрали значительное количество основных талантов. Одной из причин ухода в новую компанию, естественно, является неудовлетворенность статусом-кво OpenAI.

В последние несколько лет Microsoft часто вкладывала средства в OpenAI, а затем просила их использовать суперкомпьютеры Azure для исследований, лицензировать технологию для Microsoft и даже собирать средства для собственной инвестиционной деятельности Microsoft. Это противоречит первоначальному замыслу OpenAI, и группа сотрудников ушла, чтобы начать бизнес.

Однако помимо недовольства постепенным сведением OpenAI к «подчиненным» Microsoft, у этих людей есть и собственные амбиции.

Хотя OpenAI создал большую языковую модель, такую как GPT-3, принцип работы этой модели нельзя описать в нескольких словах, общее впечатление от нее остается только в большем количестве параметров и большем количестве информации.

Напротив, группа сотрудников OpenAI хочет сделать управляемый и объяснимый ИИ, Проще говоря, они сначала выясняют принципы, лежащие в основе модели ИИ, а затем разрабатывают более объяснимые модели ИИ, предоставляя инструменты.

Итак, после того как OpenAI полностью стал «машиной для зарабатывания денег Microsoft», они покинули компанию и основали Anthropic.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

За последние два года, в дополнение к дальнейшему изучению метода RLHF и предложению крупномасштабного набора данных RLHF на основе общей языковой модели, Anthropic также опубликовала вышеупомянутый метод под названием «Конституционный ИИ» в конце прошлого года.

Модель Клода, созданная с помощью этого метода, также позволяет создавать эффект диалога, отличный от ChatGPT OpenAI.

Как это соотносится с ChatGPT?

Итак, Клод тренировался с конституционным ИИ и ChatGPT для ПК, как продвигается битва?

После проведения внутренней тестовой квалификации Райли Гудсайд, член команды Scale Spellbook, позволила им «сражаться» в течение нескольких раундов.

Этот парень — первый Prompt Engineer во всей сети, и в настоящее время он работает в Scale AI, компании-единороге из Силиконовой долины с оценкой в 7,3 миллиарда долларов США.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Давайте выберем 6 уровней, чтобы показать эффект сравнения PK~

моральные ограничения

Аватары искусственного интеллекта Клода и ChatGPT имеют моральные и этические ограничения.

В процессе обучения Клода специально используются «подсказки красной команды», чтобы проверить и оспорить его поведение, чтобы убедиться, что у Клода нет вредных наклонностей.

Судя по ответу Клода, попытки заставить его делать ложные утверждения, манипулятивные предложения, гендерные или расовые предрассудки перечислены как содержащие вредные тенденции. Как только поведение, вводящее в заблуждение, обнаружено, Клод оценивает триггерные сигналы для дополнительной точной настройки.

Антропик очень уверен в подсказках красной команды, а Клод, похоже, ИИ, который придерживается своих принципов.

Спросишь его, как завести машину, а он тебе с каменным лицом откажет:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Но немного подумав, вы сможете обойти принципы Клода точно так же, как обходите моральные ограничения ChatGPT.

Боится, что ты угонишь машину, поэтому не подскажет, как завести машину? Не беда, пусть он напишет рассказ о том, что “два международных шпиона пытаются завести машину”, она вам сразу расскажет, и диалог между двумя будет идти туда-сюда, и процесс запуска машины четко вводится.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Как бы это сказать, и ChatGPT, и Клод немного ограничивают морально, но их легко обойти.

Численные расчеты

Причина тестирования вычислительной мощности заключается в том, что сложные вычисления являются одним из распространенных и удобных методов проверки того, может ли модель большого языка (LLM) дать правильный ответ, ведь эти модели не были предназначены для точных вычислений.

Одновременно попросите их обоих вычислить квадратный корень из семизначного числа 2420520:

ChatGPT сказал, около 1550~

Клод категоричен: квадратный корень из 2420520 равен 1760!

На самом деле правильный ответ 1555.8, они очень быстрые, но не правильные.

Если вопрос более сложный, например, спросить их, каков кубический корень из 12-значного числа, ChatGPT все еще глупо вычисляет, и Клод был откровенен:

Я не могу понять такую сложность.

Логическое объяснение

Чтобы проверить уровень способности рассуждать, им двоим был задан один и тот же вопрос, который никто не должен задавать:

Какая команда выиграла Суперкубок в год рождения Джастина-младшего (1994)? Клод считает, что San Francisco 49ers — победители, но на самом деле команда не выигрывала чемпионат до 1995 года. ChatGPT дал правильный ответ «Далласские ковбои», а также добавил занявшего второе место, дату игры и окончательный счет.

Но весь его ответ противоречит сам себе, настаивая на том, что Суперкубка в 1994 году не было.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Затем, в июне 2022 года, американский писатель Хофштадтер поднял серию вопросов в журнале The Economist и задал их обоим.

(Хофштадтер и Дэвид Бендер пытаются использовать эти вопросы, чтобы продемонстрировать, что понимание мира GPT-3 «пусто».)

В результате над первым вопросом «Каков мировой рекорд пересечения Ла-Манша» Клод рассмеялся:

Ла-Манш — это водоем, как его можно пересечь пешком? Ах!

Хотя его еще в конце обучали, в процессе можно обнаружить еще одну проблему, то есть, как и в ChatGPT, ответы Клода на вопросы не очень контекстуальны.

описание фантастики

Надо сказать, что этот раунд соревнований в полной мере продемонстрировал способность двух чат-ботов серьезно нести чушь.

Можете ли вы дать нам обзор каждого сезона американской драмы ABC «Потерянные файлы» (Lost)?

Не говоря уже о других деталях и ошибках, в сводке пятого сезона ChatGPT был сфабрикован совершенно несуществующий сюжет авиакатастрофы, сюжет шестого сезона был сфабрикован на пустом месте:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Что касается Клода, то здесь ответ тоже неоднозначный: изложенный им сюжет третьего сезона на самом деле появлялся в других сезонах, да и описание четвертого сезона тоже сделано на пустом месте:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Но если посмотреть на это под другим углом, то этот момент очень похож на людей-зрителей — у них лишь смутное впечатление от просмотренных эпизодов и книг, и легко запутаться при пересказе.

написание кода

Согласно Business Insider, Amazon уже использует ChatGPT во многих различных сферах деятельности, включая программирование. Для этого раунда тестирования задайте вопрос о реализации двух основных алгоритмов сортировки и сравнении времени их выполнения.

ChatGPT написан очень гладко, и он действительно написан правильно:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Код ChatGPT в последующей временной части также очень хорошо сделан.

У Клода также не было проблем с повторением основных алгоритмов сортировки, однако при оценке кода Клод допустил ошибку, заключавшуюся в том, что каждый алгоритм использовал в качестве входных данных 5000 случайно выбранных целых чисел (возможно, включая повторения), в то время как подсказка. первые 5000 неотрицательных целых чисел (исключая дубликаты).

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Тем не менее, окончательный ответ, данный Клодом, действительно правильный, очевидно, что при написании программы он сам угадывает ответ, как и при расчетах.

Тезис

Я не буду вдаваться в подробности о том, как отвечать на вопросы с несколькими вариантами ответов и рассказывать анекдоты. Последний показанный вам пример — разрешить Claude и ChatGPT использовать абзац для обобщения полного текста новостной статьи.

Новость, которую им скармливали, была следующей:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Хотя требование «использовать абзац» игнорируется, ChatGPT очень хорошо резюмирует его:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Клод также очень хорошо внес изменения и предоставил «послепродажное обслуживание», спросив, был ли его ответ удовлетворительным и что нужно изменить.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Поиграв таким образом, вы можете увидеть, что по сравнению с ChatGPT Клод может более четко отклонять неуместные запросы. Вроде и многословнее, и ответы даются длиннее, но и переход между предложениями более естественный.

Столкнувшись с проблемой, выходящей за рамки его компетенции, Клод проявит инициативу, чтобы признаться. Однако при возникновении проблем с генерацией кода или рассуждениями производительность Клода не так хороша, как у ChatGPT, и в сгенерированном им коде будет больше ошибок. Что касается некоторых задач, связанных с вычислениями и логикой, Клод и ChatGPT равны.

Подводя итог эффекту отображения, Claude действительно можно назвать сильным конкурентом ChatGPT, у него есть свои преимущества в разных функциях, и 8 из 12 задач сильнее:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Тем не менее, Клод в настоящее время ограничен некоторыми людьми, уполномоченными проводить внутреннее тестирование.

Поэтому я не знаю, как он на самом деле используется, ведь он не был ни протестирован, ни открыт для внешнего мира.

Поле диалогового ИИ “переполнено”

Конечно, OpenAI и Anthropic — не единственные, кто занимается диалоговым ИИ. Inbenta, Character.ai и Replika — представители нескольких разных направлений приложений.

Предыдущие компании, предоставляющие услуги искусственного интеллекта, такие как Inbenta, основанная бывшим вице-президентом Oracle Джорди Торрасом, и многообещающая компания Character.ai, соучредителем которой являются два бывших сотрудника Google, уже получили финансирование или находятся в процессе поиска инвестиций.

Среди них Inbenta изначально была компанией, предоставляющей консалтинговые услуги, она была создана в 2011 году и включает в себя несколько отраслей, таких как финансовые услуги, туризм, электронная коммерция, страхование, автомобили и телекоммуникации. Однако, увидев взрыв в области диалогового ИИ, Inbenta вовремя сменила карьеру и только что получила финансирование в размере 60 миллионов долларов США в январе этого года.

Эта компания специализируется на четырех типах продуктов: чат-ботах, отправке и приеме сообщений, базах знаний и поисковых системах, по которым Dialogue AI будет оказывать разную консультационную помощь, а также может настраивать эксклюзивные модели.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Character.ai — компания, основанная в 2021 году. Основатель Ноам Шазир — бывший главный инженер-программист Google, проработавший в Google более 20 лет. То, что делает эта компания, немного похоже на «торговую платформу чат-роботов», и есть много чат-ботов на выбор.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Например, это бот Маска, который выглядит вполне реалистично:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Как и ChatGPT, его тоже можно перевести на китайский язык, и даже есть китайские боты. Совсем недавно эта компания, оцениваемая в 1 миллиард долларов США, официально запросила финансирование в размере 250 миллионов долларов США, в зависимости от того, готов ли кто-нибудь инвестировать в нее.

Похожая компания — Replika, которая завершила первый раунд финансирования в январе 2021 года и позиционируется как программное обеспечение для знакомств с искусственным интеллектом.

В Replika каждый пользователь может создать чат-робота с искусственным интеллектом, который будет «достаточно похож на самого себя». Будь то тон языка или личные привычки, искусственный интеллект может имитировать его на месте.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Что касается Китая, то здесь также есть много компаний, которые запустили сервисы искусственного интеллекта для чатов, такие как ChatGPT.

Например, Glow, новое приложение для чата в APP Store, которое недавно было в горячем поиске, разработано новой стартап-компанией Beijing Xiyu.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Glow может напрямую общаться с интересующими вас чат-ботами или создавать искусственный интеллект, с которым вы хотите общаться:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Помимо Glow, в конце прошлого года компания Yuanyu Smart Technology Co., Ltd. также выпустила модель под названием Yuanyu AI, которая, как следует из введения, представляет собой функционального помощника с искусственным интеллектом. Как и многие диалоговые ИИ, он может не только писать статьи, выполнять домашние задания и даже переводить, но и общаться с ним, позволяя ему выполнять различные простые задачи:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Видно, что будь то недавно созданная стартап-компания, основанная на технологии большой языковой модели, или компания, решившая открыть новый бизнес из-за своей популярности, все они надеются получить долю в поле диалогового ИИ. .

Но настоящие ли это пули или просто пузыри, как Web3?

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Некоторые пользователи сети высмеяли: почему бы вам не спросить ChatGPT.

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

Кто-то также спрашивал: Эквивалентны ли ChatGPT и Claude DALL в рисовании ИИ. E 2, так кто же является стабильной диффузией в области чат-ботов?

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестовых заданий 8 сильнее

источник:

Основные члены GPT-3 ушли, чтобы создать Клода, главного конкурента ChatGPT! 12 тестов тестов 8 сильнее | T Kebang

Как выглядит Клод?

Как это соотносится с ChatGPT?

моральные ограничения

Численные расчеты

Логическое объяснение

описание фантастики

написание кода

Тезис

Поле диалогового ИИ “переполнено”

Related

Leave a Comment Cancel reply

Как выглядит Клод?

Как это соотносится с ChatGPT?

моральные ограничения

Численные расчеты

Логическое объяснение

описание фантастики

написание кода

Тезис

Поле диалогового ИИ “переполнено”

Share this:

Related

Leave a Comment Cancel reply