Home » Google Bard AI теперь может писать и выполнять код, чтобы ответить на вопрос – Ars Technica

Google Bard AI теперь может писать и выполнять код, чтобы ответить на вопрос – Ars Technica

Большие языковые модели (LLM), такие как ChatGPT и Google Bard, могут предоставить некоторый достойные ответы на определенные типы вопросов, но по иронии судьбы эти компьютеры довольно плохо справляются с вычислениями. У Google есть новое решение, позволяющее заставить языковые модели правильно выполнять простые задачи, такие как математика: написать программу. Google говорит, что теперь, когда вы задаете Барду «вычислительную» задачу, такую ​​как математика или работа со строками, вместо того, чтобы показывать вывод языковой модели, эта языковая модель вместо этого напишет программу, выполнит эту программу, а затем покажет вывод этой программы. пользователю в качестве ответа.

Сообщение в блоге Google содержит пример ввода «Перевернуть слово «леденец» для меня». ChatGPT ошибается в этом вопросе и дает неверный ответ «pillopoL», потому что языковые модели видят мир в виде кусков слов или «токенов», а они просто не умеют это делать. Вот пример вывода Барда:

Google

Он получает правильный вывод как “popilloL”, но более интересно то, что он также включает в себя код Python он написал, чтобы ответить на вопрос. Это здорово для людей, склонных к программированию, чтобы увидеть под капотом, но ничего себе, это, вероятно, самый страшный результат для обычных людей. Тоже не особо актуально. Представьте, если бы Gmail показал вам блок кода, когда вы просто попросили его получить электронную почту. Это странно. Просто делай работу, о которой тебя просили, Бард.

Google сравнивает модель ИИ, пишущую программу, с людьми, выполняющими деление в большую сторону, поскольку это другой способ мышления:

Этот подход черпает вдохновение из хорошо изученной дихотомии человеческого интеллекта, особенно описанной в книге Дэниела Канемана. Мышление, быстрое и медленное— разделение мышления «Система 1» и «Система 2».

  • Мышление Системы 1 быстрое, интуитивное и легкое. Когда джазовый музыкант импровизирует на ходу или человек, печатающий вслепую, думает о слове и наблюдает, как оно появляется на экране, они используют мышление Системы 1.
  • Мышление Системы 2, напротив, медленное, обдуманное и требующее усилий. Когда вы выполняете деление в длинное число или учитесь играть на музыкальном инструменте, вы используете Систему 2.

По этой аналогии LLM можно рассматривать как работающие исключительно в рамках Системы 1 — производящие текст быстро, но без глубоких размышлений. Это приводит к некоторым невероятным возможностям, но может потерпеть неудачу в некоторых удивительных отношениях. (Представьте, что вы пытаетесь решить математическую задачу, используя только Систему 1: вы не можете остановиться и произвести арифметические действия, вам просто нужно выдать первый ответ, который придет вам в голову.) Традиционные вычисления тесно связаны с мышлением Системы 2: они шаблонны и негибкие, но правильная последовательность шагов может дать впечатляющие результаты, такие как решение задачи деления в длинную сторону.

Google говорит, что этот метод «написания кода на лету» также будет использоваться для таких вопросов, как: «Каковы простые делители 15683615?» и «Рассчитайте темпы роста моих сбережений». Компания говорит: «До сих пор мы видели, что этот метод повышает точность ответов Барда на основанные на вычислениях словесные и математические задачи в наших внутренних наборах данных задач примерно на 30%». Как обычно, Google предупреждает, что Бард «может не понять его правильно» из-за неправильной интерпретации вашего вопроса или просто, как и все мы, написания кода, который не работает с первого раза.

Read more:  General Mills, Audi и Pfizer приостанавливают рекламу в Твиттере: отчет

Bard прямо сейчас кодирует ответы на лету, если вы хотите попробовать это на bard.google.com.

2023-06-09 18:07:39


1686338285
#Google #Bard #теперь #может #писать #выполнять #код #чтобы #ответить #на #вопрос #Ars #Technica

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.