Home » Обновления Gemini AI, новые функции поиска и многое другое

Обновления Gemini AI, новые функции поиска и многое другое

Генеральный директор Google Сундар Пичаи выступает на конференции разработчиков Google I/O.

Андрей Соколов | Фотоальянс | Гетти Изображения

Заявления во вторник последовали за аналогичными мероприятиями, проводимыми ее конкурентами в области ИИ. Ранее в этом месяце компания Anthropic, поддерживаемая Amazon, анонсировала свое первое корпоративное предложение и бесплатное приложение для iPhone. Тем временем OpenAI в понедельник запустила новую модель искусственного интеллекта и настольную версию ChatGPT, а также новый пользовательский интерфейс.

Вот что объявил Google.

Google представила обновления Gemini 1.5 Pro, своей модели искусственного интеллекта, которая вскоре сможет обрабатывать еще больше данных — например, инструмент может суммировать 1500 страниц текста, загруженного пользователем.

Существует также новая модель Gemini 1.5 Flash AI, которая, по словам компании, более экономична и предназначена для небольших задач, таких как быстрое подведение итогов разговоров, добавление субтитров к изображениям и видео и извлечение данных из больших документов.

Генеральный директор Google Сундар Пичаи отметил улучшения в переводах Gemini, добавив, что они будут доступны всем разработчикам во всем мире на 35 языках. По словам Пичаи, в Gmail Gemini 1.5 Pro будет анализировать вложенные PDF-файлы и видео, предоставляя сводки и многое другое. Это означает, что если вы пропустили длинную цепочку электронных писем во время отпуска, Gemini сможет суммировать их вместе со всеми вложениями.

Новые обновления Gemini также полезны для поиска в Gmail. Компания привела один пример: если вы сравнивали цены разных подрядчиков на ремонт вашей крыши и ищете сводную информацию, которая поможет вам решить, кого выбрать, Gemini может вернуть три предложения вместе с ожидаемыми датами начала, указанными в другом электронном письме. потоки.

Google заявил, что Gemini в конечном итоге заменит Google Assistant на телефонах Android, а это означает, что он станет более сильным конкурентом Apple Siri на iPhone.

Read more:  Изменения: YouTube обещает подготовить специальное приложение для Apple Vision Pro

Google анонсировала Veo, свою новейшую модель для создания видео высокой четкости, и Imagen 3, модель преобразования текста в изображение высочайшего качества, которая обещает реалистичные изображения и «меньше отвлекающих визуальных артефактов, чем наши предыдущие модели».

Эти инструменты будут доступны избранным авторам в понедельник и появятся на Vertex AI, платформе машинного обучения Google, которая позволяет разработчикам обучать и развертывать приложения искусственного интеллекта. До тех пор будет список ожидания.

Компания также продемонстрировала «Аудиообзоры» — возможность создавать аудиообсуждения на основе ввода текста. Например, если пользователь загружает план урока, чат-бот может кратко изложить его. Или, если вы попросите привести пример научной задачи из реальной жизни, это можно сделать с помощью интерактивного аудио.

Отдельно компания также продемонстрировала «AI Sandbox» — набор генеративных инструментов искусственного интеллекта для создания музыки и звуков с нуля на основе подсказок пользователя.

Однако инструменты генеративного искусственного интеллекта, такие как чат-боты и создатели изображений, по-прежнему имеют проблемы с точностью.

Руководитель поисковой системы Google Прабхакар Рагхаван сообщил сотрудникам в прошлом месяце, что у конкурентов «может быть новая штуковина, с которой людям нравится играть, но они все равно приходят в Google, чтобы проверить то, что они там видят, потому что это надежный источник, и это становится более важным». в эту эпоху генеративного ИИ».

Ранее в этом году Google представила генератор изображений на базе Gemini. Пользователи обнаружили исторические неточности, которые стали вирусными в Интернете, и компания удалила эту функцию, заявив, что перезапустит ее в ближайшие недели. Эта функция до сих пор не была переиздана.

По словам Лиз Рид, руководителя Google Search, Google запускает «Обзоры ИИ» в Google Search в понедельник в США. Обзоры ИИ показывают краткую сводку ответов на самые сложные поисковые вопросы. Например, если пользователь ищет лучший способ чистки кожаных ботинок, на странице результатов вверху может отображаться «Обзор искусственного интеллекта» с многоэтапным процессом очистки, полученным на основе информации, синтезированной из Интернета.

Read more:  Мета-тесты в личных сообщениях в Instagram Inbox

Компания заявила, что планирует внедрить возможности планирования, подобные помощнику, непосредственно в поиске. В компании пояснили, что пользователи смогут искать что-то вроде: «Составьте трехдневный план питания для группы, который легко приготовить», и вы получите отправную точку с широким спектром рецептов со всего Интернета».

Что касается прогресса в предложении «мультимодальности» или интеграции большего количества изображений и видео в инструменты генеративного искусственного интеллекта, Google заявила, что начнет тестировать способность пользователей задавать вопросы с помощью видео, например, снимать проблему с продуктом, которым они владеют, загружать это и попросить поисковую систему выяснить проблему. В одном из примеров Google показал, как кто-то снимал сломанный проигрыватель и спрашивал, почему он не работает. Поиск Google нашел модель проигрывателя и предположил, что он может быть неисправен, поскольку не сбалансирован должным образом.

Еще одна новая функция, находящаяся в стадии тестирования, под названием «AI Teammate» будет интегрирована в Google Workspace пользователя. Он может создать коллекцию работ с возможностью поиска из сообщений и цепочек электронной почты с большим количеством PDF-файлов и документов. Например, будущий основатель может спросить товарища по команде по искусственному интеллекту: «Готовы ли мы к запуску?» и помощник предоставит анализ и сводку на основе информации, к которой он может получить доступ в Gmail, Google Docs и других приложениях Workspace.

Project Astra — это последнее достижение Google в области искусственного интеллекта-помощника, созданное подразделением Google DeepMind AI. На данный момент это всего лишь прототип, но вы можете думать об этом как о цели Google разработать собственную версию ДЖАРВИСА, всезнающего искусственного помощника Тони Старка из вселенной Marvel.

В демонстрационном видеоролике, представленном на Google I/O, помощник — посредством видео и аудио, а не интерфейса чат-бота — смог помочь пользователю вспомнить, где он оставил свои очки, просмотреть код и ответить на вопросы о том, что представляет собой определенная часть говорящий вызывается, когда этот выступающий был показан на видео.

Read more:  Ношение слуховых аппаратов вдвое снижает риск слабоумия

В Google заявили, что по-настоящему полезный чат-бот должен позволять пользователям «общаться с ним естественно, без задержек и задержек». Разговор в демо-видео происходил в реальном времени, без лагов. Демо последовало за демонстрацией OpenAI в понедельник аналогичного аудиоразговора с ChatGPT.

Генеральный директор DeepMind Демис Хассабис заявил на сцене, что «уменьшить время отклика на что-то разговорное — сложная инженерная задача».

Пичаи сказал, что он ожидает, что Project Astra будет запущен в Gemini позднее в этом году.

Наконец, Google анонсировала Trillium, свой TPU или тензорный процессор шестого поколения — аппаратное обеспечение, необходимое для выполнения сложных операций искусственного интеллекта, — которое будет доступно облачным клиентам в конце 2024 года.

TPU не предназначены для конкуренции с другими чипами, такими как графические процессоры Nvidia. Например, Пичаи отметил во время I/O, что Google Cloud начнет предлагать графические процессоры Nvidia Blackwell в начале 2025 года.

В марте Nvidia заявила, что Google будет использовать платформу Blackwell для «различных внутренних развертываний и станет одним из первых облачных провайдеров, предлагающих экземпляры на базе Blackwell», и что доступ к системам Nvidia поможет Google предложить крупномасштабные инструменты для предприятий. разработчики, создающие большие языковые модели.

В своей речи Пичаи подчеркнул «давнее партнерство Google с Nvidia». Компании работают вместе уже более десяти лет, и Пичаи ранее заявлял, что ожидает, что они будут продолжать делать это и через десять лет.

СМОТРЕТЬ: Полное интервью CNBC с генеральным директором Alphabet Сундаром Пичаи

2024-05-14 21:13:25


1715725968
#Обновления #Gemini #новые #функции #поиска #многое #другое

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.