ChatGPT теперь тоже может генерировать изображения

ChatGPT теперь может генерировать изображения — и они потрясающе детализированы.

В среду OpenAI, стартап в области искусственного интеллекта из Сан-Франциско, представил новую версию своего генератора изображений DALL-E для небольшой группы тестировщиков и внедрил эту технологию в ChatGPT, своего популярного онлайн-чат-бота.

По словам компании, получившая название DALL-E 3, она может создавать более убедительные изображения, чем предыдущие версии технологии, демонстрируя особое умение создавать изображения, содержащие буквы, цифры и человеческие руки.

«Она гораздо лучше понимает и представляет то, что просит пользователь», — сказал Адитья Рамеш, исследователь OpenAI, добавив, что технология была создана для более точного понимания английского языка.

Добавляя последнюю версию DALL-E в ChatGPT, OpenAI укрепляет своего чат-бота как центр генеративного искусственного интеллекта, который может самостоятельно создавать текст, изображения, звуки, программное обеспечение и другие цифровые медиа. С тех пор, как в прошлом году ChatGPT стал вирусным, он положил начало гонке среди технологических гигантов Кремниевой долины за то, чтобы быть в авангарде искусственного интеллекта с достижениями.

Во вторник Google выпустила новую версию своего чат-бота Bard, который подключается к нескольким наиболее популярным сервисам компании, включая Gmail, YouTube и Docs. Этим летом Midjourney и Stable Diffusion, два других генератора изображений, обновили свои модели.

OpenAI уже давно предлагает способы подключения своего чат-бота к другим онлайн-сервисам, включая Expedia, OpenTable и Wikipedia. Но это первый случай, когда стартап объединил чат-бота с генератором изображений.

DALL-E и ChatGPT ранее были отдельными приложениями. Но с последней версией люди теперь могут использовать службу ChatGPT для создания цифровых изображений, просто описывая то, что они хотят видеть. Или они могут создавать изображения, используя описания, сгенерированные чат-ботом, что дополнительно автоматизирует создание графики, произведений искусства и других медиа.

В ходе демонстрации на этой неделе Габриэль Го, исследователь OpenAI, показал, как ChatGPT теперь может генерировать подробные текстовые описания, которые затем используются для создания изображений. Например, после создания описаний логотипа ресторана Mountain Ramen бот за считанные секунды сгенерировал на основе этих описаний несколько изображений.

Новая версия DALL-E может создавать изображения из описаний, состоящих из нескольких абзацев, и точно следовать инструкциям, изложенным в мельчайших деталях, сказал г-н Го. По его словам, как и все генераторы изображений и другие системы искусственного интеллекта, он также подвержен ошибкам.

Работая над усовершенствованием технологии, OpenAI не представит DALL-E 3 широкой публике до следующего месяца. DALL-E 3 будет доступен через ChatGPT Plus, услугу, стоимость которой составляет 20 долларов в месяц.

Эксперты предупреждают, что технологии генерации изображений могут использоваться для распространения больших объемов дезинформации в Интернете. Чтобы защититься от этого, в DALL-E 3 OpenAI включила инструменты, предназначенные для предотвращения проблемных тем, таких как изображения откровенно сексуального характера и изображения общественных деятелей. Компания также пытается ограничить способность DALL-E имитировать стили конкретных артистов.

В последние месяцы ИИ использовался как источник визуальной дезинформации. Синтетическая и не особо изощренная пародия на очевидный взрыв в Пентагоне, среди других примеров, привела к кратковременному падению фондового рынка в мае. Эксперты по голосованию также обеспокоены тем, что эта технология может быть использована злонамеренно во время крупных выборов.

Сандини Агарвал, исследователь OpenAI, занимающийся вопросами безопасности и политики, сказала, что DALL-E 3 имеет тенденцию генерировать изображения, которые были скорее стилизованными, чем фотореалистичными. Тем не менее, она признала, что модель можно попросить создать убедительные сцены, например, зернистые изображения, снятые камерами наблюдения.

По большей части OpenAI не планирует блокировать потенциально проблемный контент, поступающий из DALL-E 3. Г-жа Агарвал сказала, что такой подход «слишком широк», поскольку изображения могут быть безобидными или опасными в зависимости от контекста, в котором они появляются.

«Это действительно зависит от того, где оно используется, как люди о нем говорят», — сказала она.

2023-09-20 17:09:25

1695245906
#ChatGPT #теперь #тоже #может #генерировать #изображения

ChatGPT теперь тоже может генерировать изображения

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply