Сора OpenAI — полная загадка

Вчера днем OpenAI дразнил Сорамодель создания видео, которая обещает преобразовать письменные текстовые подсказки в очень реалистичные видеоролики. Кадры опубликованы компанией изображает такие примеры, как «собака сиба-ину в берете и черной водолазке» и «в богато украшенном историческом зале огромная приливная волна достигает пика и начинает падать». Ажиотаж в прессе напомнил ажиотаж вокруг создателя имиджа. ДАТЬ ЕЙ или ChatGPT в 2022 году: Сора описывается как «сногсшибательный», «меняющий мир,” и “захватывающий, но ужасающий».

Образ действительно впечатляет. С одного взгляда, один из примеров анимированного «пушистого монстра» выглядит лучше, чем Шрек; «экстремальный крупный план» женского глаза, дополненного отражением сцены перед ней, поразительно реалистично. Но Сора тоже окутан тайной. Никто, кроме избранной группы тестировщиков и художников по безопасности, одобренных OpenAI, пока не может использовать программу (хотя Сэм Альтман, генеральный директор компании, был принимая Сора оперативно отправляет запросы в социальных сетях и размещение тот Результаты). Модель вполне может воплотить в жизнь те фантазии, которые уже существуют у людей. Возможно, это будет воображение двигатель, кинематографический революцияили дезинформация машина. Но на данный момент это лучше всего рассматривать как провокацию или рекламный блиц.

Хотя многие из этих продуктов настолько мощны, что могут перевернуть наше представление о мире – или уничтожить его полностью— такие компании, как OpenAI, склонны не детализировать свою внутреннюю работу. (Недавнее исследование поставил 10 крупным технологическим компаниям, включая OpenAI, неудовлетворительную оценку по индексу прозрачности ИИ.) Обзор технологий Массачусетского технологического института получил предварительный просмотр образцов видеороликов, созданных Sora, только после того, как согласился на то, что ее журналисты назвали «необычное» состояние что они не будут искать сторонние мнения до тех пор, пока OpenAI не анонсирует продукт; Первоначально к выпуску не прилагалось ни одной исследовательской работы.

Читайте: Мы на самом деле не знаем, берет ли на себя все управление ИИ

Технический отчет, который OpenAI позже опубликовано содержит краткие общие описания, в которых мало технических деталей. Это далеко не первая модель преобразования текста в видео (Meta представила один в сентябре 2022 года., примерно за два месяца до выпуска ChatGPT), но прямо сейчас, без возможности людей за пределами компании изучать или тестировать Sora, невозможно узнать, как она основывается на предыдущих продуктах или сравнивается с ними. Из отчета видно, что, как и в случае с языковыми моделями стартапа, чем больше вычислительной мощности OpenAI закачивал в Sora, тем более высоким качеством становились результаты — омерзительный комок меха превращается в фотореалистичного очаровательного щенка, если его сгенерировать с помощью 16 раз ресурсы. Помимо любого технологического прорыва, Sora может стать последним и, возможно, самым впечатляющим результатом миллиардов долларов в казне OpenAI — победой масштаба и инноваций.

Представитель OpenAI сообщил мне в письменном заявлении, что компания «раньше делится своими достижениями в исследованиях, чтобы начать работать и получать отзывы от людей за пределами OpenAI, а также дать людям представление о том, какие возможности ИИ ожидаются на горизонте». На вопрос о данных обучения представитель лишь уточнил, что модель обучена на «лицензионном и общедоступном контенте»; На вопрос о потенциальном вреде она сказала, что компания все еще работает над устранением «дезинформации, разжигающего ненависть контента и предвзятости».

OpenAI не одинок в своей секретности. Также вчера Google анонсировала обновленную версию своей флагманской языковой модели Gemini 1.5, назвав ее «прорвать». Но никто, кроме небольшой группы разработчиков и крупных корпоративных клиентов, не сможет протестировать его самые передовые возможности. Множество других продуктов искусственного интеллекта также выпущен без особой сопроводительной информации.

Читайте: Мы являемся свидетелями рождения новой художественной среды

Однако мы знаем, что демоверсии продуктов искусственного интеллекта, как правило, содержат недостатки, некоторые незначительные, а некоторые смущающие, и Сора не является исключением. По собственному признанию OpenAI, у него проблемы с изображением физики, причины и следствия (компания утверждает, что вы можете попросить видео человека, кусающего печенье, только для того, чтобы заметить, что не осталось следов укуса) и других простых деталей ( показан мужчина, бегущий по беговой дорожке в неправильном направлении). Интернет-сыщики обнаружили и другие сбои, такие как исчезающие объекты и деформированные руки. Тем не менее, продукт выглядит поразительно, что, несмотря на весь ажиотаж, вызывает весьма знакомые, но серьезные опасения по поводу дипфейки, Нарушение авторского права, средства к существованию художников, скрытые предубежденияи более.

Тем временем Интернет кишит теориями и наблюдениями в духе папарацци: догадки о том, как работает Сора; инсинуации, что Сора не генерирует новые вещи, а копирование существующие видео; сравнения, показывающие сходство между своими видеороликами и результатами ведущей модели преобразования текста в изображение. Эти опасения на данный момент нельзя признать правильными или ошибочными. Публика до сих пор едва понимает внутреннюю работу DALL-E и ChatGPT, но, по крайней мере, мы можем сами проверить возможности этих продуктов; с заявлением Соры OpenAI вошел в сферу мифотворчества.

2024-02-16 21:39:35

1708353605
#Сора #OpenAI #полная #загадка

Сора OpenAI — полная загадка

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply