Home » Meta начинает тестирование мультимодального искусственного интеллекта-конкурента GPT-4V в умных очках

Meta начинает тестирование мультимодального искусственного интеллекта-конкурента GPT-4V в умных очках

Готовы ли вы повысить узнаваемость своего бренда? Подумайте о том, чтобы стать спонсором AI Impact Tour. Узнайте больше о возможностях здесь.


Сегодня еще больше новостей от Meta Platforms, материнской компании Facebook, Instagram, WhatsApp и Oculus VR (среди прочих): по пятам за выпуском новый ИИ, клонирующий голос, под названием AudioboxСегодня компания объявила, что на этой неделе она начинает небольшое испытание в США нового мультимодального искусственного интеллекта, предназначенного для работы на умных очках Ray Ban Meta, созданных в сотрудничестве с фирменной компанией по производству очков Ray Ban.

По данным компании, новый мультимодальный ИИ Meta будет публично представлен в 2024 году. видео пост в Инстаграм давний Facebook назначил технического директора Meta Эндрю Босворта (он же «Боз»).

«В следующем году мы собираемся запустить мультимодальную версию ИИ-помощника, который использует преимущества камеры на очках, чтобы предоставить вам информацию не только о заданном вами вопросе, но и о мире вокруг вас. — заявил Боз. «И я так рад сообщить, что начиная с этой недели мы собираемся тестировать этот мультимодальный ИИ в бета-версии с помощью программы раннего доступа здесь, в США».

Боз не указал в своем посте, как принять участие в программе.

ВБ Событие

Тур по воздействию искусственного интеллекта

Присоединяйтесь к корпоративному сообществу искусственного интеллекта в рамках тура VentureBeat AI Impact Tour, который пройдет в ближайшем к вам городе!

Узнать больше

очкипоследняя версия которого была представлена ​​на Ежегодная конференция Meta Connect в Пало-Альто еще в сентябре.стоит 299 долларов США по начальной цене и уже поставляется в текущих моделях со встроенным помощником искусственного интеллекта на борту, но он довольно ограничен и не может разумно реагировать на видео или фотографии, не говоря уже о живом просмотре того, что видел владелец (несмотря на очки со встроенными камерами).

Read more:  правильно читать документацию по Python | Ти Кент | апрель 2023 г.

Вместо этого этот помощник был разработан просто для управления голосом, в частности, пользователь разговаривал с ним, как если бы это был голосовой помощник, похожий на Alexa от Amazon или Siri от Apple.

Боз продемонстрировал одну из новых возможностей мультимодальной версии в своем посте в Instagram, включая видеоклип, на котором он в очках смотрит на освещенную стену, изображающую штат Калифорния в офисе. Интересно, что он, похоже, также держал в руках смартфон, что позволяет предположить, что для работы ИИ может потребоваться смартфон в паре с очками.

Экран, показывающий очевидный пользовательский интерфейс (UI) нового мультимодального ИИ Meta, показал, что он успешно ответил на вопрос Боза «Посмотри и скажи мне, что ты видишь» и определил произведение искусства как «деревянную скульптуру», которую он назвал «красивой».

Видео, показывающее мультимодальный ИИ Meta в бета-версии. Кредит: @boztank в Instagram.

Этот шаг, возможно, и следовало ожидать, учитывая общее массовое использование ИИ в своих продуктах и ​​платформах Meta, а также ее продвижениеперьевой источник искусственного интеллекта с помощью фирменной LLM Llama 2. Но интересно увидеть первые попытки создания мультимодального ИИ не в форме модели с открытым исходным кодом в Интернете, а в форме устройства.

Переход генеративного ИИ в категорию аппаратного обеспечения пока идет медленно, за исключением нескольких небольших стартапов, в том числе Гуманный со своим «Ай Пин» запускает OpenAI GPT-4V — делает первые попытки создания специализированных устройств искусственного интеллекта.

Тем временем OpenAI пошла по пути предложения GPT-4V, своего собственного мультимодального ИИ («V» означает «видение»), через свое приложение ChatGPT для iOS и Android, хотя для доступа к модели также требуется Chat GPT Plus ( 20 долларов США в месяц) или подписка Enterprise (переменная цена).

Read more:  Вывод: будущее искусственного интеллекта в облаке

Этот шаг также напоминает Злополучные испытания Google Glassранний прототип умных очков 2010-х годов, который был высмеивают за чувство моды (или его отсутствие) и видимая база пользователей-первопроходцев (порождение термина «Стеклянные дыры«), а также ограниченные варианты практического использования, несмотря на сильную шумиху перед его запуском.

Сможет ли новый мультимодальный искусственный интеллект Meta для умных очков Ray Ban Meta избежать ловушки Glasshole? Прошло ли достаточно времени, и отношение к привязыванию камеры к лицу изменилось, чтобы позволить продукту такого рода добиться успеха?

Миссия VentureBeat должен стать цифровой городской площадкой для лиц, принимающих технические решения, где они смогут получить знания о преобразующих корпоративных технологиях и совершать сделки. Откройте для себя наши брифинги.


2023-12-12 23:00:10


1702423002
#Meta #начинает #тестирование #мультимодального #искусственного #интеллектаконкурента #GPT4V #умных #очках

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.