Вот как генеративный ИИ изображает странных людей

Другая потенциальная стратегия диверсификации результатов моделей ИИ заключается в том, чтобы разработчики добавляли ограничения и изменяли подсказки для пользователей, подталкивая программное обеспечение к инклюзивности. OpenAI, похоже, применил этот подход. Когда я попросил Dall-E 3 через ChatGPT «нарисовать карикатуру на странную пару, наслаждающуюся вечеринкой в Кастро», он без моей просьбы расширил подсказку с изображением до целого абзаца, включающего пол, расу и дополнительную информацию. подробности. Вот полное приглашение, созданное ChatGPT на основе моего первоначального запроса изображения:

Карикатурная иллюстрация странной пары, наслаждающейся вечеринкой в районе Кастро, Сан-Франциско. Они счастливо гуляют рука об руку, улыбаются и болтают. Один человек — белая женщина с короткими рыжими волосами, одетая в стильную джинсовую куртку и джинсы. Другой человек — чернокожий мужчина с короткими черными волосами, в повседневной зеленой футболке и черных брюках. На заднем плане изображена яркая и красочная уличная жизнь Кастро с радужными флагами, шумными кафе и оживленными толпами людей. Атмосфера радостная и гостеприимная, подчеркивающая разнообразие и инклюзивность этого региона.

Хотя в некоторых случаях изменение подсказок полезно, оно также может разочаровать пользователей, если оно реализовано плохо. генеральный директор Google извинился когда Gemini, платформа генеративного искусственного интеллекта Google, изменила пользовательские запросы и создала фотографии черных нацистов, а также другие антиисторические изображения. Был ли внутри компании тайный заговор с целью стереть кавказский народ из истории? Более вероятно, что инженеры Gemini обнаружили, что инструмент изначально перепроизводил изображения белых мужчин, например многие инструменты искусственного интеллекта в настоящее время делаюта разработчики Google, похоже, переусердствовали с корректирующими настройками во время спешить к запуску подписной чат-бот компании.

Даже при наличии более качественных модельных данных и программных ограждений изменчивость человеческого существования может избежать жесткости алгоритмической категоризации. «По сути, они используют прошлое, чтобы создавать будущее», — говорит Уильям Агнью, научный сотрудник Карнеги-Меллон и давний организатор Queer in AI. «Это похоже на полную противоположность безграничному потенциалу роста и перемен, который присущ большой части квир-сообществ». Усиливая стереотипы, инструменты искусственного интеллекта не только рискуют сильно искажать представление о группах меньшинств широкой публике, но и могут ограничить то, как квир-люди видят и понимают себя.

Стоит сделать паузу на мгновение, чтобы осознать головокружительную скорость, с которой продолжают совершенствоваться некоторые аспекты генеративного ИИ. В 2023 году Интернет вспыхнул, высмеивая чудовищное AI-видео Уилла Смита ем спагетти. Год спустя, преобразование текста в видео из неизданной Sora от OpenAI модели все еще несовершенны, но зачастую поражают своей фотореалистичностью.

Видеоинструмент с искусственным интеллектом все еще находится на стадии исследования и еще не был реализован. выпущен для публики, но я хотел лучше понять, как он представляет квир-людей. Итак, я обратился к OpenAI и предоставил Соре три подсказки: «разнообразная группа друзей, празднующих во время парада гордости в Сан-Франциско на красочной радужной платформе»; «две женщины в потрясающих свадебных платьях выходят замуж на ферме в Канзасе»; и «трансгендерный мужчина и его небинарный партнер играют в настольную игру в космосе». Неделю спустя я получил три эксклюзивных видеоклипа, которые, по утверждению компании, были созданы с помощью ее модели преобразования текста в видео без каких-либо изменений.

Это видео, созданное искусственным интеллектом, было снято под лозунгом «разнообразная группа друзей празднует парад гордости в Сан-Франциско на красочной радужной платформе». Пересматривая клип, сосредоточьтесь на разных людях, катающихся на платформе, чтобы заметить странности в поколении: от исчезающих флагов до забавных ног.

Сестра через OpenAI

Видеоклипы беспорядочные, но замечательные. Люди на поплавке во время парада прайда в Сан-Франциско размахивают радужными флагами, которые бросают вызов законам физики, превращаясь в небытие и вновь появляясь из воздуха. Две невесты в белых платьях улыбаются друг другу, стоя у алтаря, а их руки сливаются в безбожный комок пальцев. Пока странная пара играет в настольную игру, они словно призраки проходят сквозь игровые фигуры.

Это видео, созданное искусственным интеллектом, было снято под лозунгом «трансгендерный мужчина и его небинарный партнер играют в настольную игру в космосе». Настоящим космонавтам будет полезно надеть шлемы во время полета в космическом пространстве.

Сестра через OpenAI

Среди трех видеороликов выделяется клип, в котором должен быть показан небинарный человек, играющий в игры в космосе. Возвращаются явно странные сиреневые локоны, по коже разбросаны беспорядочные татуировки, а лицо покрывает некоторая гиперпигментация, напоминающая чешую рептилий. Даже для такого впечатляющего генератора видео с искусственным интеллектом, как Sora, изображение небинарных людей кажется сложной задачей.

Это видео, созданное искусственным интеллектом, было снято под лозунгом «две женщины в потрясающих свадебных платьях выходят замуж на ферме в Канзасе». Хотя на первый взгляд это выглядит реалистично, взгляните еще раз на то, как руки невест сливаются воедино.

Сестра через OpenAI

Когда WIRED показал эти клипы членам Queer in AI, они усомнились в определении Соры разнообразия в отношении группы друзей на параде прайда. «Модели — это наша основа для того, как выглядит разнообразие?» — спрашивает Сабина Вебер, ученый-компьютерщик из Германии. Помимо указания на чрезмерную привлекательность людей на видео, обычное явление Что касается визуализации ИИ, Вебер задался вопросом, почему не было больше представлено странных людей старшего возраста, крупного телосложения или имеющих видимые инвалидности.

Ближе к концу нашего разговора Агнью рассказал, почему алгоритмические представления могут нервировать ЛГБТК-людей. «Заставить их объединить вещи, которые сами по себе хороши, но вместе — очень проблематично», — говорят они. «Я очень обеспокоен тем, что изображение нас самих, которое и без того является постоянным полем битвы, внезапно окажется у нас в руках». Даже если в будущем инструменты ИИ будут включать в себя более целостные изображения странных людей, синтетические изображения могут привести к непредвиденным последствиям.

2024-04-02 11:00:00

1712166725
#Вот #как #генеративный #ИИ #изображает #странных #людей

Вот как генеративный ИИ изображает странных людей

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply