«Было очень забавно видеть, что люди делают с ним», — написал Пинкни в электронном письме The Washington Post. «Меня всегда впечатляло, как он, кажется, отражает суть известных людей, но в очень странной форме покемонов».
«Очень странно» — это удачный способ выразить это. Люди использовали его для создания всевозможных покемонов в причудливых образах известных личностей. Вот что он выдал, используя голливудскую суперзвезду Дуэйна Джонсона в качестве подсказки:
Вот несколько вариантов покемонов Основатель Amazon Джефф Безос. (Безос также владеет The Washington Post).
Вот, кстати, Wordle есть покемон.
Но генератор также способен создавать удивительно трогательные творения, что можно увидеть на этой мозаике образцов изображений, которыми поделился Пинкни. Первый покемон в линейке был создан из подсказки «Девушка с жемчужной сережкой», знаменитой картины голландского мастера Йоханнеса Вермеера. Посмотрим, сможешь ли ты угадать остальные.
Это покемон, созданный из «Возвращения блудного сына», одной из самых известных картин другого голландского мастера, Рембрандта Харменса ван Рейна.
На создание арт-генератора покемонов Пинкни вдохновила его 6-летняя дочь, которая недавно стала большой поклонницей франшизы.
«Я подумал, что было бы забавно обучить модель, чтобы она могла описать своего идеального покемона», — сказал он. «Кажется, это сработало!»
Генераторы искусства преобразования текста в изображение работают через процесс, называемый глубоким обучением, в котором алгоритмы делают прогнозы и выполняют задачи в процессе, который имитирует нейроны человеческого мозга. В случае искусства, созданного искусственным интеллектом, генераторы извлекают из базы данных существующих изображений и иллюстраций, чтобы собрать воедино дискретную часть на основе подсказки пользователя. Пинкни объяснил, что его собственное творение адаптировано из модели глубокого обучения с открытым исходным кодом под названием Stable Diffusion, которая уже содержит обширные наборы данных. Text-to-Pokémon работает путем сопоставления наборов данных Stable Diffusion с набором данных из 850 изображений покемонов из предыдущего исследовательского проекта, управляемого университетом, который Пинкни подал с использованием автоматической системы подписей для классификации каждого изображения с текстовым описанием.
Вот почему Text-to-Pokémon может создавать более или менее убедительные факсимиле покемонов известных общественных деятелей, таких как Дуэйн Джонсон или Тейлор Свифт, но будет генерировать более абстрактные результаты для большинства людей, использующих свои собственные имена (если только они не также известные личности). Пинкни опубликовал обширную статью о том, как работает его генератор. Блог Лямбды.
Если вы хотите попробовать свои силы в создании своих собственных покемонов, вы можете получить к нему доступ. здесь. Вам понадобится учетная запись GitHub, чтобы запустить модель через веб-сайт, но после ее настройки все, что вам нужно сделать, это ввести фразу (Киану Ривз, «Тайная вечеря», «Doom Eternal» и т. д.) и нажать кнопку отправки, чтобы сгенерировать одного или нескольких покемонов.
Пинкни намерен продолжить работу над Text-to-Pokémon. Он предложил возможность получить больше изображений покемонов, чтобы увеличить свой набор данных с более подробными подписями, возможно, в сотрудничестве с кем-то, кто больше разбирается в покемонах. Он также заинтересован в разработке генераторов рисунков, которые могут компилировать изображения помимо текстовых подсказок.
«Я думаю, что люди видели только верхушку айсберга, которая так далека от этих методов!» Пинкни написал. «Лично я считаю, что текстовые подсказки — это хороший и простой интерфейс, чтобы сообщить ИИ, какое изображение вы хотите, меня действительно интересует, как добавить другие способы влияния и управления выводом, чтобы сделать его гораздо более полезным для художники и креативщики, чтобы направлять его, чтобы создавать изображения, которые им нужны».