Мастера слова и фотографы несколько паникуют по поводу ИИ, и на то есть веские причины, поскольку Интернету суждено стать насыщенным контентом, созданным ИИ. Мы уже видим Книги Amazon Kindle и фотографии, победившие в фотоконкурсе. И учитывая, что по разным причинам многие люди, использующие ИИ, предпочитают не признаваться в этом, как мы можем быть уверены, что реально, а что нет?
Обладая более чем 20-летним опытом работы в реальном мире, делая настоящие фотографии с помощью настоящих камер и настоящих объективов, я очень хотел понять, о чем идет речь, и сделал некоторые первые выводы после использования. лучшие генераторы искусственного интеллекта, чтобы попытаться сделать реалистичные изображения.
Нет никаких сомнений в том, что самые известные генераторы изображений, в том числе Dall-E 2 (openAI), Stable Diffusion (Stability AI) и Discord (Midjourney), обладают большим потенциалом, но им далеко до того, чтобы заменить людей-фотографов в множество областей, в том числе способность передавать оригинальные и содержательные истории. Следующие причины объясняют, почему, по крайней мере в обозримом будущем, мы, люди, можем быть спокойны.
Изображения AI имеют недостатки
Заядлые создатели ИИ-арта будут утверждать, что реальность — наименее интересная вещь для создания с помощью ИИ-генератора, и это справедливо — они могут быть хорошими, чистыми и простыми развлечениями. Но использование ИИ для создания реалистичных изображений без раскрытия его использования и, что еще хуже, для манипулирования зрителями, вызывает озабоченность.
Мой опыт использования того, что в настоящее время является наиболее способным генератором искусственного интеллекта для реалистичного вывода — веб-приложения Midjourney Discord — был неоднозначным. Уточняя мои словесные подсказки до «фотореалистичный, портрет при свете окна, черно-белый, женщина, объектив 85 мм F1.2» и так далее, я добился пугающего успеха в создании портретов головы и плеч. Но Discord и другие генераторы тоже могут создавать совершенно нелепые вещи.
Добавьте дополнительные подсказки, такие как «студийный портрет, гитарист», и вас встретит изуродованное, искаженное изображение музыканта, держащего гитару. Кто знает, сколько пальцев будет у субъекта; или если у них будет большой палец; или правильно ли держат гитару; или если изображение больше похоже на фотографию.
Этот пример — лишь верхушка айсберга ИИ. Как насчет «Человека, идущего по пляжу с собакой»… подождите, он идет по воде, и почему так много собак? Кажется, что ИИ тоже не может сделать счастье. Подумайте обо всех этих гиперреалистичных портретных изображениях с искусственным интеллектом, которые обманывали людей — сколько из них улыбаются? Никто.
Счастье похоже на эпизод «Эпизод с фотографией помолвки» в «Друзьях», где Чендлер не может улыбаться — зубы представляют собой неровные белые блоки, и даже улыбки с закрытым ртом у созданных искусственным интеллектом субъектов выглядят натянутыми. Как будто ИИ не может или не будет генерировать счастье.
В подавляющем большинстве случаев ИИ просто не может передать реальность.
Творческий процесс — с ИИ нет особых проблем
Визуальные художники занимаются творческим процессом, овладение которым может занять всю жизнь; научиться пользоваться инструментами своей профессии (и я не верю, что генераторы искусств с искусственным интеллектом входят в число этих инструментов), разработать визуальный стиль, выяснить, как рассказать историю и, по выражению фотографа, знаменитого ютубера и автор Шон Такер – найти смысл в процессе создания.
Генераторы рисунков с искусственным интеллектом следуют словесным подсказкам и за считанные секунды выдают результаты, извлекая из того, что уже существует. Генераторы не исследуют мир, не знакомятся с людьми и не устанавливают реальных связей — и именно эти связи с окружающим миром являются ключом к вдохновляющему творчеству.
Вы можете утверждать, что в некоторых отношениях генераторы ИИ выгодны — творческие идеи могут быть реализованы на экране, где бы вы ни находились, без затрат на дорогу и без углеродного следа. Но мы, люди, должны испытывать и создавать для собственного благополучия.
Нам нужна борьба, чтобы сделать что-то действительно красивое и действительно значимое. Генераторы искусства ИИ не могут дать нам то, что нам действительно нужно как людям, если только я не предполагаю, что вы действительно покопаетесь в «искусстве» придумывать словесные подсказки, что представляет собой совершенно другой вид творческого процесса; и если ваши подсказки потеряются при переводе, вы скоро будете в отчаянии стучать по клавиатуре, пока генератор выдает свою странную интерпретацию вашего «видения».
Детальные ограничения
Будь то мегапиксели камеры или холст, размеры работ, которые фотографы и художники могут создавать, полностью превосходят мизерное разрешение генераторов искусства AI. По умолчанию большинство лучших генераторов ИИ создают квадратные изображения с разрешением 1024 x 1024 пикселей — фактически изображение в миллион пикселей. Даже на наши телефоны мы можем снимать цифровые фотографии с разрешением от 10 до 200 раз больше, а холсты могут занимать всю стену.
Имея небольшое ноу-хау, вы можете удвоить этот результат и изменить соотношение сторон с помощью Stable Diffusion (еще один генератор искусств на основе искусственного интеллекта), в то время как бета-редактор изображений, используемый Dall-E 2, может использовать функцию Outpainting для расширения исходного изображения. более высокое разрешение за счет добавления дополнительных периферийных деталей, но каждый раз, когда вы добавляете к изображению, у вас меньше контроля над тем, что производит генератор.
Эти ограниченные размеры продукции могут быть улучшены в ближайшие годы; и они должны быть такими, если генераторы ИИ будут серьезно восприниматься как альтернатива стандартным библиотекам, таким как Getty, которые предлагают гораздо более качественный результат. На данный момент, однако, мы находимся на первых порах с генераторами искусства AI, и вы не хотели бы просматривать их изображения на дисплее, намного большем, чем у смартфона.
Будьте конкретными и актуальными
В дополнение к сложности рендеринга многих предметов и жанров, генераторы искусства ИИ не подходят для очень специфических требований. Они достаточно хорошо справляются с общими концепциями, но вы не сможете создать изображения свадьбы друга или убедительные реальные достопримечательности и места, изображения с фирменной одеждой или слишком многословные словесные подсказки.
В конечном счете, генераторы искусств на основе ИИ могут создавать результаты только путем извлечения и повторения миллионов изображений, которые уже существуют в Интернете. Таким образом, хотя мы можем взять А и добавить В, чтобы получить «оригинальное» С, технически оригинальности нет. Мировые события еще впереди. Художественные замыслы еще не реализованы. Истории, которые еще предстоит рассказать. Генераторы искусственного интеллекта просто не могут этого сделать.
Таким образом, в то время как те, кто все чаще внедряет эту технологию, могут извлечь выгоду из быстрого и недорогого поворота, существует множество аспектов изобразительного искусства, да и нашего человечества, которых ИИ никогда не сможет коснуться. В нас, фотографах, и в художниках, и в каждом из нас есть жизнь.