22.11.2024

Теперь вы можете редактировать изображения ChatGPT в стиле Photoshop

Вы, несомненно, заметили множество искусственных генераторов искусств, появившихся за последний год или около того: супер-умные механизмы, которые могут создавать изображения, которые выглядят так же, как настоящие фотографии, или произведения искусства, созданные реальными людьми. С течением времени они становятся все более мощными и добавляют все больше и больше функций. Теперь вы даже можете найти инструмент искусственного интеллекта в Microsoft Paint.

Новым в модели изображения DALL-E AI, доступной участникам ChatGPT Plus, которые платят 20 долларов в месяц, является возможность редактировать части изображения, как вы могли бы это делать в Photoshop: вам больше не нужно создавать совершенно новое изображение. изображение только потому, что вы хотите изменить один его элемент – вы можете показать DALL-E ту часть изображения, которую хотите настроить, дать ему несколько новых инструкций и оставить все остальное в покое.

Он преодолевает одно из важных ограничений искусственного интеллекта, заключающееся в том, что каждое изображение (и видео) является чем-то совершенно уникальным и непохожим, даже если вы используете одинаковые подсказки. Это затрудняет достижение согласованности изображений или точную настройку идеи. Однако этим создателям произведений искусства с использованием искусственного интеллекта, основанным на так называемых моделях диффузии, все еще приходится преодолевать множество ограничений, как мы вам здесь покажем.

Редактирование изображений в ChatGPT

Если вы подписаны на ChatGPT Plus, вы можете загрузить приложение в Интернете или на мобильном телефоне и попросить сфотографировать все, что вам нравится: мультяшный детектив-собака, раскрывающий дело в обстановке киберпанка, холмистый пейзаж с одиноким фигура на среднем расстоянии и грозовые тучи, сгущающиеся над головой, или что бы это ни было. Через несколько секунд вы получите свое изображение.

Чтобы отредактировать изображение, вы можете нажать на сгенерированное изображение, а затем нажать кнопку Выбрать в правом верхнем углу ( похоже на ручку, чертящую линию). Затем вы регулируете размер инструмента выделения с помощью ползунка в верхнем левом углу и рисуете ту часть изображения, которую хотите изменить.

Изображения ChatGPT Интерфейс редактирования в ChatGPT Автор: : Лайфхакер

Здесь это значительный шаг вперед: вы можете оставить часть изображения нетронутой и просто обновить выделение. Раньше, если вы отправляли последующее приглашение с просьбой изменить одну конкретную часть изображения, все изображение было восстановлено и, вполне вероятно, сильно отличалось от оригинала.

Когда вы это сделали, сделали свой выбор, вам будет предложено ввести новые инструкции только для выделенного участка изображения. Как обычно с этими художественными инструментами искусственного интеллекта, чем конкретнее вы будете, тем лучше: вы можете попросить, чтобы человек выглядел более счастливым (или менее счастливым) или чтобы здание было окрашено в другой цвет. Запрошенные вами изменения будут применены.

Изображение собаки edits Успех! ChatGPT и DALL-E заменяют одну собаку другой. Фото: Lifehacker/DALL-E

Судя по моим экспериментам, ChatGPT и DALL-E, похоже, используют тот же трюк с искусственным интеллектом, который мы видели в таких приложениях, как Magic Eraser от Google: интеллектуальное заполнение фона на основе существующей информации в сцене, пытаясь оставить все за пределами сцены. выделение нетронуто.

Это не самый продвинутый инструмент выделения, и я заметил несоответствия в границах и краях объекта— чего, возможно, и следовало ожидать, учитывая, какой объем контроля вы получаете, когда дело доходит до выделения. Большую часть времени функция редактирования работала достаточно хорошо, хотя она ни в коем случае не всегда надежна, и OpenAI, без сомнения, будет стремиться улучшить ее в будущем.

Там, где искусство ИИ достигает своих пределов

Я попробовал новый инструмент редактирования, чтобы проделать множество трюков. Он хорошо справился с изменением цвета и положения собаки на лугу, но хуже с уменьшением размера гигантского человека, стоящего на валах замка — человек просто исчез в размытом куске вала, что позволяет предположить, что ИИ был без особого успеха пытаюсь рисовать вокруг него.

В сеттинге киберпанка я попросил подбросить машину, но машина не появилась. В другой сцене в замке я попросил повернуть летающего дракона так, чтобы он смотрел в другую сторону, превратить его из зеленого в красный и добавить пламя, выходящее из его пасти. После нескольких секунд обработки ChatGPT полностью удалил дракона.

Редактирование изображения дракона Не удалось! ChatGPT и DALL-E удалили дракона вместо того, чтобы изменить его.Источник: Lifehacker/DALL-E

Эта функция все еще совершенно новая, и OpenAI не утверждает, что может заменить человеческий образ редактирование пока невозможно – потому что это явно невозможно. Ситуация улучшится, но эти ошибки помогут показать, в чем заключаются проблемы с точки зрения определенных видов искусства, создаваемого ИИ.

В чем DALL-E и подобные ему модели очень хороши, так это в знании того, как расположить пиксели, чтобы получить хорошее приближение к замку (например), на основе миллионов (?) замков, на которых они обучались. Однако ИИ не знает, что такое замок: он не понимает ни геометрии, ни физического пространства, поэтому в моих замках из ниоткуда торчат башенки. Вы заметите это во многих произведениях искусства, созданных ИИ, с участием зданий, мебели или любых объектов, которые не совсем правильно визуализируются.

Простой белый фонОн довольно белый, но далеко не «простой». Фото: Lifehacker/DALL-E

По своей сути эти модели представляют собой вероятностные машины, которые (пока) не понимают, что они на самом деле показывают: именно поэтому во многих видеороликах OpenAI Sora люди исчезают в никуда, потому что ИИ очень ловко расставляет пиксели, а не отслеживает людей. Возможно, вы также читали о том, что ИИ изо всех сил пытается создать изображения пар разных рас, потому что, судя по данным обучения изображений, с большей вероятностью встречаются пары одной расы.

Еще одна странность, которая недавно была замечена, — это неспособность из этих генераторов искусств искусственного интеллекта для создания простого белого фона. Это невероятно умные инструменты во многих отношениях, но они не «думают» так, как думали бы вы или я, и не понимают, что они делают, так, как человек-художник – и важно это вынести. помните, когда вы их используете.

lifehacker.com