19.09.2024

Все способы узнать, что фотография сделана с помощью ИИ

Эта публикация является частью серии Lifehacker «Разоблачение ИИ». Мы изучаем шесть различных типов медиа, созданных ИИ, и выделяем общие особенности, побочные продукты и отличительные черты, которые помогут вам отличить искусственный контент от созданного человеком.

Искусство ИИ больше не просто концепция: оно повсюду, и вы, вероятно, сталкивались с ним в дикой природе, знали вы об этом или нет. Искусство ИИ завоевало награды (хотя и среди споров), использовалось в фильмах Netflix (опять же, столкнувшись с критикой) и обмануло бесчисленное количество пользователей Facebook ложными изображениями младенцев, Иисуса и овощей. Оно никуда не денется в ближайшее время.

Поскольку технология создания изображений продолжает совершенствоваться, как никогда важно научиться определять эти изображения, созданные ИИ, чтобы вас не обманули чьи-то поддельные фотографии. Может показаться безобидным не думать дважды о сгенерированном ИИ изображении некоторых уток, но когда недобросовестные люди распространяют дезинформацию с помощью изображений ИИ, последствия становятся ужасными. Компании, которые производят генераторы изображений ИИ, работают над способами «помечать водяными знаками» изображения, созданные ИИ, но мы пока не достигли этого. Большая часть искусства ИИ в сети циркулирует без четкой маркировки, предупреждающей пользователей о том, что изображения не являются настоящими. Вместо этого эти советы помогут вам определить эти поддельные изображения, когда они появляются в вашей ленте.

Как работают генераторы искусств ИИ

Легко взглянуть на произведение искусства ИИ и предположить, что создавший его генератор просто сшил его из набора изображений в своей базе данных. Но на самом деле это не то, что здесь происходит.

Генераторы искусств ИИ действительно обучаются на огромных наборах данных изображений, от произведений искусства до фотографий. Однако эти инструменты не могут «видеть» эти изображения так, как это делают люди. Вместо этого они разбивают эти изображения попиксельно. Он не увидит яблока; он увидит группу пикселей и их значения. Со временем он поймет, что эта группа конкретных значений пикселей имеет тенденцию быть яблоком. Обучите ИИ достаточному количеству изображений с достаточным контекстом, и он начнет рисовать линии между всеми видами объектов и стилей. Он поймет, как в целом отображать фрукты, животных и людей, а также художественные стили, цвета и настроения.

Современные генераторы изображений ИИ, такие как DALL-E, используют так называемую диффузию для обучения и генерации изображений. По сути, они берут обучающее изображение и добавляют к нему визуальный шум (представьте себе статику) до тех пор, пока вся картинка не станет бессмысленной. Идея состоит в том, чтобы понять, как на изображение влияет добавление шума на каждом этапе: отсюда он пробует противоположное, создавая собственную версию исходного изображения из одного только шума, что обучает ИИ создавать изображения с нуля.

Это очень упрощенное объяснение, но важно знать фундаментальную идею о том, что эти генераторы опираются на огромную базу данных изученных отношений. Это позволяет визуализировать сложные сцены за считанные секунды, но это также приводит к странным причудам, которые могут помочь нам отличить изображение ИИ от настоящего.

Считайте пальцы

Искусство ИИ становится лучше, но оно все еще не идеально. Хотя эти инструменты способны генерировать высококачественные изображения с реалистичным освещением, они все еще испытывают трудности с мелкими деталями.

Возможно, наиболее известно, что «человеческие» субъекты в искусстве ИИ, как правило, имеют неправильное количество пальцев. Возможно, остальная часть изображения кажется убедительной на первый взгляд, но посмотрите на руки, и вы заметите шесть, семь или восемь пальцев на каждой. Или, может быть, все наоборот, и у руки три пальца, два из которых трансформируются в один. В любом случае, пальцы и руки, к которым они прикреплены, часто путаются.

Но хотя пальцы — это то, в чем ИИ ошибается больше всего, его проблемы не ограничиваются руками. Любые повторяющиеся узоры, особенно когда это касается деталей с людьми, могут быть неправильно сгенерированы с помощью искусства ИИ. Взгляните на зубы объекта на изображении: иногда их слишком много или они выглядят искаженными так, как никогда не должны быть в норме. У большинства из нас неидеальные улыбки, но зубы ИИ — это другой уровень.

Вы даже можете увидеть объект с дополнительной конечностью: вы будете смотреть на изображение, гадая, что в нем не так, как вдруг вы заметите, что третья рука объекта вылезает из его толстовки.

У Vox есть отличное видео, в котором объясняется, почему ИИ борется с этими повторяющимися элементами, но, по сути, это сводится к недостатку опыта со стороны ИИ. Эти инструменты обучаются на огромном количестве данных, но когда дело доходит до чего-то сложного, например, рук, имеющиеся у него данные не дают достаточного контекста для того, чтобы бот знал, как правильно и реалистично сгенерировать элемент. Он не знает, как на самом деле работают руки— он может только брать из рук, которые видит. Мы здесь испытываем ограничения этих знаний.

Следите за смешиванием элементов

Посмотрите на достаточное количество ИИ-арта, и вы заметите нечто странное: вещи смешиваются и трансформируются друг в друга повсюду. Я уже упоминал, что это происходит с пальцами, но это может происходить со многими другими элементами объекта, включая зубы, трансформирующиеся в другие зубы, одежду, сливающуюся с собой, и глаза, которые, кажется, кровоточат в другие части головы объекта.

Но дело не только в субъектах: все на изображении — честная игра для этого смешивания. Посмотрите на изображение, которое я сгенерировал с помощью DALL-E ниже. Настольная игра волнистая, с частями доски, трансформирующимися в другие части, и фигурами, сливающимися с плитками. Зубы женщины справа все сплющиваются вместе, в то время как манжеты свитера другой женщины складываются сами в себя. (Не говоря уже о том, что ее пальцы сливаются в один.)

AI image группы друзей, улыбающихся друг другу во время игры в настольную игру Подсказка: «Создайте изображение группы друзей, улыбающихся каждому другим во время игры в настольную игру.» Фото: Джейк Петерсон/OpenAI

Критика письма

<р>ИИ может генерировать текст, но часто не может хорошо писать на изображении. Во многих случаях искусство ИИ, включающее в себя письмо, будет выглядеть нелепо. Иногда это логотип, который напоминает свой реальный аналог, но не дотягивает до него полностью. (Вы можете сказать, что он пытается сказать Coca-Cola, но все буквы перемешаны.) В других случаях это выглядит так, как будто кто-то пытается придумать язык, или каково это — пытаться прочитать что-то во сне. (На самом деле, многие из этих изображений ИИ отдают сновидным качеством, по крайней мере, для меня.)

Теперь эта сторона искусства ИИ быстро совершенствуется. И DALL-E, и Meta AI смогли сгенерировать изображение торта с надписью «С ДНЕМ РОЖДЕНИЯ, КАРЕН» без каких-либо ужасающих проблем. Тем не менее, Meta не был идеален: вторая «P» в «HAPPY» больше похожа на «Y», в то время как «A» в «KAREN» имеет две линии, а не одну. Но важно отметить, что эти изображения получаются лучше, когда вы специально просите ИИ написать их: предоставленный самому себе, текст часто выглядит странно, поэтому если тот, кто создал изображение, не подумал его исправить, это может быть очевидным признаком.

изображение карты, сгенерированное AI Попросите DALL-E сгенерировать карту, и она сработает с некоторой степенью точности, хотя и с «искусственным написанием». Автор: Джейк Петерсон/OpenAI

Ищите вещи, которые просто не имеют смысла

В конце концов, искусство ИИ на самом деле ничего не знает. Оно создает искусство на основе отношений, которые оно выковало из всех своих обучающих данных. Оно не знает, как на самом деле должно быть построено здание, как играют в теннис или как движется человеческая рука. Оно извлекает из своего обучения, чтобы воспроизвести эти запросы в меру своих возможностей. Если вы посмотрите достаточно внимательно, вы увидите, что эти пробелы в знаниях появляются во всем искусстве ИИ, особенно на картинках, где много всего происходит.

Возьмем, к примеру, это изображение: я попросил DALL-E сгенерировать изображение вечеринки в подвале, где люди играют в пивной понг, пьют из красных стаканчиков Solo и общаются. Сразу же, есть несколько основных проблем: глаза людей в кадре в основном не видны; рука у человека, играющего в пивной понг, испорчена; и почему он бросает шарики для пинг-понга со стороны стола? Говоря о столе, он волнистый и деформируется так, как не мог бы настоящий стол, и по какой-то причине на одной стороне стола стоят два набора стаканчиков.

Посмотрите на фон, и все становится еще страннее. Кажется, что мужчина стоит на коленях и пьет свою красную чашку, как будто это бутылка. У мужчины позади него внутри красной чашки синяя банка, как будто чашка — это koozie. У человека сзади, похоже, отфотошоплено лицо, размытое, как и сам объект.

AI-изображение вечеринки в подвалеЗапрос: «Создайте изображение вечеринки в подвале: люди играют в пивной бонг, пьют из красных одиночных стаканчиков и общаются». Автор: Джейк Петерсон/OpenAI

Даже официальные примеры от компаний, которые производят эти инструменты, имеют эти логические несоответствия. OpenAI использует забавное изображение авокадо у терапевта, чтобы продемонстрировать DALL-E 3.

Авокадо мультяшный Кредит: OpenAI

У авокадо вынута косточка, и оно жалуется терапевту, который является ложкой, на то, что чувствует себя пустым внутри. Это приличный кусок, но посмотрите на блокнот терапевта: они пишут в нем задом наперед, страницами наружу. DALL-E видел достаточно изображений терапевтов, чтобы знать, на каких инструментах они обычно пишут заметки, но не понимает, что мы, люди, обычно пишем на бумаге, а не в планшете.

Конечно, посты об ИИ, которые становятся вирусными в социальных сетях, таких как Facebook, часто вообще не имеют смысла. Кто строит скульптуры кошек из печенья Oreo? Почему так много грустных художников строят замки из песка Иисуса? Искусство может быть творческим, но искусство ИИ особенно странное, как в мелких деталях, так и в крупных темах.

Блеск ИИ

Посмотрев некоторое время на изображения ИИ, вы начинаете замечать нечто странное, особенно среди фотореалистичных изображений: все блестит. Изображения ИИ часто имеют то, что некоторые называют «блестящим ИИ», блеск, который может выдать происхождение изображения, если вы знаете, что ищете. Изображения часто переэкспонированы или имеют драматическое освещение, что делает объекты особенно яркими.

Через некоторое время вы смотрите на фотографию, подобную той, что представлена ​​ниже, и сразу понимаете, что она была сделана с помощью ИИ, просто по тому, как она выглядит. (Даже если руки объекта не были отключены.)

сгенерированное ИИ изображение женщины, держащей бейсбольный мяч Подсказка: создать фотореалистичное изображение женщины, держащей бейсбольный мяч двумя руками. Кредит: Джейк Петерсон/OpenAI

Используйте здоровый уровень скептицизма

Хотя эти советы могут быть актуальны сегодня, технология ИИ продолжает развиваться и совершенствоваться, и в ближайшем будущем они могут стать бесполезными. ИИ уже лучше пишет, так кто может сказать, что он не найдет способ каждый раз генерировать реалистичные руки? Или не дать элементам на фотографии смешиваться? Или не дать добавить странную фигню на фон изображений? И хотя приведенные выше советы в настоящее время полезны для фотореалистичных изображений, может быть сложнее идентифицировать произведения искусства, созданные ИИ: эти произведения могут иметь те же недостатки, что отмечены выше, но эти несоответствия легче замаскировать с помощью «краски», которая часто смешана, менее реалистична и более открыта для интерпретации.

Поскольку мы приближаемся к особенно бурному предвыборному году, будет важнее, чем когда-либо, включить свой радар BS, когда вы просматриваете интернет. Прежде чем вас впечатлит чье-то замысловатое произведение искусства или разозлит оскорбительное изображение, подумайте дважды: это изображение вообще реально?

lifehacker.com