Новейшая модель генерации изображений на основе искусственного интеллекта от Google, Imagen 3, теперь доступна для общественности в Соединенных Штатах, и все, что вам нужно, чтобы попробовать ее, — это бесплатная учетная запись Google. Как заметил VentureBeat, компания тихо раскрыла свою модель на этой неделе, опубликовав свое исследование в статье во вторник. Это произошло через два месяца после того, как компания впервые анонсировала новую модель на Google I/O в мае.
В посте на Hugging Face, платформе машинного обучения, исследователи Google заявили: «Мы представляем Imagen 3, модель скрытой диффузии, которая генерирует высококачественные изображения из текстовых подсказок. Мы описываем наши оценки качества и ответственности. Imagen 3 предпочтительнее других современных моделей (SOTA) на момент оценки. Кроме того, мы обсуждаем вопросы, связанные с безопасностью и репрезентативностью, а также методы, которые мы использовали для минимизации потенциального вреда наших моделей».
Из некоторых моих начальных любительских тестов, модель кажется довольно прочной. Когда запрашиваются фотореалистичные изображения, результаты относительно высокого качества, с некоторыми приличными попытками реализма, которые могут обмануть людей на первый взгляд. (Я был особенно впечатлен качеством изображений, когда попросил модель создать вид 35-мм пленки.) Imagen 3 также выделяет определенные части подсказки, которые повлияли на вывод, поэтому вы можете скорректировать их, если вам не нравится, как получилось изображение.
Автор: Джейк Петерсон/Google
Однако предложения Imagen 3 по-прежнему демонстрируют явные признаки изображений, созданных с помощью ИИ. На некоторых фотографиях руки имеют слишком много пальцев, лица искажены, а текст не имеет смысла. (Хотя модель смогла воспроизвести логотипы «Coca-Cola» и «Canon» с точностью, нарушающей товарные знаки.)
Кредит: Джейк Петерсон/Google
Google — не единственная технологическая компания, выпустившая новую модель изображения на этой неделе. Недавно X выпустила новую бета-версию Grok, чат-бота компании на основе искусственного интеллекта, а вместе с ней и генератор изображений, созданный с, казалось бы, очень небольшими ограничениями. Пользователи (в частности, Мишель Эрхардт из Lifehacker) использовали Grok для генерации всего: от Тейлор Свифт в кепке MAGA до Пикачу с АК-47.
Imagen 3, с другой стороны, демонстрирует очевидные ограждения. Когда я пытаюсь подсказать генератору изображений Google что-то спорное, он останавливается и вежливо направляет меня в раздел FAQ Imagen 3, чтобы понять, почему мой запрос неуместен. Он также отказывается генерировать контент, защищенный авторским правом, но его можно обмануть и заставить его его создать с помощью правильных подсказок. Как было отмечено выше, мне удалось сгенерировать логотипы и даже заставить его выдавать защищенных торговой маркой персонажей, таких как Марио и Пикачу, даже если мне не удалось заставить их участвовать в перестрелке.
Автор: Джейк Петерсон/Google
Как попробовать Imagen 3
Новый генератор изображений ИИ от Google бесплатно для любого пользователя США с учетной записью Google. Для этого перейдите в ImageFX в Google's AI Test Kitchen. Войдите в свою учетную запись Google, затем получите подсказки.
lifehacker.com