20.09.2024

Любой, у кого есть аккаунт Google, может попробовать новейший генератор изображений на основе искусственного интеллекта от Google прямо сейчас

Новейшая модель генерации изображений на основе искусственного интеллекта от Google, Imagen 3, теперь доступна для общественности в Соединенных Штатах, и все, что вам нужно, чтобы попробовать ее, — это бесплатная учетная запись Google. Как заметил VentureBeat, компания тихо раскрыла свою модель на этой неделе, опубликовав свое исследование в статье во вторник. Это произошло через два месяца после того, как компания впервые анонсировала новую модель на Google I/O в мае.

В посте на Hugging Face, платформе машинного обучения, исследователи Google заявили: «Мы представляем Imagen 3, модель скрытой диффузии, которая генерирует высококачественные изображения из текстовых подсказок. Мы описываем наши оценки качества и ответственности. Imagen 3 предпочтительнее других современных моделей (SOTA) на момент оценки. Кроме того, мы обсуждаем вопросы, связанные с безопасностью и репрезентативностью, а также методы, которые мы использовали для минимизации потенциального вреда наших моделей».

Из некоторых моих начальных любительских тестов, модель кажется довольно прочной. Когда запрашиваются фотореалистичные изображения, результаты относительно высокого качества, с некоторыми приличными попытками реализма, которые могут обмануть людей на первый взгляд. (Я был особенно впечатлен качеством изображений, когда попросил модель создать вид 35-мм пленки.) Imagen 3 также выделяет определенные части подсказки, которые повлияли на вывод, поэтому вы можете скорректировать их, если вам не нравится, как получилось изображение.

подсказка для 35-мм вида футбольного матча Автор: Джейк Петерсон/Google

Однако предложения Imagen 3 по-прежнему демонстрируют явные признаки изображений, созданных с помощью ИИ. На некоторых фотографиях руки имеют слишком много пальцев, лица искажены, а текст не имеет смысла. (Хотя модель смогла воспроизвести логотипы «Coca-Cola» и «Canon» с точностью, нарушающей товарные знаки.)

ai изображение бутылки кока-колы Кредит: Джейк Петерсон/Google

Google — не единственная технологическая компания, выпустившая новую модель изображения на этой неделе. Недавно X выпустила новую бета-версию Grok, чат-бота компании на основе искусственного интеллекта, а вместе с ней и генератор изображений, созданный с, казалось бы, очень небольшими ограничениями. Пользователи (в частности, Мишель Эрхардт из Lifehacker) использовали Grok для генерации всего: от Тейлор Свифт в кепке MAGA до Пикачу с АК-47.

Imagen 3, с другой стороны, демонстрирует очевидные ограждения. Когда я пытаюсь подсказать генератору изображений Google что-то спорное, он останавливается и вежливо направляет меня в раздел FAQ Imagen 3, чтобы понять, почему мой запрос неуместен. Он также отказывается генерировать контент, защищенный авторским правом, но его можно обмануть и заставить его его создать с помощью правильных подсказок. Как было отмечено выше, мне удалось сгенерировать логотипы и даже заставить его выдавать защищенных торговой маркой персонажей, таких как Марио и Пикачу, даже если мне не удалось заставить их участвовать в перестрелке.

Пикачу, сгенерированный ИИ Автор: Джейк Петерсон/Google

Как попробовать Imagen 3

Новый генератор изображений ИИ от Google бесплатно для любого пользователя США с учетной записью Google. Для этого перейдите в ImageFX в Google's AI Test Kitchen. Войдите в свою учетную запись Google, затем получите подсказки.

lifehacker.com