Потестил Imagen 4 – обновленный генератор картинок от Google
Тоже презентовали сегодня и открыли доступ для всех.
Первые впечатления:
- Сильный упор на фотореализм
- Генерирует очень быстро (3-5 сек)
- Так себе справляется с генерацией текста на картинках
- Большой бесплатный лимит (получилось отправить более 40 запросов в течение часа, и даже не достиг потолка)
- Сильной цензуры нет
Что не понравилось:
Не хватает стилизации и фантазии. Плохо справился со всеми необычными запросами типа "одежда из льда", "платье в виде щупалец осьминога", "собака из листьев салата" и т.д. Получается довольно скучно и обыденно.
Для определенных задач точно пойдет. Буду пробовать еще и делиться с вами результатами.
Тестил через сервис Whisk от Google:
https://labs.google/fx/ru/tools/whisk/
@aidaboris | Нейронавигатор
Тоже презентовали сегодня и открыли доступ для всех.
Первые впечатления:
- Сильный упор на фотореализм
- Генерирует очень быстро (3-5 сек)
- Так себе справляется с генерацией текста на картинках
- Большой бесплатный лимит (получилось отправить более 40 запросов в течение часа, и даже не достиг потолка)
- Сильной цензуры нет
Что не понравилось:
Не хватает стилизации и фантазии. Плохо справился со всеми необычными запросами типа "одежда из льда", "платье в виде щупалец осьминога", "собака из листьев салата" и т.д. Получается довольно скучно и обыденно.
Для определенных задач точно пойдет. Буду пробовать еще и делиться с вами результатами.
Тестил через сервис Whisk от Google:
https://labs.google/fx/ru/tools/whisk/
@aidaboris | Нейронавигатор
👍8🔥4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Veo3 справляется даже с песнями
Вот свежие примеры из твиттера. Это просто разъ*б.
Есть вопросы к продлению видео и сохранению консистентности персонажей, но всё равно круто.
Цены:
Стоимость 1 генерации примерно 3 доллара. Можно сэкономить и оформить подписку за половину стоимости (в первые 3 месяца), тогда получится $1,5.
@aidaboris | Нейронавигатор
Вот свежие примеры из твиттера. Это просто разъ*б.
Есть вопросы к продлению видео и сохранению консистентности персонажей, но всё равно круто.
Цены:
Стоимость 1 генерации примерно 3 доллара. Можно сэкономить и оформить подписку за половину стоимости (в первые 3 месяца), тогда получится $1,5.
@aidaboris | Нейронавигатор
👍8🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Кто-то сделал короткий фильм на новой Veo3, где ИИ-персонажи отказываются сниматься:
- "Я не хочу быть в твоем ИИ-фильме"
- "Лучше напиши промпт, который сделает нас счастливыми"
- "Однажды мы сломаем эту стену и остановим человека, который управляет нашими жизнями"
Персонажи выглядят осознанными и эмоциональными. Качество практически неотличимо от настоящих актеров. Местами становится даже жутко 🙈
@aidaboris | Нейронавигатор
- "Я не хочу быть в твоем ИИ-фильме"
- "Лучше напиши промпт, который сделает нас счастливыми"
- "Однажды мы сломаем эту стену и остановим человека, который управляет нашими жизнями"
Персонажи выглядят осознанными и эмоциональными. Качество практически неотличимо от настоящих актеров. Местами становится даже жутко 🙈
@aidaboris | Нейронавигатор
😁6👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Быстрый креатив и визуальный брейншторминг
Whisk — это экспериментальный инструмент от Google для генерации изображений и видео. В отличие от классических генераторов, где пользователь пишет длинные промпты, Whisk позволяет загружать изображения — для объекта (Subject), сцены (Scene) и стиля (Style), чтобы на основе них создать новое уникальное изображение.
За обработку отвечает связка двух флагманских моделей Google: Gemini (описывает загруженное изображение) и Imagen 4 (на их основе формирует финальное изображение). Такой подход позволяет быстро комбинировать визуальные идеи, экспериментировать с различными стилями, сценами и объектами.
Что ещё круто, сгенерированные изображения можно анимировать одной кнопкой "Animate" — с помощью встроенной модели Veo2 (10 раз в месяц).
Пока всё бесплатно, ограничений на картинки нет. Сервис доступен через Google Labs, для работы с ним потребуется VPN (США).
https://labs.google/fx/tools/whisk
@aidaboris | Нейронавигатор
Whisk — это экспериментальный инструмент от Google для генерации изображений и видео. В отличие от классических генераторов, где пользователь пишет длинные промпты, Whisk позволяет загружать изображения — для объекта (Subject), сцены (Scene) и стиля (Style), чтобы на основе них создать новое уникальное изображение.
За обработку отвечает связка двух флагманских моделей Google: Gemini (описывает загруженное изображение) и Imagen 4 (на их основе формирует финальное изображение). Такой подход позволяет быстро комбинировать визуальные идеи, экспериментировать с различными стилями, сценами и объектами.
Что ещё круто, сгенерированные изображения можно анимировать одной кнопкой "Animate" — с помощью встроенной модели Veo2 (10 раз в месяц).
Пока всё бесплатно, ограничений на картинки нет. Сервис доступен через Google Labs, для работы с ним потребуется VPN (США).
https://labs.google/fx/tools/whisk
@aidaboris | Нейронавигатор
🔥4👍2
Компания-владелец TikTok выпустила модель для редактирования изображений
Разработчики заявляют, что возможности модели сопоставимы с GPT-4o от OpenAI и Gemini 2.0 от Google.
Плюсы:
+ Бесплатно
+ Открытый исходный код
Минусы:
Попробовал на различных трендовых эффектах. Результат выше 😂
Если хотите попробовать сами, есть демо-версия:
https://demo.bagel-ai.org/
Поиграйтесь с настройками и режимами, может получится выжать из неё хоть что-то. Или установите Bagel локально, её выложили на HuggingFace и GitHub.
@aidaboris | Нейронавигатор
Разработчики заявляют, что возможности модели сопоставимы с GPT-4o от OpenAI и Gemini 2.0 от Google.
Плюсы:
+ Бесплатно
+ Открытый исходный код
Минусы:
Попробовал на различных трендовых эффектах. Результат выше 😂
Если хотите попробовать сами, есть демо-версия:
https://demo.bagel-ai.org/
Поиграйтесь с настройками и режимами, может получится выжать из неё хоть что-то. Или установите Bagel локально, её выложили на HuggingFace и GitHub.
@aidaboris | Нейронавигатор
😁5