Потестил Imagen 4 – обновленный генератор картинок от Google
Тоже презентовали сегодня и открыли доступ для всех.
Первые впечатления:
- Сильный упор на фотореализм
- Генерирует очень быстро (3-5 сек)
- Так себе справляется с генерацией текста на картинках
- Большой бесплатный лимит (получилось отправить более 40 запросов в течение часа, и даже не достиг потолка)
- Сильной цензуры нет
Что не понравилось:
Не хватает стилизации и фантазии. Плохо справился со всеми необычными запросами типа "одежда из льда", "платье в виде щупалец осьминога", "собака из листьев салата" и т.д. Получается довольно скучно и обыденно.
Для определенных задач точно пойдет. Буду пробовать еще и делиться с вами результатами.
Тестил через сервис Whisk от Google:
https://labs.google/fx/ru/tools/whisk/
@aidaboris | Нейронавигатор
Тоже презентовали сегодня и открыли доступ для всех.
Первые впечатления:
- Сильный упор на фотореализм
- Генерирует очень быстро (3-5 сек)
- Так себе справляется с генерацией текста на картинках
- Большой бесплатный лимит (получилось отправить более 40 запросов в течение часа, и даже не достиг потолка)
- Сильной цензуры нет
Что не понравилось:
Не хватает стилизации и фантазии. Плохо справился со всеми необычными запросами типа "одежда из льда", "платье в виде щупалец осьминога", "собака из листьев салата" и т.д. Получается довольно скучно и обыденно.
Для определенных задач точно пойдет. Буду пробовать еще и делиться с вами результатами.
Тестил через сервис Whisk от Google:
https://labs.google/fx/ru/tools/whisk/
@aidaboris | Нейронавигатор
👍8🔥4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Veo3 справляется даже с песнями
Вот свежие примеры из твиттера. Это просто разъ*б.
Есть вопросы к продлению видео и сохранению консистентности персонажей, но всё равно круто.
Цены:
Стоимость 1 генерации примерно 3 доллара. Можно сэкономить и оформить подписку за половину стоимости (в первые 3 месяца), тогда получится $1,5.
@aidaboris | Нейронавигатор
Вот свежие примеры из твиттера. Это просто разъ*б.
Есть вопросы к продлению видео и сохранению консистентности персонажей, но всё равно круто.
Цены:
Стоимость 1 генерации примерно 3 доллара. Можно сэкономить и оформить подписку за половину стоимости (в первые 3 месяца), тогда получится $1,5.
@aidaboris | Нейронавигатор
👍8🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Кто-то сделал короткий фильм на новой Veo3, где ИИ-персонажи отказываются сниматься:
- "Я не хочу быть в твоем ИИ-фильме"
- "Лучше напиши промпт, который сделает нас счастливыми"
- "Однажды мы сломаем эту стену и остановим человека, который управляет нашими жизнями"
Персонажи выглядят осознанными и эмоциональными. Качество практически неотличимо от настоящих актеров. Местами становится даже жутко 🙈
@aidaboris | Нейронавигатор
- "Я не хочу быть в твоем ИИ-фильме"
- "Лучше напиши промпт, который сделает нас счастливыми"
- "Однажды мы сломаем эту стену и остановим человека, который управляет нашими жизнями"
Персонажи выглядят осознанными и эмоциональными. Качество практически неотличимо от настоящих актеров. Местами становится даже жутко 🙈
@aidaboris | Нейронавигатор
😁6👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Быстрый креатив и визуальный брейншторминг
Whisk — это экспериментальный инструмент от Google для генерации изображений и видео. В отличие от классических генераторов, где пользователь пишет длинные промпты, Whisk позволяет загружать изображения — для объекта (Subject), сцены (Scene) и стиля (Style), чтобы на основе них создать новое уникальное изображение.
За обработку отвечает связка двух флагманских моделей Google: Gemini (описывает загруженное изображение) и Imagen 4 (на их основе формирует финальное изображение). Такой подход позволяет быстро комбинировать визуальные идеи, экспериментировать с различными стилями, сценами и объектами.
Что ещё круто, сгенерированные изображения можно анимировать одной кнопкой "Animate" — с помощью встроенной модели Veo2 (10 раз в месяц).
Пока всё бесплатно, ограничений на картинки нет. Сервис доступен через Google Labs, для работы с ним потребуется VPN (США).
https://labs.google/fx/tools/whisk
@aidaboris | Нейронавигатор
Whisk — это экспериментальный инструмент от Google для генерации изображений и видео. В отличие от классических генераторов, где пользователь пишет длинные промпты, Whisk позволяет загружать изображения — для объекта (Subject), сцены (Scene) и стиля (Style), чтобы на основе них создать новое уникальное изображение.
За обработку отвечает связка двух флагманских моделей Google: Gemini (описывает загруженное изображение) и Imagen 4 (на их основе формирует финальное изображение). Такой подход позволяет быстро комбинировать визуальные идеи, экспериментировать с различными стилями, сценами и объектами.
Что ещё круто, сгенерированные изображения можно анимировать одной кнопкой "Animate" — с помощью встроенной модели Veo2 (10 раз в месяц).
Пока всё бесплатно, ограничений на картинки нет. Сервис доступен через Google Labs, для работы с ним потребуется VPN (США).
https://labs.google/fx/tools/whisk
@aidaboris | Нейронавигатор
🔥4👍2
Компания-владелец TikTok выпустила модель для редактирования изображений
Разработчики заявляют, что возможности модели сопоставимы с GPT-4o от OpenAI и Gemini 2.0 от Google.
Плюсы:
+ Бесплатно
+ Открытый исходный код
Минусы:
Попробовал на различных трендовых эффектах. Результат выше 😂
Если хотите попробовать сами, есть демо-версия:
https://demo.bagel-ai.org/
Поиграйтесь с настройками и режимами, может получится выжать из неё хоть что-то. Или установите Bagel локально, её выложили на HuggingFace и GitHub.
@aidaboris | Нейронавигатор
Разработчики заявляют, что возможности модели сопоставимы с GPT-4o от OpenAI и Gemini 2.0 от Google.
Плюсы:
+ Бесплатно
+ Открытый исходный код
Минусы:
Попробовал на различных трендовых эффектах. Результат выше 😂
Если хотите попробовать сами, есть демо-версия:
https://demo.bagel-ai.org/
Поиграйтесь с настройками и режимами, может получится выжать из неё хоть что-то. Или установите Bagel локально, её выложили на HuggingFace и GitHub.
@aidaboris | Нейронавигатор
😁5
Шпаргалка по AI-видеоконтенту (май 2025)
Один человек с правильно подобранными инструментами может создавать контент уровня "почти голливуд" (не байт, а факт). Но выбор инструмента критически важен. Неправильное решение может стоить сотни долларов и часы потраченного времени на неудачные генерации.
🏆 ТОП нейросетей для видео:
🔹 Анимация изображений (оживить фотку, создать контент для блога, персональные проекты) - Kling, Hailuo
🔹 Морфинг, трансформации и переходы между изображениями - Higgsfield, Luma Dream Machine, Vidu Studio
🔹 Видеопродакшн (нейрофильмы, музыкальные клипы, реклама) - Runway, Higgsfield, Google Veo
🔹 Вирусные эффекты для соцсетей, мемы - Pika, PixVerse, Wan
🔹 Мультфильмы и оживление иллюстраций - Hailuo, Kling
🔹 Реклама товаров - Higgsfield, Kling
🔹 Video-2-Video (редактирование уже отснятых видео в нейронке) - Runway, Pika
🔹 Видеоаватары и "говорящие" фото - Heygen, Hedra, Dreamina
🔹 Апскейл видео - Topaz, Krea
Кратко:
⭐️ Универсальный чемпион: Kling
🚀 Технологическое чудо (следим всей планетой): Google Veo
🆓 Лучший freemium: Hailuo
❌ Не подходит ни для чего: Sora Video 🤪
Вопросы, комменты, лайки приветствуются 🤝
💬 Если вы профессионально занимаетесь AI-видеоконтентом, обязательно поделитесь своим мнением. Согласны с этой подборкой?
@aidaboris | Нейронавигатор
Один человек с правильно подобранными инструментами может создавать контент уровня "почти голливуд" (не байт, а факт). Но выбор инструмента критически важен. Неправильное решение может стоить сотни долларов и часы потраченного времени на неудачные генерации.
🏆 ТОП нейросетей для видео:
🔹 Анимация изображений (оживить фотку, создать контент для блога, персональные проекты) - Kling, Hailuo
🔹 Морфинг, трансформации и переходы между изображениями - Higgsfield, Luma Dream Machine, Vidu Studio
🔹 Видеопродакшн (нейрофильмы, музыкальные клипы, реклама) - Runway, Higgsfield, Google Veo
🔹 Вирусные эффекты для соцсетей, мемы - Pika, PixVerse, Wan
🔹 Мультфильмы и оживление иллюстраций - Hailuo, Kling
🔹 Реклама товаров - Higgsfield, Kling
🔹 Video-2-Video (редактирование уже отснятых видео в нейронке) - Runway, Pika
🔹 Видеоаватары и "говорящие" фото - Heygen, Hedra, Dreamina
🔹 Апскейл видео - Topaz, Krea
Кратко:
⭐️ Универсальный чемпион: Kling
🚀 Технологическое чудо (следим всей планетой): Google Veo
🆓 Лучший freemium: Hailuo
❌ Не подходит ни для чего: Sora Video 🤪
Вопросы, комменты, лайки приветствуются 🤝
💬 Если вы профессионально занимаетесь AI-видеоконтентом, обязательно поделитесь своим мнением. Согласны с этой подборкой?
@aidaboris | Нейронавигатор
👍8🔥6❤2🤝1