Разобрался со свежим сливом по моделям Google.
Что меня зацепило, это три строки внизу списка.
omni-bag-autopush-iapi-agent
omni-bag-prod-iapi-agent
omni-bag-staging-iapi-agent
Похоже, это три версии одной и той же модели Gemini Omni.
Autopush - это где гоняют свежие сборки внутри компании.
Staging - тестовая площадка перед публичным запуском.
Prod - боевая версия, которую видят обычные пользователи.
То есть Google уже катит Omni по своей обычной цепочке от внутренних тестов к релизу.
О существовании Omni первый раз заговорили 2 мая 2026, когда в интерфейсе Gemini заметили строку Powered by Omni.
Toucan - это Veo 3.1, текущий видео-движок. То, что Omni стоит соседом, многое говорит о его роли.
Я полез смотреть, что пишут инсайдеры и пользователи по Omni, и собрал картину.
Первое и самое важное.
Omni позиционируют как единую мультимодальную модель.
Текст, картинка и видео в одном пайплайне
По логике это аналог GPT-4o, только с нативной генерацией видео на выходе.
Второе.
Заявлено чат-редактирование видео.
То есть можно загрузить ролик и попросить переодеть персонажа, заменить сезон, поменять фон без полной перегенерации.
Для меня и для вас это самая интересная часть, потому что именно тут видео-генерация перестаёт быть лотереей и превращается в нормальный итеративный инструмент.
Третье.
Утёкшие демо, которые гуляют по сети, выглядят сильно.
Двое мужчин едят пасту в ресторане (смотрите пост выше), профессор пишет тригонометрические тождества мелом на доске и параллельно объясняет.
По соответствию запросу Omni обходит Veo 3.1.
Четвёртое.
Модель тяжёлая.
Один из пользователей, поймавший Omni в проде, написал, что за две генерации сжёг 86 процентов своего дневного лимита на тарифе AI Pro.
То есть Google явно готовит жёсткие лимиты под эту штуку.
Пятое.
По смыслу слова Omni у комьюнити три трактовки.
Это либо просто ребренд Veo (вероятность около 30 процентов), либо отдельная видео-модель Gemini параллельно с Veo (около 50 процентов), либо настоящий omni-model, который умеет всё в одной архитектуре (около 40 процентов).
Утёкшие демо и сама стратегия Google склоняют меня к третьему варианту.
Дальше про то, что ещё ожидается на Google I/O 19 и 20 мая.
Gemini 3.2 Flash засветился 5 мая в iOS-приложении и в AI Studio.
Цена из утечки: 0.25 доллара за миллион входных токенов и 2 доллара за миллион выходных.
По бенчмаркам он близок к 3.1 Pro по коду, но скорость и цена как у Flash-линейки.
Это будет рабочая лошадка для тех, кому надо много и быстро.
Spark Robin - кодовое имя визуальной модели, которое всплыло вместе с Omni.
Возможно, это компаньон Omni для изображений, как сейчас Nano Banana идёт парой с Veo.
Teamfood - это функция долговременной памяти чатов. Не модель, а слой над ней.
Gemini 4 - тут только домыслы изданий. Утечек с конкретным названием модели я не нашёл, в основном пишут в стиле "ожидаем флагман нового поколения". Может быть, покажут, может, придержат.
Liquid Glass UI - редизайн интерфейса Gemini в стиле свежего iOS-обновления.
Pill-образный промпт-бар, пульсирующий градиент, перенесённый селектор моделей.
Agents (Beta) - новая вкладка в сайдбаре, которую уже видно, но она пока неактивна. Очевидно, под агентные сценарии.
Теперь главный вывод, который я для себя сделал.
Суффикс -agent стоит абсолютно на всех моделях из утечки.
На lite, на pro, на flash, на TTS, на image, на lyria, на omni-bag.
Это не случайность.
Google перепаковывает всю свою линейку под агентные задачи.
Это бьётся с темой Gemini Intelligence, которую анонсировали на The Android Show 12 мая.
То есть на I/O нам покажут не столько новые "чистые" модели для генерации, сколько агентный слой поверх всей линейки 3.x.
Omni при этом пойдёт как главный сюрприз и хедлайнер.
По таймингу всё сходится.
Названия в интерфейсе и внутренние адреса моделей обычно утекают за 2-4 недели до I/O, и это рабочий паттерн Google последних лет.
У Omni высокие шансы получить официальный анонс именно 19 мая, скорее всего сразу с двумя версиями: Flash и Pro.
Ждем кейноут.
Что меня зацепило, это три строки внизу списка.
omni-bag-autopush-iapi-agent
omni-bag-prod-iapi-agent
omni-bag-staging-iapi-agent
Похоже, это три версии одной и той же модели Gemini Omni.
Autopush - это где гоняют свежие сборки внутри компании.
Staging - тестовая площадка перед публичным запуском.
Prod - боевая версия, которую видят обычные пользователи.
То есть Google уже катит Omni по своей обычной цепочке от внутренних тестов к релизу.
О существовании Omni первый раз заговорили 2 мая 2026, когда в интерфейсе Gemini заметили строку Powered by Omni.
Toucan - это Veo 3.1, текущий видео-движок. То, что Omni стоит соседом, многое говорит о его роли.
Я полез смотреть, что пишут инсайдеры и пользователи по Omni, и собрал картину.
Первое и самое важное.
Omni позиционируют как единую мультимодальную модель.
Текст, картинка и видео в одном пайплайне
По логике это аналог GPT-4o, только с нативной генерацией видео на выходе.
Второе.
Заявлено чат-редактирование видео.
То есть можно загрузить ролик и попросить переодеть персонажа, заменить сезон, поменять фон без полной перегенерации.
Для меня и для вас это самая интересная часть, потому что именно тут видео-генерация перестаёт быть лотереей и превращается в нормальный итеративный инструмент.
Третье.
Утёкшие демо, которые гуляют по сети, выглядят сильно.
Двое мужчин едят пасту в ресторане (смотрите пост выше), профессор пишет тригонометрические тождества мелом на доске и параллельно объясняет.
По соответствию запросу Omni обходит Veo 3.1.
Четвёртое.
Модель тяжёлая.
Один из пользователей, поймавший Omni в проде, написал, что за две генерации сжёг 86 процентов своего дневного лимита на тарифе AI Pro.
То есть Google явно готовит жёсткие лимиты под эту штуку.
Пятое.
По смыслу слова Omni у комьюнити три трактовки.
Это либо просто ребренд Veo (вероятность около 30 процентов), либо отдельная видео-модель Gemini параллельно с Veo (около 50 процентов), либо настоящий omni-model, который умеет всё в одной архитектуре (около 40 процентов).
Утёкшие демо и сама стратегия Google склоняют меня к третьему варианту.
Дальше про то, что ещё ожидается на Google I/O 19 и 20 мая.
Gemini 3.2 Flash засветился 5 мая в iOS-приложении и в AI Studio.
Цена из утечки: 0.25 доллара за миллион входных токенов и 2 доллара за миллион выходных.
По бенчмаркам он близок к 3.1 Pro по коду, но скорость и цена как у Flash-линейки.
Это будет рабочая лошадка для тех, кому надо много и быстро.
Spark Robin - кодовое имя визуальной модели, которое всплыло вместе с Omni.
Возможно, это компаньон Omni для изображений, как сейчас Nano Banana идёт парой с Veo.
Teamfood - это функция долговременной памяти чатов. Не модель, а слой над ней.
Gemini 4 - тут только домыслы изданий. Утечек с конкретным названием модели я не нашёл, в основном пишут в стиле "ожидаем флагман нового поколения". Может быть, покажут, может, придержат.
Liquid Glass UI - редизайн интерфейса Gemini в стиле свежего iOS-обновления.
Pill-образный промпт-бар, пульсирующий градиент, перенесённый селектор моделей.
Agents (Beta) - новая вкладка в сайдбаре, которую уже видно, но она пока неактивна. Очевидно, под агентные сценарии.
Теперь главный вывод, который я для себя сделал.
Суффикс -agent стоит абсолютно на всех моделях из утечки.
На lite, на pro, на flash, на TTS, на image, на lyria, на omni-bag.
Это не случайность.
Google перепаковывает всю свою линейку под агентные задачи.
Это бьётся с темой Gemini Intelligence, которую анонсировали на The Android Show 12 мая.
То есть на I/O нам покажут не столько новые "чистые" модели для генерации, сколько агентный слой поверх всей линейки 3.x.
Omni при этом пойдёт как главный сюрприз и хедлайнер.
По таймингу всё сходится.
Названия в интерфейсе и внутренние адреса моделей обычно утекают за 2-4 недели до I/O, и это рабочий паттерн Google последних лет.
У Omni высокие шансы получить официальный анонс именно 19 мая, скорее всего сразу с двумя версиями: Flash и Pro.
Ждем кейноут.
🔥49❤28👏16🤔2🤯2✍1😁1😨1🎄1🤪1
🚀 Скорость и итеративность сегодня решают всё!
Новый урок по Weavy AI для всех подписчиков Boosty!
В этом уроке я разобрал, как ускорить генерацию в Weavy AI
Работа с CSV-итераторами
Что вы узнаете из урока:
⚡️Магия CSV-файлов: Как создавать таблицы в Google Sheets, которые Weavy мгновенно превращает в серии готовых промптов.
⚡️Управление планами и позами: Научитесь в один клик менять ракурсы (фронтальный, боковой, 3/4) и детализацию, не переписывая основной запрос.
⚡️Многостолбцовые итераторы: Как импортировать сложные файлы и выбирать, что именно менять в генерации - цвет одежды, позу или окружение.
⚡️Функция Unpack: Как быстро «распаковать» все итерации в отдельные изображения для удобной работы с каждым персонажем.
⚡️Связка с LLM (Claude AI): Лайфхак, как делегировать нейронке создание сложных CSV-структур по готовому гайду, чтобы вообще не писать код или таблицы руками.
🔥Итог: Вы получите готовые шаблоны и инструкции, которые сэкономят часы рутины и позволят создавать целые наборы персонажей и сцен в едином стиле максимально быстро.
Если вы еще не познакомились со всеми преимуществами этой программы, а это:
визуальный борд с рабочими процессами,
гибкость настроек, логика и стабильность,
удобная узловая структура,
то все уроки по Weawy вы можете найти ЗДЕСЬ
Начать использовать Weavy AI ЗДЕСЬ
Смотрите урок и внедряйте в работу! ⚡️
Новый урок по Weavy AI для всех подписчиков Boosty!
В этом уроке я разобрал, как ускорить генерацию в Weavy AI
Работа с CSV-итераторами
Что вы узнаете из урока:
⚡️Магия CSV-файлов: Как создавать таблицы в Google Sheets, которые Weavy мгновенно превращает в серии готовых промптов.
⚡️Управление планами и позами: Научитесь в один клик менять ракурсы (фронтальный, боковой, 3/4) и детализацию, не переписывая основной запрос.
⚡️Многостолбцовые итераторы: Как импортировать сложные файлы и выбирать, что именно менять в генерации - цвет одежды, позу или окружение.
⚡️Функция Unpack: Как быстро «распаковать» все итерации в отдельные изображения для удобной работы с каждым персонажем.
⚡️Связка с LLM (Claude AI): Лайфхак, как делегировать нейронке создание сложных CSV-структур по готовому гайду, чтобы вообще не писать код или таблицы руками.
🔥Итог: Вы получите готовые шаблоны и инструкции, которые сэкономят часы рутины и позволят создавать целые наборы персонажей и сцен в едином стиле максимально быстро.
Если вы еще не познакомились со всеми преимуществами этой программы, а это:
визуальный борд с рабочими процессами,
гибкость настроек, логика и стабильность,
удобная узловая структура,
то все уроки по Weawy вы можете найти ЗДЕСЬ
Начать использовать Weavy AI ЗДЕСЬ
Смотрите урок и внедряйте в работу! ⚡️
🔥32❤14🤣3
Media is too big
VIEW IN TELEGRAM
И она реально хороша.
Доступно в Weavy AI через узел Import Model.
Скопируйте ЭТУ (изображения) ссылку и вставьте на борд Weavy AI
Для генерации векторной графики используйте ЭТУ ссылку
V4.1 основная и самая выразительная.
Сама экспериментирует со светом, настроением и композицией, заточена под концептинг и арт.
Понимает короткие промпты, простыни инструкций писать не стоит.
V4.1 Vector про линию. Логотипы, типографика, иллюстрации. На выходе настоящий редактируемый SVG со слоями и чистой геометрией, а не растр после автотрейса.
V4.1 Utility наоборот, без художественной отсебятины. Плоский свет, фронтальная композиция, простые сцены. Под мокапы, продуктовые шоты и всё, где нужен спокойный предсказуемый кадр.
Что подтянули по качеству:
* фотореализм стал тише, без характерного AI-глянца
* иллюстрация резче, появились стили, которых раньше не было
* character sheets теперь полноценные, с фронтом, профилем, спиной, видом 3/4 и цветовой палитрой
* типографика и текстурные надписи аккуратнее
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45👏26❤10✍4
🏞 Расширение любого изображения до ЛЮБОГО соотношения сторон).
Уже доступно в Weavy AI для построения удобных рабочих процессов без выхода во внешние решения.
Скопируйте ссылку ЗДЕСЬ и просто вставьте её на борд в Weavy AI
Большинство функций обычного Outpainting испытывают трудности на границах: разрывы света, искажение текстур, появление швов.
FLUX Outpainting исправляет это на уровне модели.
Добавьте изображение и геометрию холста и получите целостное расширение сцены с сохраненной структурой и непрерывностью.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47❤24🤝3🤷1
Никого не интересует ваше резюме и ваш трудный путь длинной в много лет в кино и так далее.
Интересуют только реальные результаты и люди которые управляются с пачкой инструментов.
У TheDorBrothers требования максимально простые.
Нужны режиссеры рекламных роликов с использованием ИИ.
Нужны талантливые специалисты с глубоким практическим опытом в создании фильмов с помощью ИИ.
Обязательно:
• Реальный опыт работы режиссером рекламных роликов для клиентов
• Цветокоррекция и постпродакшн
• Seedance 2.0
• Nano Banana Pro
• Kling 3.0
• Photoshop
• Adobe Premiere / DaVinci Resolve
• Topaz Video Enhance AI
Мы будем рассматривать только заявки, включающие портфолио c видеоматериалами.
Присылайте свои работы по адресу:
office@thedorbrothers.com
🔥 Пожалуйста, не присылайте резюме!
Интересуют только реальные результаты и люди которые управляются с пачкой инструментов.
У TheDorBrothers требования максимально простые.
Нужны режиссеры рекламных роликов с использованием ИИ.
Нужны талантливые специалисты с глубоким практическим опытом в создании фильмов с помощью ИИ.
Обязательно:
• Реальный опыт работы режиссером рекламных роликов для клиентов
• Цветокоррекция и постпродакшн
• Seedance 2.0
• Nano Banana Pro
• Kling 3.0
• Photoshop
• Adobe Premiere / DaVinci Resolve
• Topaz Video Enhance AI
Мы будем рассматривать только заявки, включающие портфолио c видеоматериалами.
Присылайте свои работы по адресу:
office@thedorbrothers.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32🤣18😁4🤯4🥰1
17 мая (вск), 19:00 мск.
«Все о качественном липсинк.
Лучшие техники, модели и софт.
Русская речь в Seedance 2.0»
⭐️ Вводная часть.
Что такое AI липсинк и чем он отличается от классической анимации губ и ротоскопии.
Где это уже используется: дубляж фильмов, локализация YouTube, цифровые аватары, реклама, мемы и UGC
⭐️Обзор инструментов.
Лидеры рынка.
Связка с голосом.
Сравнительная таблица: цена, лимиты, качество, поддержка языков (включая русский), длительность видео.
⭐️Под капотом: как это работает
Что такое референс-кадр и почему важна фронтальная съёмка.
Роль аудиоэмбеддингов и фонем.
Почему модель путается на быстрой речи, шёпоте и пении. Как это исправить.
Разница между face-swap, talking head и full lip-sync
⭐️Практический воркфлоу.
Подготовка исходника: видео или статичный портрет, требования к разрешению, освещению, ракурсу.
Генерация или запись голоса (TTS vs живой голос).
⭐️ Прогон через липсинк-модель.
⭐️ Постобработка: чистка артефактов, ретушь зубов и губ, ресемпл в DaVinci Resolve
Финальный микс звука.
⭐️ Живая демонстрация.
Берём один и тот же ролик и прогоняем через 2-3 сервиса, сравниваем результат на экране
⭐️ Локализация: один видеофрагмент переводим на 3 языка
⭐️Оживляем статичную фотографию (портрет, картина, AI-сгенерированное изображение)
⭐️ Типичные ошибки и как их обходить.
Дёрганые губы, "резиновый" подбородок, пропадающие зубы.
Частичный липсинк.
Расхождение тайминга на длинных репликах.
Что делать, если модель "теряет" лицо при повороте головы.
⭐️Финал.
Чек-лист "Правильный и точный липсинк».
Список ресурсов, промптов и пресетов.
Семинар доступен подписчикам Boosty на тарифы «На связи с Нейрографом» и «AI Режиссер».
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30❤9😁7🤪4
🔥 Новый пост для всех доступен на Boosty!
Автоматический перевод промптов в Google таблицах.
Подготовка CSV-файлов с сотнями промптов вручную замедляет работу.
Связка Google Sheets + GOOGLETRANSLATE превращает этот процесс в быстрый конвейер.
Почему это удобно:
⚡️ Экономия времени: Вы формулируете идеи на русском, а английский текст для модели генерируется мгновенно и автоматически.
⚡️ Работа с объемом: Подготовка 100+ вариаций кадра занимает минуты, а не часы.
⚡️Системный контроль: Все параметры (свет, ракурсы, оптика) наглядны. Легче вносить массовые правки, чем в интерфейсе нейросети.
⚡️ Никакой рутины: Вы избавляетесь от постоянного копирования текста в переводчик и обратно.
В посте вы найдете:
1. Шаблон Google таблиц с уже встроенными GOOGLETRANSLATE - импортируете и заполняете RU-столбцы, EN-перевод заполняется сам.
2. Инструкция с пошаговым процессом, глоссарием кинотерминов и разделом о том, как подключить продвинутые переводчики (DeepL, GPT) - на случай, если машинный перевод не справляется.
Как пользоваться итераторами в Weavy AI можно узнать в этом ПОСТЕ на Boosty.
Автоматический перевод промптов в Google таблицах.
Подготовка CSV-файлов с сотнями промптов вручную замедляет работу.
Связка Google Sheets + GOOGLETRANSLATE превращает этот процесс в быстрый конвейер.
Почему это удобно:
⚡️ Экономия времени: Вы формулируете идеи на русском, а английский текст для модели генерируется мгновенно и автоматически.
⚡️ Работа с объемом: Подготовка 100+ вариаций кадра занимает минуты, а не часы.
⚡️Системный контроль: Все параметры (свет, ракурсы, оптика) наглядны. Легче вносить массовые правки, чем в интерфейсе нейросети.
⚡️ Никакой рутины: Вы избавляетесь от постоянного копирования текста в переводчик и обратно.
В посте вы найдете:
1. Шаблон Google таблиц с уже встроенными GOOGLETRANSLATE - импортируете и заполняете RU-столбцы, EN-перевод заполняется сам.
2. Инструкция с пошаговым процессом, глоссарием кинотерминов и разделом о том, как подключить продвинутые переводчики (DeepL, GPT) - на случай, если машинный перевод не справляется.
Как пользоваться итераторами в Weavy AI можно узнать в этом ПОСТЕ на Boosty.
🔥28❤6❤🔥3😁2🙏1
Книга Джона Харта «Искусство раскадровки» доступна для всех на Boosty!
Это базовая книга по раскадровке, будет полезна не только тем, кто работает в кино, рекламе или анимации, но и тем, кто занимается генеративным искусством.
Раскадровка помогает точнее формулировать визуальную идею: понимать, какой нужен план, свет, перспектива, план и движение камеры, положение персонажа, атмосфера и последовательность кадров.
Книга учит передавать своё видение, рассказывать историю и планировать ключевые сцены с помощью простых техник раскадровки, в ней много примеров кадров, композиции, ракурсов и движения камеры.
Забрать книгу ЗДЕСЬ
Это базовая книга по раскадровке, будет полезна не только тем, кто работает в кино, рекламе или анимации, но и тем, кто занимается генеративным искусством.
Раскадровка помогает точнее формулировать визуальную идею: понимать, какой нужен план, свет, перспектива, план и движение камеры, положение персонажа, атмосфера и последовательность кадров.
Книга учит передавать своё видение, рассказывать историю и планировать ключевые сцены с помощью простых техник раскадровки, в ней много примеров кадров, композиции, ракурсов и движения камеры.
Забрать книгу ЗДЕСЬ
❤🔥29🔥17❤15🫡3
Если вы хотите узнать о максимальных возможностях lip-sync на русском языке, в том числе в Seedance 2.0, то сегодня состоится уникальный эфир.
💥 Стартуем в 19:00 мск.
В течение целого месяца в рамках одного из своих проектов, я разбирался со всеми тонкостями этого непростого процесса чтобы получить максимально качественный результат и теперь готов поделиться с вами.
Он состоит из нескольких этапов и знания нескольких инструментов которые нужно применять в определенной последовательности с определенными настройками.
Именно этим я сегодня с вами и поделюсь.
Я расскажу и покажу последовательные шаги, максимально качественные и дешевые инструменты, существующие на сегодняшний день.
После этого занятия вы сможете создавать любых персонажей, которые говорят практически на 100% как живые люди, причем на русском языке. Ну а с английским проблем точно не будет.
Эфир доступен подписчиком Boosty, тариф «На связи с Нейрографом» и «AI Режиссер».
🔴 Присоединяйтесь к самому продвинутому русскоязычному AI сообщесту на Boosty получайте лучший передовой контент, который поможет вам развиваться как творческому человеку, так и как предпринимателю, который хотел бы зарабатывать на любимом деле .
В течение целого месяца в рамках одного из своих проектов, я разбирался со всеми тонкостями этого непростого процесса чтобы получить максимально качественный результат и теперь готов поделиться с вами.
Он состоит из нескольких этапов и знания нескольких инструментов которые нужно применять в определенной последовательности с определенными настройками.
Именно этим я сегодня с вами и поделюсь.
Я расскажу и покажу последовательные шаги, максимально качественные и дешевые инструменты, существующие на сегодняшний день.
После этого занятия вы сможете создавать любых персонажей, которые говорят практически на 100% как живые люди, причем на русском языке. Ну а с английским проблем точно не будет.
Эфир доступен подписчиком Boosty, тариф «На связи с Нейрографом» и «AI Режиссер».
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥49❤19👏8😁2💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Ладно.
Посмотрим что покажут сегодня и завтра Google на своей конференции I/O.
Новый Veo Omni?
Новый🍌 Банан?
Новый Gemini?
Посмотрим что покажут сегодня и завтра Google на своей конференции I/O.
Новый Veo Omni?
Новый
Новый Gemini?
Please open Telegram to view this post
VIEW IN TELEGRAM
💯29🔥23👏5❤4🤔1👌1🍾1
Книга «Если пурпурный - кто-то умрёт» доступна для всех подписчиков Boosty!
Цвет как язык эмоций.
Этой книги нет на русском языке.
Я перевел ее с помощью агента Claude AI и ее вполне можно читать, не идеально, но смысл читается полностью, все изображения сохранены.
Patti Bellantoni - преподаватель Школы кинематографии Нью-Йоркского университета - в своей книге «If It's Purple, Someone's Gonna Die: The Power of Color in Visual Storytelling» раскладывает по полочкам то, что обычно работает на уровне интуиции: как именно цвет управляет чувствами зрителя.
Почему это важно для тех, кто занимается генеративным искусством:
Когда вы пишете промпт для нейросети вы фактически даёте модели режиссёрские указания. И если композицию и стиль нейросеть угадывает легко, то эмоциональный тон сцены почти всегда задаётся цветом - и именно здесь у большинства случается провал.
Беллантони на примерах из сотен фильмов показывает, что:
🔴красный - это не «страсть вообще», а конкретный спектр от агрессии до сексуального голода;
🟡жёлтый провоцирует тревогу и безумие чаще, чем радость;
🔵синий способен как успокоить, так и заморозить и изолировать персонажа;
🟢зелёный двусмысленен - жизнь и гниение одновременно;
🟣фиолетовый (пурпурный) - маркер смерти, перехода, потустороннего (отсюда и название).
Для генеративного художника это даёт три практических вещи: словарь точных цветовых описаний для промптов; понимание, какую палитру выбрать под нарратив, а не наоборот; и насмотренность референсами, разобранными покадрово.
Книга короткая, написана живо, полна кадров - её можно пройти за пару вечеров, а пользоваться как справочником по эмоциональной палитре потом годами.
Забрать книгу ЗДЕСЬ
Цвет как язык эмоций.
Этой книги нет на русском языке.
Я перевел ее с помощью агента Claude AI и ее вполне можно читать, не идеально, но смысл читается полностью, все изображения сохранены.
Patti Bellantoni - преподаватель Школы кинематографии Нью-Йоркского университета - в своей книге «If It's Purple, Someone's Gonna Die: The Power of Color in Visual Storytelling» раскладывает по полочкам то, что обычно работает на уровне интуиции: как именно цвет управляет чувствами зрителя.
Почему это важно для тех, кто занимается генеративным искусством:
Когда вы пишете промпт для нейросети вы фактически даёте модели режиссёрские указания. И если композицию и стиль нейросеть угадывает легко, то эмоциональный тон сцены почти всегда задаётся цветом - и именно здесь у большинства случается провал.
Беллантони на примерах из сотен фильмов показывает, что:
🔴красный - это не «страсть вообще», а конкретный спектр от агрессии до сексуального голода;
🟡жёлтый провоцирует тревогу и безумие чаще, чем радость;
🔵синий способен как успокоить, так и заморозить и изолировать персонажа;
🟢зелёный двусмысленен - жизнь и гниение одновременно;
🟣фиолетовый (пурпурный) - маркер смерти, перехода, потустороннего (отсюда и название).
Для генеративного художника это даёт три практических вещи: словарь точных цветовых описаний для промптов; понимание, какую палитру выбрать под нарратив, а не наоборот; и насмотренность референсами, разобранными покадрово.
Книга короткая, написана живо, полна кадров - её можно пройти за пару вечеров, а пользоваться как справочником по эмоциональной палитре потом годами.
Забрать книгу ЗДЕСЬ
🔥34🙏9❤7⚡2🤔2❤🔥1👨💻1🤝1
Ссылки из видео.
Weavy AI
Astra Upscaler
Google TTS для Weavy AI
Sync So на сайте
Sync So для использования в Weavy
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32❤28👏11🤣2💅1
Google I/O 2026: где смотреть и программа по московскому времени
Сегодня стартует Google I/O 2026 - ежегодная конференция Google, на которой компания показывает главные технологические направления на ближайший год.
Смотреть стоит тем, кто следит за искусственным интеллектом, Gemini, Android, Chrome, инструментами для разработчиков и будущим AI-продуктов. Обычно именно на Google I/O становятся понятны не только отдельные новинки, но и общая стратегия Google: куда движется поиск, приложения, мобильная экосистема и разработка с помощью AI.
Программа по московскому времени
19 мая
20:00-21:45 - главная презентация Google
Главные анонсы компании: искусственный интеллект, Gemini, продукты Google, Android и общая стратегия.
23:30-00:45 - презентация для разработчиков
Новые AI-инструменты Google, разработка приложений и будущее экосистемы Google для разработчиков.
Ночь с 19 на 20 мая
01:30-02:15
Что нового в Google AI, Android, Chrome и AI-рабочих процессах от промпта до продакшена.
02:30-03:15
Google AI Studio, Google Antigravity, Firebase, Google Play и новые возможности веб-разработки с AI.
20 мая
20:00-20:45
Android development tools, Gemma, Flutter, Web UI и агентный AI.
21:00-21:45
Android-экосистема, TPU-стек Google, квантовое будущее AI и Chrome DevTools для AI-агентов.
22:00-22:45
AI и новые горизонты науки с Демисом Хассабисом.
23:00-23:45
Разговор о будущем профессии разработчика.
Ночь с 20 на 21 мая
00:00-00:45 - ключевые навыки разработчика в эпоху AI
01:00-01:45 - программная инженерия на переломном этапе
02:00-02:45 - Google Antigravity и Flutter
Главное, что стоит посмотреть в первую очередь:
20:00 МСК - главная презентация Google
23:30 МСК - Developer keynote
Где смотреть онлайн
Официальная страница Google I/O
https://io.google/2026/
YouTube-плейлист с трансляциями
https://www.youtube.com/playlist?list=PLOU2XLYxmsIKL_eEgkKJWDRhYUEvS9eYz
Официальный канал Google for Developers
https://www.youtube.com/user/GoogleDevelopers
Сегодня стартует Google I/O 2026 - ежегодная конференция Google, на которой компания показывает главные технологические направления на ближайший год.
Смотреть стоит тем, кто следит за искусственным интеллектом, Gemini, Android, Chrome, инструментами для разработчиков и будущим AI-продуктов. Обычно именно на Google I/O становятся понятны не только отдельные новинки, но и общая стратегия Google: куда движется поиск, приложения, мобильная экосистема и разработка с помощью AI.
Программа по московскому времени
19 мая
20:00-21:45 - главная презентация Google
Главные анонсы компании: искусственный интеллект, Gemini, продукты Google, Android и общая стратегия.
23:30-00:45 - презентация для разработчиков
Новые AI-инструменты Google, разработка приложений и будущее экосистемы Google для разработчиков.
Ночь с 19 на 20 мая
01:30-02:15
Что нового в Google AI, Android, Chrome и AI-рабочих процессах от промпта до продакшена.
02:30-03:15
Google AI Studio, Google Antigravity, Firebase, Google Play и новые возможности веб-разработки с AI.
20 мая
20:00-20:45
Android development tools, Gemma, Flutter, Web UI и агентный AI.
21:00-21:45
Android-экосистема, TPU-стек Google, квантовое будущее AI и Chrome DevTools для AI-агентов.
22:00-22:45
AI и новые горизонты науки с Демисом Хассабисом.
23:00-23:45
Разговор о будущем профессии разработчика.
Ночь с 20 на 21 мая
00:00-00:45 - ключевые навыки разработчика в эпоху AI
01:00-01:45 - программная инженерия на переломном этапе
02:00-02:45 - Google Antigravity и Flutter
Главное, что стоит посмотреть в первую очередь:
20:00 МСК - главная презентация Google
23:30 МСК - Developer keynote
Где смотреть онлайн
Официальная страница Google I/O
https://io.google/2026/
YouTube-плейлист с трансляциями
https://www.youtube.com/playlist?list=PLOU2XLYxmsIKL_eEgkKJWDRhYUEvS9eYz
Официальный канал Google for Developers
https://www.youtube.com/user/GoogleDevelopers
❤19🔥17👌8🤓3
Сегодня прошла презентация Google I/O, и для нас, кто крутится в генеративном видео, главное событие это новая модель Gemini Omni.
Сразу оговорюсь: пока пишу по тому, что заявили со сцены и что всплыло в утечках за последнюю неделю. Реальное качество и лимиты увидим, когда сам потыкаю и народ начнёт её ломать.
Что это и как работает.
Берёшь любое фото или видео из галереи, говоришь текстом или голосом что хочешь получить, модель делает. Без отдельных программ, без сложных настроек.
Дальше каждая следующая фраза наслаивается на результат: меняешь мелкие детали или перекраиваешь сцену целиком, не начиная с нуля.
Модель понимает физику и последствия запросов, можно крутить ракурс, окружение, стиль, действие, добавлять персонажей и объекты.
Сегодня вышла версия Omni Flash. Старшая Pro обещана позже, по той же схеме, что и с Nano Banana.
Теперь по фишкам.
Аудио и картинка.
Генерируются за один проход. Раньше у Google под звук шёл отдельный этап.
Omni выдаёт изображение и пространственный звук вместе: шаги попадают в момент приземления ноги, реплики ложатся в губы, фоновый шум комнаты держится сценой.
Если это работает так, как описывают, отпадает половина пост-продакшна.
Повторяемый каст персонажей.
Создаёшь героя с нуля по текстовому промпту или по референсному изображению, привязываешь к нему голос под характер, и потом вызываешь его в любой новый кадр через @имя_персонажа.
Полная визуальная и голосовая согласованность сцена к сцене. То, об что спотыкались все, от Sora до Seedance.
Аватары.
Платным подписчикам открыли экспериментальную функцию Аватар.
Регистрируешь свой аватар, добавляешь своё лицо и свой голос, и потом подставляешь себя в любые свои проекты.
По сути, это твой собственный персонаж в общей системе каста, которого можно вызывать в кадр так же, как любого другого героя через @имя.
Для тех, кто делает контент от первого лица, это закрывает огромную боль: не надо больше снимать себя на камеру под каждый ролик.
Видео в видео.
Загружаешь свой материал и текстом меняешь стиль, обстановку, действия.
Можно вставить себя в чужой клип, перегнать реалистичную съёмку в мультик или аниме, отправить себя гулять по картине эпохи Возрождения. Каждая правка ложится поверх предыдущей.
Кинематографический реализм до 10 секунд за клип.
Это не потолок модели, а решение продукта: Google хочет раздать инструмент быстрее и считает, что длиннее пока массово не нужно. Более длинные ролики обещают скоро.
Мультимодальные референсы.
В одну генерацию можно смешать несколько изображений, несколько персонажей, несколько голосов.
Текст внутри кадра наконец читается.
В одной из ранних демок профессор пишет на доске математическую формулу, и она математически верна, а не просто похожа на буквы. Это давняя боль всех видеомоделей.
Своя библиотека инструментов.
Внутри Flow можно создавать и шарить кастомные инструменты под свой рабочий процесс на естественном языке. Слева панель с готовыми, можно собрать свои с нуля.
Где брать.
Omni Flash доступен сегодня в приложении Gemini, в Google Flow и в YouTube Shorts.
Платным подпискам полный набор, включая аватары, бесплатно потыкать можно через Shorts и приложение YouTube Create.
Flow, кстати, получает отдельное приложение, его перепаковали под Omni как креативный комбайн.
Важное про лимиты, чтобы никто не разочаровался. Модель тяжёлая.
По ранним тестам два промпта на Omni сжирали 86 процентов дневной квоты на тарифе Gemini Pro.
Именно поэтому Google переезжает с лимитов по числу промптов на лимиты по израсходованным вычислениям.
Простой текстовый промпт ест мало, сложная видеогенерация ест много, лимит обновляется каждые пять часов до недельного потолка.
Цены.
Появился новый тариф AI Ultra за 100 долларов в месяц для тех, кому 20-долларовый Pro мал, а топовый ранее за 250 был жирно.
Старший Ultra одновременно подешевел с 250 до 200, набор фич тот же.
На все ролики из Omni ставится водяной знак SynthID, его теперь читают Google Поиск и Chrome, к системе верификации подключилась и OpenAI.
Сразу оговорюсь: пока пишу по тому, что заявили со сцены и что всплыло в утечках за последнюю неделю. Реальное качество и лимиты увидим, когда сам потыкаю и народ начнёт её ломать.
Что это и как работает.
Берёшь любое фото или видео из галереи, говоришь текстом или голосом что хочешь получить, модель делает. Без отдельных программ, без сложных настроек.
Дальше каждая следующая фраза наслаивается на результат: меняешь мелкие детали или перекраиваешь сцену целиком, не начиная с нуля.
Модель понимает физику и последствия запросов, можно крутить ракурс, окружение, стиль, действие, добавлять персонажей и объекты.
Сегодня вышла версия Omni Flash. Старшая Pro обещана позже, по той же схеме, что и с Nano Banana.
Теперь по фишкам.
Аудио и картинка.
Генерируются за один проход. Раньше у Google под звук шёл отдельный этап.
Omni выдаёт изображение и пространственный звук вместе: шаги попадают в момент приземления ноги, реплики ложатся в губы, фоновый шум комнаты держится сценой.
Если это работает так, как описывают, отпадает половина пост-продакшна.
Повторяемый каст персонажей.
Создаёшь героя с нуля по текстовому промпту или по референсному изображению, привязываешь к нему голос под характер, и потом вызываешь его в любой новый кадр через @имя_персонажа.
Полная визуальная и голосовая согласованность сцена к сцене. То, об что спотыкались все, от Sora до Seedance.
Аватары.
Платным подписчикам открыли экспериментальную функцию Аватар.
Регистрируешь свой аватар, добавляешь своё лицо и свой голос, и потом подставляешь себя в любые свои проекты.
По сути, это твой собственный персонаж в общей системе каста, которого можно вызывать в кадр так же, как любого другого героя через @имя.
Для тех, кто делает контент от первого лица, это закрывает огромную боль: не надо больше снимать себя на камеру под каждый ролик.
Видео в видео.
Загружаешь свой материал и текстом меняешь стиль, обстановку, действия.
Можно вставить себя в чужой клип, перегнать реалистичную съёмку в мультик или аниме, отправить себя гулять по картине эпохи Возрождения. Каждая правка ложится поверх предыдущей.
Кинематографический реализм до 10 секунд за клип.
Это не потолок модели, а решение продукта: Google хочет раздать инструмент быстрее и считает, что длиннее пока массово не нужно. Более длинные ролики обещают скоро.
Мультимодальные референсы.
В одну генерацию можно смешать несколько изображений, несколько персонажей, несколько голосов.
Текст внутри кадра наконец читается.
В одной из ранних демок профессор пишет на доске математическую формулу, и она математически верна, а не просто похожа на буквы. Это давняя боль всех видеомоделей.
Своя библиотека инструментов.
Внутри Flow можно создавать и шарить кастомные инструменты под свой рабочий процесс на естественном языке. Слева панель с готовыми, можно собрать свои с нуля.
Где брать.
Omni Flash доступен сегодня в приложении Gemini, в Google Flow и в YouTube Shorts.
Платным подпискам полный набор, включая аватары, бесплатно потыкать можно через Shorts и приложение YouTube Create.
Flow, кстати, получает отдельное приложение, его перепаковали под Omni как креативный комбайн.
Важное про лимиты, чтобы никто не разочаровался. Модель тяжёлая.
По ранним тестам два промпта на Omni сжирали 86 процентов дневной квоты на тарифе Gemini Pro.
Именно поэтому Google переезжает с лимитов по числу промптов на лимиты по израсходованным вычислениям.
Простой текстовый промпт ест мало, сложная видеогенерация ест много, лимит обновляется каждые пять часов до недельного потолка.
Цены.
Появился новый тариф AI Ultra за 100 долларов в месяц для тех, кому 20-долларовый Pro мал, а топовый ранее за 250 был жирно.
Старший Ultra одновременно подешевел с 250 до 200, набор фич тот же.
На все ролики из Omni ставится водяной знак SynthID, его теперь читают Google Поиск и Chrome, к системе верификации подключилась и OpenAI.
🔥74❤49❤🔥5🤷1
This media is not supported in your browser
VIEW IN TELEGRAM
Google выпустили масштабное обновление Project Genie.
Project Genie - это экспериментальный продукт Google DeepMind, который позволяет создавать и исследовать интерактивные миры в реальном времени по текстовому промпту или картинке.
🔥 Теперь вы можете моделировать миры, основанные на реальных событиях в Google Maps.
Street View: управляйте своими творениями в новой библиотеке и делитесь ими с внешними ресурсами.
Основа Street View: Теперь вы можете создавать миры, начиная с реальных мест.
Коснитесь метки на карте, чтобы выбрать местоположение, и вы можете выбрать стиль, например, «Песчаные пустыни» или «Мир океана».
Опишите своего персонажа, и Genie свяжет ваше начальное местоположение с реальными изображениями.
Библиотека.
Теперь вы можете хранить и организовывать созданные миры. Просматривайте прошлые творения или переделывайте свои любимые, чтобы развивать свои идеи.
Внешний доступ.
Вы можете делиться своими созданными мирами.
Любой может посмотреть видеопревью вашего мира, а подписчики Ultra могут исследовать или переделывать их.
Посмотреть опубликованный мир можно здесь:https://goo.gle/42j85pj (VPN США)
Проект Genie постепенно становится доступен всем подписчикам Google AI Ultra по всему миру.
Подписаться можно здесь:
https://gemini.google/subscriptions/
Или через Google One:
https://one.google.com/about/google-ai-plans/
Что важно знать после вчерашнего анонса на Google I/O 2026:
Теперь есть два тарифа Ultra.
Новый за $100 в месяц (анонсирован вчера, для разработчиков и продвинутых креаторов) и оригинальный за $200 в месяц (раньше был $250) с максимальными лимитами.
Google AI Ultra доступен в более чем 150 странах (России нет).
Google One
Подписываться нужно с личного Google-аккаунта (не Workspace).
Если аккаунта нет - нужно создать.
Project Genie - это экспериментальный продукт Google DeepMind, который позволяет создавать и исследовать интерактивные миры в реальном времени по текстовому промпту или картинке.
Street View: управляйте своими творениями в новой библиотеке и делитесь ими с внешними ресурсами.
Основа Street View: Теперь вы можете создавать миры, начиная с реальных мест.
Коснитесь метки на карте, чтобы выбрать местоположение, и вы можете выбрать стиль, например, «Песчаные пустыни» или «Мир океана».
Опишите своего персонажа, и Genie свяжет ваше начальное местоположение с реальными изображениями.
Библиотека.
Теперь вы можете хранить и организовывать созданные миры. Просматривайте прошлые творения или переделывайте свои любимые, чтобы развивать свои идеи.
Внешний доступ.
Вы можете делиться своими созданными мирами.
Любой может посмотреть видеопревью вашего мира, а подписчики Ultra могут исследовать или переделывать их.
Посмотреть опубликованный мир можно здесь:https://goo.gle/42j85pj (VPN США)
Проект Genie постепенно становится доступен всем подписчикам Google AI Ultra по всему миру.
Подписаться можно здесь:
https://gemini.google/subscriptions/
Или через Google One:
https://one.google.com/about/google-ai-plans/
Что важно знать после вчерашнего анонса на Google I/O 2026:
Теперь есть два тарифа Ultra.
Новый за $100 в месяц (анонсирован вчера, для разработчиков и продвинутых креаторов) и оригинальный за $200 в месяц (раньше был $250) с максимальными лимитами.
Google AI Ultra доступен в более чем 150 странах (России нет).
Google One
Подписываться нужно с личного Google-аккаунта (не Workspace).
Если аккаунта нет - нужно создать.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32❤9🤣2💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Многие после первых тестов обновленной модели генерации видео от Google Gemini Omni начали страдать на тему «Фууу, она не может как Seedance 2.0».
Google идут другим, своим путем и я считаю это правильно, так как у них большая инфраструктура, которая должна быть адаптирована под все будущие обновления.
А они точно будут и будут впечатляющими.
Я уже нашел массу классных вариантов применения Gemini Omni и неспешно, с анализом всех фич, снимаю видео на YouTube канал что бы вы могли успешно использовать новые функции модели.
Google идут другим, своим путем и я считаю это правильно, так как у них большая инфраструктура, которая должна быть адаптирована под все будущие обновления.
А они точно будут и будут впечатляющими.
Я уже нашел массу классных вариантов применения Gemini Omni и неспешно, с анализом всех фич, снимаю видео на YouTube канал что бы вы могли успешно использовать новые функции модели.
🔥137👌27❤26🙏3😁1🤯1😨1💅1
This media is not supported in your browser
VIEW IN TELEGRAM
Пока другие отдыхают, я тружусь в тяжелейших условиях.
🤣101😁39🔥21❤8🫡7💅4