Please open Telegram to view this post
VIEW IN TELEGRAM
😁5🤯4👍2🤡1
Как анимационная студия вместе с Google DeepMind сделала впечатляющий ролик (и что из этого взять себе)
Ладно перейдем от брейнрота к качеству -> короткометражка «Dear Upstairs Neighbors» была показана на Sundance Film Festival.
Задача команды была проверить, как генеративные инструменты можно встроить в пайплайн художников так, чтобы не потерять контроль (ведь генерация часто непредсказуема).
Сам ролик → LINK
Проект: коллаб ветеранов анимации и исследователей Google DeepMind. Режиссёр: Connie He (экс‑Pixar). Авторы статьи: Cassidy Curtis (supervising animator) и Sarah Rumbley (VFX supervisor). И в целом напоминает вот этот проект, так что это не революция, а подтверждения стандарта.
💗 🧑🎓 Что сработало в продакшене
1) Настройка под стиль (fine‑tune)
Чтобы персонаж выглядел стабильно, команда дообучила кастомные модели Veo и Imagen на собственном арте (вот это конечно повезло, интересно сколько стоило делать Lora на Veo и Imagen)
2) Гибридный пайплайн, а не “текст → магия”
Черновую анимацию делали привычно: Maya, TVPaint и др.
Дальше исследователи прогоняли материал через fine‑tuned Veo/Imagen (для Imagen: кастомный workflow на ComfyUI ВОУ!).
А на монтаже спокойно переключались между генерацией и обычными инструментами (упоминается Premiere).
3) Итерации без перегенерации всего кадра
Ни один шот не получился в один клик. Чтобы не пересобирать всё заново, сделали локальные правки: редактировали конкретные области кадра с регулируемой степенью контроля.
😚 😚 Пример: маской просили Veo доделать кусок волос в нужной зоне.
👍 Что можно забрать себе в продакшен даже если используете NanoBanana или Wan 2.2:
— Зафиксируйте художественные правила как спецификацию: силуэт, пропорции, палитры по состояниям, список “что нельзя ломать”.
— Соберите маленький, но чистый датасет для fine‑tune или для референс кадров: несколько сильных эталонов лучше бесконечных промптов.
— Переходите от text‑only к video‑to‑video: движение задаёт аниматор, генерация отвечает за стиль.
— Правьте точечно (маски/региональные правки/частичная перегенерация), иначе итерации становятся слишком дорогими.
— Отделяйте финальный мастеринг от стилизации: сначала стиль/перфоманс, потом апскейл (например до 4K) с контролем сохранения художественного языка.
🥲 ☺️ 😊
Полная статья о проекте
и полный ролик -> https://www.youtube.com/watch?v=eCk5VFKKz08
Ладно перейдем от брейнрота к качеству -> короткометражка «Dear Upstairs Neighbors» была показана на Sundance Film Festival.
Задача команды была проверить, как генеративные инструменты можно встроить в пайплайн художников так, чтобы не потерять контроль (ведь генерация часто непредсказуема).
Сам ролик → LINK
Проект: коллаб ветеранов анимации и исследователей Google DeepMind. Режиссёр: Connie He (экс‑Pixar). Авторы статьи: Cassidy Curtis (supervising animator) и Sarah Rumbley (VFX supervisor). И в целом напоминает вот этот проект, так что это не революция, а подтверждения стандарта.
1) Настройка под стиль (fine‑tune)
Чтобы персонаж выглядел стабильно, команда дообучила кастомные модели Veo и Imagen на собственном арте (вот это конечно повезло, интересно сколько стоило делать Lora на Veo и Imagen)
2) Гибридный пайплайн, а не “текст → магия”
Черновую анимацию делали привычно: Maya, TVPaint и др.
Дальше исследователи прогоняли материал через fine‑tuned Veo/Imagen (для Imagen: кастомный workflow на ComfyUI ВОУ!).
А на монтаже спокойно переключались между генерацией и обычными инструментами (упоминается Premiere).
3) Итерации без перегенерации всего кадра
Ни один шот не получился в один клик. Чтобы не пересобирать всё заново, сделали локальные правки: редактировали конкретные области кадра с регулируемой степенью контроля.
— Зафиксируйте художественные правила как спецификацию: силуэт, пропорции, палитры по состояниям, список “что нельзя ломать”.
— Соберите маленький, но чистый датасет для fine‑tune или для референс кадров: несколько сильных эталонов лучше бесконечных промптов.
— Переходите от text‑only к video‑to‑video: движение задаёт аниматор, генерация отвечает за стиль.
— Правьте точечно (маски/региональные правки/частичная перегенерация), иначе итерации становятся слишком дорогими.
— Отделяйте финальный мастеринг от стилизации: сначала стиль/перфоманс, потом апскейл (например до 4K) с контролем сохранения художественного языка.
Полная статья о проекте
и полный ролик -> https://www.youtube.com/watch?v=eCk5VFKKz08
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤7
Forwarded from Ai molodca (Dobrokotov)
Nano Banana 2 vs. Nano Banana Pro vs. Seedream 5 lite
(картинки именно в таком порядке)
Навыходило обновлений! Решил устроить им очную ставку на одном из своих стресс-тестов.
Что тест проверяет: точный текст и типографическая иерархия, пространственная логика, анатомия, контроль количества, цветовая точность, физика света, мульти-референс консистентность.
Промт ~3000 символов. Если коротко:
На удивление вторая банана выступила вполне на уровне ПРО, но напоминаю, что промт довольно большой. Думал сильно хуже будет. Учитывая, что это базовая дешевая модель по умолчанию, весьма хорошо. Сидрим вполне хорошо понимает пространственную логику, но какая-то беда со стилем. Еще попробовал Reve, но там что-то грустно совсем, так и не понял выкатили ли новую модель для редактирования.
Если кому интересно, полный промт в комментах.
(картинки именно в таком порядке)
Навыходило обновлений! Решил устроить им очную ставку на одном из своих стресс-тестов.
Что тест проверяет: точный текст и типографическая иерархия, пространственная логика, анатомия, контроль количества, цветовая точность, физика света, мульти-референс консистентность.
Промт ~3000 символов. Если коротко:
Фотореалистичная сцена в советской квартире 1980-х. Человек (лицо из Ref 1, одежда из Ref 2) сидит за столом и держит перед собой двумя руками ровный вертикальный постер с точным текстом. Один источник света (лампа на столе слева) — все тени падают вправо.
На столе ровно 7 предметов со строгими позициями: зелёная книга в центре с очками сверху, перед ней стакан воды с преломлённой ложкой, слева красная кружка, справа газета, сзади смартфон. Справа стеклянный шкаф с корректными отражениями.
На удивление вторая банана выступила вполне на уровне ПРО, но напоминаю, что промт довольно большой. Думал сильно хуже будет. Учитывая, что это базовая дешевая модель по умолчанию, весьма хорошо. Сидрим вполне хорошо понимает пространственную логику, но какая-то беда со стилем. Еще попробовал Reve, но там что-то грустно совсем, так и не понял выкатили ли новую модель для редактирования.
Если кому интересно, полный промт в комментах.
❤6🔥4🤡3
Media is too big
VIEW IN TELEGRAM
WINTERGATAN: музыка из шариков, инженерный кошмар и один из самых безумно красивых проектов YouTube
Wintergatan — шведский музыкальный проект Мартина Молина. Название переводится как «Млечный путь». Больше всего их знают по Marble Machine: механической музыкальной машине с металлическими шариками. То есть сочетание Машины Голдберга (или chain-reaction machine или marble course) и музыкальной машины. Создавая человек-оркестр.
☺️ Что особенно интересно:
• Идея Marble Machine пришла Молину после визита в музей механической музыки Speelklok в Утрехте. Изначально он думал, что закончит проект к Рождеству, но в итоге на первую машину ушло больше года.
• Первая Marble Machine (она как раз в видео) строилась почти без нормальных чертежей: много импровизации, ручной подгонки и решений «на глаз». На съёмку финального видео ушло ещё около 60 дней, а потом ещё 60 дней на его переделку. LINK
• Внутри машины было около 2000 металлических шариков. Она играла на вибрафоне, электробасе и перкуссии. По оценке Молина, на сборку ушло примерно 3000 деталей, 3000 шурупов, 500 LEGO-элементов и 5 больших листов берёзовой фанеры.
• Один из самых жёстких фактов: в процессе работы Молин понял, что верхняя часть конструкции не заработает, и за несколько часов уничтожил примерно 6 месяцев уже сделанной работы.
• Самая большая «драма» этой истории — не скандалы, а инженерия. Оригинальная Marble Machine оказалась слишком капризной для концертов и гастролей. Поэтому в 2017 году Молин начал строить Marble Machine X, улучшенную туровую версию. Прогресс он показывал в еженедельных видео на YouTube.
• Но MMX тоже превратилась в инженерный ад: спустя годы новые проблемы продолжали появляться даже после исправления старых. В какой-то момент стало ясно, что мировой тур с ней почти нереален.
• Почему это вообще так сложно? Потому что для точной музыки шарики нужно контролировать почти с точностью до 1 миллисекунды. Сам Молин говорил, что marble machine — это «почти худшее возможное решение» для создания музыки, а шарики, по его словам, «ведут себя как вода» и постоянно находят способ сорвать механику. LINK
• И всё же проект не умер: у Wintergatan есть открытые CAD-файлы MMX, отдельная документация по Marble Machine 3, а вокруг машины выросло настоящее инженерно-музыкальное комьюнити.
• У них есть полноценный альбом Wintergatan (2013), треки Sommarfågel, Starmachine2000, All Was Well, а ещё серия Music Machine Mondays про старые механические инструменты.
Wintergatan — это история о человеке, который много лет пытается заставить почти невозможную механическую систему играть живую музыку. И именно из-за этой смеси музыки, безумия, упрямства и инженерной боли проект стал культовым.
👀 Увидел пост на реддите и решил скрасить субботний день, инженерной красотой в сочетании с приятной музыкой. А ещё такие сложные инженерные вещи практически нереально сделать через AI текстовые видеомодельки, а вот через Blender будет сложно, но возможно.
Wintergatan — шведский музыкальный проект Мартина Молина. Название переводится как «Млечный путь». Больше всего их знают по Marble Machine: механической музыкальной машине с металлическими шариками. То есть сочетание Машины Голдберга (или chain-reaction machine или marble course) и музыкальной машины. Создавая человек-оркестр.
• Идея Marble Machine пришла Молину после визита в музей механической музыки Speelklok в Утрехте. Изначально он думал, что закончит проект к Рождеству, но в итоге на первую машину ушло больше года.
• Первая Marble Machine (она как раз в видео) строилась почти без нормальных чертежей: много импровизации, ручной подгонки и решений «на глаз». На съёмку финального видео ушло ещё около 60 дней, а потом ещё 60 дней на его переделку. LINK
• Внутри машины было около 2000 металлических шариков. Она играла на вибрафоне, электробасе и перкуссии. По оценке Молина, на сборку ушло примерно 3000 деталей, 3000 шурупов, 500 LEGO-элементов и 5 больших листов берёзовой фанеры.
• Один из самых жёстких фактов: в процессе работы Молин понял, что верхняя часть конструкции не заработает, и за несколько часов уничтожил примерно 6 месяцев уже сделанной работы.
• Самая большая «драма» этой истории — не скандалы, а инженерия. Оригинальная Marble Machine оказалась слишком капризной для концертов и гастролей. Поэтому в 2017 году Молин начал строить Marble Machine X, улучшенную туровую версию. Прогресс он показывал в еженедельных видео на YouTube.
• Но MMX тоже превратилась в инженерный ад: спустя годы новые проблемы продолжали появляться даже после исправления старых. В какой-то момент стало ясно, что мировой тур с ней почти нереален.
• Почему это вообще так сложно? Потому что для точной музыки шарики нужно контролировать почти с точностью до 1 миллисекунды. Сам Молин говорил, что marble machine — это «почти худшее возможное решение» для создания музыки, а шарики, по его словам, «ведут себя как вода» и постоянно находят способ сорвать механику. LINK
• И всё же проект не умер: у Wintergatan есть открытые CAD-файлы MMX, отдельная документация по Marble Machine 3, а вокруг машины выросло настоящее инженерно-музыкальное комьюнити.
• У них есть полноценный альбом Wintergatan (2013), треки Sommarfågel, Starmachine2000, All Was Well, а ещё серия Music Machine Mondays про старые механические инструменты.
Wintergatan — это история о человеке, который много лет пытается заставить почти невозможную механическую систему играть живую музыку. И именно из-за этой смеси музыки, безумия, упрямства и инженерной боли проект стал культовым.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤19👍1
Нейросети и Блендер
WINTERGATAN: музыка из шариков, инженерный кошмар и один из самых безумно красивых проектов YouTube Wintergatan — шведский музыкальный проект Мартина Молина. Название переводится как «Млечный путь». Больше всего их знают по Marble Machine: механической музыкальной…
И конечно text2video тесты:
через Sora 2. Kling 3.0, Seedance 2.0 (порядок соблюден)
Физика плывет у каждой модельки
промпт:
Если у вас получится сделать красоту из видеомоделей, скинуть в личку канала☺️
через Sora 2. Kling 3.0, Seedance 2.0 (порядок соблюден)
Физика плывет у каждой модельки
промпт:
A highly detailed cinematic marble music course inside a handcrafted mechanical instrument machine. Hundreds of polished steel marbles travel through intricate wooden rails, brass guides, vibraphone bars, suspended bells, chimes, drum triggers, resonant strings, and miniature percussion mechanisms. Every marble movement physically creates sound: marbles strike tuned metal bars, activate tiny hammers, spin ratchets, tap cymbals, bounce across tuned wooden blocks, and trigger visible mechanical linkages in precise rhythm.
The machine feels real and engineered, not like a toy or fantasy object. Materials are tactile and premium: birch wood, brushed brass, polished steel, felt dampers, rubber belts, machined gears, springs, screws, and worn instrument surfaces. The marbles have realistic weight, friction, momentum, collision, and slightly imperfect motion. The structure is dense, layered, elegant, and believable.
Camera begins with a slow macro cinematic push-in through the upper section of the machine, revealing marbles entering from a rotating feeder. It follows one lead marble as it drops through a sequence of musical interactions. The camera glides alongside the marble with shallow depth of field, weaving through rails and instruments, then widens to reveal multiple synchronized pathways where dozens of marbles create a cascading orchestral pattern. End on a semi-wide shot of the full machine in motion, with several marble lanes running simultaneously and rhythmic mechanical choreography clearly visible.
Lighting is warm workshop-meets-stage lighting: soft golden highlights, subtle volumetric dust, rich shadows, cinematic contrast, bright glints on steel marbles, and gentle reflections on brass and varnished wood. The atmosphere feels magical but physically grounded, like a premium documentary about a museum-grade mechanical masterpiece.
Motion should feel smooth, hypnotic, precise, and musically satisfying. Emphasize realistic chain reactions, visible cause-and-effect mechanics, synchronized timing, and tactile detail. No cartoon physics, no plastic toy look, no simplified geometry, no people, no speech.
Sound design: crisp marble clicks, resonant vibraphone notes, delicate bell tones, light drum taps, wooden knocks, gear whirs, spring tension sounds, subtle room resonance, immersive mechanical musical ambience.
Style: ultra-realistic, cinematic, tactile, precision-engineered, mesmerizing, high-end documentary aesthetic.
Если у вас получится сделать красоту из видеомоделей, скинуть в личку канала
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7😁7💊4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
На Reddit завирусился отличный пример разоблачения:
скаммера с дипфейк-лицом попросили поднести 3 пальца к лицу просто чтобы подтвердить, что перед ними не AI.
👍 На этом моменте он просто вышел из звонка.
Если хотите быстрее вычислять таких ребят, вот ещё пара простых проверок:
• попросите человека повернуть голову вбок или назад. На таких движениях AI модельки часто начинают сыпаться
• внимательно посмотрите на волосы, линию роста волос и края лица. Там артефакты часто заметнее всего
🚨 Если бы Kling 3.0 или Seedance 2.0 могли бы в realtime, то тут уже наверное я бы попросил дверь открыть или покрутиться на кресле раз 5.
скаммера с дипфейк-лицом попросили поднести 3 пальца к лицу просто чтобы подтвердить, что перед ними не AI.
Если хотите быстрее вычислять таких ребят, вот ещё пара простых проверок:
• попросите человека повернуть голову вбок или назад. На таких движениях AI модельки часто начинают сыпаться
• внимательно посмотрите на волосы, линию роста волос и края лица. Там артефакты часто заметнее всего
Please open Telegram to view this post
VIEW IN TELEGRAM
😁13👍9❤3🎄2💊1
Нашёл интересный проект - top3d.ai.
Ребята сделали слепую арену для сравнения 3D AI генераторов. Работает просто: две модели рядом, названия скрыты, голосуешь за лучшую. Уже больше 100 000 голосов.
Залип на лидерборде и вот что заметил:
🥵 Лидер рейтинга сменился буквально за 10 дней - вышла новая версия YVO3D и перетасовала всё
🥵 Open-source инструменты (Hunyuan, стабильно держатся в топе - платные не всегда выигрывают
🥵 Разница между топами - считанные очки ELO. Одно обновление и ситуация меняется
🥵 Самое интересное - некоторые генераторы делают отличную геометрию но слабые текстуры, и наоборот. Универсального лидера пока нет
Ещё у них появились два новых режима:
🧩 Segmentation - сравнение качества разбивки моделей на части
🧊 Low Poly - отдельный рейтинг для low-poly
☺️ Плюс на страницах инструментов бывают промо-коды на скидки.
В целом если работаете с 3D AI - полезная платформа чтобы понимать что сейчас реально работает, ещё и полностью бесплатно.
ссылка
#AI #3D #Blender #нейросети #benchmark
Ребята сделали слепую арену для сравнения 3D AI генераторов. Работает просто: две модели рядом, названия скрыты, голосуешь за лучшую. Уже больше 100 000 голосов.
Залип на лидерборде и вот что заметил:
Ещё у них появились два новых режима:
🧩 Segmentation - сравнение качества разбивки моделей на части
🧊 Low Poly - отдельный рейтинг для low-poly
В целом если работаете с 3D AI - полезная платформа чтобы понимать что сейчас реально работает, ещё и полностью бесплатно.
ссылка
#AI #3D #Blender #нейросети #benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10🤯4❤1
⚠️ Про закрытие Sora 2 уже многие слышали, но важные даты знают не все.
🚨 Если у вас сервисы, пайплайны или внутренние инструменты были завязаны на Sora 2, стоит проверить это уже сейчас:
— через сайт и приложение Sora можно будет генерировать только до 26 апреля 2026 года;
— через API: до 24 сентября 2026 года.
До отключения веб-версии осталось меньше месяца, так что лучше не откладывать миграцию и сохранить нужный контент заранее.
🤗 Слопа, который можно было генерить бесплатно станет меньше
LINK , Extra LINK
— через сайт и приложение Sora можно будет генерировать только до 26 апреля 2026 года;
— через API: до 24 сентября 2026 года.
До отключения веб-версии осталось меньше месяца, так что лучше не откладывать миграцию и сохранить нужный контент заранее.
LINK , Extra LINK
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2🤯2
Forwarded from Ai molodca (Dobrokotov)
На Freepik недавно появилась дико полезная приблуда для профиков нейро-видео. Рассказываю (и показываю) суть.
3D stages (находится в all tools) позволяет загрузить ваш кадр (в примере — сижу на диване) и полетать по его трехмерной, чуть упрощенной, версии.
Параллельно можно крутить фокусное расстояние, диафрагму и стили, чтобы рендерить удачные ракурсы.
Для чего? Точный контроль камеры! Все как на мясных съемках. Находите удачные кадры, допиливаете нанобананами — камера, мотор,снято сгенерировано.
3D stages (находится в all tools) позволяет загрузить ваш кадр (в примере — сижу на диване) и полетать по его трехмерной, чуть упрощенной, версии.
Параллельно можно крутить фокусное расстояние, диафрагму и стили, чтобы рендерить удачные ракурсы.
Для чего? Точный контроль камеры! Все как на мясных съемках. Находите удачные кадры, допиливаете нанобананами — камера, мотор,
🔥31
Промптеры, узнаете себя?
☺️ Вот вы, уже в Popular Mechanics, в февральском номере 1930 года. На соседних страницах были продающие слоганы про то, как научиться пользоваться электричеством без книг и учителей, почти соверемнный инфобизнес из 1930-х, и заметка об останках фараона. И среди всего этого затесался текст о Magic Wand of the Opera про Chicago Civic Opera House.
«Промптер» старше «вайбкодера» не на пару лет, а примерно на 585.💥
OED даёт самое раннее известное употребление prompter в 1440 году. Etymonline показывает, как дальше менялся смысл: в 1540-х это тот, кто побуждает к действию, в 1590-х тот, кто помогает оратору или чтецу, а около 1600 года уже конкретно театральный prompter.
И тут самое интересное. Почему «промптер» не сводится к «подсказчику»? Исторически в слове важна не только подсказка, но и импульс. Merriam-Webster до сих пор даёт у prompt первое значение: to move to action, incite. А Etymonline ведёт слово к латинскому promere, то есть «выносить наружу», «извлекать». Получается, prompt это не просто шпаргалка. Это то, что вытягивает наружу ответ, речь, действие, реакцию.🐈⬛
👍 Поэтому слово так легко мигрировало между эпохами. Сначала оно относилось к побуждению вообще. Потом к памяти и речи: промптер помогал человеку выдать следующую реплику. Позже в вычислительной культуре prompt стал приглашением к вводу.
А в AI prompt превратился в инструкцию, которая задаёт, что именно модель породит: текст, изображение, код, структуру ответа. Смысл при этом почти не изменился: словом запустить чужой ответ. Сначала человеческий, теперь машинный.
И вот тут «вайбкодер» звучит сильно менее элитно: слово одного технологического сезона. Collins назвал vibe coding словом 2025 года, а Merriam-Webster описывает его как недавно возникший термин.
👍 У промптера за спиной театр, риторика, телевидение, командная строка и AI.
🥁 Так что если совсем коротко: вайбкодер говорит машине «сделай что-нибудь по ощущениям». Промптер знает, как словом вызвать нужную реплику, нужное действие и нужный результат. Звучит уже не как мем, а как ремесло.
А вы кто?
за промтера кидаем огонек, за вайбкодера лайк
«Промптер» старше «вайбкодера» не на пару лет, а примерно на 585.
OED даёт самое раннее известное употребление prompter в 1440 году. Etymonline показывает, как дальше менялся смысл: в 1540-х это тот, кто побуждает к действию, в 1590-х тот, кто помогает оратору или чтецу, а около 1600 года уже конкретно театральный prompter.
И тут самое интересное. Почему «промптер» не сводится к «подсказчику»? Исторически в слове важна не только подсказка, но и импульс. Merriam-Webster до сих пор даёт у prompt первое значение: to move to action, incite. А Etymonline ведёт слово к латинскому promere, то есть «выносить наружу», «извлекать». Получается, prompt это не просто шпаргалка. Это то, что вытягивает наружу ответ, речь, действие, реакцию.
А в AI prompt превратился в инструкцию, которая задаёт, что именно модель породит: текст, изображение, код, структуру ответа. Смысл при этом почти не изменился: словом запустить чужой ответ. Сначала человеческий, теперь машинный.
И вот тут «вайбкодер» звучит сильно менее элитно: слово одного технологического сезона. Collins назвал vibe coding словом 2025 года, а Merriam-Webster описывает его как недавно возникший термин.
А вы кто?
за промтера кидаем огонек, за вайбкодера лайк
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍10🤡5💊4😁1🤯1