This media is not supported in your browser
VIEW IN TELEGRAM
Гугль Допль
Про Doppl я уже писал.
Это переодеватор от Гугла.
Гугл не успокаивается и продолжает приканчивать стартапы.
Они явно целят в поляну B2C, ибо выпустили только мобильные приложения (и только в US).
Сделали персонализированную ленту Fashion Discovery Feed (чтобы хвастацца), прямые ссылки для покупки одежды (вот это круто) и функцию «Коллекции», которая позволяет сохранять прикиды для будущего использования.
С Нанабананой под подушкой грех не поубивать десяток стартапов, особенно в B2C сегменте...
https://labs.google/doppl
@cgevent
Про Doppl я уже писал.
Это переодеватор от Гугла.
Гугл не успокаивается и продолжает приканчивать стартапы.
Они явно целят в поляну B2C, ибо выпустили только мобильные приложения (и только в US).
Сделали персонализированную ленту Fashion Discovery Feed (чтобы хвастацца), прямые ссылки для покупки одежды (вот это круто) и функцию «Коллекции», которая позволяет сохранять прикиды для будущего использования.
С Нанабананой под подушкой грех не поубивать десяток стартапов, особенно в B2C сегменте...
https://labs.google/doppl
@cgevent
👍19😱19❤6
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка
🛠 Эксперимент: создание авторского трейлера к «Евгению Онегину»
🎨 Автор: Режиссер-оператор Варвара Новченкова
https://www.youtube.com/@TakkiTales
тг @novchenkova
⏱️ Срок: примерно 3 месяца (с перерывами).
🎬 В каждого героя я постаралась вложить душу, передать его чувства и внутренние конфликты.
Буду рада, если это видео отзовётся в вашей душе и заставит по‑новому взглянуть на знакомую со школы историю.
А если вам захочется после просмотра снова открыть «Евгения Онегина» — значит, всё было не зря.
🚀Технологии, которые помогли оживить задумку:
Визуал: Midjourney, Nano Banana, Seedanse, Veo, Kling, Sora, Aleph, Topaz, GPT
Музыка: ElevenLabs + доработка в SUNO
Монтаж: Adobe Premiere Pro
Эффекты(совсем немного): Adobe After Effects
💰 Бюджет: около 6-7 тысяч
📌 Итог: в плане визуала больше всего понравился Seedanse, следование промпту очень даже неплохое, почти не галлюционировал. Но, дорого (если брать нормальное разрешение). На втором месте Veo. Почти не пользовалась Sora, так как у неё image-to-video адекватно не работает. Kling стала использовать только с выходом версии 2.6. В Aleph меняла освещение в одном из кадров. Что касается музыки, то первоначально композиция создана в ElevenLabs. Но в конце были шумы. В Suno сделала продление и вуаля, выдало чисто без шумов. К слову сказать, один раз очень выручил сервис moises (можно разделить композицию на дорожки: музыка, голос, выделить разные инструменты и скачать по отдельности).
@cgevent
🛠 Эксперимент: создание авторского трейлера к «Евгению Онегину»
🎨 Автор: Режиссер-оператор Варвара Новченкова
https://www.youtube.com/@TakkiTales
тг @novchenkova
⏱️ Срок: примерно 3 месяца (с перерывами).
🎬 В каждого героя я постаралась вложить душу, передать его чувства и внутренние конфликты.
Буду рада, если это видео отзовётся в вашей душе и заставит по‑новому взглянуть на знакомую со школы историю.
А если вам захочется после просмотра снова открыть «Евгения Онегина» — значит, всё было не зря.
🚀Технологии, которые помогли оживить задумку:
Визуал: Midjourney, Nano Banana, Seedanse, Veo, Kling, Sora, Aleph, Topaz, GPT
Музыка: ElevenLabs + доработка в SUNO
Монтаж: Adobe Premiere Pro
Эффекты(совсем немного): Adobe After Effects
💰 Бюджет: около 6-7 тысяч
📌 Итог: в плане визуала больше всего понравился Seedanse, следование промпту очень даже неплохое, почти не галлюционировал. Но, дорого (если брать нормальное разрешение). На втором месте Veo. Почти не пользовалась Sora, так как у неё image-to-video адекватно не работает. Kling стала использовать только с выходом версии 2.6. В Aleph меняла освещение в одном из кадров. Что касается музыки, то первоначально композиция создана в ElevenLabs. Но в конце были шумы. В Suno сделала продление и вуаля, выдало чисто без шумов. К слову сказать, один раз очень выручил сервис moises (можно разделить композицию на дорожки: музыка, голос, выделить разные инструменты и скачать по отдельности).
@cgevent
👍71👎37🔥16❤10
Инь-Янь от Хунь-Янь
Полный список языковых и генеративных моделей от дядюшки ХУ.
Любопытно взглянуть сверху на их полный зоопарк: от моделей мира до 3д.
У кого ещё есть такой выводок моделей?
@cgevent
Полный список языковых и генеративных моделей от дядюшки ХУ.
Любопытно взглянуть сверху на их полный зоопарк: от моделей мира до 3д.
У кого ещё есть такой выводок моделей?
@cgevent
👍16🔥6❤3😁3🙏1
Open AI плюс Disney.
Ничего себе!
Дисней вваливает миллиард долларов в Open AI и разрешает использовать\генерить любых своих персонажей.
Сравните со сделкой Warner и Suno. Почувствуйте разницу, так сказать...
https://openai.com/index/disney-sora-agreement/
Ничего себе!
Дисней вваливает миллиард долларов в Open AI и разрешает использовать\генерить любых своих персонажей.
Сравните со сделкой Warner и Suno. Почувствуйте разницу, так сказать...
https://openai.com/index/disney-sora-agreement/
OpenAI
The Walt Disney Company and OpenAI reach landmark agreement to bring beloved characters from across Disney’s brands to Sora
Disney and OpenAI have reached an agreement to bring more than 200 Disney, Marvel, Pixar and Star Wars characters to Sora for fan-inspired short videos. The agreement emphasizes responsible AI in entertainment and includes Disney’s company-wide use of ChatGPT…
🔥92😱21❤13👎9👍7
Forwarded from AI Product | Igor Akimov
GPT-5.2!
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
👍34🔥12👎6❤5😱1
А между тем, Runway ML тихо провел свой Research Demo Day Stream.
Я его послушал и вот вам краткая выжимка.
1. Gen-4.5: Вскоре вы сможете как создавать, так и редактировать исходный звук с помощью Gen-4.5, а также редактировать видео произвольной(?!) длины с помощью многокадрового монтажа (multi-shot editing)
2. General World Model, GWM-1: GWM-1 построен на основе Gen-4.5, но с одним важным отличием — он является авторегрессионным. Он прогнозирует кадр за кадром, основываясь на том, что было ранее. В любой момент вы можете вмешаться с действиями в зависимости от приложения, которые могут заключаться в перемещении в пространстве, управлении роботом-манипулятором или взаимодействии с агентом, и модель будет моделировать то, что произойдет дальше. 720p и 24 fps (но непонятно на каком железе). Еще один игрок на поле Моделей Мира.
3. GWM Robotics — это обучаемый симулятор, который генерирует синтетические данные для масштабируемого обучения роботов. Сделан на основе GWM-1.
4. GWM Worlds. Это модель мира для симуляции окружающей среды в реальном времени.
Вы даете модели статическую сцену, и она генерирует иммерсивное, бесконечное, доступное для исследования пространство с геометрией, освещением и физикой, по которому вы можете перемещаться. Все это происходит в реальном времени. Вы можете путешествовать в любое место, реальное или воображаемое. Вы можете стать любым агентом: человеком, гуляющим по городу, дроном, летящим над заснеженной горой, или роботом, перемещающимся по складу.
5. GWM Avatars - тут они показали нечто очень похожее на Hedra и Live Avatars - говорящие головы и видео большой длины с ними. Причем там не только кожаные головы, но и всякия твари, персонажи, животные и пр. 720р
А теперь спойлер: все это ни хрена не готово и будет готово когда-нибудь. Сроков не назвали.
С мирами у них должно неплохо получиться, они говорили про миры раньше всех, но в последнее время они явно отстают по скорости обновлений.
Смотрите тут: https://www.youtube.com/watch?v=OnXu-6xecxM
Читайте тут: https://runwayml.com/
@cgevent
Я его послушал и вот вам краткая выжимка.
1. Gen-4.5: Вскоре вы сможете как создавать, так и редактировать исходный звук с помощью Gen-4.5, а также редактировать видео произвольной(?!) длины с помощью многокадрового монтажа (multi-shot editing)
2. General World Model, GWM-1: GWM-1 построен на основе Gen-4.5, но с одним важным отличием — он является авторегрессионным. Он прогнозирует кадр за кадром, основываясь на том, что было ранее. В любой момент вы можете вмешаться с действиями в зависимости от приложения, которые могут заключаться в перемещении в пространстве, управлении роботом-манипулятором или взаимодействии с агентом, и модель будет моделировать то, что произойдет дальше. 720p и 24 fps (но непонятно на каком железе). Еще один игрок на поле Моделей Мира.
3. GWM Robotics — это обучаемый симулятор, который генерирует синтетические данные для масштабируемого обучения роботов. Сделан на основе GWM-1.
4. GWM Worlds. Это модель мира для симуляции окружающей среды в реальном времени.
Вы даете модели статическую сцену, и она генерирует иммерсивное, бесконечное, доступное для исследования пространство с геометрией, освещением и физикой, по которому вы можете перемещаться. Все это происходит в реальном времени. Вы можете путешествовать в любое место, реальное или воображаемое. Вы можете стать любым агентом: человеком, гуляющим по городу, дроном, летящим над заснеженной горой, или роботом, перемещающимся по складу.
5. GWM Avatars - тут они показали нечто очень похожее на Hedra и Live Avatars - говорящие головы и видео большой длины с ними. Причем там не только кожаные головы, но и всякия твари, персонажи, животные и пр. 720р
А теперь спойлер: все это ни хрена не готово и будет готово когда-нибудь. Сроков не назвали.
С мирами у них должно неплохо получиться, они говорили про миры раньше всех, но в последнее время они явно отстают по скорости обновлений.
Смотрите тут: https://www.youtube.com/watch?v=OnXu-6xecxM
Читайте тут: https://runwayml.com/
@cgevent
👍24❤15
This media is not supported in your browser
VIEW IN TELEGRAM
Meshy 6 Preview: генерация 3Д-персонажей в T\A-позе по произвольной картинке (плюс риг).
Можно подавать на вход картинку с персонажем в произвольной позе, а Meshy в процессе генерации развернет персонаж в T- или А-позу. См. видео.
Дополнительно они прикрутили примитивную систему для рига персонажей. Там даже есть окошко, напоминающее HumanIK из Maya\Motion Builder, где можно расставить суставы и он вставит скелет в персонажа.
Скелет очень примитивный, нет шеи, спины, пальцев, только ноги и руки из двух костей. Ну и не факт, что это нейрориг, скорее всего обычный алгоритм сетапа персонажей.
Но радует то, что 3Д-генераторы начинают думать дальше, чем 3Д-печать получаемых моделей.
https://www.meshy.ai/
@cgevent
Можно подавать на вход картинку с персонажем в произвольной позе, а Meshy в процессе генерации развернет персонаж в T- или А-позу. См. видео.
Дополнительно они прикрутили примитивную систему для рига персонажей. Там даже есть окошко, напоминающее HumanIK из Maya\Motion Builder, где можно расставить суставы и он вставит скелет в персонажа.
Скелет очень примитивный, нет шеи, спины, пальцев, только ноги и руки из двух костей. Ну и не факт, что это нейрориг, скорее всего обычный алгоритм сетапа персонажей.
Но радует то, что 3Д-генераторы начинают думать дальше, чем 3Д-печать получаемых моделей.
https://www.meshy.ai/
@cgevent
🔥36👍11❤5
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за влоггеров.
Еще один генератор аватаров - Creatify Aurora.
Очередной генератор говорящих голов. Однако в отличие от Хедры, они, похоже, просто юзают чужие API.
Изначально компания занималась и занимается генерацией рекламных видео на основе коммерческих генераторов типа Veo или Kling.
Похоже кожаным влоггерам придется изобретать специальные визуальные коды типа покрутить шеей на 360 или укусить себя за палец, чтобы обозначить, что они кожаные. Ибо все нейроблоггеры довольно одинаково трясут головой, а эмоции живут отдельно от контекста. И пока они выучат кусание за палец, кожаные придумают новые коды.
Впрочем, кто на них смотрит? Их же слушают, не? В машине, на работе, фоном...
https://creatify.ai/features/ai-avatar
@cgevent
Еще один генератор аватаров - Creatify Aurora.
Очередной генератор говорящих голов. Однако в отличие от Хедры, они, похоже, просто юзают чужие API.
Изначально компания занималась и занимается генерацией рекламных видео на основе коммерческих генераторов типа Veo или Kling.
Похоже кожаным влоггерам придется изобретать специальные визуальные коды типа покрутить шеей на 360 или укусить себя за палец, чтобы обозначить, что они кожаные. Ибо все нейроблоггеры довольно одинаково трясут головой, а эмоции живут отдельно от контекста. И пока они выучат кусание за палец, кожаные придумают новые коды.
Впрочем, кто на них смотрит? Их же слушают, не? В машине, на работе, фоном...
https://creatify.ai/features/ai-avatar
@cgevent
😁20🔥5👎2❤1👍1