Метаверсище и ИИще

Гугль Допль

Про Doppl я уже писал.
Это переодеватор от Гугла.

Гугл не успокаивается и продолжает приканчивать стартапы.

Они явно целят в поляну B2C, ибо выпустили только мобильные приложения (и только в US).

Сделали персонализированную ленту Fashion Discovery Feed (чтобы хвастацца), прямые ссылки для покупки одежды (вот это круто) и функцию «Коллекции», которая позволяет сохранять прикиды для будущего использования.

С Нанабананой под подушкой грех не поубивать десяток стартапов, особенно в B2C сегменте...

https://labs.google/doppl

@cgevent

👍19😱19❤6

8.52K viewsSergey Tsyptsyn ️️, 09:01

Метаверсище и ИИще

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

7.95K viewsSergey Tsyptsyn ️️, 11:01

#Нейропрожарка

🛠 Эксперимент: создание авторского трейлера к «Евгению Онегину»
🎨 Автор: Режиссер-оператор Варвара Новченкова
https://www.youtube.com/@TakkiTales
тг @novchenkova

⏱️ Срок: примерно 3 месяца (с перерывами).
🎬 В каждого героя я постаралась вложить душу, передать его чувства и внутренние конфликты.
Буду рада, если это видео отзовётся в вашей душе и заставит по‑новому взглянуть на знакомую со школы историю.
А если вам захочется после просмотра снова открыть «Евгения Онегина» — значит, всё было не зря.

🚀Технологии, которые помогли оживить задумку:

Визуал: Midjourney, Nano Banana, Seedanse, Veo, Kling, Sora, Aleph, Topaz, GPT
Музыка: ElevenLabs + доработка в SUNO
Монтаж: Adobe Premiere Pro
Эффекты(совсем немного): Adobe After Effects

💰 Бюджет: около 6-7 тысяч
📌 Итог: в плане визуала больше всего понравился Seedanse, следование промпту очень даже неплохое, почти не галлюционировал. Но, дорого (если брать нормальное разрешение). На втором месте Veo. Почти не пользовалась Sora, так как у неё image-to-video адекватно не работает. Kling стала использовать только с выходом версии 2.6. В Aleph меняла освещение в одном из кадров. Что касается музыки, то первоначально композиция создана в ElevenLabs. Но в конце были шумы. В Suno сделала продление и вуаля, выдало чисто без шумов. К слову сказать, один раз очень выручил сервис moises (можно разделить композицию на дорожки: музыка, голос, выделить разные инструменты и скачать по отдельности).

@cgevent

👍71👎37🔥16❤10

8.76K viewsSergey Tsyptsyn ️️, edited 14:01

Метаверсище и ИИще

Инь-Янь от Хунь-Янь

Полный список языковых и генеративных моделей от дядюшки ХУ.

Любопытно взглянуть сверху на их полный зоопарк: от моделей мира до 3д.

У кого ещё есть такой выводок моделей?

@cgevent

👍16🔥6❤3😁3🙏1

7.89K viewsSergey Tsyptsyn ️️, 14:44

Метаверсище и ИИще

Open AI плюс Disney.

Ничего себе!

Дисней вваливает миллиард долларов в Open AI и разрешает использовать\генерить любых своих персонажей.

Сравните со сделкой Warner и Suno. Почувствуйте разницу, так сказать...

https://openai.com/index/disney-sora-agreement/

OpenAI

The Walt Disney Company and OpenAI reach landmark agreement to bring beloved characters from across Disney’s brands to Sora

Disney and OpenAI have reached an agreement to bring more than 200 Disney, Marvel, Pixar and Star Wars characters to Sora for fan-inspired short videos. The agreement emphasizes responsible AI in entertainment and includes Disney’s company-wide use of ChatGPT…

🔥92😱21❤13👎9👍7

8.62K viewsSergey Tsyptsyn ️️, 15:55

Метаверсище и ИИще

Forwarded from AI Product | Igor Akimov

GPT-5.2!

Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.

• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%

Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.

Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.

Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.

GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.

https://openai.com/index/introducing-gpt-5-2/

👍34🔥12👎6❤5😱1

7.08K viewsSergey Tsyptsyn ️️, 19:41

This media is not supported in your browser

VIEW IN TELEGRAM

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

А между тем, Runway ML тихо провел свой Research Demo Day Stream.

Я его послушал и вот вам краткая выжимка.

1. Gen-4.5: Вскоре вы сможете как создавать, так и редактировать исходный звук с помощью Gen-4.5, а также редактировать видео произвольной(?!) длины с помощью многокадрового монтажа (multi-shot editing)

2. General World Model, GWM-1: GWM-1 построен на основе Gen-4.5, но с одним важным отличием — он является авторегрессионным. Он прогнозирует кадр за кадром, основываясь на том, что было ранее. В любой момент вы можете вмешаться с действиями в зависимости от приложения, которые могут заключаться в перемещении в пространстве, управлении роботом-манипулятором или взаимодействии с агентом, и модель будет моделировать то, что произойдет дальше. 720p и 24 fps (но непонятно на каком железе). Еще один игрок на поле Моделей Мира.

3. GWM Robotics — это обучаемый симулятор, который генерирует синтетические данные для масштабируемого обучения роботов. Сделан на основе GWM-1.

4. GWM Worlds. Это модель мира для симуляции окружающей среды в реальном времени.

Вы даете модели статическую сцену, и она генерирует иммерсивное, бесконечное, доступное для исследования пространство с геометрией, освещением и физикой, по которому вы можете перемещаться. Все это происходит в реальном времени. Вы можете путешествовать в любое место, реальное или воображаемое. Вы можете стать любым агентом: человеком, гуляющим по городу, дроном, летящим над заснеженной горой, или роботом, перемещающимся по складу.

5. GWM Avatars - тут они показали нечто очень похожее на Hedra и Live Avatars - говорящие головы и видео большой длины с ними. Причем там не только кожаные головы, но и всякия твари, персонажи, животные и пр. 720р

А теперь спойлер: все это ни хрена не готово и будет готово когда-нибудь. Сроков не назвали.

С мирами у них должно неплохо получиться, они говорили про миры раньше всех, но в последнее время они явно отстают по скорости обновлений.

Смотрите тут: https://www.youtube.com/watch?v=OnXu-6xecxM

Читайте тут: https://runwayml.com/

@cgevent

👍24❤15

8.67K viewsSergey Tsyptsyn ️️, 20:10

Метаверсище и ИИще

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

Meshy 6 Preview: генерация 3Д-персонажей в T\A-позе по произвольной картинке (плюс риг).

Можно подавать на вход картинку с персонажем в произвольной позе, а Meshy в процессе генерации развернет персонаж в T- или А-позу. См. видео.

Дополнительно они прикрутили примитивную систему для рига персонажей. Там даже есть окошко, напоминающее HumanIK из Maya\Motion Builder, где можно расставить суставы и он вставит скелет в персонажа.
Скелет очень примитивный, нет шеи, спины, пальцев, только ноги и руки из двух костей. Ну и не факт, что это нейрориг, скорее всего обычный алгоритм сетапа персонажей.

Но радует то, что 3Д-генераторы начинают думать дальше, чем 3Д-печать получаемых моделей.

https://www.meshy.ai/

@cgevent

🔥36👍11❤5

8.05K viewsSergey Tsyptsyn ️️, 10:14

Метаверсище и ИИще