Метаверсище и ИИще
47.7K subscribers
6.04K photos
4.51K videos
46 files
6.94K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Интересное применение Нанабананы - тот самый бесконечный зум

Примечательно, что это все упаковано в приложение на AI Google Studio, где можно подгрузить свою картинку и делать этот зум над ее участками, просто выделяя нужную область.
Осторожно, очень залипательно - можно долго смотреть в какие дебри это все приводит.

Пробуем тут (генерация не очень быстрая, видео сильно ускорено):
https://aistudio.google.com/apps/bundled/enhance?showPreview=true&showAssistant=true

@cgevent
79🔥38👍19👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Tripo V3.0 Ultra

Упор на текстуры и тонкие детали.

Показывают сетку в 2М полигонов.

Но зачем?

studio.tripo3d.ai

@cgevent
🔥34😁11
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Гугол снова выкатил интересную штуку — Learn Your Way.

Суть: берём скучную главу из нудного учебника, кормим её нейроночкам, а на выходе получаем эту же главу, но так, будто её делали специально под вас и ваши интересы.

Фанат баскетбола? Законы Ньютона объясняются через мяч и кольцо. Любишь искусство? Экономика превращается в торги картинами.

И это не просто подстановка новых примеров. Оно делает разные форматы: mindmap для визуалов, аудиоуроки в стиле "учитель — ученик", интерактивные таймлайны, тесты, которые меняются под твои фейлы и т.д.

Ну и сразу же, не отходя от кассы провели эксперимент: взяли 60 школьников из Чикаго, рандомно поделили на две группы. Одним дали обычный PDF, другие же пользовались сабжем. 20–40 минут на чтение, потом тест. Через три дня ещё один тест.

📊 Результаты:
– сразу после изучения: у ИИ-учебника средний балл 77%, у обычного — 64%
– через три дня: те же 77% против 64%
– 100% сказали, что материал было проще понимать (у обычного учебника — 70%)
– 90% отметили, что им реально понравилось (у обычного учебника — 57%)

Скорее бы курс по линалу в виде моих любимых мемов про пиво.

тут можно посмотреть демки, скриншоты и ознакомиться подробнее.
5🔥104👍2521👎4
Grok-4 Fast теперь имеет контекстное окно в ДВА Миллиона токенов.

Два года назад такие цифры казались фантастикой.

Быстро летит время.

@cgevent
👍46😱15🔥148👎2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Runway бахнул бесплатный курс AI for Gaming

О том, как эффективно интегрировать набор генеративных ИИ-решений Runway в полный цикл разработки игр. От первоначальных исследований концепции до производственных ресурсов и рекламных роликов

Пять лекций:

Adding Motion to Concept Art

Character Dialogue Simulation

Concept Art for Level Design

Expanding your Gaming Asset Library

Texture Creation and Simulation

Пригодится и тем, кто пользует другие генераторы

https://runwayml.com/ai-for-gaming

@cgevent
1🔥5319👍12👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Шах и мат, криворукие кожаные.

Вам без маникюра такое недоступно..

Скрал у @derplearning

@cgevent
27😁17👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Новости от Хуньяньского

Hunyuan3D-Omni: модель для генерации 3D-объектов с КонтролНетами.

Все бы ничего, только это Hunyuan 2.1 с обвесом из ControlNet

А мы уже отравлены новостями про 3.0 и Hunyuan 3D Studio

КонтролНеты:

по одному изображению для позы для ерсонажей и аватаров
по облаку точек
через bounding box: задаёт пропорции объекта
по вокселям: задание топологии

Все это было в Rodin

Ждем версию для 3.0

https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni

@cgevent
🔥157👍5
Новости от Хуньяньского

HunyuanImage 3.0


Тут есть две пачки новостей, хорошая и плохая.

Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)

Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.

HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.

В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.

Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность


Все это я проверил на ОДНОМ примере.

Вместо промпта написал ей:
solve this:
8x + 10 = 18
and make picture with solution


Результат вы видите в шапке поста. Впечатляет.

Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).

В общем выглядит прельстивейше.

А теперь Чорные Новости:

Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ

Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)

Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)

То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.

Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.

А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"

Пока тестируем на агрегаторах.

@cgevent
2👍26🔥145
Тестирую математику и генерацию текста на разных генераторах

chatGPT-5

solve this: 8x + 10 = 18 and make picture with solution

Выдает график кривой

Поэтому дописываю в промпт:
solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom

Исправляется с небольшими косяками.

@cgevent
😁18👍64👎2
Тестирую математику и генерацию текста на разных генераторах

REVE

solve this: 8x + 10 = 18 and make picture with solution on school board in the classroom

@cgevent
🔥23👍6👎21
Тестирую математику и генерацию текста на разных генераторах

Нанабанана

solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom

@cgevent
151👍22🔥18👎2
Примеры в постах выше обозначают какой путь прошли модели генерации картинок в этом году. От 1girl, wow, aststation и redshift два года назад, до той самой мультимодальности и ризонинга, вшитых в (задумайтесь) модели генерации картинок.

@cgevent
🔥466👍4👎2🙏1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка


Демонстрация возможностей nano banana + MJ + HailuoAI

Автор: @kostebas
🔗 Контакты: linktr.ee/kostebas
🌐 Сайт - https://www.kostebas.com

Задача: Потестить банану в деле и создать цифрового клона и студию для YouTube канала и в последствии уже создание истории вокруг персонажа.
Все началось с тестирования Wan 2.2 на бесконечные видео и там я получил интересный лук перса, который я уже дорабатывал через свои Flux лоры, получил первый образ перса и после пошло-поехало.
Далее миджорни сгенерировал на основе moodboard основные сцены и доп кадры создавались через банану и генерировались в hailuoai.

Удачные кадры отобрал в давинчи, после экспорт в AE и там создавались бесшовные склейки, матчкаты и прочие прелести.


Время: 8 дней по 2-3 часа после основных проектов


Главный хак - инпейнт по маске:
replace objects from the green brush area with the [НОВЫЙ ОБЪЕКТ]


Стек:
Image - Midjourney
Image Edit - Nano Banana
Video - Hailuo_AI
Lipsync - Runway (Act-one)
Platforms - Krea.ai, Freepik
Edit - Davinci Resolve
Effects - After Effects
Music - Suno
SFX, Voice - ElevenLabs


Бюджет: Условно бесплатно (существующие активные подписки)

Результат: Готовый цифровой блогер для демонстрации возможностей ИИ + классических инструментов монтажа и композа.

@cgevent
👍77👎23🔥136
〰️ В 2017 вы профукали Bitcoin. Если бы вложили даже 10 баксов — стали бы миллионером

〰️ В 2020 не успели за NFT. Люди заработали миллиарды на тупых картинках

〰️ В 2023 проср%ли мем-коины. За день эти монеты росли на 1000%

Очевидно, что тренд этого года — нейросети. Как только на них не зарабатывают: подключают к биржам фриланса и выполняют задания, создают аватаров для фейковых блогов и продают там рекламу — вариантов столько, насколько хватит вашей фантазии.

А если вы в лоб не видите, как можно поднять денег на нейросетях, загляните на канал AI News.

Там команда айтишников перебрала все варианты заработка на ИИ и делится лучшими в канале.

😁 Чтобы потом не рыдать от очередной упущенной возможности, лучше подпишись: @ai_news

#промо
👎204😁30😱61🙏1
Вайб воркинг

Если бы кто-то употребил такой термин, то я бы точно подумал, что это шутка.
Ан нет.

На серьезных щах Микрософт вводит такое понятие в нашу жизнь.

Там есть Agent Mode для Word, Excel и Power Point и Office Agent, который создаёт документы и презентации в чате в Copilot.

Мне здесь интересны прежде всего презентации - всегда считал, что гугл и Микрософт рано или поздно придушат десятки стартапов для презентаций типа Gamma.app.

А все это работает, внимание, на основе моделей Антропика!

И да, там есть вайб-райтинг (writing).

Ждём вайб-прокрастинейтинг.

https://www.microsoft.com/en-us/microsoft-365/blog/2025/09/29/vibe-working-introducing-agent-mode-and-office-agent-in-microsoft-365-copilot/

@cgevent
😁465👍2👎2🔥1
Media is too big
VIEW IN TELEGRAM
Симпатичный плагин для UE Meta Human.

Делает motion capture даже с веб-камеры, при этом поддерживает ретаргет мета хьюмана и делает это все в Реальном времени.

Ноги ведут себя довольно хорошо.

https://cyanpuppets.myshopify.com/

А сверху теперь хочет набросить какой-нибудь нейрорендер.

@cgevent
🔥46👍73
This media is not supported in your browser
VIEW IN TELEGRAM
Клинжара лучший в гимнастике. Тренированный, как рекс.

Остальные смешные. Минимах - второе место.

@cgevent
1👍47😁22🔥103😱2