This media is not supported in your browser
VIEW IN TELEGRAM
Интересное применение Нанабананы - тот самый бесконечный зум
Примечательно, что это все упаковано в приложение на AI Google Studio, где можно подгрузить свою картинку и делать этот зум над ее участками, просто выделяя нужную область.
Осторожно, очень залипательно - можно долго смотреть в какие дебри это все приводит.
Пробуем тут (генерация не очень быстрая, видео сильно ускорено):
https://aistudio.google.com/apps/bundled/enhance?showPreview=true&showAssistant=true
@cgevent
Примечательно, что это все упаковано в приложение на AI Google Studio, где можно подгрузить свою картинку и делать этот зум над ее участками, просто выделяя нужную область.
Осторожно, очень залипательно - можно долго смотреть в какие дебри это все приводит.
Пробуем тут (генерация не очень быстрая, видео сильно ускорено):
https://aistudio.google.com/apps/bundled/enhance?showPreview=true&showAssistant=true
@cgevent
❤79🔥38👍19👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Tripo V3.0 Ultra
Упор на текстуры и тонкие детали.
Показывают сетку в 2М полигонов.
Но зачем?
studio.tripo3d.ai
@cgevent
Упор на текстуры и тонкие детали.
Показывают сетку в 2М полигонов.
Но зачем?
studio.tripo3d.ai
@cgevent
🔥34😁11
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Гугол снова выкатил интересную штуку — Learn Your Way.
Суть: берём скучную главу из нудного учебника, кормим её нейроночкам, а на выходе получаем эту же главу, но так, будто её делали специально под вас и ваши интересы.
Фанат баскетбола? Законы Ньютона объясняются через мяч и кольцо. Любишь искусство? Экономика превращается в торги картинами.
И это не просто подстановка новых примеров. Оно делает разные форматы: mindmap для визуалов, аудиоуроки в стиле "учитель — ученик", интерактивные таймлайны, тесты, которые меняются под твои фейлы и т.д.
Ну и сразу же, не отходя от кассы провели эксперимент: взяли 60 школьников из Чикаго, рандомно поделили на две группы. Одним дали обычный PDF, другие же пользовались сабжем. 20–40 минут на чтение, потом тест. Через три дня ещё один тест.
📊 Результаты:
– сразу после изучения: у ИИ-учебника средний балл 77%, у обычного — 64%
– через три дня: те же 77% против 64%
– 100% сказали, что материал было проще понимать (у обычного учебника — 70%)
– 90% отметили, что им реально понравилось (у обычного учебника — 57%)
Скорее бы курс по линалу в виде моих любимых мемов про пиво.
тут можно посмотреть демки, скриншоты и ознакомиться подробнее.
Суть: берём скучную главу из нудного учебника, кормим её нейроночкам, а на выходе получаем эту же главу, но так, будто её делали специально под вас и ваши интересы.
Фанат баскетбола? Законы Ньютона объясняются через мяч и кольцо. Любишь искусство? Экономика превращается в торги картинами.
И это не просто подстановка новых примеров. Оно делает разные форматы: mindmap для визуалов, аудиоуроки в стиле "учитель — ученик", интерактивные таймлайны, тесты, которые меняются под твои фейлы и т.д.
Ну и сразу же, не отходя от кассы провели эксперимент: взяли 60 школьников из Чикаго, рандомно поделили на две группы. Одним дали обычный PDF, другие же пользовались сабжем. 20–40 минут на чтение, потом тест. Через три дня ещё один тест.
📊 Результаты:
– сразу после изучения: у ИИ-учебника средний балл 77%, у обычного — 64%
– через три дня: те же 77% против 64%
– 100% сказали, что материал было проще понимать (у обычного учебника — 70%)
– 90% отметили, что им реально понравилось (у обычного учебника — 57%)
Скорее бы курс по линалу в виде моих любимых мемов про пиво.
тут можно посмотреть демки, скриншоты и ознакомиться подробнее.
5🔥104👍25❤21👎4
Grok-4 Fast теперь имеет контекстное окно в ДВА Миллиона токенов.
Два года назад такие цифры казались фантастикой.
Быстро летит время.
@cgevent
Два года назад такие цифры казались фантастикой.
Быстро летит время.
@cgevent
👍46😱15🔥14❤8👎2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Runway бахнул бесплатный курс AI for Gaming
О том, как эффективно интегрировать набор генеративных ИИ-решений Runway в полный цикл разработки игр. От первоначальных исследований концепции до производственных ресурсов и рекламных роликов
Пять лекций:
Adding Motion to Concept Art
Character Dialogue Simulation
Concept Art for Level Design
Expanding your Gaming Asset Library
Texture Creation and Simulation
Пригодится и тем, кто пользует другие генераторы
https://runwayml.com/ai-for-gaming
@cgevent
О том, как эффективно интегрировать набор генеративных ИИ-решений Runway в полный цикл разработки игр. От первоначальных исследований концепции до производственных ресурсов и рекламных роликов
Пять лекций:
Adding Motion to Concept Art
Character Dialogue Simulation
Concept Art for Level Design
Expanding your Gaming Asset Library
Texture Creation and Simulation
Пригодится и тем, кто пользует другие генераторы
https://runwayml.com/ai-for-gaming
@cgevent
1🔥53❤19👍12👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Новости от Хуньяньского
Hunyuan3D-Omni: модель для генерации 3D-объектов с КонтролНетами.
Все бы ничего, только это Hunyuan 2.1 с обвесом из ControlNet
А мы уже отравлены новостями про 3.0 и Hunyuan 3D Studio
КонтролНеты:
по одному изображению для позы для ерсонажей и аватаров
по облаку точек
через bounding box: задаёт пропорции объекта
по вокселям: задание топологии
Все это было в Rodin
Ждем версию для 3.0
https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni
@cgevent
Hunyuan3D-Omni: модель для генерации 3D-объектов с КонтролНетами.
Все бы ничего, только это Hunyuan 2.1 с обвесом из ControlNet
А мы уже отравлены новостями про 3.0 и Hunyuan 3D Studio
КонтролНеты:
по одному изображению для позы для ерсонажей и аватаров
по облаку точек
через bounding box: задаёт пропорции объекта
по вокселям: задание топологии
Все это было в Rodin
Ждем версию для 3.0
https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni
@cgevent
🔥15❤7👍5
Новости от Хуньяньского
HunyuanImage 3.0
Тут есть две пачки новостей, хорошая и плохая.
Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)
Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.
HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.
В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.
Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность
Все это я проверил на ОДНОМ примере.
Вместо промпта написал ей:
Результат вы видите в шапке поста. Впечатляет.
Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).
В общем выглядит прельстивейше.
А теперь Чорные Новости:
Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ
Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)
Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)
То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.
Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.
А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"
Пока тестируем на агрегаторах.
@cgevent
HunyuanImage 3.0
Тут есть две пачки новостей, хорошая и плохая.
Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)
Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.
HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.
В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.
Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность
Все это я проверил на ОДНОМ примере.
Вместо промпта написал ей:
solve this:
8x + 10 = 18
and make picture with solution
Результат вы видите в шапке поста. Впечатляет.
Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).
В общем выглядит прельстивейше.
А теперь Чорные Новости:
Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ
Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)
Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)
То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.
Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.
А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"
Пока тестируем на агрегаторах.
@cgevent
2👍26🔥14❤5
Тестирую математику и генерацию текста на разных генераторах
chatGPT-5
solve this: 8x + 10 = 18 and make picture with solution
Выдает график кривой
Поэтому дописываю в промпт:
solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom
Исправляется с небольшими косяками.
@cgevent
chatGPT-5
solve this: 8x + 10 = 18 and make picture with solution
Выдает график кривой
Поэтому дописываю в промпт:
solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom
Исправляется с небольшими косяками.
@cgevent
😁18👍6❤4👎2
Тестирую математику и генерацию текста на разных генераторах
REVE
solve this: 8x + 10 = 18 and make picture with solution on school board in the classroom
@cgevent
REVE
solve this: 8x + 10 = 18 and make picture with solution on school board in the classroom
@cgevent
🔥23👍6👎2❤1
Тестирую математику и генерацию текста на разных генераторах
Нанабанана
solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom
@cgevent
Нанабанана
solve this:
8x + 10 = 18
and make picture with solution on school board in the classroom
@cgevent
1❤51👍22🔥18👎2
Примеры в постах выше обозначают какой путь прошли модели генерации картинок в этом году. От 1girl, wow, aststation и redshift два года назад, до той самой мультимодальности и ризонинга, вшитых в (задумайтесь) модели генерации картинок.
@cgevent
@cgevent
🔥46❤6👍4👎2🙏1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка
Демонстрация возможностей nano banana + MJ + HailuoAI
Главный хак - инпейнт по маске:
Стек:
Бюджет: Условно бесплатно (существующие активные подписки)
Результат: Готовый цифровой блогер для демонстрации возможностей ИИ + классических инструментов монтажа и композа.
@cgevent
Демонстрация возможностей nano banana + MJ + HailuoAI
Автор: @kostebas
🔗 Контакты: linktr.ee/kostebas
🌐 Сайт - https://www.kostebas.com
Задача: Потестить банану в деле и создать цифрового клона и студию для YouTube канала и в последствии уже создание истории вокруг персонажа.
Все началось с тестирования Wan 2.2 на бесконечные видео и там я получил интересный лук перса, который я уже дорабатывал через свои Flux лоры, получил первый образ перса и после пошло-поехало.
Далее миджорни сгенерировал на основе moodboard основные сцены и доп кадры создавались через банану и генерировались в hailuoai.
Удачные кадры отобрал в давинчи, после экспорт в AE и там создавались бесшовные склейки, матчкаты и прочие прелести.
Время: 8 дней по 2-3 часа после основных проектов
Главный хак - инпейнт по маске:
replace objects from the green brush area with the [НОВЫЙ ОБЪЕКТ]
Стек:
Image - Midjourney
Image Edit - Nano Banana
Video - Hailuo_AI
Lipsync - Runway (Act-one)
Platforms - Krea.ai, Freepik
Edit - Davinci Resolve
Effects - After Effects
Music - Suno
SFX, Voice - ElevenLabs
Бюджет: Условно бесплатно (существующие активные подписки)
Результат: Готовый цифровой блогер для демонстрации возможностей ИИ + классических инструментов монтажа и композа.
@cgevent
👍77👎23🔥13❤6
〰️ В 2017 вы профукали Bitcoin. Если бы вложили даже 10 баксов — стали бы миллионером
〰️ В 2020 не успели за NFT. Люди заработали миллиарды на тупых картинках
〰️ В 2023 проср%ли мем-коины. За день эти монеты росли на 1000%
Очевидно, что тренд этого года — нейросети. Как только на них не зарабатывают: подключают к биржам фриланса и выполняют задания, создают аватаров для фейковых блогов и продают там рекламу — вариантов столько, насколько хватит вашей фантазии.
А если вы в лоб не видите, как можно поднять денег на нейросетях, загляните на канал AI News.
Там команда айтишников перебрала все варианты заработка на ИИ и делится лучшими в канале.
😁 Чтобы потом не рыдать от очередной упущенной возможности, лучше подпишись: @ai_news
#промо
〰️ В 2020 не успели за NFT. Люди заработали миллиарды на тупых картинках
〰️ В 2023 проср%ли мем-коины. За день эти монеты росли на 1000%
Очевидно, что тренд этого года — нейросети. Как только на них не зарабатывают: подключают к биржам фриланса и выполняют задания, создают аватаров для фейковых блогов и продают там рекламу — вариантов столько, насколько хватит вашей фантазии.
А если вы в лоб не видите, как можно поднять денег на нейросетях, загляните на канал AI News.
Там команда айтишников перебрала все варианты заработка на ИИ и делится лучшими в канале.
😁 Чтобы потом не рыдать от очередной упущенной возможности, лучше подпишись: @ai_news
#промо
👎204😁30😱6❤1🙏1
Вайб воркинг
Если бы кто-то употребил такой термин, то я бы точно подумал, что это шутка.
Ан нет.
На серьезных щах Микрософт вводит такое понятие в нашу жизнь.
Там есть Agent Mode для Word, Excel и Power Point и Office Agent, который создаёт документы и презентации в чате в Copilot.
Мне здесь интересны прежде всего презентации - всегда считал, что гугл и Микрософт рано или поздно придушат десятки стартапов для презентаций типа Gamma.app.
А все это работает, внимание, на основе моделей Антропика!
И да, там есть вайб-райтинг (writing).
Ждём вайб-прокрастинейтинг.
https://www.microsoft.com/en-us/microsoft-365/blog/2025/09/29/vibe-working-introducing-agent-mode-and-office-agent-in-microsoft-365-copilot/
@cgevent
Если бы кто-то употребил такой термин, то я бы точно подумал, что это шутка.
Ан нет.
На серьезных щах Микрософт вводит такое понятие в нашу жизнь.
Там есть Agent Mode для Word, Excel и Power Point и Office Agent, который создаёт документы и презентации в чате в Copilot.
Мне здесь интересны прежде всего презентации - всегда считал, что гугл и Микрософт рано или поздно придушат десятки стартапов для презентаций типа Gamma.app.
А все это работает, внимание, на основе моделей Антропика!
И да, там есть вайб-райтинг (writing).
Ждём вайб-прокрастинейтинг.
https://www.microsoft.com/en-us/microsoft-365/blog/2025/09/29/vibe-working-introducing-agent-mode-and-office-agent-in-microsoft-365-copilot/
@cgevent
Microsoft News
Vibe working: Introducing Agent Mode and Office Agent in Microsoft 365 Copilot
Microsoft Copilot introduces Agent Mode in Office apps, enabling smarter document creation, analysis, and collaboration across Excel, Word, and PowerPoint.
😁46❤5👍2👎2🔥1
Media is too big
VIEW IN TELEGRAM
Симпатичный плагин для UE Meta Human.
Делает motion capture даже с веб-камеры, при этом поддерживает ретаргет мета хьюмана и делает это все в Реальном времени.
Ноги ведут себя довольно хорошо.
https://cyanpuppets.myshopify.com/
А сверху теперь хочет набросить какой-нибудь нейрорендер.
@cgevent
Делает motion capture даже с веб-камеры, при этом поддерживает ретаргет мета хьюмана и делает это все в Реальном времени.
Ноги ведут себя довольно хорошо.
https://cyanpuppets.myshopify.com/
А сверху теперь хочет набросить какой-нибудь нейрорендер.
@cgevent
🔥46👍7❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Клинжара лучший в гимнастике. Тренированный, как рекс.
Остальные смешные. Минимах - второе место.
@cgevent
Остальные смешные. Минимах - второе место.
@cgevent
1👍47😁22🔥10❤3😱2