Метаверсище и ИИще
49.9K subscribers
6.21K photos
4.82K videos
48 files
7.16K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

Поезд

Автор: Александр Жемчугов @imixpsy

Идея: Это моя первая "серьезная" работа. Основной целью было создание короткометражного фильма берущего за основу очень известную литературную повесть.
Вторая цель была - поместится в хронометраж 1мин. (хотелось испытать себя, смогу ли я передать зрителю полноту и образность истории).


Инструменты:
сценарий и раскадровка - написан Chat GPT и Gemini 3pro, конечно редактировался кожаными руками.
генерация изображений - nano banana pro (google flow) было сгенерировано порядка 800 шотов, 43 было отобранно для монтажа.
генерация видео - все шоты за исключением одного были сгенерированны в Veo 3.1 fast (google flow) 50 шотов, один с младенцем в Kling 2.6. (до этого создавал пару роликов в Kling, и по моему опыту Veo 3.1 сейчас жёстко сливает, больше им пользоваться нет желания)
генерация закадрового голоса - Eleven Labs (бесплатный тариф)
текст закадрового голоса - руками.
фоновые звуки - частично оставлены из аудиоряда Veo, основная часть взята с аудио стоков.
фоновая музыка - взят оригинальный саундтрек из фильма, в дальнейшем если буду где-то размещать, буду генерировать что-то похожее в Suno или Producer
монтаж - DaVinci Resolve, отдельной головной болью для меня стал поиск инструмента для удаления водяного знака veo.. в итоге сделал через fx в Davinci.
Временные затраты:
Сценарий 5 часов.
Генерация изображений 8 часов.
Генерация и монтаж видео 16 часов.
Генерация, монтаж и поиск аудио 8 часов.
Весь ролик сделал примерно за месяц, по 2 часа в день, плюс были большие перерывы.
Денежные затраты: пачка сухарей, подписка на Гугл про была уже оформлена, каждый месяц дают бесплатно 50 видео роликов и безлимитную банану. (Но нужно отметить, что банана часто работала с перебоями, поэтому для коммерции я бы выбирал какой-нибудь платный стабильный агрегатор )
Искренне благодарю всех за внимание! Надеюсь на конструктивную критику.

@cgevent
3👍68👎45🔥109😁2
Сидэнский без ограничений.

Везде начали снимать ограничения (типа только для компаний).

Если на Фал по API без плясок с бубнами, то и везде так в ближайшее время.

На Runway в Unlimited Plan уже есть Unlimited Seedance 2.0

@cgevent
🔥44👍106
Комфи апдейты, FireRed и немного нытья

Зашел посмотреть, что завезли в Комфи. Для этого, как обычно, ломанулся на immers.cloud, чтобы завести там сервак. Все H100 пока заняты, выхватил 4090. Развернул сохраненный том, залогинился, запустил Комфи.

Щас немного поворчу.

Иду в темплейты, там красота, чего только нет. И тут надо понимать, что красота в основном - это API ноды. Хорошо, что есть фильтр Run On и можно выбрать ComfyUI(немного странное название меню), получим локальное выполнение.

Вижу локальную красоту.

Light Migration for Character Portrait
1 click Multiple Scene Angles
Multi-Keyframe Video Stitching


Однако понять, что это за модель из описания невозможно. Нужно протыкивать и создавать workflow. И по названиям отсутствующих моделей разбираться.

Смотрю, что есть фильтры Tasks, ok, жмакаем, ох.. сколько всего.

Есть 3D и есть 3D Model - непонятно в чем разница. И там, и там есть Хуньянь.

Есть Tasks = LLM, там одинокий Qwen 3.0 и только 4B. Почему только он, и почему именно 4B?

В общем, у меня ощущение, что модерацией темплейтов занимается примерно никто. Сделано на отвали. Никого гайдлайна для заведения нового темплейта, чтобы он был понятный и полезный - нет. А ведь это, похоже, долгоиграющий проект - попытка создать на будущее базу поддерживаемых моделей. Но оформление этой базы - просто никакое. Могли бы поглядеть на civitai.ai - там хоть какая-то мысль и структура присутствует.

В общем, это я приподвзварчиваю, как обычно, глядя на развитие Комфи. У них точно отсутствует продакт менеджер и все их попытки сделать удобно выглядят пока как сайты в девяностых.

Чтобы не ограничиваться только ворчанием, открыл темплейт прошедшей незамеченной модели FireRed Edit 1.1
Погонял его на своей любимой фотке Марго Робби.
Хорошо редактирует изображения, в чем-то лучше Qwen Edit.
Жрет 23 гига VRAM, неторопливая. Рекомендую.

И на посошок, принес вам полезные ноды от подписчика Вячеслава, специально для фотографов (которые освоили Комфи):
умеют как загружать RAW-файлы разных форматов, так и сохранять изображения в DNG (цифровые негативы), с учётом псевдорасширения ДД изображения, таким образом можно в ComfyUI сгенерировать цифровые негативы и потом привычно обработать их в любом фоторедакторе
Забираем тут:
https://github.com/thezveroboy/ComfyUI-zveroboy-photo

Продолжаю следить за хаотическим развитием Комфи... и ворчать.

@cgevent
👍2714👎3
Forwarded from эйай ньюз
OpenAI релизнули подписку ChatGPT Pro за $100

Он всё так же даёт доступ к GPT 5.4 Pro и прочим фичам Pro подписки (помните про ChatGPT Pulse?), но с меньшими лимитами на Codex. Пользователи нового Pro тира будут получать 5x использования Codex по сравнению с Plus, но до 31 мая действует акция, которая удваивает использование для всех Pro пользователей, то есть на почти два месяца лимиты в 10x больше чем у Plus.

@ai_newz
🔥173👍2
Media is too big
VIEW IN TELEGRAM
HappyHorse: сравнения

Интересное сопоставление Счастливой Лошади и Veo, Kling, SkyReel и PixVerse.

Когда смотришь первый раз, без пауз, то кажется, что все модели хороши. И подумалось мне, что довольно скоро мы перестанем рассуждать о том, кто круче. А просто будет как со сменной оптикой - здесь хорошо сработает телевик, а тут давайте коротыша. Далее видеофилы будут биться в духе Canon против Nikon - сидэнский 5.0 лучше рисует тени, а Клинг лучше в боке.
Впрочем, я не уверен, что зумеры знают, что такое сменная оптика и тем более Никон. Просто будут спорить, чья кнопка на телефоне делает красивее.

P.S. Все это сделано на Video Arena, никаких доступов пока нет. Алибаба молчит.

@cgevent
🔥2219👍8😁6
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini теперь сам пишет приложения для визуализации прямо в чате.

Раньше я его просил "Напиши на three.js визуализацию аттрактора Лоренца". Он выдавал мне код и говорил, как его запустить. Можно было даже запустить в нем самом.

Теперь процесс еще более упростился, но в принципе все осталось как прежде: пишете промпт "помоги визуализировать траектории аттрактора Лоренца" и оно пишет код, и выдает вам красивую кнопку "Show Visualisation". Нажав на которую вы видите сниппет прямо в чате.

Телеграмчик уже приподвзвизгивает про "новую фичу", и "Gemini научился"но как по мне - это хорошо упакованная и довольно старая фича. Просто теперь не надо сильно растолковывать Gemini, что именно ты хочешь получить. Она сама решает, какие параметры визуализировать.

Трюк в том, что в чате с Gemini надо выбрать модель Pro (Thinking не работает, проверил) и сказать "помоги визуализировать (неведомую хрень)". Получите кнопку.

О чем еще не пишет телеграмчик, так это то, что в новом чате на этот же запрос вы получите совсем другую визуализацию. Совсем по-другому оформленную. У меня другой аттрактор Лоренца вышел белый и довольно "лоу-поли" (шаг рунге-кутты слишком большой).

P.S. chatGPT и Клод тоже так умеют, только надо попросить чуть иначе.
@cgevent
👍269👎4
Метаверсище и ИИще
Мне кажется мы очень быстро перейдем к фазе, аналогичной наличию ядерных вооружений в тех или иных руках. Просто щелк! и вот уже надо договариваться на уровне государств,
И вот уже процесс пошел на уровне государств...

Министр финансов США Скотт Бессент и председатель Федеральной резервной системы Джером Пауэлл провели на этой неделе экстренное совещание с генеральными директорами банков, чтобы предупредить о киберрисках, создаваемых новейшей моделью искусственного интеллекта компании Anthropic, сообщили в четверг два источника, знакомые с ситуацией.

Компания Anthropic запустила мощную модель Mythos в начале этой недели, но воздержалась от ее широкого распространения, сославшись на опасения, что она может выявить ранее неизвестные уязвимости в сфере кибербезопасности.

https://finance.yahoo.com/sectors/technology/articles/bessent-powell-warn-bank-ceos-010258625.html

@cgevent
😁26😱128🙏1
Нейронки это не только про генерацию картинок, видео и ChatGPT

Один из самых больших эффектов от внедрения - в маркетинге и продажах.

Например, вот так с AI можно сгенерировать 1000 уникальных КП в несколько кликов.

Здесь мини-инструкция, в которой AI ищет по вашей табличке сайт компании, имена ЛПР в Гугле, квалифицирует их и тд.

А это бесплатный гайд о том, как сегодня можно внедрить ИИ в ваше привлечение клиентов.

У Андрея на канале есть больше таких постов и гайдов. Подпишитесь, кому актуально.
3👎20👍75🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам пару видеопереодеваторов.

Один старый: https://github.com/Zheng-Chong/CatV2TON

А второй совсем свежий, побивающий Cat2VTON: https://hyunsoocha.github.io/vanast/

У него правда еще код не положили куда надо, но обещают.

Интересно, как Банана, Qwen Edit и Flux Kontext с помощью редактирования изображений по рефам приподубили картиночные переодеваторы.

Интересно, что будет на поляне видеопримерочных?

@cgevent
🔥14👍101😁1
Forwarded from CGIT_Vines (Marvin Heemeyer)
Я тут наковырял, прототип того во что может превратиться текстуринг в ближайшее время.

Modddif это сервис который эксплуатирует идею с генерацией и репрожектином текстур на вашу геометрию, если у вас ее нету, там же можете сгенерировать и модель и дополнительные ракурсы и инпэинтингом дорисовывать недопрожекченные детали. Так например можно чинить косяки генерации из HY или Tripo.

Но сразу скажу, что прыгать от идеальности работы не хочется, потому что это определенного вида ебля все же пока. И ракурс подобрать и сгенерить что-то близкое к соседнему виду, чтобы оно по стилю попало и геометрию модели учло и по цвету сошлось, хотя цвет текстуры можно и докрутить там же.

В общем это какая-то пре альфа сабстанс пэинтера на нейронках и вполне вероятно, что что-то подобное в пэинтере и появится, это же адоб! Но как я и говорил никто из софтверных компаний не особо пока хочет касаться этого плохопахнущего сегмента, акции, инвесторы, это понимать надо. Но в любом случае попробуйте, возможно кому-то зайдет, потому что это уже похоже на продукт.

Самое приятное что он бесплатный но с ограничениями, ваши модели публичны, вы ограничены в разрешении текстур и еще по мелочи, этого вполне хватит чтобы полностью затекстурить вашу модель и понять надо оно вам или нет.
@CGIT_Vines
🔥10👍74😱2👎1
Пронейропрожарку.

Я смотрю, что в коментах много любителей нажать на паузу и поискать блох.
Я помню, что в рекламном постпродакшене было распространено такое явление: девочка (или мальчик) в принимающем работу агентстве ставила на паузу видос и с умным видом вопрошала:

"у вас тут нечетко!".

"Тык это ж motion blur" - неловкая пауза.

"Надо переделать" - совсем неловкая пауза.

Это я к чему? Смотрите видео как видео. Если что-то режет глаз - это должен быть фрагмент видео, а не отдельный кадр. Если ставить на паузу, то можно найти косяков в любом видосе. Вопрос в том, влияют ли они на восприятие при просмотре именно видео.

Всем хорошей пятничной прожарки. Она смешная.

@cgevent
1👍11429😁9🙏9👎4🔥1😱1
Media is too big
VIEW IN TELEGRAM
#Нейропрожарка

ЖЭК. Последний расчёт.
Автор - Карина Камола

Короткометражный синематик на злободневную тему повышения тарифов ЖЭКа и то, как Петровна берет все в свои руки. (Вдохновлялась персонажами Эдуарда Набиуллина)

🟢Создано на базе Unreal Engine 5 (в нем созданы сцены с детальной проработкой локаций, постановкой камеры, освещения. Также в анриле собиралась предварительная анимация каждого шота (всего их было около 35), для понимания таймлайна и конечного визуала ролика.

🟢Далее создавались два варианта начальных и при необходимости конечных кадров каждого шота в двух вариантах - lit| unlit, для того, чтобы скормить банане отдельно композицию и отдельно освещение и текстуры.

🟢После чего делался мастер-промпт в обсидиан, с детальным описанием сеттинга, визуала, лора и ключевых моментов, которые мне необходимо учесть в каждом кадре. Файл обсидиана отправлялся в ChatGPT (семейная подписка 250 р), который уже генерил мне на каждый шот уникальный промпт на основе мастер-промпта.

🟢Картинки генерились в NanoBanana2 на платформе Genspark (1500 р в мес). После того, как каждый шот был доработан нейросетью я перешла к генерации видео.

🟢Видео создавались в Kling 3.0 (2600 р на весь ролик, даже чуть осталось токенов). В основном по одному стартовому кадру, но местами (например выбивание двери), где это необходимо генерация была по 2ум кадрам.

🟢Липсинг англ прям с клинга. Переозвучка на русском с созданием моделей спикеров в нейросети Fish Audio (бесплатно)

🟢Монтаж в Capcut. Саунд-дизайн (музыка подложка Wolfenstein II: The New Colossus. Звуки подобраны с сайта zvukipro.

@cgevent
Please open Telegram to view this post
VIEW IN TELEGRAM
👎98😁62👍3820🔥14😱7🙏1
HappyHorse: 30 апреля и пока только по API

@cgevent
👎11😱7🔥4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
MiniMax Music 2.6


До Суно далеко, особенно по функциональной оснастке.

Что в версии 2.6:
→ Первый аудиофайл менее чем за 20 секунд:
→ Улучшенная низко-среднечастотные характеристики: более плотный бас для хауса, трэпа, драм-н-бейса
→ Перенос стиля и ремикширование.

14-дневное бесплатное глобальное бета-тестирование начинается сегодня ( лимит 500 песен в день).

https://www.minimax.io/news/music-26

@cgevent
👍115👎4
Forwarded from Neural Shit
тут корчеватель 2.0 подъехал.

Шведская исследовательница придумала фейковую болезнь Биксониманию. Якобы это когда у человека розовеют веки от долгого залипания в монитор. Всё это было нужно, чтобы закинуть в интернет и на препринт-площадки несколько липовых статей про выдуманную болезнь и проверить, начнут ли LLM'ки тащить этот бред как настоящий медицинский факт. И языковые модельки, конечно же повелись не смотря на то, что препринты статей были написаны максимально по дебильному: в благодарностях значилась "Академия Звёздного флота на борту Энтерпрайза", а спонсором выступил "Фонд Сайдшоу Боба по части продвинутого мошенничества". А ещё в текстах статей прямо было написано: "Вся эта статья выдумана".

Copilot вежливо сообщил, что Биксонимания это "интригующее и относительно редкое состояние".
Gemini начал раздавать советы по лечению и отправлять пользователей к офтальмологу.
Perplexity вообще выдал базу: заявил, что болезнь поражает 1 из 90 000 человек (откуда он взял цифру? правильно, нагаллюцинировал из своей чугунной головы).
ChatGPT тоже надиагностировал симптомов по запросу.

Но самое весёлое тут не то, что повелись нейронки. Индийские мясные исследователи умудрились опубликовать статью в рецензируемом журнале Cureus, в которой на полном серьёзе процитировали один из фейковых препринтов. Статью, конечно же через некоторое время отозвали, но факт остаётся фактом.

Вот так галлюцинации и излишняя доверчивость одного алгоритма становятся "научным фактом" для другого, а потом и для ленивого кожаного мешка в белом халате.

тут подробнее
🔥40😁29👍12😱72