Цифровой Луч | AI & CG
463 subscribers
262 photos
434 videos
257 links
Рассказываю, как использовать нейросети для диджитал контента.
Полезные сервисы, гайды и новости.

Никаких компромиссов — только лучшее!

Для связи: @Pasha_Terentev
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
AI + нейроимплант вернули голос парализованной женщине 🧠

Под вечер поделюсь трогательной историей, как технологии помогли человеку, запертому в собственном теле, вернуть часть своей жизни.

Об этом писали еще летом 2023, видел тогда новость, но только сейчас прочитал подробно про процесс и результаты исследования. Общую суть я кратко изложил в видео, но хочу рассказать еще про пару моментов.

Во-первых, просто невероятно, что из сигналов мозга получилось напрямую декодировать речь. Для этого несколько недель нейросеть обучалась понимать, что хочет сказать Энн (пациентка), но только не целые слова, а фонемы. Из получившейся системы получилось сделать словарный запас на 1024 слова.

Скорость, с которой получается декодировать и воспроизводить речь — это 80 слов в минуту! Для примера, обычно у здорового человека 150-200 слов.

Ах да, цифрового аватара собрали на игровом движке Unreal Engine!
Самое удивительное применение анрила, которое я знаю.

В общем, супер радуют подобные техно-оптимистичные истории. Кому интересно, подробная статья от Калифорнийского университета, который занимался этим исследованием — [ ссылка ]
Полное видео, по которому делал озвучку — [ ссылка ]
Please open Telegram to view this post
VIEW IN TELEGRAM
Студийный звук даже с плохим микрофоном - одной кнопкой 🔺

В голосовом выше показал⬆️, как работает эта нейронка. Для наглядности включил шум стройки на фоне - поверьте, стоит мне начать записывать озвучку, как соседи сразу вспоминают, что им нужно сверлить стены...

Итак, в обновлении NVIDIA Broadcast 2.0 появилась AI-функция Studio Voice, которая подтягивает качество звука до уровня профессионального подкаста.

Голос ощущается объемнее и ниже, посторонние шумы исчезли, но результат ооочень далек от идеала. Звук стал каким-то неестественным и роботизированным, а также нейронка съедает некоторые буквы.

Еще из минусов: вообще нет никаких настроек - только вкл/выкл. Да и ресурсов ПК потребляет много - у моей 4070ti на 12GB съедает почти половину памяти.

😻Вывод: Если нет оборудования и навыков обработки, а нужно быстро улучшить звук — Studio Voice однозначно пригодится. В остальных случаях — это не лучшее решение.

Кстати, как вам такой формат с голосовыми? Стоит пробовать периодически рассказывать что-то в аудио, а не текстом?

ссылка на Nvidia Broadcast
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня вышла Kingdom Come II — экшен в сеттинге средневековья и открытым миром. Я не играл в первую часть, но трейлеры сиквела продали мне игру.

Блин, вы только посмотрите, какой крутой синематик! Он меньше чем за минуту передаёт всю суть того, что тебя ждет. Они еще и поделились бэкстейджем со съемки трейлера!

Кстати, если интересно больше узнать про этот операторский приём, когда камера установлена на теле актёра, рекомендую вот эту нарезку из разных фильмов с пояснениями. Приём называется Snorricam.
Media is too big
VIEW IN TELEGRAM
«Беловежская пуща» — первый полнометражный AI мультфильм

По трейлеру сразу понятно, что это тотальный кринж. Отлично описывает суть этот комментарий с ютуба:
"Представьте, что вы пришли в зоопарк, а все животные там - чучела, которых дёргают за ниточки сверху, пытаясь создать видимость жизни. Такое ощущение от этого мультфильма".

Эту "чудо" картину выпустила белорусская студия, явно с целью просто срубить лёгких денег, нагенерив 3D а-ля Pixar. Да, это блин показывают в кинотеатрах.

Еще они хотели хайпануть на "мы первые сделали AI полнометражку", но вообще-то уже был мультфильм про роботов, который можно посмотреть бесплатно на ютубе.

Для справки: в хорошей мультипликации вообще может не быть анимации — только статика и звук. Так что проблема тут не в AI, а в жадности.
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть для удаления фона у видео

PramaLLC представили новую модель BEN2, которая вырезает объекты из фона. Хорошо справляется с деталями, может как и с фото, так и с видео.

Есть бесплатное онлайн демо, с лимитом на 100 кадров для одного видео. Протестировал на танцующем Фареле — теперь он может плясать, где угодно🕺

Демо на HF
Сайт разработчиков
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Дополненная реальность в нейрохирургии

У меня в последнее время какой-то повышенный интерес к технологиям в медицине. В этом кейсе 3D модель головы совмещается с МРТ снимками, и врач накладывает их прямо на пациента используя AR-очки.

Эффективность такого метода пока спорная, из-за недостаточной точности, но это полезно для предоперационной визуализации.
Нашел еще такое видео — ссылка
Как моё видео собрало 6 млн просмотров и 2,5к подписчиков на ютубe… НО на чужом канале

Нет, это не кликбейт. Захотелось немного разбавить контент чем-то закулисным, и как раз появилась забавная история про мои успехи с короткими видео на разных площадках.

Так вот, некоторые мои ролики хорошо залетают, в основном в запретграмме. Например, недавнее видео про нейроимплант у женщины уже собрало больше 1 млн просмотров в reels всего за неделю!

Периодически мне скидывают, что какие-то мои видео постят к себе разные паблики в ТГ, и даже, блин, в VK. Не, я вообще не против, даже если меня никак не отмечают. Сам периодически беру за основу сторонние футажи для озвучки или эдитов.

Но недавно мне в рекомендациях попался маленький канал про пчел на ютубе, который взял видео с моей озвучкой, немного его ускорил, и набрал 6 млн просмотров и 2,5к подписчиков!
И вот теперь внимание: тоже самое видео конечно же есть на моем ютуб канале, но у него всего 1000 просмотров 😅

Алгоритмы ютуба конечно беспощадны! Пока до конца не понимаю, как именно они работают. Возможно, от части, важную роль сыграли все эти "замедления".

В запретграмме, кстати, это же видео про пчел у меня рекордсмен — 4 млн просмотров за всё время.

😮‍💨 На чужом канале
🌸 У меня на канале
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как надо делать рекламу за миллионы долларов

Вчера был финал Super Bowl 2025 — главного события в мире американского футбола. Помимо игры, все обсуждают рекламные вставки, ведь один слот на 30 секунд стоит $7 миллионов, и компании выкладываются на максимум креативности.

Сейчас в центре внимания якобы провальный ролик OpenAI. Многие говорят, что он сложный и непонятный для такого формата.
Я отчасти согласен, хотя о результатах стоит говорить только после маркетингового анализа.

И пока все обсуждают этот ролик, старый добрый Йе снова сделал бриллиант в мире рекламного креатива! Даже не знаю, как это лучше всего описать? Эмм.. хмм...
⭐️AI модель для улучшения старых видео

Topaz Labs, уже зарекомендовавшие себя действительно крутыми апскейлерами, представили новый продукт — Starlight.

Главная фишка: он не просто увеличивает разрешение, а реально улучшает даже самые шакальные ретро-футажи. Убирает шумы, восстанавливает детали, но при этом не замыливает лица и кожу. Вот этот футаж с концерта Фредди Меркьюри получился просто офигенно!

Не обошлось без выкрутасов. Разработчики решили поменять бизнес-модель на подписочную и перенести софт в облако, что многих сильно расстроило.
Сообщение на форуме от СЕО компании

@digital_beam
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Стоматолог одним рилсом попала в очень широкую ЦА фанатов спорта. При этом и незаметно сразу, что использовалась нейросеть 💪

Если без шуточек, правда крутой ролик. Снова убеждаюсь, что решает не супер-дупер реалистичность, а креативность... точнее даже умение в мемастность.

Кстати, нейронка здесь Viggle, которая заменяет персонажа в видео на вас. Достаточно просто фотографии.

Автор svetlana.mets
Please open Telegram to view this post
VIEW IN TELEGRAM
Уже поздновато, но вдруг кому-то срочно нужна милая валентинка❤️
В Glif есть прикольная сборка, для генерации открыток в акварельном стиле.

Кстати, Glif ввели систему кредитов: теперь дают 30 штук в день бесплатно, а одна картинка стоит около 5 кредитов. Ещё и вотермарку начали ставить.

upd, вотермарка только в этой сборке от автора
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
"Сделаем свой YouTube" — свежий апдейт в Telegram

Знаю, что среди нас много тех, кто ведет свои ТГ каналы. Тут как раз Дуров выпустил интересную обнову, которая будет точно полезна как админам каналов, так и юзерам.

Видео:
🔴Теперь можно ставить обложки для видео — это важный инструмент для оформления, на том же ютуб конверсия у роликов сильно зависит от обложек (thumbnail)
🔴Делиться ссылкой на нужный момент — тоже супер полезная опция из ютуба
🔴Полоска прогресса просмотра, когда видео идет в фоновом режиме в чате — вроде UX мелочь, но хорошо работает на удержание

Для важных переговоров:
Улучшенный поиск стикеров с помощью ИИ — теперь ищет среди базы из миллионов стикеров.
Лично я вообще не фанат стикеров, мне хватает эмоджи. Вы часто пользуетесь ими в общении? 🤔

Продвижение:
Звёздные реакции от имени своего канала — теперь можно поддержать автора чужого канала и прорекламировать свой. Всё равно пока сломанная система, в плане донатов, но хотя бы так

Я уже как-то упоминал, что телега продолжает развиваться в сторону видео-платформы, но пока есть большая проблема — это отсутствие механик для органического продвижения контента внутри ТГ. Однако радует, что они двигаются небольшими, но продуманными шагами, а не превращают мессенджер в свалку из всего и вся.

Подробная папира со всеми обновлениями

@digital_beam
Please open Telegram to view this post
VIEW IN TELEGRAM
Самый умный ИИ на Земле

Завтра утром по Москве будет релиз Grok 3 от компании xAI. Илон Маск уже скромно назвал новую версию своего чат-бота "Самым умным на Земле" — мы конечно же верим, ага...

Однако, ресурсов вложили действительно немало! Обучали на ферме Colossus из 100 000 Nvidia H100, которую построили всего за 8 месяцев в том году. В итоге на обучение Grok 3 было затрачено в 10 раз больше GPU часов, чем для предыдущей версии.
Подробнее тут

Насколько это всё оправдано, будет понятно по тестам. Пока что юзаю Grok, только для быстрых картинок с селебами.

😻И еще одна новость от Маска. В Дубае запускают строительство Dubai Loop — подземной высокоскоростной транспортной системы, как в Лас-Вегасе. Хотят решить проблемы с пробками или просто сделать город еще футуристичнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Обратная перспектива

Вдохновляемся крутой серией 3D работ от студии Petrick — главное только не сломать мозг.

Одна из самых известных областей, где используется этот визуальный прием — иконопись. Для подчёркивания значимости святых фигур и концентрации на духовном содержании.

Для тех, кому интересно углубиться в технические нюансы обратной перспективы, недавно еще попалось видео, где парень сделал камеру снимающую с таким эффектом.
This media is not supported in your browser
VIEW IN TELEGRAM
Вместо Марса будут покорять геймдев 🚀

Маск и команда xAI представили сегодня Grok 3. Мне их состав чем-то напомнил шоу "ПрожекторПерисХилтон" 😂
В итоге, громкие заявления Илона оказались не пустым звуком — Chatbot Arena и другие бенчмарки показали, что модель не уступает топовым конкурентам.

Мне понравилось, как Grok 3 сгенерировал рабочую игру по текстовому промту, объединив матч-3 и тетрис. Перевел даже этот момент с трансляции — в конце есть эпическая шутка от Маска 🎤

Добавили Deep Search — поиск с анализом (рассуждением) данных из всех доступных источников. Сейчас это трендовая опция, которую другие компании тоже внедряют.

А ещё выяснилось, что для обучения использовали 200 тысяч GPU, а не 100. При этом xAI собирает инвестиции, чтобы продолжить наращивать вычислительные мощности.

В общем, Grok 3 пока выглядит очень интересно, учитывая что всего за год получилось догнать Open AI. Скоро еще добавят голосовой режим.

🤥 Полный разбор хайлайтов можно почитать тут
Please open Telegram to view this post
VIEW IN TELEGRAM