AI-Surfer | IT, CG, Нейронки
246 subscribers
65 photos
44 videos
2 files
76 links
Про искусственный интеллект, технологии, геймдев и CG простым языком от руководителя направления AI-VFX в Sber Immersive / Sber Studios. Cотрудничество hello@svasilev-work.ru
Download Telegram
Google обновил Flow: теперь можно менять положение и движение камеры даже после генерации видео - сразу в готовом ролике.

Появился мощный Insert - выделяешь зону и указываешь, что заменить, работает как видео-инпейнт. Выглядит удобнее и точнее, чем у конкурентов вроде Runway Aleph.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
👍5
Банана 2 и апдейт Gemini рядом, на ладошке, вот они 🔥

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Eleven Labs теперь… агрегатор картинок, видео, звука, голосов селебрити. Всё это в одном месте, с быстрым доступом для тестов и прототипирования. Думаю тут еще очень сыграет на пользу их внутренняя студия, научится ли она композить и монтировать это все?

Что нового:
• Генерация картинок и видео: досутпны API от Veo 3, Sora2, Kling, Wan, Seedance и других.
• Апскейлеры: доступен Topaz - классика.

Однозначно нужно сравнивать с хигсфилдом, креа и другими. Очень интересно.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
🔥2
Gemini 3 Pro раскатывается и уже доступен в AI-Studio, бенчмарки хороши по всем показателям - даже получилось подступиться к Sonnet по программированию и математике.

Банана будет где-то в четверг/пятницу. Очень хорошо!

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
🔥1
Мысли про Nano Banana Pro - это действительно важная точка для всей сферы генеративной графики. За эти пару месяцев «банана» стала полноценным инструментом для бизнеса: теперь здесь и поддержка 2K/4K, и генерация текста на объектах (вывески, постеры, комиксы), и до 16 референсов для стилистики, и стабильная работа с персонажами и светом.

Первые наблюдения по новой модели, это контроль и консистентность. Можно «держать» стиль бренда и героев сквозь разные сцены, быстро делать сложную инфографику (хоть и накосячила на картинке для поста) и визуалы для рекламы, вплоть до печати.

Повседневно ОЧЕНЬ активно кручу ее в рабочих проектах. А еще я делаю дома ремонт и она прекрасно создает фотопривязки с мебелью)) Закрывает реально дофига потребностей по статике и нейрофотошоповым задачам.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
👍3
Не, ну как же она круто и быстро это всё делает. Погонял банану ещё разок на примере скетча «Сёрфер в городе» с задачей выстроить композицию, сохранить черты лица, передать атмосферу хрущёвок.

Киноязычные штуки типа Medium Shot, Close-up, POV - всё как по нотам. Персонаж узнаваем на всех кадрах, раньше иногда теряла усы)) Думер-атмосфера тоже на месте со своей серостью, снегом и панельками.

Нравится, 10/10.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🔥7
Обнаружен досуг на выходные, смотрим странные дела? По трейлеру это вообще какой-то боевик будет.

Кстати, продюсер сериала Шон Леви и братья Дафферы неоднократно заявляли, что они против использования искусственного интеллекта для творческих задач и максимально поддерживают забастовки в киноиндустрии США: «Нет, мы не используем и не будем использовать ИИ».

Или все-таки разок пройдемся апскейлом и денойзом по Векне?

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
Media is too big
VIEW IN TELEGRAM
Kling O1 — новая модель от клингчангского, которая позиционируется как All-in-One Creative Studio. По сути, это мощный инструмент для редактирования видео, который понимает всё.

На что смотрим:
• Мультимодальность: Работает с текстом, фото и видео одновременно.
• Консистентность: Идеально держит персонажа в разных сценах.
• Комбо-задачи: Меняет фон + добавляет объекты в одном запросе.
• Контроль: Генерация от 3 до 10 секунд.
• По функционалу напоминает нанобанану, но для видео.

Вот здесь гайд по использованию.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
👍5
Представлены новые модели DeepSeek-V3.2 и её специализированная версия V3.2-Speciale. Производительность базовой модели сопоставима с GPT-5, а версия Speciale показывает результаты, близкие к уровню Gemini 3.0 Pro в задачах на логику. И как всегда респект за опенсорс, вроде только они так делают.

DeepSeek-V3.2
• Функциональность: Универсальная модель, поддерживающая работу с внешними инструментами через обновленный чат-шаблон .
• Развертывание: Адаптирована для локального использования .
• Технология: Использует архитектуру DeepSeek Sparse Attention (DSA) для оптимизации скорости и снижения потребления памяти при работе с длинными текстами.

DeepSeek-V3.2-Speciale
• Специализация: Разработана для задач, требующих сложных рассуждений, таких как математика и программирование.
• Ограничения: Не поддерживает вызов внешних инструментов .
• Достижения: Модель показала высокие результаты на нескольких международных олимпиадах по математике и информатике в 2025 году, включая IMO, IOI и ICPC World Finals.

Обе модели опубликованы под открытой лицензией MIT, что позволяет свободно их использовать и модифицировать.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
5
TIME назвал «Человеком года 2025» не одного человека, а «Архитекторов ИИ». Главная мысль: осторожные дебаты об искусственном интеллекте закончились - началась бешеная глобальная гонка за его внедрение.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из KAIST и SNU представили EgoX — новый ИИ-фреймворк, который генерирует видео от первого лица (egocentric) на основе всего одного ролика, снятого со стороны (exocentric).

Как это работает: Модель использует мощь видео-диффузионных моделей с адаптацией LoRA. Специальный механизм Geometry-Guided Self-Attention помогает нейросети «понимать» пространство, сохраняя геометрию сцены и качественно дорисовывая невидимые зоны.

Сетка позволяет буквально «влезть в шкуру» героев кино или спортсменов. Авторы показали примеры на кадрах из «Темного рыцаря» (глазами Джокера), «Мстителей» и спортивных трансляций. Выглядит очень реалистично и стабильно.

Посмотреть проект и примеры: EgoX Project

Код тоже обещают дать, но попозже.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
2
Media is too big
VIEW IN TELEGRAM
Последний месяц достаточно мало писал здесь и в целом почти не делился личными проектами - пришло время исправляться. Весь декабрь я был полностью поглощен AI-балетом «Снегурочка» в театре им. Э. Сапаева (Йошкар-Ола).

Перед моей командой стояла задача оживления авторских эскизов художника Бориса Голодницкого. Мы превратили его наброски в детализированные цифровые миры, бережно сохранив авторский стиль и почерк.

В итоге мы реализовали сложный пайплайн генерации AI-видео для декораций (I2I, I2V). Вместо статики зритель видит живое, «дышащее» пространство Берендеева царства и других сказочных локаций.

Очень доволен этой предновогодней задачей. Это было настоящее погружение в сказку, где технологии не заменяют искусство, а дают ему новый масштаб и глубину.

Отдельно хочу отметить, как мощно DaVinci Resolve Studio 20 апскейлит генерации в UHD и 8К с помощью AI-Super Scale. Максимально рекомендую всем, кто работает с нейровидео и качественным финишингом.

AI-Surfer | IT, CG, Нейронки 🏄‍♂️
🔥4