DenoiseLAB

TLB-VFI: Temporal-Aware Latent Brownian Bridge Diffusion for Video Frame Interpolation

Интерполяция видеокадров (VFI) направлена на прогнозирование промежуточного кадра I_n (мы используем n для обозначения времени в видео, чтобы избежать перегрузки нотации временным шагом t в диффузионных моделях) на основе двух соседних последовательных кадров I_0 и I_1. В современных подходах для решения этой задачи используются диффузионные модели (как на основе изображений, так и на основе видео), которые обеспечивают высокую производительность. Однако диффузионные модели на основе изображений не способны извлекать временную информацию и относительно неэффективны по сравнению с методами, не использующими диффузию. Диффузионные модели на основе видео могут извлекать временную информацию, но они слишком велики с точки зрения масштаба обучения, размера модели и времени вывода. Чтобы устранить вышеуказанные проблемы, мы предлагаем эффективную модель диффузии на основе видео с учетом латентного броуновского моста для интерполяции видеокадров (TLB-VFI). Извлекая обширную временную информацию из видеовходов с помощью предлагаемого нами 3D-вейвлет-стробирования и автоэнкодера с учетом времени, наш метод обеспечивает 20%-ное улучшение FID для самых сложных наборов данных по сравнению с недавним SOTA моделей диффузии, основанных на изображениях. Между тем, благодаря наличию обширной временной информации, наш метод обеспечивает высокую производительность при использовании в 3 раза меньшего количества параметров. Такое сокращение параметров приводит к ускорению в 2,3 раза. Благодаря использованию оптического управления потоком, наш метод требует в 9000 раз меньше обучающих данных и обеспечивает более чем в 20 раз меньшее количество параметров, чем диффузионные модели на основе видео. Коды и результаты доступны на странице нашего проекта: https://zonglinl.github.io/tlbvfi_page.

✅https://arxiv.org/pdf/2507.04984
✅https://zonglinl.github.io/tlbvfi_page/
✅https://github.com/ZonglinL/TLBVFI

zonglinl.github.io

TWITTER BANNER TITLE META TAG

TWITTER BANNER DESCRIPTION META TAG

74 views07:00