Compressed Vision for Efficient Video Understanding
DeepMind опубликовал интересную статью, с далеко идущими последствиями. Идея довольно простая и элегантная:
У нас есть много длинных видео, работать с ними сложно по ряду причин (long sequences, размер и тп). Так почему бы нам сначала не сжать эти видосы (с помощью нейрокодека), а потом обучать нейросеть уже на сжатых видео?
Так они и поступили. Мне кажется этот подход будет хорошо работать и с другими долгими последовательностями, например со стримами с датчиков.
🌟 Блог-пост
📖 Статья
#CV #compression #pretraining
DeepMind опубликовал интересную статью, с далеко идущими последствиями. Идея довольно простая и элегантная:
У нас есть много длинных видео, работать с ними сложно по ряду причин (long sequences, размер и тп). Так почему бы нам сначала не сжать эти видосы (с помощью нейрокодека), а потом обучать нейросеть уже на сжатых видео?
Так они и поступили. Мне кажется этот подход будет хорошо работать и с другими долгими последовательностями, например со стримами с датчиков.
🌟 Блог-пост
📖 Статья
#CV #compression #pretraining