VG: Video Courses
1.04K subscribers
349 photos
30 videos
301 links
Канал для объявлений лаборатории машграфики ВМК МГУ и лаборатории анализа видео института ИИ МГУ по курсам на ВМК МГУ, ФКН ВШЭ, AIM МГУ и университета Иннополис. А также для дискуссионных постов про новости в обработке видео и не только.
Download Telegram
Господа!

Раз в кои-то веки не наши новости, но на мой взгляд для самых продвинутых крайне интересно. А касается вообще всех. Крупный американский венчурный фонд Coatue опубликовал любопытный доклад "The AI Revolution" на 115 слайдов.

На первом графике - запредельно наглядно показана скорость инвестиций в AI за 3.5 года. Видно, что 10 млрд в OpenAI было больше, чем ВСЕ инвестиции во ВСЕ стартапы за предыдущие 2 года. И скорость инвестиций после выросла ~ в 3 раза. Заметим, что компания нашего Карена Симоняна на втором месте по ожиданиям инвесторов 👍😉

Дальше любопытный график скорости достижения уровня человека разными алгоритмами. На вашем месте я обратил бы внимание на линию "Core Generation". LLM уже многие простые куски кода пишут намного быстрее человека и скорее всего прогресс ускорится. Судя по комментариям на Хабре у части веб-программистов уже пригорает. Странно, почему? 😉 Можно предсказать заметное изменение эффективности работы и перераспределение спроса на рынке труда.

Ну и к вопросу "никогда такого не было и вот опять" - шикарный слайд о повышении производительности труда дизайнеров. Простая реклама могла занять месяцы в 60-х, когда чтобы передвинуть надпись - нужно было заново делать рисунок. В 80-х скорость резко возросла (особенно для надписей). Дальше серьезное ускорение за счет совместной работы над макетами (в США модным стали overnight заказы, которые реально реализовывали в Индии). А сейчас с генеративными моделями можно бросать очень прикольных вариантов и кинуть на них нужный текст буквально за минуты. А ведь творческая специальность! (где-то сейчас заплакал оставшийся без ужина дизайнер)

Но ведь это не может с программистами повториться? Ведь никак не может, правда? 😉

Там есть и другие любопытные слайды!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Не удержусь и сделаю форвард, тем более Сергей меня пиарит)

Внимательно посмотрите в следующем фото на руки девушки (оригинальной и в двух отражениях). А вот нечего руками махать, когда тебя фотографируют умные смартфоны! )))

Да, это ровно обработка видео при склейке кадра. Сегодня практически все телефоны делают это! И пример шикарный, конечно!

Кто пройдет по двум ссылкам - попадет на статью на хабре, в которой я попытался максимально популярно разжевать тему.

Раньше мы давали задание на Motion Estimation, чтобы люди пощупали руками видеопоток и поняли, как непросто с ним работать (в том числе выбрать нужный кадр для склейки).
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
А теперь реальный нейрорендеринг.
Ох, щас наброшу интересную тему.

Айфон сам решает, что вы должны увидеть на фото или почему фотография уже давно не отражает этот мир, а представляет собой метаверс, преломленный в мозгах нейрочипов.

Подруга невесты сфоткала последнюю на айфон. И получила три разных невесты. На одном снимке.

Стоя перед двумя большими зеркалами, отражение невесты не отражает ту позу, которую она принимает, и мало того, оба отражения отличаются друг от друга и от той позы, которую невеста принимала на самом деле.

В то время как невеста держала одну руку вверх, а другую вниз, отражение слева видит, что она держит обе руки вниз, а отражение справа - что она держит обе руки на талии.

"Это реальная фотография, не отфотошопленная, не панорамный снимок, не Live Photo", - пишет невеста в своей инсте.

Невеста в ярости идет в Apple Store, где ей рассказывают, что айфончик на деле делает серию снимков, а потом не просто выбирает лучший, а сшивает их в одну фотку.

Ну то есть айфончик решил, что в одном зеркале невесте к лицу одна поза, в другом - другая поза, а как там она выглядит или держит руки ему насрать. Ибо бьютификация - всё, а реальный уродливый мир - отстой и ничто.

Понятно, что вычислительная фотография давно уже не отражает реальный мир (вот почитайте огромную работу Димы Ватолина, где на фотках появляются неожиданные персонажи в результате апскейла).

Но этот кейс потрясающе выпукло демонстрирует нам факт, что мы давно уже полагаемся на ИИ в гораздо более широком круге вопросов, чем думаем.

Если у вас есть другие объяснения происходящего или годные теории заговора, пишите в коменты.
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Господа!

Хорошая новость - у нас состоялся релиз 17-го бенчмарка MSU Video Super-Resolution Quality Metrics Benchmark! 🥳 И это 14-й бенчмарк в "новой серии" бенчмарков)

Интересен он тем что его выпустил третьекурсник зимнего набора прошлого года!

Вежливо замечу, что в лучшем случае раньше на 3 курсе удавалось весной зарелизить, а то и вообще только к 4 курсу. А тут очень оперативно, при этом лидерборд крайне представительный (60+ метрик и еще будет пополняться в ближайшее время, поскольку посчитано больше).

Это 4-й наш бенчмарк на тему SR. Будем копать тему адекватных метрик качества, ибо работы в этой области (в которой прямо сейчас идет революция) непочатый край.

Интересно, что прямо сейчас один известный онлайн кинотеатр дал нам сэмплы на увеличение разрешения (вы знаете, какое "мыло" они часто показывают), так что работа сразу проходит "боевое" испытание (и оно дается непросто, заметим).

Но перспективы выглядят очень хорошо!

PS. Пояснение картинки: PSNR в некоторых случаях дает ОТРИЦАТЕЛЬНУЮ корреляцию с визуальным качеством SR, при этом она является САМОЙ используемой в статьях по SR. 🤷‍♂️🤦‍♂️😉 Будем менять эту тенденцию! 💪

Поздравляю Артема Борисова с релизом!!! 🎉🎉🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2🎉2
Ну и чтобы два раза не вставать.

Сегодня (!) наш магистр Никита Алутис сделал устный доклад на конференции VCIP 2023 (как они про себя скромно пишут AI-powered Visual Communications and Image Processing Toward Industry and Services​).

С какими приключениями пришлось столкнуться при оплате оргвзноса и билетами вы можете догадаться уже потому, что из России без VPN даже сайт конференции не открывается). Но! В итоге все получилось!!! (напомню зимой у нас был устный доклад на конференции в США, и это не предел)))

Замечу, что Никита автор MSU Video Deblurring Benchmark и перед ним был доклад очередной SOTA в video deblurring, т.е. была возможность пригласить на бенчмарк людей можно сказать лично (это очень важно, кстати, поскольку лично люди дают обратную связь про бенчмарк и т.п., чего никогда не стали бы писать письмами).

Ну и конференция, как заметил внимательный читатель, Toward Industry and Services, то есть ориентированная на индустрию (по крайней мере они пытаются, что, учитывая нашу практичность, очень хорошо).

В общем - поздравляю Никиту с первым докладом на английском на прекрасном корейском острове Седжю (Jeju)! 👏👏👏

#pro_conferences
🔥15👏1
Господа!

У нас улетная новость!)

Последняя статья Насти Анциферовой сотоварищи "Comparing the robustness of modern image- and video-quality metrics to adversarial attacks that increase quality scores" зашла на AAAI-2024! Это А* конференция по AI! Йе-е-е-е-е-есссс!!!! 💪 Мы сделали это!!! 💃💃💃) Это уже третья А* Насти и команды метрик за последние 2 года! 🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉🎉

Статья описывает работы по бенчмарку устойчивости метрику, который измеряет насколько метрики легко накручиваются. С одной стороны до сих пор находится много наивных чукотских людей, которые не понимают, кому это нужно. С другой - в топах большинства бенчмарков, сравнений и соревнований в области обработки и сжатия видео уже почти не осталось лидеров, которые бы не оптимизировали результат под метрики (😲 упс...). Все исследователи делают это... А если у бенчмарка лидерборд не по метрике, а по субъективному сравнению, не так просто туда заманить авторов (и почему так происходит, интересно? 😉). Увеличение адекватности сравнения без дорогого субъективного - это буст всей области!

Но еще важнее другая тема. Для тренировки JPEG AI, например, взяли 5 простых старых метрик, не потому, что лучше не было. Метрик лучше (моднее и молодежнее) был вагон. Просто они неустойчивы и в loss их поставить нельзя. При этом очевидно, что при постановке в loss более продвинутой метрики мы получим лучший результат. Аналогичную картину наблюдаем в SR и в других областях. Вопрос, где такую метрику взять или как построить? И это вопрос реально очень хороший. Мы уже сожгли много электричества (в прямом смысле) и потратили много сил на прокапывание этой области, но кроличья нора, похоже, весьма глубока.

Как минимум это повод для следующих А*! 😁😁😁

Продолжаем движение! ✌️

#pro_conferences
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92🔥2
Господа!

Анастасия Анциферова - герой прошлого поста и наш сотрудник в ИИИ прислала сегодняшние фото с NeurIPS (A* AI, 7000 участников) сегодня из Нового Орлеана (юг США).

Думаю, подробности еще будут (конференция идет неделю).

#pro_conferences
🔥93
Господа!

Анастасия выступила вчера на постерной секции.

Кто узнает человека, окруженного толпой у постеров - молодец!) (пишите имя в комментариях)))

Ну и конференция огромна - на фото выше виден зал, в котором докладчика видно только в бинокль подзорную трубу и большое количество экранов не сильно спасают положение)))

На последнем скриншоте: Настя написала автору метрики в приложении конференции про наш новый бенчмарк устойчивости метрик, а он оказывается следит за этой нашей работой и им интересно посотрудничать.

Работаем! )))

#pro_conferences
🎉12
This media is not supported in your browser
VIEW IN TELEGRAM
Господа!

Из наших текущих развлечений.

Довольно широко известны физические атаки на классификаторы и детекторы. Это когда вы надеваете футболку с хитрым принтом и пропадаете с детектора (или хитрый макияж наносите и сеть вас не узнает).

У нас была задача повторить физическую атаку для метрик. Это оказалось не так просто, как хотелось бы, но, наконец, получилось! Выше пример, когда вы добавляете специально обученный (во всех смыслах) стикер в кадр и no-reference метрика такая "Бо-о-оже, как же похорошела картинка!!!" 😉

В ближайшее время будем расширять спектр атак и, кстати, спектр защит от атак)

Stay tuned!)
👍162
Господа, из прикольных новостей этой недели.

Выступил очно на этой неделе с двумя докладами на открытом математическом семинаре в университете Иннополис в ОЧЕНЬ хорошей компании (Алексей Наумов - директор центра ИИ Вышки, а Александр Крайнов - директор по развитию ИИ Яндекса, и там еще очень интересные люди были).

Иннополис тоже впечатляет, в первую очередь темпами своего развития. Похож на Сколково, но с лучшим контролем, меньшим количеством перекосов и очень хорошими перспективами. У них новый молодой ректор (Александр Гасников), который массу правильных вещей стартует.

Запись первого дня (я в начале).

Запись второго дня (я в конце после Крайнова - на картинке старое расписание)

Многие слайды до этого показывались только на внутренних индустриальных конференциях) Есть несколько графиков, которые вообще показывались впервые)

Но в целом - известные вам вещи - обзор темы взлома метрик + измерение качества JPEG AI и суперрезов. У Крайнова очень обзорный рассказ про ИИ в Яндексе (и там есть разница между рассказом и реальностью, о которой рассказывают наши люди там, но в целом для введения хорошо))). У Наумова - хорошая математика. А Савватеев просто всегда великолепно жжет)
👍1