VG: Video Courses
1.04K subscribers
349 photos
30 videos
301 links
Канал для объявлений лаборатории машграфики ВМК МГУ и лаборатории анализа видео института ИИ МГУ по курсам на ВМК МГУ, ФКН ВШЭ, AIM МГУ и университета Иннополис. А также для дискуссионных постов про новости в обработке видео и не только.
Download Telegram
Господа!

Мы в этом году снова участвуем в челленджах 11-го CVPR NTIRE (New Trends in Image Restoration and Enhancement, хотя за 11 лет там уже давно далеко не только восстановление и улучшение). И если в прошлом году у нас прошел только один челлендж по улучшению пользовательского видео, то в этом два — челлендж детекторов дипфеков картинок и челлендж предсказания карт салиентности (куда смотрит человек в видео).

Соревнование еще в самом разгаре (на первой картинке внизу таймлайн), но уже можно сказать, что челлендж дипфейков существенно перекрывает по популярности все соревнования, которые мы проводили (сейчас 173 участника и 609 сабмитов)! Более того, оно сейчас на первом месте среди 44 соревнований этого года на всем NTIRE!

Причем по опыту часть сильных участников засылают свои решения в последний момент, а часть засылает, но не дает добро показать их в лидерборде (в том числе сильные, и мы это видим).

Смысл соревнования в том что сегодня детекторы дипфейков уже довольно неплохо работают, однако когда в реальной жизни их результат заливают в соцсеть, его жмут. Иногда жмут сильно (ну типа много пережимали, когда пересылали). И на этих сжатых точность детекторов резко падает. Наш лидерборд строится по результатам после 18 преобразований деградации. Т.е. измеряет лучше всего выживающих.

Всего мы подключили 42 генератора картинок (как опенсорсные, так и коммерческие). В трейн из них ушло 20 генераторов. Датасет постарались сделать максимально без неявных дата-ликов (когда, например, у коллег мера эстетики сгенерированных была заметно выше, чем у реальных, а мерам эстетики, кто помнит, была посвящена наша Highlight paper на ICCV прошлого года... или, например, все реальные картинки были пожаты JPEG, а все сгенерированные вообще не сжимались, что сегодня тоже легко детектится). Тем не менее текущие результаты оказались довольно просты для детекторов (см вторую картинку), хотя решения типа с 0,99 на данных без искажений и 0,80 (огромная ошибка по нынешним временам) на данных с искажениями встречаются.

Но дальше будет интереснее. Самые лучшие решения, это те, где результат лучше всего генерализуется. В идеальном мире у нас не должно быть ситуации, что выходит, новый генератор и детекторы полностью перестают на нем работать. Или все дружно переходят на вышедший в сентябре прошлого года JPEG AI и детекторы массово умирают. В общем для участников будет интрига, насколько изменится датасет в финале, а там точно будут новые генераторы, ибо мы меньше половины генераторов из нашего датасета задействовали (мы заявили 25 генераторов на Validation и 35 на private). Новые сложные преобразования в приватном также заявлены) А для нас будет интрига, кто из участников откроет в конце код (и войдет в финальный лидерборд статьи). Ибо часть участников (включая лидеров) код может не открыть.

Забавно, что сейчас лидер, см скриншот — Ant International (и судя по описанию в профиле это они, да) — сингапурская финансовая компания, часть холдинга Ant Group (наиболее известный продукт — Alipay). Если кто следил, то нашумевший год назад Deepseek был создан также финансистами — китайским хэдж фондом. Сейчас Ant International на первом месте. И интрига в том, потеряют ли они его и откроют ли код. Велика вероятность, что не откроют (особенно если не потеряют))). Но в любом случае очевидно, что код открывших будет внимательно изучен и улучшит другие решения. Ну и мы внимательно изучим, естественно. 😉

Очевидно для нас челлендж — это великолепная возможность проверить качество датасета. Ибо мы планируем самый большой (и самый качественный) датасет такого рода в мире подготовить. И уже много для этого сделали. Также мы планируем следующий челлендж сделать на детекторы дипфейков в видео (намного более сложная тема, в том числе чисто вычислительно для нас).

Буду держать вас в курсе этой интереснейшей темы! 😁

Stay tuned! 😉

#our_successes@vgcourse
@vgcourse
👍7🔥52
This media is not supported in your browser
VIEW IN TELEGRAM
Уже в эту среду, 18 февраля пройдет первая лекция спецкурса «‎Интеллектуальные методы обработки видео»‎, на котором вы узнаете:
• Какие существуют современные тренды в обработке видео
• Как правильно использовать машинное обучение и нейросети в этой области
• Почему существуют мыльные картинки и как от них избавиться
• В чем заключается магия пленоптики, или как устроены 4D видео

Если ты учишься на 2-4 курсе и хочешь попасть в видеогруппу нашей лаборатории – этот курс твой счастливый пропуск!

Присоединяйся к чату курса
7👍4
Господа!

Ровно неделю назад я писал про наш новый челленжд по дипфейкам на CVPR NTIRE, который вырвался на 1 место среди 44 челленджей по количеству участников и сабмитов.

Короче! За неделю количество сабмитов УДВОИЛОСЬ (!) до 1231 (условно идет +100 в день, в выходные чуть меньше), а число участников перевалило за 200 (пруф выше).

Мы продолжаем держаться на 1 месте по популярности среди 44 челленджей CVPR NTIRE и по участникам, и по сабмитам! 💪🙂

Сейчас забавно читать, как год назад, 15 февраля 2025 я писал про наше первое участие в NTIRE:
Соревнование по сути только началось (первый этап), а у нас (будучи почищено от тестовых и странных) 45 участников, 22 сабмита (17 из них уникальных). Это ОЧЕНЬ круто!

По сравнению с тремя челленджами ECCV это тогда было реально круто. И вот через год мы драйвим самый большой на данный момент по участникам и сабмитам челлендж NTIRE. Хороший прогресс! 😁

Для нас это серьезное испытание качества нашего свежесозданного датасета. Его, кстати, только на HuggingFace уже скачали больше 500 раз, при том, что мы его выложили там позже (меньше 2 недель назад), поскольку люди жаловались на сложности скачивания с нашего сервера. Т.е. общих скачиваний больше. Очень неплохо заходит, особенно учитывая, что это только часть гораздо более крупного запланированного датасета, на который будет, собственно, основная статья.

Из любопытного:

* Текущий датасет пока (до планового расширения) оказался слишком легким. Борьба сейчас идет за 3-й знак после запятой! 😲 Усложнение уже добавили в табличку (чтобы морально подготовить участников, см вторую картинку).

* В этом плане сейчас место — это переобучение под эти данные (что вредно для генерализации, заметим). Но видно, как китайцы тем не менее кладут новые и новые сабмиты, чтобы выбить побольше. 😉 Забавно было наблюдать, как Ant International сдвинули на 2 место, а потом на 3. Они сначала сняли результат из лидерборда. А потом выложили новый результат, который 1 место выбил. А сейчас они опять на втором) Китайцев хлебом не корми, дай посоревноваться! С ними очень непросто конкурировать.

* Забавно, что на 26 месте сейчас компания Reagvis Labs, которая была создана прошлым летом и работает на рынке детекторов дипфейков на картинках, видео, аудио и документах. Они явно не парятся перезаточкой под данные, но вангую, что в финале их место существенно вырастет (хотя не факт, что они раскроют код).

На днях поговорил с нашим выпускником, который сейчас работает за рубежом в компании, которая также занимается детектом дипфейков. Он много интересного рассказал, в том числе о том, как они в челленджах участвуют с разного рода хитростями (когда код раскрывается, но это свежесозданный вайбкод, например). Будем этот опыт учитывать! 😁

Еще забавно, что на втором месте по популярности NTIRE этого года также бенчмарк детекторов дипфейков, но мы пока удерживаем лидерство 😉

И самый смак, конечно, будет в анализе результатов.

Stay tuned! 😉

#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Всем привет, уже завтра стартует спецкурс «Интеллектуальные методы обработки видео».

На первой лекции мы расскажем о нашей лаборатории и наших проектах, а также наши аспиранты поведают о своем исследовательском пути в ней

Ждем всех желающих в 14:35 в аудитории 612 на ВМК

P.S. на гифке изображен четырехмерный кадр, который вы научитесь получать сами в последнем задании курса)
🔥8👍2
Господа!

Из свежего забавного. На прошлой неделе оживленные споры в рассылке университета Иннополис вызвал анонс выступления Марка Обозова, который типа "руководитель исследовательской команды в Т-банке, мейтнейнер PyTorch и исследователь института ИИ Иннополиса" при том, что ему всего 15 лет. 😲

Сразу скажу, что на странице мейнтейнеров PyTorch найти такую фамилию не удалось, зато удалось найти профиль https://openreview.net/profile?id=~Mark_Obozov1. Для тех, кто не в курсе — большинство А* конференций рецензируются на сайте openreview и по профилю там можно посмотреть, какой опыт у человека. Прямо скажем далеко не у каждого аспиранта ВМК такой же богатый профиль openreview. Я бы даже сказал, что это найти аспиранта с сопоставимым профилем — это редкость 😲😁. При этом статьи в основном за прошлый год, когда молодому человеку было, надо полагать, 14. 🤯

На github в torchtune у Марка 9 место среди контрибьюторов, очень неплохо! 🙂

В качестве научного руководителя у него указан Александр Гасников — ректор университета Иннополис, который не только один из самых молодых ректоров, но и единственный ректор в России, у которого несколько десятков А* статей по ИИ.

Что я по поводу этого всего думаю 😉

Когда-то давно я был олимпиадником и еще будучи школьником получил в научные руководители сотрудника академического института РАН, который сам был вундеркиндом, его жена была вундеркиндом и их ребенок с 6 лет активно программировал и выдающиеся результаты показывал. Этот замечательный человек на своем и пачке чужих примеров популярно объяснил мне, что одной из самых болезненных проблем вундеркиндов является то, что раннее развитие далеко не всегда означает выдающееся развитие в зрелом возрасте. Скорее наоборот — это редкость. 🤷‍♂️

И гораздо чаще возникают ситуации, когда в детстве молодой человек избалован успехами, интервью в СМИ, участием в передачах и т.п., а к 25-30 годам лучшие из сверстников не только догоняют, но и перегоняют. Упс! И это нередко крайне болезненно воспринимается. Тебя уже не показывают каждый месяц по телевизору к радости бабушки 🤔😭

При этом нейропластичность никто не отменял и то, что у вас в раннем возрасте научный руководитель будет ректор университета сильно выше среднего, это очень мощный потенциальный бустинг. Который кто-то использует, а кто-то нет. Все как всегда, короче! 😉

Выступление Марка, кстати, можно посмотреть тут! Там час выступления и 10 минут вопросов. Ничего особенного. Чел просто рано прокачивается делать научные доклады и работать с аудиторией 😉

И дальше для вас вопрос, когда созреете прокачиваться вы. Мы с коллегами наблюдаем сейчас абсолютно рекордное количество желающих прокачаться среди закончивших университет 3-7 лет назад. Ибо они ощущают, что жаренным в воздухе попахивает. Подобная Марку зубастая молодежь весьма бодро шуршит.

Всем конкурентоспособности! 😁

@vgcourse
#neuroplasticity
#нейропластичность
Please open Telegram to view this post
VIEW IN TELEGRAM
15😁4🤔3
Господа!

Работал на прошлой неделе над повышением доходов студентов. 😁

На лекции задал вопросы (со слайдов):
— Кто хочет получать больше 1 млн рублей в месяц?
(лес рук)
— Кто хочет получать больше 1 млн долларов в год?
(смех, лес рук)
— Почему вам будут их платить в 2030 году, учитывая скорость развития ИИ?
(тут аудитория подзависла)

Были варианты:
— Потому что мы будем работать много.
А другие желающие получать много будут работать мало? 😉
— Потому что мы умеем учиться.
Другие не умеют? 😉
— Мы будем предлагать нестандартные решения.
А другие не будут? 😉
— Мы будем уметь находить и извлекать информацию.
А других их не будут уметь? 😉
— Потому что мы будем делать то, что другие не могут.

Ваш покорный слуга:
— Отлично! А что именно вы будете делать, что другие не могут? Я ж не против! А что именно?

И дальше молчание аудитории...

Я, увы, не смог выбить из аудитории второкурсников конкретные знания и навыки, за которые много платят в век ИИ... (уверен, что среди подписчиков ситуация была бы сильно лучше)))

Забавно, что первое домашнее задание цикла "Путь лемминга", который я уже больше 10 лет читаю, заключается ровно в составлении списка, чему нужно научиться в университете. Очень полезное домашнее задание, замечу. Выписать КОНКРЕТНЫЕ навыки, которые будут цениться на интервью на топовые позиции.

В качестве намека: какое-то время назад в статье с характерным названием "Дефицит компетенций стал главным барьером развития искусственного интеллекта" директор по развитию технологий ИИ "Яндекса" Александр Крайнов ехидно отмечал, что хотя по бумагам наши вузы выпускают миллионы миллиардов специалистов в ИИ, Яндекс не может их обнаружить:
"Когда мы приглашаем специалиста, то он должен уметь простую вещь. Он должен взять последнюю научную публикацию по теме ИИ, объяснить, что там написано, сравнить с другими и оценить ее. И это не тестовое задание, это его будущая работа. Теперь внимание, сколько выпускников справляется с такой задачей. Мы видим, что есть буквально три вуза в стране, где мы можем в год брать больше десяти человек, обладающих такими компетенциями. Далее длинный хвост, где можно пригласить одного, двух человека из ВУЗа"

И он прав! Таких людей ОЧЕНЬ мало среди выпускников! Забавно, что прошлым летом я делал пост о том, что такое фундаментальные знания, которые может давать университет сегодня, который очень хорошо рифмуется с уважаемым директором по ИИ:
Хороший критерий — способность самостоятельно (без GPT) читать свежие статьи по теме с топовых конференций типа CVPR, ICML, ICLR, ICCV, ECCV, AAAI etc.

Существует довольно много работающих с младших курсов молодых людей, считающих, что они все им нужное от университета получили, которые этот критерий не проходят. И не считают нужным проходить. И слава богу!

Также деликатно замечу, что способность ЧИТАТЬ, намного слабее способности ПИСАТЬ. И если человек серийно ПИШЕТ в основные треки топовых конференций, он гораздо больше понимает, почему именно статьи написаны так, а не иначе (ибо там много-много байесов, порождающих fake science). И успешнее создает топовые технологии.

У нас за 4 года уже 9 первых авторов А* статей по ИИ (а с выпускниками 11). Тот же Александр Крайнов не раз заявлял, что Яндекс ведет список первых авторов А* для HR (при этом наибольшее число первых авторов А* в России работает почему-то в Сбере 😉)

Как тут шутят в одном известном канале:
2024: Промпт-инженер
2025: Вайб-кодер
2026: Менеджер ИИ-агентов
2027: Безработный

В этом плане вангую, что к 2030 году сегодняшние студенты поделятся на тех, кто будет обоснованно считать, что Яндекс безобразно мало платит (и уйдет получать больше!) и тех, кто лихо промптил и вайбкодил в университете 😂

Все меняется очень быстро! Ответ на первое домашнее задание за 5 лет поменялся очень заметно (и продолжает меняться!). Но вы можете его не делать! Большинство не делает. Как писалось в одной старой книжке "Много званных, но мало избранных". А в это время кто-то тихо и методично прокачивает А* с 14 лет (где он будет в 24, и где будешь в 24 ты?).

Sapienti sat.

Всем конкурентоспособности! 😁

@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍5🔥3🤔2😁1
Господа!

Мы меж тем продолжаем драйвить самый популярный челлендж CVPR NTIRE (на графике выше число участников во всех 44 челленджах, выделены наши два). Видно, что челлендж детекторов дипфейков лидирует с отрывом. 💪💪👍

До окончания соревнования осталось две недели и мы планово выложили набор Hard Validation (ранее Validation 2). Безобразие с борьбой за третий знак тут же прекратилось, набор действительно оказался заметно сложнее (привет, улучшение датасета!))). При том, что мы постарались сохранить достаточно реалистичные искажения (например, сжатие JPEG 2000 и JPEG AI), более реалистичные, чем у конкурента. Сейчас даже у сохранившего первое место Ant International 0.9587. А ведь дальше будет еще одно плановое повышение сложности (писал об этом)! В общем благодаря сравнительно легкому входу удалось собрать много участников и сейчас начинается самая жара. 🔥

Счетчик сабмитов замедлился, поскольку количество посылок в день пришлось ограничить одной (было 5) для уменьшения заточки под датасет, поэтому у нас будет 2 место по сабмитам среди соревнований NTIRE, но зато более адекватные результаты финального лидерборда. Однозначно выбираем второе! 😁

В целом детекторы выступили заметно лучше, чем мы изначально ожидали. Например, у нас нет очень сложного (но все более популярного) кейса — редактирования картинки, когда большая часть дипфейка является реальным изображением. Такие примеры детекторы сломают массово, но такого рода датасет кардинально сложнее и дороже готовить. В общем, есть, куда расти! 😉

Очень греет, что только с huggingface датасет скачали уже ~700 раз (при том, что он выложен в двух местах, а открывших результат в лидерборд участников только 107, т.е. датасет активно качают и не участвующие в соревновании). Он на глазах становится нашим самым популярным датасетом, при том, что будет только маленькой частью большого датасета, который опубликуем с А* статьей. Работа, очевидно, заходит!

Когда опубликуем результаты по генераторам (очевидно, разные детекторы разные генераторы в разным успехом распознают), будут сюрпризы! 🎁

Stay tuned! 😁

#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥7👏2
Господа!

У нас тут идет активное обсуждение модного в этом сезоне Agentic AI и его применения в ресече. В частности, наш сотрудник настроил контейнер с изоляцией на сервере c GPU для запуска Super-Resolution (SR) и так вчера описал результат:
Дальше я взял копайлот с Opus 4.6 и сказал ему что-то вроде "вот ссылка на гитхаб с SR, склонируй и разберись, как добавить в нашу систему прогона". Где-то через час-два с буквально парой моих подсказок, и 10-минутной проверки результата, в систему нормально добавлен нетривиальный SR.

Свежие SOTA методы SR содержат довольно много кода и с ними обычно хватает приключений!
А потом ещё один. А потом ещё один. А потом ещё один. И все как полагается с ужасным китайским кодом. За два дня я передобавлял в систему почти все остававшиеся SR, которые есть у нас в статье!

То есть оно само находит репозиторий, клонирует его, дальше само (долго и упорно) разбирается с ужасными god forsaken зависимостями в ужасном питоновском коде [ужасных] китайских учёных, само чистит ненужные для инференса файлы, само разбирается где и пишет скрипт, чтобы скачать веса, само адаптирует китайско-учёные скрипты инференса под мою систему прогона, и само проверяет, что докер собирается, веса скачиваются, инференс работает, и на выходе прилично выглядящие картинки!

Это праздник! 😁
В общем, работающая песочница и правильный agentic loop рулят (но я на это за два дня потратил где-то половину своего месячного copilot pro)

Правда, теперь надо искать другие задачи для нашего студента из AI Masters, когда он закроет, наконец, вопрос со своей пересдачей!

Короче, стажер остался без задачи. 🤷‍♂️

Все шустро сделал Agentic AI! 🤩

Эта история вызвала много обсуждений) Наш выпускник (руководящий довольно крупной командой) вчера написал:
Я себя программистом уже не считаю и мне не надо доказывать кому-то, что ИИшка пишет плохой код, а я лучше ;) (болезнь очень многих хороших программистов, к сожалению)

Так вот, пока моя команда несколько месяцев делала нормальную прод-версию onpremise ИИ-ассистента на базе RAG-системы для заказчика, я за пару дней с помощью codex сделал MVP версию систему, почти не отличимую от прода по функциональности (включая весь фронт и бек - чего я вообще не знаю). И ее мы уже показывали заказчику для обсуждение разных нюансов.

[...]
После этого я понял, что джуны-разработчики уже не нужны, да и мидлы почти тоже :)

Интересно, что в предыдущие двое выходных я 5 часов общался по зуму со своими выпускниками в Англии, Испании и США. И двое из трех говорят, что у них то же самое — корпоративные подписки на Антропик, OpenAI, гугл и перестают нанимать джунов!

Другой выпускник вчера вечером пишет мне:
Моя новая позиция — программистам остался год…
Клод 4.6 опус пишет отличный рабочий код, который прекрасно вписывается в проект на 100к+ строк. И делает это быстро
[...]
У нас скорость написания новых фич куда критичнее количества сжигаемых токенов. И сжигаем мы очень много)


Какие мысли по поводу:

* Agentic AI помощники на глазах совершенствуются и оказываются в состоянии делать все более и более сложные рутинные задачи (которые ранее отнимали кучу времени и сил). А старые задачи делает все дешевле и дешевле.

* Как следствие — быстро повышается уровень абстракции (уровень понимания), который необходим для адекватного решения задач. На сложных задачах разница в производительности между синьором (с AI) и джуном (с AI) растет, а необходимость в джунах падает.

* Мы сейчас находимся на этапе наиболее быстрого совершенствования технологий. Далее, думаю, что скорость улучшения AI замедлится (поскольку растет сложность), но все равно останется довольно большой (там есть и куда улучшать, и как).

* Параллельно будет происходить довольно инертный процесс адаптации бизнеса к новой ситуации, появление нового железа и другие "медленные" процессы. Это даст плавный массовый рост успешного использования.

Это революция создаст много новых возможностей, но и увеличит конкуренцию. (Всячески пытаюсь поднять вашу зарплату через 5 лет).

Всем конкурентоспособности! 😁

Sapienti sat.

@vgcourse
12🔥4🤔4👏1
Господа!

У нас очередная отличная новость! 🙂🎉🙂

Вчера успешно защитил диссертацию наш сотрудник и мой зам лаборатории в институте ИИ МГУ Сергей Лаврушкин (соавторство в 4 А* на данный момент)!

Вопросов было немного. Решение единогласное!
🥳🥳🥳🥳🥳🥳🥳🥳🥳

На этой неделе разговаривал с одним директором компании, он говорит: "Предпочитаю на ресеч брать кандидатов наук. Они лучше умеют сделать то, что нужно сделать, даже если не хочется и доводят задачу до результата".

Кстати, диплом вуза в наши времена массовых уходов в академ ту же функцию играет. На привлекательные вакансии слишком много желающих и установить требования по образование или степени — это просто способ отфильтровать кандидатов на интервью.

Я уж молчу про то, что тот же Google любит брать PhD даже на обычные инженерные позиции. У них типа, по статистике перформанс лучше. Могут себе позволить, что тут сказать 😁

Напомню, что еще летом писал, что в Superintelligence team 29 из 30 Scientific Researcher — PhD.

Также любопытно обсуждение быть или не быть To PhD or not to PhD в Реддите, где приводят статистику, что 99.9% Research Scientist в DeepMind с PhD (и неудивительно, это первое требование на работу к ним). У Anthropic сейчас примерно половина сотрудников с PhD (но у них и девопсы, и тестировщики, и маркетологи есть), т.е. среди программистов доля очень велика. PhD есть у большинства в ядре xAI и т.д.

Естественно, сама по себе степень ничего не гарантирует (как и диплом не гарантирует знаний, особенно сегодня), но если знания и навыки целенаправленно прокачаны — это реально бустит! 💪

У нас сейчас 12 аспирантов, так что не будем останавливаться на достигнутом! 😁

Сергею еще раз горячие поздравления! 🎉🥳🎉🥳🎉🥳🎉🥳🎉🥳🎉

Stay tuned! 😁

#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉30🔥96🤩3
Дорогие дамы!

Вы уже знаете, что девочки у нас жгут не по-детски!

Начала жечь Настя Анциферова, ставшая первым автором нашей первой А* на NeurIPS-2022 (всего у нее 10 А* на данный момент, если нигде со счета не сбился)))

Продолжила жечь Катя Шумицкая — первый автор нашей второй А* (ICLR 2023), которая в прошлом году ПОСТУПАЛА в аспирантуру имея в багаже 4 А* (две - первым автором). Сильно не у всех аспирантов в МГУ столько на выпуске из аспирантуры есть (я бы сказал, таких почти нет))). Сейчас у нее 5 А* и к концу аспирантуры там будет, думаю, очень богато 😁

Продолжает жечь Виктория Леоненкова, которая свою первую А* первым автором затащила недавно в январе на 1 курсе магистратуры. 🙂

Таких девушек мы очень любим и очень ими гордимся! 💐💐💪💐💐

Год назад, кстати, звал парней догонять. Парни не подвели! У нас двое бакалавров А* первыми авторами затащили в прошлом году, составляя достойную компанию нашим девушкам (а то они скучали на пьедестале)))

В общем — наших замечательных девушек и всех читающих девочек, девушек и женщин с праздником весны! 😁

P.S. Картинка символизирует нейросетевой праздничный датасет из изображений и видео 😂 (подарочный вариант)))

@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥7
Господа!

Из текущего любопытного.

Не знаю, как проводили выходные вы, а я наконец-то дослушал два подкаста от 12 и 19 февраля. Первый, от Бориса Черного — одессита, закончившего UCSD, доросшего до принципал инженера в запрещенной компании (очень круто!), руководящего разработкой Claude Code в Anthropic (суперхайповый проект сейчас), 350 тысяч просмотров. Второй, от Шервина Ву, китайца, закончившего MIT, и руководителя отдела разработки API и платформы для разработчиков OpenAI, 70 тысяч просмотров. Оба подкаста в гостях у Ленни Рачитского — одессита, закончившего UCSD))) (да, два одессита таки имели, что нам сказать за LLM, но на хорошем английском))).

Оба подкаста по факту были посвящены тому, как сейчас устроено программирование внутри этих компаний.

В силу концепции догфудинга, оба стартапа крайне активно используют свои собственные инструменты Claude Code и OpenAI Codex для внутренней разработки, получая с одной стороны опыт разного рода косяков (и понимание, что надо исправлять) и увеличивая сложность делегируемых задач с другой. Второе по сути означает увеличение эффективности работы команд.

Оба отмечают существенный рост производительности. Борис говорит про 200% и что с ноября он не написал руками ни строчки кода. И даже ни одной правки не сделал. Для человека, который крайне профессионально 17 лет писал код (и был одним из самых продуктивных инженеров в Запрещеногорамме!) это звучит сильно. Аналогично лучшие разработчики Spotify не написали ни строчки кода с декабря.

Оба отмечают усиление использования API. Борис говорит об удвоении активных пользователей Claude Code за последний месяц.

Момент, который впечатлил меня лично: Борис утверждает, что в Антропике некоторые инженеры тратят на токены сотни тысяч долларов в месяц ("hundreds of thousands of dollars a month"). И компания поощряет тратить много, набирая статистику и эффективные практики. Благо они могут себе это позволить — Антропик сейчас зарабатывает порядка 19 миллиардов долларов в год (пересчет среднемесячного), а Яндекс в прошлом году заработал, для сравнения, 15 миллиардов. Но в Антропике все еще работает меньше 3 тысяч человек, а в Яндексе больше 30 тысяч. Это сильно меняет дело.

Понятно, что это все еще эксперимент, но масштабы поражают. Основной риск — рост технического долга, особенно при написании high-load частей кода (а в обеих компаниях такой, конечно, есть). И здесь уровень квалификации программистов становится критичен.

Любопытных моментов много, в том числе история появления и развития Claude Code и Claude Cowork внутри компании.

Рекомендую сначала послушать Бориса, а потом на 2х Шервина и сравнить — у них очень много одинаковых моментов)

Революция обычно идет по логистической кривой. Такое впечатление, что мы выходим на участок максимальной скорости с одной стороны и уменьшения ускорения с другой.

В заголовке статьи график годичной давности изменения стоимости токенов за 2 года. Видно, что если бы тренд сохранился, то линии тренда уже пробили бы 0 и компании платили бы нам за использование LLM 😉 Очевидно долго такое быстрое сокращение стоимости происходить не могло и сейчас падение продолжается, но уже не столь быстро, как в первые два года "эры GPT". В любом случае это означает кратное сокращение стоимости токенов за год при увеличении качества результата (быстрее всего падала стоимость токена для наиболее сложных задач, обратите внимание). Т.е. то, на что сегодня тратят сотни тысяч за токены в месяц завтра превратится в тысячи. Так будет выглядеть продолжение этой революции.

Мы живем в удивительнейшее время! 😲😁

Больше материалов на тему:
#speed_of_progress@vgcourse

@vgcourse
10🤔1
Господа!

У нас продолжается увлекательнейший процесс проведения самого популярного челленджа CVPR NTIRE 2026! (писал про это тут, тут и тут)

Какие новости к этому часу:

* Количество участников доросло до 477 😲 И там еще подходят участники (есть шанс дотянуть до 500!))) Информации по этому году еще нет, но в прошлом году 500 не было ни в одном челлендже CVPR 😲😁 По крайней мере найти не смог, кто поможет буду признателен!

* Количество залитых решений перевалило за 3000!

* Количество скачиваний датасетов c huggingface доросло до 1248 и 827 (рекорд для нас по скорости популяризации наших датасетов) + утром выложен третий датасет.

* Сегодня ночью завершился этап валидации и началась последняя тестовая фаза. Утром сделали рассылку со словами:
Submission Limits

To keep the evaluation process manageable, the following limits apply during the final submission phase:

* Maximum 1 submission per day
* Maximum 3 submissions IN TOTAL during the entire final phase

Please use your submissions carefully.

Были явно участники, которые тюнились. Усложнили им жизнь с 3 сабмитами на фазу. 😉 Датасет также в очередной раз планово усложнен, т.е. планка каждый раз повышается от достаточно низкого входного порога в самом начале до ощутимо сложного сейчас. Там явно кто-то регистрировал фейковые команды, пришлось их блокировать ручками (и довольно много). В общем работа идет)

Профиль у большинства участвующих команд недозаполнен, но по редким заполнившим картина по странам такая:
Китай — 35 участников 🐲 (подавляющее большинство!)
Южная Корея — 5
Индия — 4
США — 3
Франция, Сингапур, Вьетнам — по 2
И дальше по одной команде из Греции, Алжира, Непала, Саудовской Аравии, Норвегии, Испании, Италии, Греции, России. Есть Макао и Гонконг — тоже, Китай, практически. Есть даже одна команда из Ирана! 😲

Отдельно потом подведем размер команд. Обычно это 3-6 человек, но команда из Франции, например, 23 человека! 🇫🇷😎

В списке команд от компаний вижу:
* ByteDance (150 тысяч сотрудников, 155$ млрд выручки)
* Tencent (105 тысяч сотрудников, 92$ млрд выручки)
* ZTE (75 тысяч сотрудников, 15-17$ млрд выручки)
* Xiaomi (44 тысячи, 53$ млрд выручки)
* несколько команд Ant Group (16 тысяч, ~17$ млрд выручки), у которых на Validation Hard два первых места сейчас 🙂 (так что не смотрите, что они меньше других, они, похоже, твердо намерены первое место удержать!)
и т.д.

Есть несколько специализированных компаний типа CheckAI, Reagvis Labs, ML1.ai и, наконец, Instsig (разработчики популярного приложения CamScanner, третье место на Validation Hard — красавцы, учитывая крутизну других участников!).

Удивляет количество команд от известных университетов и лабораторий. Ранее их знали только по публикациям. Смотрим, как коллеги активно и бодро меняют темы и достигают хороших результатов в сложных конкурентных областях. Есть чему поучиться.

На 22 месте (т.е. довольно высоко) сейчас товарищ с ником i_need_job 😁 В общем, он даже вполне может ее найти с таким местом! И даже неплохую 😂

Две ключевых интриги на данный момент сохраняются:

* Как поменяются места на тестовой фазе с генераторами, которых не было ранее (т.е. насколько детекторы сохраняют устойчивость на неизвестных генераторах)

* И кто выложит код в конце (здесь скорее всего тихо уйдут в туман многие интересные решения компаний и на первый план выйдут университеты, речь о которых впереди... продвигая науку и давая компаниям новые идеи)))

Не переключайтесь! Stay tuned! 😉

#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥113🤔1
Господа!

Один из моих любимых авторов Андрей Карпаты (раз, два, три, четыре, пять) на днях выпустил очень интересный анализ "Справочника Бюро статистики труда США перспективам профессий", в котором дается статистика по 342 профессиям, покрывающим 143 миллиона рабочих мест в США (почти всю экономику по сути).

Карпаты взял 3 величины:
* Прогноз роста/сокращения числа рабочих мест из справочника
* Медианную зарплату
* Минимальное образование, требуемое для профессии
И добавил к ним 4 компоненту — влияние AI на профессию, которую "прикинул" с помощью Gemini Flash и все это визуализировал (цветом — величину, прямоугольником — количество людей с такой профессией).

Получилось очень наглядно и прикольно.

Что любопытного видно сходу:

* Часть специальностей (34.1 млн рабочих мест) быстро сокращается. Например, быстро падает число кассиров супермаркетов (прогноз BLS: -10% за 10 лет, 3.2 млн) и General Office Clerks (-7%, 2.6 млн). А часть специальностей растет, например, Home Health and Personal Care Aides (+17%, 4,3 млн)

* Очень любопытно кликать на зарплату и образование. Наглядно видно, как во многих специальностях более высокие требования к образованию конвертируются в большие зарплаты. Заметим, что PhD в среднем получают сильно больше закончивших магистратуру, но при этом закончившие бакалавриат получают чуть больше закончивших магистратуру (первая картинка)!

* Но самая жесть начинается при анализе влияния ИИ. Общая логика такова, что чем больше профессия связана с работой за экраном компьютера, тем сильнее на нее повлияет ИИ. И дальше внезапно ожидаемо оказывается, что многие не очень высоко оплачиваемые специальности типа рабочих стройки (1.6 млн) оказываются практически неподвержены влиянию ИИ (за ними роботы придут позже))), а вот многие профессии с высокой оплатой оказываются наиболее подвержены! Причем из них сильнее всего те, для которых хватает бакалавриата.

Для постоянных читателей канала в этом нет ничего нового, поскольку еще в августе я писал про масштабное научное исследование, с тем же выводом:
наиболее заменимы [...] профессии, для которых хватает диплома бакалавра


Дальше история была более драматична. В воскресенье Илон наш Маск по поводу Карпаты отхайповал в Х: "Все профессии станут необязательны. Будет всеобщий высокий доход". Пост набрал 2.6 миллиона просмотров и понеслоооось...

Журналисты прочитали и начали строчить тоннами заголовки "Соучредитель OpenAI и бывший директор по AI Tesla предсказал, что все профессии заменит ИИ!!!!!!!!111" 🤦‍♂️

Карпаты посмотрел на это безумие и снес репозиторий. 🤷‍♂️ Ибо это всего лишь прикидка на основе жалкого Gemini Flash, навайбкоженная с Клодом за субботу, которая очень много параметров не учитывает (если моделировать все минимально более серьезно). Но были успевшие сделать форк... ✌️ И он все вернул 😉

Какие выводы:

* Даже после начала СВО у нас студенты поступают в магистратуру за рубежом. Один мой студент закончил магу в Калифорнии в прошлом году, другой учится сейчас в маге в Германии, третья в Лондоне (поступила этой осенью). По факту все отмечают другую атмосферу и заметно большую нацеленность на учебу. Дословно "намного проще учиться, когда тебя не окружают мидлы Яндекса".

* В этом плане массовый уход студентов на работу и иногда достаточно презрительное отношение "мидлов Яндекса" к тем, кто учится, однозначно снизило качество образования. Я как-нибудь выложу вопросы, которыми "валю" студентов на госах магистратуры. Для многих из старших поколений это будет шок) Впрочем, если кто собесы проводит — ничего нового. Да, выпускники сейчас элементарного не знают 🤷‍♂️ Как следствие, в России аналогичная статистика будет верна и для магистратуры.

Настоятельно рекомендую визуализацию Карпаты вдумчиво потыкать! 😁 Она про наше ближайшее будущее)

Sapienti sat! 😁 (в переводе латинского, вроде, "Что-то для умных" 😉)

#winter_is_coming

@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏74🤔1
Господа!

У нас на финишной наш большой челлендж детекторов дипфейков! Вчера закончилась тестовая фаза!

Напомню, предыдущие 5 лет мы делали много бенчмарков и в MSU Benchmark Collection их 18 штук сейчас, но раскрутить бенчмарки с закрытым датасетом непросто (хотя в лидерборде наиболее популярного у нас Video Quality Metrics Benchmark сотня метрик) — исследователи не очень охотно по какой-то странной никому непонятной причине 😉 в такие сабмиттят. Бенчмарки с открытым датасетом крайне популярны, но очень часто топ их лидерборда заполнен решениями которые почему-то не воспроизводятся на других данных 🤷‍♂️😁 (deep fake science на марше, масштабы бедствия довольно велики).

В этом плане у челленджа много плюсов:

1. Данные после открываются (и все можно проверить), но во время соревнования никто не знает "правильный ответ" (что логично, но неверно для львиной доли бенчмарков). 🤷‍♂️

2. Если не хочешь светить алгоритм, можно снять результат с финала. При этом у тебя будет твое реальное место на рынке (если датасет достаточно хорош и реалистичен) в сравнении с пачкой конкурентов (которые также не горят желанием раскрыть код, и с которыми так просто не сравниться). Это проблема и дополнительная работа для организаторов, но прикольность соревы заметно повышает (поскольку университеты видят, насколько лучше решения компаний, например).

3. Можно делать сложные правила и менять датасет по ходу соревнования, как это сделали мы в этот раз. Т.е. изначально порог входа может быть низким, но постепенно ближе к концу соревнования расти, повышая интригу. В бенчмарке аналог — это отдельные треки, но оно менее зрелищно, конечно)

4. Для участников (как из компаний, так и из универа) такое соревнование — шанс побывать на CVPR (конференция #1 по Impact Factor в мире), и уже одно это заметно бустит число участников) (упрощая жизнь организаторам, поскольку обычно собирать участников непросто).

5. Обратная сторона — большое количество желающих организовать соревнование и в прошлом году, например, из 6 наших proposals на проведение челленджа прошел только 1 (в этом 2 из 2))).

Итак! Какие новости к этому часу:

1. Мы пробили границу 500 зарегистрированных участников! 💃 Это значит, что мы в топе самых популярных челленджей CVPR за несколько лет 🥳 (точнее постараемся подвести позже)

2. Суммарно было залито 3400+ решений! Кошмар! 🥵 (проверка на втором нашем челлендже, кстати, намного "тяжелее" по компьюту и только использование МГУ-270 нас спасает!)

3. Первые два места умудрились сохранить команды "Alipay" (типа разных подразделений, ну или делают вид, ибо у них разница результатов в тысячных). Обратите внимание, их решение прямо с отрывом лучше 3 места. Третье место TeleAI-TeleGuard, похоже на стартап (пока информации нет). Замыкает пятерку лидеров два места представителей INTSIG.

4. Характерно, что товарищи из стартапа Reagvis Labs поднялись с 22 на валидации до 8 места в тесте (это к вопросу практичности решений компаний).

5. Пока код прислали 13 команд, но кто-то пришлет в последний момент перед дедлайном! Тестируем! 🥵

Анализ результатов будет позже!

Stay tuned! 😉

#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥4
Господа!

В позавчерашнем посте я упомянул проблему, что студенты часто элементарного не знают. Замечательные подписчики тут же отозвались!

Пример от Алексея Шалпегина — человека из того самого набора, в котором мы 4 человек всего набрали, но через 4 года после окончания трое были уже в Google, причем независимо в разных городах))). Алексей мужественно остался в Москве, переплюнул меня по числу лайков на один хабрапост (что очень-очень непросто!))) и вчера пишет:
Собеседования сейчас это нечто. Как-то час пытался "вытянуть" знания, навести на мысль, проверял разные направления, мол, может хоть это знает, под конец кандидат попросил прекратить эту пытку))

За около 50 собеседований был только один раз, когда кандидат знал всё и даже больше. Но он к нам вышел раз в офис, сказал, офис у вас стремный, и ушёл куда подальше)

Забавно, что кандидат даже на работу вышел! 😁😁😁

Тимур Мамедов, наш соискатель, сейчас заходящий на защиту диссера, ему вторит:
текущий рынок кадров: пишет кандидат из центрального университета. Сейчас на 3 курсе бакалавриата. Не буду говорить, сколько денег просит. Опыт работы 3 года и 10 месяцев. Вопрос: о какой учебе речь?

достижения такого уровня, резюме кандидата:

"Сократил пик VRAM с 75GB до примерно 24GB за счёт квантования и оптимизированного пути загрузки модели, сделав инференс надёжным на более компактных GPU и заметно снизив аппаратные требования для продакшена"

жду следующее "достижение": прочитал статью

🤣😂🤣

Тут забавно, что кандидат на вакансию явно искренне не понимает легкости задачи (особенно в такой постановке). 🙈 Зато со школы работает!!! 😂

У меня по ощущениям тоже впечатление серьезной деградации. Что-то знает на госах магистратуры ну может не 1 студент из 50, но где-то 1 из 10. Справедливости ради — те, кто что-то реально знают — мало ходят по собеседованиям, так что статистике Алексея это не противоречит.

Но ощущения всегда можно списать на субъективность. Раньше, мол, и небо было голубее, и деревья выше, и дискеты больше. Вполне измеримый пример — уже больше 10 лет моя первая лекция — краткое изложение цикла "Уйти с тропы лемминга" — о том, как прийти не по по широкой натоптанной дороге к двери с вакансией и тысячами претендентов, а по не столь натоптанным тропинкам (идущим вверх по тяжелым склонам) к богатой двери, которая открыта и никого, ибо они людей под свои высокие требования набрать не могут. Там есть вопрос в зал: "Сколько книг вы прочитали за последний год? Кто больше 20? Больше 10? Больше 5?"... Короче! Последние пару лет вопрос становится фейспалмом. Не поверите! 10 лет назад студенты еще умели читать читали книги! Сейчас навык жив у единиц на масштабе единиц книг. Аналогично, за первые 15 лет научного руководства у меня в академ ушел 1 (один) человек. А в последние годы практически каждый семестр 1-3 "академика". 😲 И это еще у нас отбор студентов прямо сильно выше среднего. Что-то ОБЪЕКТИВНО меняется в этом мире.

В прошлом августе уже давал ссылку на статистику HH. Сейчас посмотрел — тренд усиливается. В феврале 2025 было на 23% больше резюме в IT, чем феврале 2024. А в феврале 2026 уже +30% к прошлому году (суммарно в ~1.6 раза рост за 2 года). А количество вакансий феврале 2025 было на 13% меньше, чем в 2024. А в феврале 2026 уже на 36% меньше (итого ~0.6 от 2024). Соотношение резюме к вакансиям в IT в РФ стало хуже примерно в 2.6 раза за 2 года. 🤔 Совпадение? Не думаю! 😁 Это #winter_is_coming, котаны! 😉

Если серьезно, то складывается несколько факторов. И увеличение эффективности работы с ИИ-агентами еще серьезного влияния оказывать не начало. Эту драму нам только предстоит увидеть в ближайшие 3 года.

По опыту студенты делятся на тех, кто над этими вопросами не задумывается (таких большинство), там логика — "все пошли на работу, а я рыжий?" Тех, кто созрел качаться и не тянет (такое бывает) и тех, кто созрел и затаскивает. 😁 Работаем над увеличением процента последних) Похоже, они будут заметно успешнее в дивном новом мире.

Sapienti sat! 😁

Больше мотивации тут:
#winter_is_coming@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74🤔1
Господа!

Две наших модных девушки рассекали на этой неделе в солнечной Италии на одной из самых маленьких А* конференций IEEE International Conference on Pervasive Computing and Communications (PerCom 2026)! 😁 В этом году мероприятие проходило в исследовательском кластере CNR в Пизе.

Волшебным образом авторы статьи — ровно те же Настя, Катя и Вика, про которых я писал в поздравительном посте на 8 марта 💐

Из путевых заметок Насти:
Конференция маленькая и уютная (350 человека), видно что там устоявщееся коммьюнити. Встретила женщину в футболке "PerCom 2014". Оказалось, что она с 2004 посещает конференцию почти каждый год (пропустила только дважды, один из которых конференция проходила в Австралии). Сказала мне "welcome to the community" 😊

По тематикам: в основном около-железячные разработки, но тем и прикольнее - демо были очень живые и интерактивные, пожалуй, самая интересная демо-сессия из всех, что я видела на конференциях. Там было демо от японцев, например, по девайсу распознавания движений мелкой мускулатуры по двум датчикам, по опыту знаю, насколько шумные такие данные и трудно собирать датасет, обучать модели. Вообще японцев было удивительно много, а китайцев удивительно мало - я вообще ни одного китайца не встретила, в основном европейцы (и арабы, которые тоже живут или учатся в Европе).

Учитывая, сколько было китайцев в июле у Георгия во Франции даже немного удивительно 😉

Передам микрофон Кате:
Мы тоже участвовали с демо: демонстрировали атаку на камеру распознавания лиц с помощью патча, показанного с экрана телефона. Тип атаки — «dodging»: без патча камера корректно распознаёт человека, с патчем же система перестаёт идентифицировать владельца корректно и связывает его с «чужим» идентификатором (не фиксированным целевым ID). Интерес к нашему стенду был большой — много людей хотели попробовать «сломать» камеру и посмотреть поведение системы.

И снова Настя:
По уровню работ трудно сказать, они скорее ниже, чем на NeurIPS, но acceptance rate все равно 15%.

На NeurIPS Настя была, есть с чем сравнивать)
Мы успели съездить во Флоренцию в среду но почти никакие музеи посетить не смогли - была ветреная погода и возможно из-за этого большие очереди на вход (а хотелось посмотреть на работы в обители эпохи возрождения в оригинале). Но зато побродили по улочкам и паркам.

В следующем году конференция будет проходить в Индии на Гоа - с одной стороны, получить визу не трудно и там пляжный курорт, с другой - надо быть готовыми к особенностям Индии)

С пизанской башней тоже удалось сфотографироваться (фото было выше). В общем совмещение приятного с полезным 😁 Вика, первый автор, увы, не смогла, девочки за нее отдувались.

У Кати уже есть в достижениях статья первым автором на ICML, и вообще, напомню, она в аспирантуру поступала с 4 А* в загашнике (2 — первым автором), так что была участие в пятой статье в середине первого года аспирантуры. Чисто весной в Италию съездить. 😁

Продолжаем движение! 😁

#pro_conferences
@vgcourse
🔥20🤩75👍2