Господа!
Когда-то сатирик Задорнов популяризировал выражение "Ну американцы тупые!" (кстати, у него акценты расставлялись более корректно, чем ему приписывают, но про это позже).
В общем тут позавчера популярный американский ресурс Gizmodo в разделе про ИИ опубликовал заметку о том, как захватывает дух от скорости разрушения искусственным интеллектом образовательной системы и от того как выросла скорость американского отупения.
Основная мысль крайне проста. Когда-то думали, что придет ИИ и сильно упростит работу учителя. Ну-ну! 😁 Пришел ИИ и сильно упростил работу ученика! Из-за галлюцинаций сегодня все еще довольно сложно использовать ИИ для проверки работ. А для выполнения — без проблем (ученик по определению может довольно часто ошибаться).
Опыт США наиболее интересен тем, что они заметно опережают Россию в скорости внедрения ИИ в образование. Опять же большинство LLM на английском заметно умнее, чем на русском. Спецпредложения для студентов есть у OpenAI, Anthropic, Perplexity (возможность получить тариф Pro бесплатно — это же праздник, правда? 😉)))
С одной стороны в США есть истории, студент активно использует GPT не вникая в суть диплома, например, а потом ему устраивают экзамен по его диплому и отчисляют. С другой в США есть студенты, которые раздают интервью о том, что они поступили в университет (Лиги Плюща, на секундочку) благодаря ИИ, учатся благодаря ИИ и им плевать на задания курсов («Они могут быть взломаны ИИ, и я просто не был заинтересован в том, чтобы делать их»). 😲
Основное следствие такого подхода — сильнейшее недообучение (в терминах ИИ))). Размер скормленных мозгу батчей и количество эпох обучения таковы, что нейросеть между ушей просто не в состоянии обучиться! Период полураспада знаний (который и так был невелик), снижается до неприлично малых значений. 🤷♂️😁
Чем отличается США от России:
* На Россию не распространяются скидки студентам, у нас те же самые процессы будут идти с отставанием примерно на год. 🤔
* Разрыв в зарплатах в индустрии/университетах в России намного больше, чем в США. Нет никакого смысла работать в университете, когда в нем зарплата за месяц столько же, сколько в IT компании за день. 🤷♂️ Понятно, что есть программы типа ИИ-360, которые за счет денег компаний несколько выравнивают диспропорцию, но... какой это процент от всех CS студентов? Ну и для продвинутых таких программ совсем мало, что характерно. 🤔
Не далее, как в этот четверг принимал очередной госэкзамен и в очередной раз убеждался в том, насколько сузился профессиональный кругозор студентов. Я практически не спрашиваю теории (хотя она критична!), а сознательно делаю акцент на современном практическом применении знаний билета. И там печаль. 🤦♂️
Студенты спорят: "Зачем это все знать, если все это можно запросить" (знает нейросеть) Это просто прекрасно! 😁 ВАМ (которые это спрашивают) это знать ну точно не нужно! 😁 ТОЧНО-ТОЧНО! 😂
Ибо очень скоро в IT будет наблюдаться чудный процесс — будет РАСТИ нужда в топовых специалистах и будет снижаться запрос на специалистов поверхностных. 🤷♂️ Ибо поверхностных, у которых между ушей что-то недообученное, заменить на LLM намного проще (и дешевле).
За последние 4 месяца мы буквально каждый месяц собеседуем желающих ко мне в аспирантуру и защитить диссер. За последние 20 лет никогда такого не было. Это почуяли ветер перемен бросившие аспиранту и ушедшие в компании. Утверждаю, что это только самое начало процесса. Во что, конечно, тоже можно и нужно не верить! 😁
Ибо чем больше будет не верящих, тем проще будет с хорошими местами для тех, кто сечет ситуацию и сейчас плотно качает!😉
Sapienti sat! (это такое латинское выражение, оно означает "что-то для умных") 😁
Когда-то сатирик Задорнов популяризировал выражение "Ну американцы тупые!" (кстати, у него акценты расставлялись более корректно, чем ему приписывают, но про это позже).
В общем тут позавчера популярный американский ресурс Gizmodo в разделе про ИИ опубликовал заметку о том, как захватывает дух от скорости разрушения искусственным интеллектом образовательной системы и от того как выросла скорость американского отупения.
Основная мысль крайне проста. Когда-то думали, что придет ИИ и сильно упростит работу учителя. Ну-ну! 😁 Пришел ИИ и сильно упростил работу ученика! Из-за галлюцинаций сегодня все еще довольно сложно использовать ИИ для проверки работ. А для выполнения — без проблем (ученик по определению может довольно часто ошибаться).
Опыт США наиболее интересен тем, что они заметно опережают Россию в скорости внедрения ИИ в образование. Опять же большинство LLM на английском заметно умнее, чем на русском. Спецпредложения для студентов есть у OpenAI, Anthropic, Perplexity (возможность получить тариф Pro бесплатно — это же праздник, правда? 😉)))
С одной стороны в США есть истории, студент активно использует GPT не вникая в суть диплома, например, а потом ему устраивают экзамен по его диплому и отчисляют. С другой в США есть студенты, которые раздают интервью о том, что они поступили в университет (Лиги Плюща, на секундочку) благодаря ИИ, учатся благодаря ИИ и им плевать на задания курсов («Они могут быть взломаны ИИ, и я просто не был заинтересован в том, чтобы делать их»). 😲
Основное следствие такого подхода — сильнейшее недообучение (в терминах ИИ))). Размер скормленных мозгу батчей и количество эпох обучения таковы, что нейросеть между ушей просто не в состоянии обучиться! Период полураспада знаний (который и так был невелик), снижается до неприлично малых значений. 🤷♂️😁
Чем отличается США от России:
* На Россию не распространяются скидки студентам, у нас те же самые процессы будут идти с отставанием примерно на год. 🤔
* Разрыв в зарплатах в индустрии/университетах в России намного больше, чем в США. Нет никакого смысла работать в университете, когда в нем зарплата за месяц столько же, сколько в IT компании за день. 🤷♂️ Понятно, что есть программы типа ИИ-360, которые за счет денег компаний несколько выравнивают диспропорцию, но... какой это процент от всех CS студентов? Ну и для продвинутых таких программ совсем мало, что характерно. 🤔
Не далее, как в этот четверг принимал очередной госэкзамен и в очередной раз убеждался в том, насколько сузился профессиональный кругозор студентов. Я практически не спрашиваю теории (хотя она критична!), а сознательно делаю акцент на современном практическом применении знаний билета. И там печаль. 🤦♂️
Студенты спорят: "Зачем это все знать, если все это можно запросить" (знает нейросеть) Это просто прекрасно! 😁 ВАМ (которые это спрашивают) это знать ну точно не нужно! 😁 ТОЧНО-ТОЧНО! 😂
Ибо очень скоро в IT будет наблюдаться чудный процесс — будет РАСТИ нужда в топовых специалистах и будет снижаться запрос на специалистов поверхностных. 🤷♂️ Ибо поверхностных, у которых между ушей что-то недообученное, заменить на LLM намного проще (и дешевле).
За последние 4 месяца мы буквально каждый месяц собеседуем желающих ко мне в аспирантуру и защитить диссер. За последние 20 лет никогда такого не было. Это почуяли ветер перемен бросившие аспиранту и ушедшие в компании. Утверждаю, что это только самое начало процесса. Во что, конечно, тоже можно и нужно не верить! 😁
Ибо чем больше будет не верящих, тем проще будет с хорошими местами для тех, кто сечет ситуацию и сейчас плотно качает!
Sapienti sat! (это такое латинское выражение, оно означает "что-то для умных") 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10
Господа!
Любопытные новости были за последнюю неделю по SWE агентам:
1. CodeRabbit выпустили бесплатный плагин для AI Code Review, который доступен для VS Code, Cursor и недавно купленной OpenAI Windsurf. В рекламе обещают 4х кратное ускорение пул-реквестов, отлов 95% багов и на 50% более быстрый review. Понятно, что надо делить на N, но при грамотном применении ускорение и польза будут. И развитие будет.🙂
2. OpenAI выпустили агента Codex-1 (доступен только на платных аккаунтах ChatGPT Pro, Team, and Enterprise). На SWE-Bench Verified он с первой попытки выбивает больше 70% и 75% на внутренних тестах OpenAI. Народ на ycombinator.com уже пишет, например:
3. И, наконец, самое интересное на мой вкус. Google показал широкой публике AlphaEvolve (A Gemini-powered coding agent for designing advanced algorithms).
Когда со мной спорят касательно SWE ассистентов наиболее частый (и справедливый!) аргумент — качество кода. Вайб-кодинг явно становится культурным синонимом г**но-кодинга. 🤷♂️😉 В этом плане опыт Google для меня наиболее интересен. Очевидно, их не интересует цель завалить свои репозитории плохим кодом. У них появилась очень пристойная модель с большим контекстом (Gemini 2.5-Pro). И у них точно есть много много внутренних качественных репозиториев для обучения. Сильно больше, чем у OpenAI и сильно качественней, чем GitHub. И это скажется. Сейчас они анонсировали агента для высокоуровневых алгоритмических задач, который они уже успешно применяли для оптимизации умножения сложных матриц, ускорения ядра FlashAttention (на 32,5%), оптимизация балансировки ЦОД Google (экономия 0,7% вычислительных ресурсов Google) и т.д. Это логичный следующий уровень улучшений и было известно, что Google над ним работает, но не были известны результаты. Сейчас их, наконец, объявили! Промежуточные)💪
Для одной недели неплохо! 😁
На картинке выше сокращения сотрудников технологических компаний за последние 1,5 года, отсортированные по числу уволенных (данные https://layoffs.fyi/). 😲😲😲
Глобально сокращения для IT компаний это как омоложение, оно реально позволяет улучшить тонус компании. Более того, собственно, сотрудник Intel мне рассказывал в свое время, как регулярные сокращения важны для нормального функционирования. Но то, что за последний год им пришлось уволить треть сотрудников это в любом случае жесть, конечно. Среди 25% уволенных сотрудников Unity тоже много программистов. Как и среди 8000 сотрудников SAP. 😢
В принципе в этом году пока увольнений немного (61 тысяча человек из 130 технологических компаний за 4,5 месяца).🤔
В Intel работает наш выпускник (и ныне соискатель на ученую степень), причем в подразделении, которое занимается OpenVINO (тулкит для оптимизации и внедрения DL моделей). В компании жарко, но их подразделение не трогают. Неудивительно, согласитесь! 😉
А в каком подразделении будешь работать ты, %%USERNAME%%? 😁
Всем конкурентоспособности!💪
Stay tuned! 😁
#winter_is_coming
#speed_of_progress
Любопытные новости были за последнюю неделю по SWE агентам:
1. CodeRabbit выпустили бесплатный плагин для AI Code Review, который доступен для VS Code, Cursor и недавно купленной OpenAI Windsurf. В рекламе обещают 4х кратное ускорение пул-реквестов, отлов 95% багов и на 50% более быстрый review. Понятно, что надо делить на N, но при грамотном применении ускорение и польза будут. И развитие будет.
2. OpenAI выпустили агента Codex-1 (доступен только на платных аккаунтах ChatGPT Pro, Team, and Enterprise). На SWE-Bench Verified он с первой попытки выбивает больше 70% и 75% на внутренних тестах OpenAI. Народ на ycombinator.com уже пишет, например:
Это похоже на джуна на стероидах, вам просто нужно указать на файл или функцию, указать задачу, и модель сделает большую часть пул-реквеста. Вам все еще нужно сделать много работы, чтобы доработать его до прода, но в вашем распоряжении теперь бесконечное количество джунов, работающих над разными задачами.
Качество модели хорошо, но пока сложно сказать, что оно намного лучше других. Сравнимо с Cursor + Gemini 2.5-Pro, именование, стиль и логика относительно близки...
3. И, наконец, самое интересное на мой вкус. Google показал широкой публике AlphaEvolve (A Gemini-powered coding agent for designing advanced algorithms).
Когда со мной спорят касательно SWE ассистентов наиболее частый (и справедливый!) аргумент — качество кода. Вайб-кодинг явно становится культурным синонимом г**но-кодинга. 🤷♂️😉 В этом плане опыт Google для меня наиболее интересен. Очевидно, их не интересует цель завалить свои репозитории плохим кодом. У них появилась очень пристойная модель с большим контекстом (Gemini 2.5-Pro). И у них точно есть много много внутренних качественных репозиториев для обучения. Сильно больше, чем у OpenAI и сильно качественней, чем GitHub. И это скажется. Сейчас они анонсировали агента для высокоуровневых алгоритмических задач, который они уже успешно применяли для оптимизации умножения сложных матриц, ускорения ядра FlashAttention (на 32,5%), оптимизация балансировки ЦОД Google (экономия 0,7% вычислительных ресурсов Google) и т.д. Это логичный следующий уровень улучшений и было известно, что Google над ним работает, но не были известны результаты. Сейчас их, наконец, объявили! Промежуточные)
Для одной недели неплохо! 😁
На картинке выше сокращения сотрудников технологических компаний за последние 1,5 года, отсортированные по числу уволенных (данные https://layoffs.fyi/). 😲😲😲
Глобально сокращения для IT компаний это как омоложение, оно реально позволяет улучшить тонус компании. Более того, собственно, сотрудник Intel мне рассказывал в свое время, как регулярные сокращения важны для нормального функционирования. Но то, что за последний год им пришлось уволить треть сотрудников это в любом случае жесть, конечно. Среди 25% уволенных сотрудников Unity тоже много программистов. Как и среди 8000 сотрудников SAP. 😢
В принципе в этом году пока увольнений немного (61 тысяча человек из 130 технологических компаний за 4,5 месяца).
В Intel работает наш выпускник (и ныне соискатель на ученую степень), причем в подразделении, которое занимается OpenVINO (тулкит для оптимизации и внедрения DL моделей). В компании жарко, но их подразделение не трогают. Неудивительно, согласитесь! 😉
А в каком подразделении будешь работать ты, %%USERNAME%%? 😁
Всем конкурентоспособности!
Stay tuned! 😁
#winter_is_coming
#speed_of_progress
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Господа!
Как кто-то из вас уже, возможно, знает, МГУ выиграл грант центра ИИ третьей волны!💃 💃 💃
Суммарное финансирование — 976 миллионов (почти миллиард!) на 2 года, что, правда на заявленное число сотрудников и большое количество заявленных результатов, не так уж много. Но тут важно, что эти деньги государство дает во многом на прокачку наиболее топовых публикаций в ИИ — на А* конференциях...✌️
Если быть точным, то нужны и конференционные А* публикации и журнальные Q1 публикации, причем в равном количестве (заметим, что и список конференций, и список журналов ограничен, и какой попало Q1 журнал не прокатит). Но поскольку по факту А* в ИИ заметно сложнее, оплата за них обычно в 2 раза выше, чем за Q1.
4 года назад наша лаборатория участвовала в заявке центров первой волны. Тогда МГУ проиграл, а выиграли 6 центров (из 30+ заявок) — Сколтех, Физтех, Вышка, ИСП, ИТМО и Иннополис. И мы присоединились к центру ИСП, сделав там пять А* публикаций на NeurIPS, ICML (2 шт), ICLR и AAAI. Далее была "вторая волна" грантов, но более индустриальных (требовалась скорее работа с компаниями, чем наука). Во второй волне гранты получили еще 6 центров в основном в регионах у которых возникли большие проблемы со статьями.
И вот сейчас в "третьей волне" МГУ наконец-то выиграл основной грант!
Выиграл, если честно, на флажке. Изначально планировалось, что выигравших центров традиционно будет 6. Однако после подведения итогов по баллам выяснилось, что МГУ на 7 месте, причем на 6 месте был Сколтех с очень небольшим отрывом (они довольно экономно пообещали в плане показателей). А с 8 места прямо очень заметная была ступенька уменьшения показателей. В итоге после рассмотрения 19 заявок было принято решение дать грант 7 центрам: 6 центрам первой волны и МГУ.
Для МГУ это очень важно, я считаю. Фактически это был шанс заскочить в последний вагон этого поезда. Есть мнение, что в дальнейшем больше грантов в текущем виде (со сложной процедурой заявки) не будет, а будет упрощённая только для победителей этого года. Ибо вторая и третья волна четко показали, что более коллективов делающих топовые публикации в стране, увы, практически не осталось. 🤷♂️
При этом текущие центры очень прокачались. Так ИСП РАН (в том числе с нашим участием) за прошлый год сделал, помнится, 23 А* публикации. А ВЕСЬ МГУ за ПЯТЬ лет сделал, если правильно помню статистику, собранную к заявке, 24. Т.е. ИСП РАН за год сделал столько же А*, сколько МГУ за 5 лет. 😲 При этом сотрудники нашей лаборатории сделали 12 А* за 5 лет...☺️ Вот такая любопытная математика.
Замечу, что основными лоббистами KPI в виде А* в этой программе были, как ни странно, не представители академии, а Яндекс со Сбером. А представители науки как раз неоднократно выступали за снижение показателей) Большие компании хотят А* потому, что по факту сегодня затащить А* означает (очень часто) победить в соревновании на скорость исследований с китайцами. Это ооочень сложно. И обычно первых авторов А* начинают хантить. Причем открываются двери и в западные компании (там тоже таких любят). 😉
Ну и больше всего А* запланировали в центр ИИ МГУ научные группы под управлением Антона Конушина и вашего покорного слуги! Сейчас задача это затащить 😉
Короче! В ближайшее время мы объявим вакансии в наши научные группы! Не переключайтесь!
В заключение замечу, что ВК в софинансировании центра, это наша работа. Любимый Huawei зачесть было нельзя, но с ВК.Видео мы нашли тему, которая весьма интересна и полезна и нам, и им. И они в довольно короткий срок провернули крайне нетривиальную бюрократическую работу и поддержали грант, за что им огромная благодарность!🙂
А теперь взлетаем!🚀 Кто с нами — велкам! 🤝
Вернем А* в МГУ! 😁💪 🙂
Как кто-то из вас уже, возможно, знает, МГУ выиграл грант центра ИИ третьей волны!
Суммарное финансирование — 976 миллионов (почти миллиард!) на 2 года, что, правда на заявленное число сотрудников и большое количество заявленных результатов, не так уж много. Но тут важно, что эти деньги государство дает во многом на прокачку наиболее топовых публикаций в ИИ — на А* конференциях...
Если быть точным, то нужны и конференционные А* публикации и журнальные Q1 публикации, причем в равном количестве (заметим, что и список конференций, и список журналов ограничен, и какой попало Q1 журнал не прокатит). Но поскольку по факту А* в ИИ заметно сложнее, оплата за них обычно в 2 раза выше, чем за Q1.
4 года назад наша лаборатория участвовала в заявке центров первой волны. Тогда МГУ проиграл, а выиграли 6 центров (из 30+ заявок) — Сколтех, Физтех, Вышка, ИСП, ИТМО и Иннополис. И мы присоединились к центру ИСП, сделав там пять А* публикаций на NeurIPS, ICML (2 шт), ICLR и AAAI. Далее была "вторая волна" грантов, но более индустриальных (требовалась скорее работа с компаниями, чем наука). Во второй волне гранты получили еще 6 центров в основном в регионах у которых возникли большие проблемы со статьями.
И вот сейчас в "третьей волне" МГУ наконец-то выиграл основной грант!
Выиграл, если честно, на флажке. Изначально планировалось, что выигравших центров традиционно будет 6. Однако после подведения итогов по баллам выяснилось, что МГУ на 7 месте, причем на 6 месте был Сколтех с очень небольшим отрывом (они довольно экономно пообещали в плане показателей). А с 8 места прямо очень заметная была ступенька уменьшения показателей. В итоге после рассмотрения 19 заявок было принято решение дать грант 7 центрам: 6 центрам первой волны и МГУ.
Для МГУ это очень важно, я считаю. Фактически это был шанс заскочить в последний вагон этого поезда. Есть мнение, что в дальнейшем больше грантов в текущем виде (со сложной процедурой заявки) не будет, а будет упрощённая только для победителей этого года. Ибо вторая и третья волна четко показали, что более коллективов делающих топовые публикации в стране, увы, практически не осталось. 🤷♂️
При этом текущие центры очень прокачались. Так ИСП РАН (в том числе с нашим участием) за прошлый год сделал, помнится, 23 А* публикации. А ВЕСЬ МГУ за ПЯТЬ лет сделал, если правильно помню статистику, собранную к заявке, 24. Т.е. ИСП РАН за год сделал столько же А*, сколько МГУ за 5 лет. 😲 При этом сотрудники нашей лаборатории сделали 12 А* за 5 лет...
Замечу, что основными лоббистами KPI в виде А* в этой программе были, как ни странно, не представители академии, а Яндекс со Сбером. А представители науки как раз неоднократно выступали за снижение показателей) Большие компании хотят А* потому, что по факту сегодня затащить А* означает (очень часто) победить в соревновании на скорость исследований с китайцами. Это ооочень сложно. И обычно первых авторов А* начинают хантить. Причем открываются двери и в западные компании (там тоже таких любят). 😉
Ну и больше всего А* запланировали в центр ИИ МГУ научные группы под управлением Антона Конушина и вашего покорного слуги! Сейчас задача это затащить 😉
Короче! В ближайшее время мы объявим вакансии в наши научные группы! Не переключайтесь!
В заключение замечу, что ВК в софинансировании центра, это наша работа. Любимый Huawei зачесть было нельзя, но с ВК.Видео мы нашли тему, которая весьма интересна и полезна и нам, и им. И они в довольно короткий срок провернули крайне нетривиальную бюрократическую работу и поддержали грант, за что им огромная благодарность!
А теперь взлетаем!
Вернем А* в МГУ! 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
👏24🎉15❤5👍3🔥1
Господа!
На прошлой неделе побывал у наших коллег в Институте ИИ Физтеха.
Я давно с огромным интересом наблюдаю за их развитием, хорошо много лет знаком с текущим первым директором института, а сейчас целенаправленно ездил пообщаться с молодым растущим руководителем одной из лучших лабораторий Физтеха в ИИ. 👍👍👍
Сегодня в России сложилась во многом уникальная ситуация в плане превращения IT факультетов в научном плане в лунный пейзаж. Это очень маленькая государственная зарплата помноженная на лютый дефицит кадров при хорошей маржинальности бизнеса, который привел к конскому росту зарплат в IT и набору людей в компании буквально с 1 курса. Часть наиболее наиболее "умных" студентов-олимпиадников прямо говорят — "мне учеба не нужна, меня Яндекс в начале 1 курса взял, мне нужна только корочка". 🤦♂️ И забивают на учебу примерно полностью. 😲 Я на госах/дипломах регулярно держусь за лицо, при том, что зарабатываю на проектах с компаниями и спрашиваю только применимые прямо сейчас вещи. Это уже привело к появлению поколения недоучек, ибо такая ситуация везде (в Вышке, например, намного сильнее, чем на ВМК, а в региональных вузах коллеги рассказывают про ужас-ужас). 🤷♂️
На сотрудников пылесос компаний тоже мощно действует. Недавно общался с руководителем подразделения российской компании, который хотел бы с нами работать. Долго объяснял ситуацию. Наконец, задал в лоб неприличный вопрос о зарплате. Выяснилось, что наша зарплата отличается в 100 раз (сто раз, Карл!). Этофеерический п* очень многое меняет. Он руководитель исследовательского подразделения, и я руководитель исследовательского подразделения (кстати, не намного меньше). Но есть маленький нюанс. 😂 Разница зарплат в IT начинается с 10 раз на низовых должностях, потом доходит до 100 раз на средних и потом (говорят 😉) опять снижается к декану-ректору. В этом плане смысла руководить исследовательскими подразделениями в IT в университете примерно ноль. В большой статье О русской науке замолвите слово... я про все это в красках написал давно. В комментариях там меня назвали упоротым и это чистая правда. Нормальному человеку, который востребован в компаниях, остаться в университете сегодня почти нереально (меня только 6 официальных мест работы спасают). Характерно, что этот процесс вымывания сотрудников снижает качество образования и дает лишние аргументы не желающим учиться студентам (это система с положительной обратной связью, если кто-то знает, что это такое). 😉
Все вышеописанное привело к тому, что за последние 5 лет А* статей на ВМК за пределами нашей лаборатории не было, а в МГУ в ИИ они были в основном в на мехмате и физфаке (где "давление рынка" меньше).
Я сначала пытался объяснять (в первую очередь компаниям, потом студентам), спорить. Но через несколько лет понял, что это потеря времени! Мы сегодня на пороге сильнейшего изменения ситуации на рынке труда. Причем у программистов в первую очередь. И наиболее глубоко прокачанные будут наиболее успешны.✌️
Сокращение квоты студентов в нашу лабораторию вынудило искать студентов вовне. В этом учебном году мы прочитали 7 курсов в разных местах (рекорд!). На Физтехе пока не читаем, но мне очень нравятся уровень их студентов.
Чем они отличаются:
* На Физтехе "с рождения" была создана система базовых кафедр предприятий, которая на мой вкус наилучшим образом соответствует текущей безумной политике компаний (по вырубанию деревьев, плодами которых они питаются). Это позволяет удерживать топовых-преподавателей.
* В последнее время у них прошло уже 2 реформы подразделений (в т.ч. создание физтех-школ), которые сильно перетряхнули имеющиеся подразделения и сильно омолодили их организационно.
* У них нет как таковых квот. Т.е. студенты идут туда, где есть конкурс, усиливая сильные места и ослабляя слабые. Похожая система на Физфаке и Мехмате МГУ, кстати.
* Физтех борется за олимпиадников и стобальников.
И там еще, как водится, огромное количество нюансов, в которые я вникаю давно, но каждый раз что-то новое для себя нахожу!
В общем ездил в Физтех учиться. Многое почерпнул! 😁
Работаем! 😁
На прошлой неделе побывал у наших коллег в Институте ИИ Физтеха.
Я давно с огромным интересом наблюдаю за их развитием, хорошо много лет знаком с текущим первым директором института, а сейчас целенаправленно ездил пообщаться с молодым растущим руководителем одной из лучших лабораторий Физтеха в ИИ. 👍👍👍
Сегодня в России сложилась во многом уникальная ситуация в плане превращения IT факультетов в научном плане в лунный пейзаж. Это очень маленькая государственная зарплата помноженная на лютый дефицит кадров при хорошей маржинальности бизнеса, который привел к конскому росту зарплат в IT и набору людей в компании буквально с 1 курса. Часть наиболее наиболее "умных" студентов-олимпиадников прямо говорят — "мне учеба не нужна, меня Яндекс в начале 1 курса взял, мне нужна только корочка". 🤦♂️ И забивают на учебу примерно полностью. 😲 Я на госах/дипломах регулярно держусь за лицо, при том, что зарабатываю на проектах с компаниями и спрашиваю только применимые прямо сейчас вещи. Это уже привело к появлению поколения недоучек, ибо такая ситуация везде (в Вышке, например, намного сильнее, чем на ВМК, а в региональных вузах коллеги рассказывают про ужас-ужас). 🤷♂️
На сотрудников пылесос компаний тоже мощно действует. Недавно общался с руководителем подразделения российской компании, который хотел бы с нами работать. Долго объяснял ситуацию. Наконец, задал в лоб неприличный вопрос о зарплате. Выяснилось, что наша зарплата отличается в 100 раз (сто раз, Карл!). Это
Все вышеописанное привело к тому, что за последние 5 лет А* статей на ВМК за пределами нашей лаборатории не было, а в МГУ в ИИ они были в основном в на мехмате и физфаке (где "давление рынка" меньше).
Я сначала пытался объяснять (в первую очередь компаниям, потом студентам), спорить. Но через несколько лет понял, что это потеря времени! Мы сегодня на пороге сильнейшего изменения ситуации на рынке труда. Причем у программистов в первую очередь. И наиболее глубоко прокачанные будут наиболее успешны.
Сокращение квоты студентов в нашу лабораторию вынудило искать студентов вовне. В этом учебном году мы прочитали 7 курсов в разных местах (рекорд!). На Физтехе пока не читаем, но мне очень нравятся уровень их студентов.
Чем они отличаются:
* На Физтехе "с рождения" была создана система базовых кафедр предприятий, которая на мой вкус наилучшим образом соответствует текущей безумной политике компаний (по вырубанию деревьев, плодами которых они питаются). Это позволяет удерживать топовых-преподавателей.
* В последнее время у них прошло уже 2 реформы подразделений (в т.ч. создание физтех-школ), которые сильно перетряхнули имеющиеся подразделения и сильно омолодили их организационно.
* У них нет как таковых квот. Т.е. студенты идут туда, где есть конкурс, усиливая сильные места и ослабляя слабые. Похожая система на Физфаке и Мехмате МГУ, кстати.
* Физтех борется за олимпиадников и стобальников.
И там еще, как водится, огромное количество нюансов, в которые я вникаю давно, но каждый раз что-то новое для себя нахожу!
В общем ездил в Физтех учиться. Многое почерпнул! 😁
Работаем! 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤3👍2
Господа!
В моих старых добрых лекциях "Уйти с тропы лемминга" в последней части "Жизненный цикл программиста" я кратко рассказываю про книжку "Важные годы / Почему не стоит откладывать жизнь на потом". Это, кстати, эпичный пример, как перевод может убить исходный месседж. Исходное название "The Defining Decade: Why Your Twenties Matter — And How to Make the Most of Them Now". ОПРЕДЕЛЯЮЩЕЕ десятилетие, почему ваши 20 имеют имеют значение. Это принципиально другой смысл!
Так почему десятилетие с 20 до 30 определяющее? Желающие могут посмотреть TED talk автора "Why 30 is not the new 20", но если брать суть, то дело в нейропластичности.
Тему копают довольно давно. В 1989 был создан аж отдельный журнал Neural Plasticity только о нейропластичности. Большинство исследований посвящены детским годам, когда нейропластичность (см. график) максимальна. Но много работ и о реабилитации после травм, когда мозг также (в некоторых случаях и при некоторых условиях) демонстрирует удивительную пластичность даже в более взрослом возрасте.
В шуточном варианте можно сравнить высокую нейропластичность молодых лет с формированием архитектуры нейросети, а обучение с 20 до 30 с fine-tuning 😉 И те, кто старшие классы потратил на Доту получают embedded ImageNet, а кто на олимпиады — built-in transformer-based архитектуру 🤣😂🤣
Если быть более точным, то у нас между ушей развивается Mixture of Experts-based архитектура, т.е. на входных данных дообучается сразу несколько архитектур параллельно (под разные задачи). Более того, параллельно дообучается оркестратор. Это очень важный механизм, который позволяет имея супер прокачанный CS/GO "ImageNet" и управление мышкой (когда вы без модов снайперски попадаете куда надо — ценнейший навык для работы 😂) и transformer-based генеративки в зачаточном состоянии 😉 таки их прокачать в направлении кода, презентаций и статей (пусть затратив массу сил). Я наблюдал удивительные случаи прокачки студентов с ооочень слабой начальной базой (если воли хватает).💪
Одним из ключей к прокачке (согласно обзору Principles of Experience-Dependent Neural Plasticity) является интенсивность:
(Ходящие в фитнес увидели знакомое))) Для обучения важно повышение уровня сложности, что не все тянут.
Примерно 35 лет назад обучение в университете не давало отсрочки от армии. Военкомат забирал со 2-4 курсов и возвращал через 2 года. Казалось бы, жалких 2 года, но была масса примеров, как весьма успешные до армии студенты балансировали на грани вылета (или за гранью) после возвращения. Даже мотивированные! Людям реально становилось сложно затаскивать!
Зимой писал про интервью интервью с руководителем ШАД, где речь шла про специальный трек для закончивших вузжалких 3-5 лет назад, ибо им даже поступить сложнее.
Мне наиболее интересны те, кто хотел бы прокачаться на самый топ. В недавнем материале Reuters описываются зарплаты в 10-20 миллионов долларов в год у топовых исследователей OpenAI & Google и разовых бонусах по паре миллионов. 😲
При этом я пачками вижу студентов (часто с хорошими данными), уходящих фигачить прод (в DS это джейсончики перекладывать) ВМЕСТО прокачки в 20 с хвостиком. 🤷♂️😁
Вангую, что PyTorch будет чем-то типа PHP в резюме через 15 лет (как и многие другие модные темы 😉), и качать надо немоду фреймворки, а алгоритмы и фундаментальные технологии от базовых ко все более сложным (кто потянет).
Желаю всем успеть потратить остатки нейропластичности на более крутую build-in архитектуру и в целом сохранить нейропластичность повыше!🙂 А чем больше будет рано уходящих в прод, тем больше вы будете зарабатывать! 😁
Работаем! 😉
#neuroplasticity
В моих старых добрых лекциях "Уйти с тропы лемминга" в последней части "Жизненный цикл программиста" я кратко рассказываю про книжку "Важные годы / Почему не стоит откладывать жизнь на потом". Это, кстати, эпичный пример, как перевод может убить исходный месседж. Исходное название "The Defining Decade: Why Your Twenties Matter — And How to Make the Most of Them Now". ОПРЕДЕЛЯЮЩЕЕ десятилетие, почему ваши 20 имеют имеют значение. Это принципиально другой смысл!
Так почему десятилетие с 20 до 30 определяющее? Желающие могут посмотреть TED talk автора "Why 30 is not the new 20", но если брать суть, то дело в нейропластичности.
Нейропластичность - это способность нейронов и нейронных сетей в мозге изменять свои связи и поведение в ответ на новую информацию, сенсорную стимуляцию, развитие, повреждение или дисфункцию.
Британника, статья #Нейропластичность.
Тему копают довольно давно. В 1989 был создан аж отдельный журнал Neural Plasticity только о нейропластичности. Большинство исследований посвящены детским годам, когда нейропластичность (см. график) максимальна. Но много работ и о реабилитации после травм, когда мозг также (в некоторых случаях и при некоторых условиях) демонстрирует удивительную пластичность даже в более взрослом возрасте.
В шуточном варианте можно сравнить высокую нейропластичность молодых лет с формированием архитектуры нейросети, а обучение с 20 до 30 с fine-tuning 😉 И те, кто старшие классы потратил на Доту получают embedded ImageNet, а кто на олимпиады — built-in transformer-based архитектуру 🤣😂🤣
Если быть более точным, то у нас между ушей развивается Mixture of Experts-based архитектура, т.е. на входных данных дообучается сразу несколько архитектур параллельно (под разные задачи). Более того, параллельно дообучается оркестратор. Это очень важный механизм, который позволяет имея супер прокачанный CS/GO "ImageNet" и управление мышкой (когда вы без модов снайперски попадаете куда надо — ценнейший навык для работы 😂) и transformer-based генеративки в зачаточном состоянии 😉 таки их прокачать в направлении кода, презентаций и статей (пусть затратив массу сил). Я наблюдал удивительные случаи прокачки студентов с ооочень слабой начальной базой (если воли хватает).
Одним из ключей к прокачке (согласно обзору Principles of Experience-Dependent Neural Plasticity) является интенсивность:
Intensity: If you do something that doesn’t challenge you, you won’t see much of a difference. Intensity can be the number of times you do an exercise or how difficult it is. Try to find an intensity that is one step above your current level.
Примерно 35 лет назад обучение в университете не давало отсрочки от армии. Военкомат забирал со 2-4 курсов и возвращал через 2 года. Казалось бы, жалких 2 года, но была масса примеров, как весьма успешные до армии студенты балансировали на грани вылета (или за гранью) после возвращения. Даже мотивированные! Людям реально становилось сложно затаскивать!
Зимой писал про интервью интервью с руководителем ШАД, где речь шла про специальный трек для закончивших вуз
Мне наиболее интересны те, кто хотел бы прокачаться на самый топ. В недавнем материале Reuters описываются зарплаты в 10-20 миллионов долларов в год у топовых исследователей OpenAI & Google и разовых бонусах по паре миллионов. 😲
При этом я пачками вижу студентов (часто с хорошими данными), уходящих фигачить прод (в DS это джейсончики перекладывать) ВМЕСТО прокачки в 20 с хвостиком. 🤷♂️😁
Вангую, что PyTorch будет чем-то типа PHP в резюме через 15 лет (как и многие другие модные темы 😉), и качать надо не
Желаю всем успеть потратить остатки нейропластичности на более крутую build-in архитектуру и в целом сохранить нейропластичность повыше!
Работаем! 😉
#neuroplasticity
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21❤8👎1
Господа!
Вчера мы доложили наш Challenge на CVPR NTIRE workshop (писал про его начало)! Увы, визу получить не успели, поэтому доклад был удаленный 🤷♂️
Кто помнит, я писал в прошлом сентябре, как у нас три челленджа зашли на AIM ECCV (лежат тут https://challenges.videoprocessing.ai/), я вошел в оргкомитет воркшопа, а наш аспирант Андрей Москаленко посетил гостеприимный Милан и супер интересную ECCV.
В сентябре я писал:
CVPR — это топовая конференция в CS по impact factor, причем с отрывом, если по ссылке сходите 😁. А NTIRE — это New Trends in Image Restoration and Enhancement — наиболее известный workshop в обработке изображений и видео, который в этом году проходит в 10 раз (первый юбилей)! Нам, как хозяевам videoprocessing.ai, сам бог велел там оказаться. 😉
Из-за юбилея попасть на CVPR NTIRE этого года было очень сложно. Мы подали аж 6 пропоузалов на челленджи, но зашел только один. Уже хорошо! 😁
В чем смысл челленджа: он очень похож на бенчмарк (коих у нас 18), но проводится в ограниченное время. Датасет закрыт (т.е. веры результатам больше), а после окончания челленджа датасет открывается, так что есть возможность верифицировать авторов. Если есть возможность сравнительно дешево генерировать датасеты (что возможно не всегда), то челлендж — это хороший способ притормозить бушующий кризис воспроизводимости. За счет того, что конференция А* (куда народ рвется хоть тушкой, хоть чучелком), сильно упрощается набор участников. В финале участники должны раскрыть код алгоритма.
Мы стараемся предлагать челленджи так, чтобы они были одновременно уникальны (подача — это соревнование со многими топовыми в области лабораториями), современны (должно быть достаточно желающих поучаствовать), практичны (интерес компаний к результатам) и давали так или иначе вклад в наши работы по написанию А* (на челлендже можно отлично протестировать новую методику сбора датасета или собрать конкурентов для своего метода, претендующего на SOTA).🌿
Проведенный челлендж был посвящен улучшению пользовательского видео (UGC Video Enhancement), т.е. человек что-то заснял на телефон и хочет, чтобы оно автоматически стало лучше (в плане шума, тряски, размытия из-за движения, цветов и т.д.) И сегодня (хвала нейросетям!) это возможно, но важно минимально уронить качество в неудачных кейсах! Результаты оценивались в 3 этапа слепым субъективным тестированием (людьми). Cущественно поднять качество удалось всем финалистам.🙂
Всего на челлендж зарегистрировалось 83 участника, которые в сумме сделали 92 сабмита. Любопытно, что финальный сабмит с кодом сделало всего 7 участников (мы надеялись на больше, конечно), из которых 6 — это китайские компании, часто в обнимку с китайскими университетами. Констатирую: китайские компании завтра всех порвут! 😁 Топ-3:
1. ShannonLab (Tencent)
2. DeepView (Tencent)
3. Alibaba Group и Beihang University
Скоро видео, залитое в WeChat, будет чудесным образом становиться лучше,чем залитое в телеграм/VK 😉
📖 Статья, кому интересны детали
🧑💻 Github
Пользуясь случаем проанонсирую, что 3 наших челленджа зашли на ICCV этого года (Y-e-e-e-s!!!💪 ). Сейчас их стартуем. Так что в этом году мы добавим себе на скрижали 4 челленджа на А* (в гармоничное дополнение к А* статьям))). 😉
Продолжение следует! 😉
Stay tuned! 😁
Вчера мы доложили наш Challenge на CVPR NTIRE workshop (писал про его начало)! Увы, визу получить не успели, поэтому доклад был удаленный 🤷♂️
Кто помнит, я писал в прошлом сентябре, как у нас три челленджа зашли на AIM ECCV (лежат тут https://challenges.videoprocessing.ai/), я вошел в оргкомитет воркшопа, а наш аспирант Андрей Москаленко посетил гостеприимный Милан и супер интересную ECCV.
В сентябре я писал:
(сейчас задача зайти на CVPR NTIRE, если кому-то эти буквы что-то говорят))).
CVPR — это топовая конференция в CS по impact factor, причем с отрывом, если по ссылке сходите 😁. А NTIRE — это New Trends in Image Restoration and Enhancement — наиболее известный workshop в обработке изображений и видео, который в этом году проходит в 10 раз (первый юбилей)! Нам, как хозяевам videoprocessing.ai, сам бог велел там оказаться. 😉
Из-за юбилея попасть на CVPR NTIRE этого года было очень сложно. Мы подали аж 6 пропоузалов на челленджи, но зашел только один. Уже хорошо! 😁
В чем смысл челленджа: он очень похож на бенчмарк (коих у нас 18), но проводится в ограниченное время. Датасет закрыт (т.е. веры результатам больше), а после окончания челленджа датасет открывается, так что есть возможность верифицировать авторов. Если есть возможность сравнительно дешево генерировать датасеты (что возможно не всегда), то челлендж — это хороший способ притормозить бушующий кризис воспроизводимости. За счет того, что конференция А* (куда народ рвется хоть тушкой, хоть чучелком), сильно упрощается набор участников. В финале участники должны раскрыть код алгоритма.
Мы стараемся предлагать челленджи так, чтобы они были одновременно уникальны (подача — это соревнование со многими топовыми в области лабораториями), современны (должно быть достаточно желающих поучаствовать), практичны (интерес компаний к результатам) и давали так или иначе вклад в наши работы по написанию А* (на челлендже можно отлично протестировать новую методику сбора датасета или собрать конкурентов для своего метода, претендующего на SOTA).
Проведенный челлендж был посвящен улучшению пользовательского видео (UGC Video Enhancement), т.е. человек что-то заснял на телефон и хочет, чтобы оно автоматически стало лучше (в плане шума, тряски, размытия из-за движения, цветов и т.д.) И сегодня (хвала нейросетям!) это возможно, но важно минимально уронить качество в неудачных кейсах! Результаты оценивались в 3 этапа слепым субъективным тестированием (людьми). Cущественно поднять качество удалось всем финалистам.
Всего на челлендж зарегистрировалось 83 участника, которые в сумме сделали 92 сабмита. Любопытно, что финальный сабмит с кодом сделало всего 7 участников (мы надеялись на больше, конечно), из которых 6 — это китайские компании, часто в обнимку с китайскими университетами. Констатирую: китайские компании завтра всех порвут! 😁 Топ-3:
1. ShannonLab (Tencent)
2. DeepView (Tencent)
3. Alibaba Group и Beihang University
Скоро видео, залитое в WeChat, будет чудесным образом становиться лучше,
📖 Статья, кому интересны детали
Пользуясь случаем проанонсирую, что 3 наших челленджа зашли на ICCV этого года (Y-e-e-e-s!!!
Продолжение следует! 😉
Stay tuned! 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5👍1
Господа!
Мы сейчас работаем над новым бенчмарком устойчивости нейросетевых алгоритмов сжатия картинок.
Я уже писал, что зимой мы выложили MSU Learning-based Image Compression Benchmark, где сравнивалось сжатие нейросетевых и классических и JPEG AI всех порвал. Имея степень сжатия примерно втрое лучше JPEG и вдвое+ лучше JPEG 2000 при том же качестве у JPEG AI отличные шансы на взлет!🙂 💪
Но есть маленький нюанс. Это нейросетевой алгоритм... А значит все прелести нейросетевых алгоритмов ему не чужды. В том числе такая прелесть, как состязательные атаки! 🤷♂️😉
Можно атаками вызывать артефакты (если вы по каким-то причинам не хотите, чтобы какая-то картинка распространялась как минимум в хорошем качестве — будет востребовано, вангую), можно увеличивать размер сжатой картинки (своеобразная DDOS атака на хранилище) и т.д.
И, конечно, к атакам возможны защиты. Часть атак можно успешно обнаружить во время сжатия (если думать об этом) и благополучно стереть, в том числе не сильно ухудшим картинку. Естественно у разных атак и защит разная скорость работы и если мы думаем о практичности, то все становится еще кучерявей. 😉 В общем это большая новая прикольная практичная тема!
Интересно, что модели разных типов имеют разную устойчивость к атакам, причем JPEG AI в целом довольно устойчив. 👍
Мы сейчас подали статью на ACM Multimedia 2025 Open Source Track. А там смотрят на популярность репозитория. 🔍
У кого есть логин на GitHub большая просьба докинуть звездочку:
https://github.com/msu-video-group/NIC-RobustBench/
⭐️ ⭐️ ⭐️
Заранее большое спасибо!⭐️
Обещаю с выходом статьи алаверды докинуть интересных подробностей! 😁
Работаем! 😉
Мы сейчас работаем над новым бенчмарком устойчивости нейросетевых алгоритмов сжатия картинок.
Я уже писал, что зимой мы выложили MSU Learning-based Image Compression Benchmark, где сравнивалось сжатие нейросетевых и классических и JPEG AI всех порвал. Имея степень сжатия примерно втрое лучше JPEG и вдвое+ лучше JPEG 2000 при том же качестве у JPEG AI отличные шансы на взлет!
Но есть маленький нюанс. Это нейросетевой алгоритм... А значит все прелести нейросетевых алгоритмов ему не чужды. В том числе такая прелесть, как состязательные атаки! 🤷♂️😉
Можно атаками вызывать артефакты (если вы по каким-то причинам не хотите, чтобы какая-то картинка распространялась как минимум в хорошем качестве — будет востребовано, вангую), можно увеличивать размер сжатой картинки (своеобразная DDOS атака на хранилище) и т.д.
И, конечно, к атакам возможны защиты. Часть атак можно успешно обнаружить во время сжатия (если думать об этом) и благополучно стереть, в том числе не сильно ухудшим картинку. Естественно у разных атак и защит разная скорость работы и если мы думаем о практичности, то все становится еще кучерявей. 😉 В общем это большая новая прикольная практичная тема!
Интересно, что модели разных типов имеют разную устойчивость к атакам, причем JPEG AI в целом довольно устойчив. 👍
Мы сейчас подали статью на ACM Multimedia 2025 Open Source Track. А там смотрят на популярность репозитория. 🔍
У кого есть логин на GitHub большая просьба докинуть звездочку:
https://github.com/msu-video-group/NIC-RobustBench/
Заранее большое спасибо!
Обещаю с выходом статьи алаверды докинуть интересных подробностей! 😁
Работаем! 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥4👍3🎉1
Господа!
Недавно мы выпустили скрининг (быстрое тестирование) российских видеохостингов.
История началась на профессиональной конференции VideoTech осенью прошлого года, где после моего дневного доклада окораблях бороздящих просторы вселенной последних достижениях в области метрик качества видео на вечерней дискуссии поднялся товарищ и выдал мне в лоб с размаху. Короче, его начальство считает измерение качество совершенно ненужным. У них бизнес. Они внедряют lean production, как у Toyota. Там все, что людям непосредственно не нужно, должно быть безжалостно сокращено. Поэтому они снижают качество видео, пока люди не отписываются — и это наиболее здоровая бизнес-практика, а не эта ваша никому не нужная наука. А мой тейк состоял в том, что Toyota перед тем, как отрезать лишнее, сначала поставила планку качества (что каждый узел должен быть не хуже по надежности самого лучшего узла любого конкурента) и только потом начала безжалостно резать. А если резать косты до тех пор, пока идут продажи, получится как бы не совсем Toyota. 🤷♂️ Ну есть такое мнение. 😉
Дискуссия была жаркой и закончилась ничем. А недавно мы сделали скрининг видеохостингов. На пробу. Оценить, как зайдет. Ибо предыдущий опыт был негативным. В конце концов, вполне возможно, мы не правы и тестирование качества нужно только иностранным компаниям, а вам и так сойдет! 😁
Если честно, то пока реакция компаний на отчет ОЧЕНЬ радует. 😲🙂
Думаю, что у нас есть реальный шанс существенно поднять техническое качество российских сервисов и это основная цель данного проекта. Цель амбициозная и по ряду причин непростая. Буду держать вас в курсе продолжения этой чудной истории. Ниже пост про нас в одном из каналов (моя цитата взята из отчета, который рекомендую прочитать в оригинале):
#pro_conferences
Недавно мы выпустили скрининг (быстрое тестирование) российских видеохостингов.
История началась на профессиональной конференции VideoTech осенью прошлого года, где после моего дневного доклада о
Дискуссия была жаркой и закончилась ничем. А недавно мы сделали скрининг видеохостингов. На пробу. Оценить, как зайдет. Ибо предыдущий опыт был негативным. В конце концов, вполне возможно, мы не правы и тестирование качества нужно только иностранным компаниям
Если честно, то пока реакция компаний на отчет ОЧЕНЬ радует. 😲
Думаю, что у нас есть реальный шанс существенно поднять техническое качество российских сервисов и это основная цель данного проекта. Цель амбициозная и по ряду причин непростая. Буду держать вас в курсе продолжения этой чудной истории. Ниже пост про нас в одном из каналов (моя цитата взята из отчета, который рекомендую прочитать в оригинале):
#pro_conferences
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2
Forwarded from Телекоммуналка
И дело не в зрителях, а в оптимизации. Институт перспективных исследований проблем ИИ и интеллектуальных систем МГУ им. М.В. Ломоносова провел сравнительный анализ популярных видеохостингов с акцентом на визуальное качество видео. Сам отчет можно найти по ссылке.
В сравнении попали Rutube, «VK Видео», а также зарубежные Vimeo и YouTube. Представители аналитической команды отмечают, что это пробный скрининг, который впоследствии может развиться в более глубокую работу по анализу десятков кодеков, но он дает ответ на вопрос, почему «замедленный» хостинг через VPN порой работает лучше, чем альтернативы.
• YouTube требует в два раза меньшего битрейта для достижения того же качества, что и у отечественных сервисов. Это означает, что при одинаковом визуальном качестве файлы на Rutube и «VK Видео» занимают вдвое больше места. Такая неэффективность может существенно повлиять на стоимость хранения и доставки контента, особенно в условиях ограничений пропускной способности.
• Российские сервисы испытывают трудности с трансляцией видео при низкой скорости интернета. При имитации реальных сетевых условий качество стриминга на Rutube и «VK Видео» было в два раза ниже, чем у YouTube. Задержки воспроизведения у Rutube превышают аналогичные показатели YouTube более чем в 8 раз.
• Проблемы с оптимизацией кодирования популярного контента. Российские видеохостинги не применяют более продвинутые настройки кодирования для популярных видео, что снижает их конкурентоспособность даже относительно собственных решений для менее просматриваемых материалов.
• Неэффективное управление битрейтом и риск «непрактичных» решений. Например, Rutube использует завышенные битрейты для FullHD-видео, что может приводить к техническим проблемам при воспроизведении, особенно на сложных сценах.
• Существуют ошибки в транскодировании, которые могут ухудшать пользовательский опыт. Некоторые видео на Rutube демонстрировали немонотонность RD-кривых — ситуация, при которой увеличение битрейта не приводит к улучшению качества, что создает проблемы для плеера и пользователя.
Дмитрий Ватолин, руклабораторий компьютерной графики ВМК МГУ и интеллектуального анализа видео института ИИ МГУ:
У бизнеса самый главный показатель — это пользователи и подписки. И если они битрейт понижают, а пользователи не отписываются, значит все в порядке. Такая точка зрения действительно распространена, но надо трезво понимать, что снижение себестоимости «пока покупают» — это риск повторения истории Лады Калина, что в условиях скорого прихода китайских компаний на наш рынок вещания весьма чревато. Сейчас мы активно работаем с китайскими компаниями и они демонстрируют и великолепное понимание тонкостей накрутки, и квалификацию, достаточную для написания крайне конкурентоспособных кодеков. В наших же компаниях кодеки не пишут, а инженеры жалуются на специфические компетенции начальства, и нежелание вкладывать деньги в качество сервиса.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3😢3
Господа!
У нас праздник! 🎉🎉🎉
На ICCV 2025 (A*) зашло 2 статьи!!!💃 💃 💃
Так что обновили сразу пачку рекордов:
* У нас первый раз 2 статьи разом зашли 🏆🏆
* У нас уже 3 А* статьи зашло в этом году (и год еще не закончился))) 🏆🏆🏆
* У нас добавилось еще 2 человека в клуб первых авторов А*, в котором у нашей группы сейчас 6 человек 🏆🏆🏆🏆🏆🏆
* И 7 А* по ИИ за 4 года на фюзеляже нашей группы⭐️ ⭐️ ⭐️ ⭐️ ⭐️ ⭐️ ⭐️
Про суть работ чуть позже, но там есть что написать 😉
Поддерживаем звание лучшей лаборатории МГУ по А* статьям в ИИ! 😁
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
💃 💃 💃 💃 💃 💃 💃 💃 💃 💃 💃 💃 💃
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
#our_successes
У нас праздник! 🎉🎉🎉
На ICCV 2025 (A*) зашло 2 статьи!!!
Так что обновили сразу пачку рекордов:
* У нас первый раз 2 статьи разом зашли 🏆🏆
* У нас уже 3 А* статьи зашло в этом году (и год еще не закончился))) 🏆🏆🏆
* У нас добавилось еще 2 человека в клуб первых авторов А*, в котором у нашей группы сейчас 6 человек 🏆🏆🏆🏆🏆🏆
* И 7 А* по ИИ за 4 года на фюзеляже нашей группы
Про суть работ чуть позже, но там есть что написать 😉
Поддерживаем звание лучшей лаборатории МГУ по А* статьям в ИИ! 😁
#our_successes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32❤3👏1
Господа!
Я тут на днях писал, что у нас 2 статьи зашли на ICCV. Пора дать больше деталей, там таки есть о чем! 😉
Речь пойдет о статье "MEMFOF: High-Resolution Training for Memory-Efficient Multi-Frame Optical Flow Estimation". Оптический поток — это ключевой алгоритм в обработке (и частично анализе) видео, построение векторного поля сдвига каждого пикселя относительно предыдущего кадра.
В решении этой задачи много проблем, например:
* области открытия/закрытия, для которых корректного вектора просто нет,
* полупрозрачные области, которым могут корректно соответствовать два и более вектора,
* однородные области, для которых в принципе нетривиально построить корректное поле векторов,
* точное восстановление субпиксельных сдвигов...
а также изменение яркости, цвета, резкости между кадрами и т.д. по длинному списку! 🤕
Интересное современное развитие этого семейства алгоритмов — построение многокадрового оптического потока, когда за счет анализа информации большего числа кадров, и того, что обычно движение в видео сравнительно последовательно, удается значительно поднять точность работы.
Ключевая проблема такого подхода — существенная ресурсоемкость, в том числе по количеству требуемой памяти. Мы расширили двукадровый SOTA метод SEA-RAFT до трехкадрового и сократили потребление памяти на FullHD входах в 4 раза, с ~8 гигов видеопамяти до ~2 (см. графики выше). Такое снижение памяти позволило обучать метод в нативном FullHD, без прибегания к кропам и тайлингу, что позволило значительно улучшить качество на Spring, как zero-shot, так и finetune. Что привело к SOTA результатам на ключевых бенчмарках в области (список покоренных бенчмарков на второй картинке выше))) 🥇🥇🥇🥇🥇💪
Звучит, согласитесь, просто, и теперь готовый рецепт по написанию SOTA у вас в кармане!🌿 😁 Главный риск, конечно, был в том, что статья не пройдет с первого раза, а SOTA в этой области быстро устаревают 🤷♂️ В общем это наша первая статья, зашедшая через SOTA (предыдущие 6 были через cool idea и через hard work в виде датасетов и бенчмарков). И первая статья, зашедшая с первого раза! Мы сделали это!!! 🎉💃 🎉
Если пользуетесь Hugging Face, большая просьба проголосовать за статью тут:
https://huggingface.co/papers/2506.23151🙏 🤝🙏
Звездочки (по желанию))) можно ставить тут:
https://github.com/msu-video-group/memfof/
Страничка проекта с визуализациями и графиками тут:
https://msu-video-group.github.io/memfof/
Статья: PapersWithCode, Arxiv📖
Продолжаем движение!🧑💻 😉
Я тут на днях писал, что у нас 2 статьи зашли на ICCV. Пора дать больше деталей, там таки есть о чем! 😉
Речь пойдет о статье "MEMFOF: High-Resolution Training for Memory-Efficient Multi-Frame Optical Flow Estimation". Оптический поток — это ключевой алгоритм в обработке (и частично анализе) видео, построение векторного поля сдвига каждого пикселя относительно предыдущего кадра.
В решении этой задачи много проблем, например:
* области открытия/закрытия, для которых корректного вектора просто нет,
* полупрозрачные области, которым могут корректно соответствовать два и более вектора,
* однородные области, для которых в принципе нетривиально построить корректное поле векторов,
* точное восстановление субпиксельных сдвигов...
а также изменение яркости, цвета, резкости между кадрами и т.д. по длинному списку! 🤕
Интересное современное развитие этого семейства алгоритмов — построение многокадрового оптического потока, когда за счет анализа информации большего числа кадров, и того, что обычно движение в видео сравнительно последовательно, удается значительно поднять точность работы.
Ключевая проблема такого подхода — существенная ресурсоемкость, в том числе по количеству требуемой памяти. Мы расширили двукадровый SOTA метод SEA-RAFT до трехкадрового и сократили потребление памяти на FullHD входах в 4 раза, с ~8 гигов видеопамяти до ~2 (см. графики выше). Такое снижение памяти позволило обучать метод в нативном FullHD, без прибегания к кропам и тайлингу, что позволило значительно улучшить качество на Spring, как zero-shot, так и finetune. Что привело к SOTA результатам на ключевых бенчмарках в области (список покоренных бенчмарков на второй картинке выше))) 🥇🥇🥇🥇🥇
Звучит, согласитесь, просто, и теперь готовый рецепт по написанию SOTA у вас в кармане!
Если пользуетесь Hugging Face, большая просьба проголосовать за статью тут:
https://huggingface.co/papers/2506.23151
Звездочки (по желанию))) можно ставить тут:
https://github.com/msu-video-group/memfof/
Страничка проекта с визуализациями и графиками тут:
https://msu-video-group.github.io/memfof/
Статья: PapersWithCode, Arxiv
Продолжаем движение!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤2🔥2
Господа!
За последний месяц я принимал госы, а также слушал дипломы на ВМК, в Сколтехе и Вышке. Пополнил свою коллекцию разных феерических историй. 😉
Но сильнее всего прикол один молодой человек, который на невинный вопрос "А какие предметы вы сдавали в этом семестре?" реально не по-детски завис. 😲🤷♂️ 🤦♂️
Это не ВМК (хотя программист), но это и не так важно. Ибо причины явления универсальны:
1. Прогресс фармакологии. Люди как в школе сдавали ЕГЭ на спидах/фене/ноотропах (горячо осуждаю), так и продолжают. Период полураспада знаний при этом стремится к нулю, естественно. 🤷♂️
2. Прогресс радиотехники. Микронаушники для экзаменов продаются от 1,5 тысяч для нищебродов до 15 для ценящих незаметность и надежность. Безденежные доны могу взять у друга или арендовать. Хоба, и вы можете ответить на ЛЮБОЙ каверзный вопрос!!! 😉
3. Прогресс нейросетей. С этого года большинство домашних заданий курсов успешно решается нейросетями! Yes-s-s-s!!!👍 Экономия времени!!! 👍
4. Нет времени учиться. Сегодня кто не работает, тот лох. 😂 Не, ну реально некогда, чо пристали! 🤷♂️😉
5. Нет смысла учиться. Человеку еще после окончания лицея HR Яндекса сказали, что берут по fast track (и взяли!). Ему нужна только корочка, а вся эта ваша так называемая база не нужна! 😲😉🤦♂️
6. Нет времени учить. Университеты почти не индексируют зарплаты, а в IT компаниях они бурно растут, и разница уже давно конская. В этих условиях огромный процент сотрудников университетов — это совместители на одну миллионную ставки, которые учат ради найма к себе в подразделениеи реферал бонусов, превышающих смешную зарплату. 🤷♂️🤦♂️
7. Сказываются родители. Они в школе привыкли с ноги открывать дверь кабинета директора и устраивать ай-яй-яй учителям, кошмарящим их нежное и ранимое чадо (строго по шедевру "Альтернативная математика" — очень рекомендую!). Не поверите, их чада выросли и теперь они приходят в университет, устраивая нескучную жизнь там! Пара случаев травмирующего опыта общения с ними серьезно демотивируют что-то требовать с раздолбаев.🤬 👍
8. Сказывается СВО. Если студент не сдает и вылетает, его непременно заберут на СВО. А там его точно убьют. Поэтому требовательный преподаватель — это циничный убийца с руками по локоть в крови. 🙈🤬
На этом фоне, честно говоря, удивляют немногие учащиеся🙂
Но основная причина, конечно, что мы живем в условиях рыночной экономики и сейчас просто период, когда ПЛАТЕЖЕСПОСОБНЫЙ спрос на качественное образование в IT на минимуме (я по чудовищной разнице зарплат сужу))). Наиболее честная (хотя и циничная) позиция тут у Вышки, которая устами бывшего ректора и декана ФКН доносит четкий месседж "Университет дает ВОЗМОЖНОСТЬ получить образование". И если какой студент занят работой настолько, что не успевает возможность воспользоваться — это его дело. Будет чукчей, обманувшим таксиста, из старого анекдота (заплатил и не поехал, однако!). 😁 Образование постепенно станет очень платным (жутко непопулярный тезис, напишите об этом в комментариях))). Ну или будет видимостью. 🤷♂️
В общем — с таким количеством факторов (и фармакология, и радиотехника, и LLM, и рынок, и...) процент студентов, который будут искренне зависать на коварном вопросе о сданных предметах в июне обречен бурно расти!📈
Случай меня было огорчил, но тут, к счастью, бальзамом подоспел ПМЭФ! Господа! У нас все офигенно и компании рапортуют о лучших в мире нейросетях, а ректоры рассказывают о миллионах выпускаемых супер-специалистов. Проблемы нет!💪 😉
Вышеизложенные тренды — великолепная новость для тех, кто нацелен копать! Нейропластичность не обманешь и спустившие золотые годы на изучение тонкостей React/Hadoop/Spark/SwiftUI (и даже Metasploit!) завтра обнаружат, что дружный коллектив AI-агентов знает эти тонкости лучше их. 🤷♂️ (Этого, конечно, никогда не произойдет, я шучу!)😉
У меня в этом году (на фоне моды ненужности глубокого IT образования) почему-то рекордное количество желающих пойти в аспирантуру (в том числе из компаний), будет сложно столько взять. Смотрю на ситуацию c широко открытыми (как в аниме) глазами и с оптимизмом! 😉
Продолжаем движение! 😁
За последний месяц я принимал госы, а также слушал дипломы на ВМК, в Сколтехе и Вышке. Пополнил свою коллекцию разных феерических историй. 😉
Но сильнее всего прикол один молодой человек, который на невинный вопрос "А какие предметы вы сдавали в этом семестре?" реально не по-детски завис. 😲🤷♂️ 🤦♂️
Это не ВМК (хотя программист), но это и не так важно. Ибо причины явления универсальны:
1. Прогресс фармакологии. Люди как в школе сдавали ЕГЭ на спидах/фене/ноотропах (горячо осуждаю), так и продолжают. Период полураспада знаний при этом стремится к нулю, естественно. 🤷♂️
2. Прогресс радиотехники. Микронаушники для экзаменов продаются от 1,5 тысяч для нищебродов до 15 для ценящих незаметность и надежность. Безденежные доны могу взять у друга или арендовать. Хоба, и вы можете ответить на ЛЮБОЙ каверзный вопрос!!! 😉
3. Прогресс нейросетей. С этого года большинство домашних заданий курсов успешно решается нейросетями! Yes-s-s-s!!!
4. Нет времени учиться. Сегодня кто не работает, тот лох. 😂 Не, ну реально некогда, чо пристали! 🤷♂️😉
5. Нет смысла учиться. Человеку еще после окончания лицея HR Яндекса сказали, что берут по fast track (и взяли!). Ему нужна только корочка, а вся эта ваша так называемая база не нужна! 😲😉
6. Нет времени учить. Университеты почти не индексируют зарплаты, а в IT компаниях они бурно растут, и разница уже давно конская. В этих условиях огромный процент сотрудников университетов — это совместители на одну миллионную ставки, которые учат ради найма к себе в подразделение
7. Сказываются родители. Они в школе привыкли с ноги открывать дверь кабинета директора и устраивать ай-яй-яй учителям, кошмарящим их нежное и ранимое чадо (строго по шедевру "Альтернативная математика" — очень рекомендую!). Не поверите, их чада выросли и теперь они приходят в университет, устраивая нескучную жизнь там! Пара случаев травмирующего опыта общения с ними серьезно демотивируют что-то требовать с раздолбаев.
8. Сказывается СВО. Если студент не сдает и вылетает, его непременно заберут на СВО. А там его точно убьют. Поэтому требовательный преподаватель — это циничный убийца с руками по локоть в крови. 🙈🤬
На этом фоне, честно говоря, удивляют немногие учащиеся
Но основная причина, конечно, что мы живем в условиях рыночной экономики и сейчас просто период, когда ПЛАТЕЖЕСПОСОБНЫЙ спрос на качественное образование в IT на минимуме (я по чудовищной разнице зарплат сужу))). Наиболее честная (хотя и циничная) позиция тут у Вышки, которая устами бывшего ректора и декана ФКН доносит четкий месседж "Университет дает ВОЗМОЖНОСТЬ получить образование". И если какой студент занят работой настолько, что не успевает возможность воспользоваться — это его дело. Будет чукчей, обманувшим таксиста, из старого анекдота (заплатил и не поехал, однако!). 😁 Образование постепенно станет очень платным (жутко непопулярный тезис, напишите об этом в комментариях))). Ну или будет видимостью. 🤷♂️
В общем — с таким количеством факторов (и фармакология, и радиотехника, и LLM, и рынок, и...) процент студентов, который будут искренне зависать на коварном вопросе о сданных предметах в июне обречен бурно расти!
Случай меня было огорчил, но тут, к счастью, бальзамом подоспел ПМЭФ! Господа! У нас все офигенно и компании рапортуют о лучших в мире нейросетях, а ректоры рассказывают о миллионах выпускаемых супер-специалистов. Проблемы нет!
Вышеизложенные тренды — великолепная новость для тех, кто нацелен копать! Нейропластичность не обманешь и спустившие золотые годы на изучение тонкостей React/Hadoop/Spark/SwiftUI (и даже Metasploit!) завтра обнаружат, что дружный коллектив AI-агентов знает эти тонкости лучше их. 🤷♂️ (Этого, конечно, никогда не произойдет, я шучу!)
У меня в этом году (на фоне моды ненужности глубокого IT образования) почему-то рекордное количество желающих пойти в аспирантуру (в том числе из компаний), будет сложно столько взять. Смотрю на ситуацию c широко открытыми (как в аниме) глазами и с оптимизмом! 😉
Продолжаем движение! 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👌8❤3👍3👎3🥴2
This media is not supported in your browser
VIEW IN TELEGRAM
Господа!
Мир вокруг меняется... Причем от некоторых изменений я реально фигею (дорогая редакция)! 🤯😁
Не люблю лекции в стилемонотонно усыпляющей говорящей головы, а люблю задавать аудитории много вопросов. Это позволяет понять, какой темп изложения нужен, что народ массово пропустил в материале пререквизитов, будить заснувших и т.д.
Какое-то время назад вопросы показали, что у студентов в очередной раз упала способность считать в уме. Я про это подробно писал в самой своей популярной по просмотрам статье на Хабре "К вопросу о математических способностях студентов или как учить переполненный мозг". И начинаю там, кстати, с воспоминаний профессора МГУ Сергея Александровича Рачинского, который покинув МГУ и уехав в родное имение в XIX веке, открыл в сельской местности 18(!) школ:
Картина сегодня сильно отличается... Простые задачки, которые с удовольствием решали студенты всего 10 лет назад вызывают ступор... И на тебя смотрит куча народу. И в глазах у них читается (крупными буквами): "Ну давай уже!!! Говори ответ и дальше пошли!" 🤷♂️😂
Вскрытие показало, чтопациент спал народ массово плохо помнит таблицу умножения. И вообще в эпоху, когда у каждого в кармане девайс, превышающий по мощности суперкомпьютеры 25-летней давности, знать таблицу умножения необязательно!!!
Я читаю спецкурсы, причем сразу объявляю, что моя цель — найти лучших, которых интересует зарплата не ниже 800 тысяч (кстати, пора индексировать и ставить миллион, в последнее время регулярно слышу справедливый вопрос разбирающихся в теме: "почему так мало"). В этом плане спорить смысла ноль! Поэтому я горячо поддерживаю, что в принципе ничего изучать не надо (и лекции не нужны!))), поскольку тот же самый волшебный карманный девайс помимо калькулятора (не поверите!) еще и подключен к интернет!!! 😂🤣😂
Заметим, что точка зрения про таблицу умножения становится популярна. На видео выше человек, похожий на журналиста, беседует с человеком, похожим на министра образования и науки Эстонии. Зацените! Таблицу умножения не знают, обратите внимание, оба! 🤯🤦♂️ Но первый пока владеет устным счетом в пределах 100. 😲 Вааау!👏
Кто-то скажет, что ну это у них. Щаззз! Вздорная история на днях произошла с нашим министром образования. Впрочем, ее уже объявили дипфейком на ПМЭФ))) Т.е. разница только в том, что у них это выкладывают, а в нас (пока) объявляют дипфейком. А сколько подобных фееричных историй в США? Популярность STEM в университетах падает не случайно! 🤷♂️
Открою страшный секрет! (Должна же у вас быть прямая польза от моих постов) 😁 Сегодня, в эпоху data science, разница между человеком, который легко жонглирует цифрами в уме, и человеком, который только калькулятору их скармливать может, это разница между человеком, который глядя на чиселки говорит "Стоп! Тут какая-то фигня!" (и находит хитрую багу в подготовке данных) и человеком, который никакой проблемы в упор не видит (и багу в подготовке данных пропускает в обучение модели, идущей в прод). Все! 😁
Причем проблема косит и продвинутых (знаю по себе). Лаида Кушнарева (автор А*, мехмат МГУ, Huawei, канал @tech_priestess) на днях писала у себя:
Честный пост про деградацию в стиле математического киберпанка (в молодежных терминах))) о ее борьбе с собственной когнитивной деградацией!🙂 Красавица! Панки хой!) 💪
Всем победы в этой непростой борьбе! 😁
Мир вокруг меняется... Причем от некоторых изменений я реально фигею (дорогая редакция)! 🤯😁
Не люблю лекции в стиле
Какое-то время назад вопросы показали, что у студентов в очередной раз упала способность считать в уме. Я про это подробно писал в самой своей популярной по просмотрам статье на Хабре "К вопросу о математических способностях студентов или как учить переполненный мозг". И начинаю там, кстати, с воспоминаний профессора МГУ Сергея Александровича Рачинского, который покинув МГУ и уехав в родное имение в XIX веке, открыл в сельской местности 18(!) школ:
Разом, все они человек тридцать-сорок накидывались на меня: "Сергей Александрович, мне деленьице! — Мне на сотни! —– Мне на единицы! — Мне на миллионы! — Мне на тысячи!"… эта беспрестанная усиленная возня с цифрами нагнала на меня настоящий арифметический кошмар
Картина сегодня сильно отличается... Простые задачки, которые с удовольствием решали студенты всего 10 лет назад вызывают ступор... И на тебя смотрит куча народу. И в глазах у них читается (крупными буквами): "Ну давай уже!!! Говори ответ и дальше пошли!" 🤷♂️😂
Вскрытие показало, что
Я читаю спецкурсы, причем сразу объявляю, что моя цель — найти лучших, которых интересует зарплата не ниже 800 тысяч (кстати, пора индексировать и ставить миллион, в последнее время регулярно слышу справедливый вопрос разбирающихся в теме: "почему так мало"). В этом плане спорить смысла ноль! Поэтому я горячо поддерживаю, что в принципе ничего изучать не надо (и лекции не нужны!))), поскольку тот же самый волшебный карманный девайс помимо калькулятора (не поверите!) еще и подключен к интернет!!! 😂🤣😂
Заметим, что точка зрения про таблицу умножения становится популярна. На видео выше человек, похожий на журналиста, беседует с человеком, похожим на министра образования и науки Эстонии. Зацените! Таблицу умножения не знают, обратите внимание, оба! 🤯🤦♂️ Но первый пока владеет устным счетом в пределах 100. 😲 Вааау!
Кто-то скажет, что ну это у них. Щаззз! Вздорная история на днях произошла с нашим министром образования. Впрочем, ее уже объявили дипфейком на ПМЭФ))) Т.е. разница только в том, что у них это выкладывают, а в нас (пока) объявляют дипфейком. А сколько подобных фееричных историй в США? Популярность STEM в университетах падает не случайно! 🤷♂️
Открою страшный секрет! (Должна же у вас быть прямая польза от моих постов) 😁 Сегодня, в эпоху data science, разница между человеком, который легко жонглирует цифрами в уме, и человеком, который только калькулятору их скармливать может, это разница между человеком, который глядя на чиселки говорит "Стоп! Тут какая-то фигня!" (и находит хитрую багу в подготовке данных) и человеком, который никакой проблемы в упор не видит (и багу в подготовке данных пропускает в обучение модели, идущей в прод). Все! 😁
Причем проблема косит и продвинутых (знаю по себе). Лаида Кушнарева (автор А*, мехмат МГУ, Huawei, канал @tech_priestess) на днях писала у себя:
Как будто туман рассеивается, и на горизонте появляется знакомый, но давно забытый пейзаж строгого математического мышления...
А ведь я столько лет строила внутри себя уютную империю когнитивной стагнации!
Каждое утро я начинала с тиктоков для зумеров - чтобы приглушить нейроны, отвечающие за критическое мышление и логику. Иногда я ловила себя на мысли - "а ведь когда-то я читала Вейля" - и тут же включала видео, где кто-то ссыт себе в штаны под рэп-баттл между Оксимироном и Гнойным.
Честный пост про деградацию в стиле математического киберпанка (в молодежных терминах))) о ее борьбе с собственной когнитивной деградацией!
Всем победы в этой непростой борьбе! 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍5❤3
Господа!
Из текущего интересного, наш магистр Георгий Бычков передает всем привет с ICME-2025 (Core A) из жаркой Франции)
Краткие впечатления:
Тренд! 🤷♂️😉
Жесть, конечно! 🤯
Отлично! Даже Subjectify!) (мы его отдельно позиционируем))) Если учесть, что еще недавно нас только по сравнениям кодеков знали и много бенчмарков мы выложили буквально за последние 3 года — неплохо. Работаем! )))
Пример правильного активного поведения на конференции, характерного не для всех магистров!!! 👍👍👍
Да, прослойка тонка 😁
3,5 года назад, когда мы вошли в грант Центра Доверенного ИИ ИСП РАН я поставил у нас задачу:
* Каждому бакалавру по Scopus
* Каждому магистру по Q1
* Каждому аспиранту по А*
Мы хорошо продвинулись на этом пути! 😁 А сейчас, с Центром ИИ МГУ убираем первый пункт и сразу подключаем бакалавров в А*.💪
И надо сказать, это работает.
Если самым сильным негативным впечатлением июня был молодой человек, который не смог назвать предметы, которые он сдавал в этом семестре (пример закономерного тренда развития IT-образования).
То самым сильным положительным впечатлением была статья на ICCV (А*) про оптический поток, первым автором которой является наш третьекурсник. ТРЕТЬЕКУРСНИК, Карл!😨 Понятно, что без аспиранта и магистра в соавторах фокус бы не получился, но человек реально дал ключевой вклад в статью. Для полноты картины замечу, что это был зимний набор 2 курса, т.е. прокачка и работа была сделана за 1,5 года. Т.е. человек прошел полугодовой спецкурс (лучшим), потом полгода прокачки и погружения в тему. Потом год работы. И получилось! 👏💪 👏💪 👏💪 👏
В общем — кто-то прокачивает А*, а кто-то прокачивает React/Angular/Vue. Посмотрим, кто из них где будет через 3-5 лет 😉 Ибо по факту А* сегодня, это способность выиграть соревнование по скорости с китайцами, которых, вы видите, на тренировочной для них А уже 95% 🤷♂️😉
Замечу, что я люблю пробивать авторов статей и довольно регулярно вижу в китайских статьях первым автором магистра. Но и бакалавры встречаются! Считаю, что по этому параметру наша лаборатория догнала топовые китайские! Ye-e-e-e-es!!! 😁😂😁
Также замечу, что IFAIK на ВМК более никто из аспирантов других лабораторий не публикуется последние 5 лет на А*, с аффилиацией МГУ по крайней мере (пока найти не удалось, если знаете, пишите в комментарии, плз). Ну и к нам в этом году хочет поступить рекордное число в аспирантуру. Будет запредельно интересно, сколько сможем взять. 😁
И еще из хорошего за июнь. На процедуре выбора тем научной работы весенний набор дружно кинулся на самые сложные темы!!! Первый раз такое видел за много лет! 😲 Что-то точно меняется в этом мире! 😉
Работаем! 😁
#pro_conferences
Из текущего интересного, наш магистр Георгий Бычков передает всем привет с ICME-2025 (Core A) из жаркой Франции)
Краткие впечатления:
Вообще очень много китайцев: по словам General Chair, 88% из mainland China, если считать просто китайцев, их около 95%)
Тренд! 🤷♂️😉
Из-за этого уровень некоторых устных докладов был очень низкий, так как докладчик плохо говорил по-английски. Много proxy, с ними тоже не все хорошо, так как часто не могут ответить на простые вопросы по статье. Вишенка на торте презентация лучших докладов: устная презентация 3х лучших работ конференции: 2/3 спикера не говорили по-английски и на вопросы из зала отвечали через переводчика. В топ-15 лучших работ, кстати, все работы китайские. На постерных сессиях иногда много кого нет на своих местах и приходится самому вникать, что происходит. Пленарные доклады отличные.
Жесть, конечно! 🤯
Из интересного: подошёл после доклада к организаторам челленджа по SR. Начал спрашивать про челлендж, и сказал, что мы организуем их на ICCV. Поинтересовались, откуда я. Сразу же вспомнили бенчмарки, сравнение кодеков и Subjectify.us.)
Отлично! Даже Subjectify!) (мы его отдельно позиционируем))) Если учесть, что еще недавно нас только по сравнениям кодеков знали и много бенчмарков мы выложили буквально за последние 3 года — неплохо. Работаем! )))
Потом организатор челленджа с Microsoft подошёл ко мне на постерной сессии и сказал, что заинтересовался нашими челленджами. Я ему дал ссылку на ICCV AIM наш, он обещал к понедельнику посмотреть и что-то нам отписать. Наши контакты у него есть, кто-то ему из наших уже писал.
Пример правильного активного поведения на конференции, характерного не для всех магистров!!! 👍👍👍
Докладов по нашей тематике очень много. Были по атакам, доверенному ИИ, SR, метрикам, JPEG AI, кодекам, сжатию. Один из европейцев (вроде университет Клагенфурта, Австрия) вспоминал Николая с VCIP)
Да, прослойка тонка 😁
3,5 года назад, когда мы вошли в грант Центра Доверенного ИИ ИСП РАН я поставил у нас задачу:
* Каждому бакалавру по Scopus
* Каждому магистру по Q1
* Каждому аспиранту по А*
Мы хорошо продвинулись на этом пути! 😁 А сейчас, с Центром ИИ МГУ убираем первый пункт и сразу подключаем бакалавров в А*.
И надо сказать, это работает.
Если самым сильным негативным впечатлением июня был молодой человек, который не смог назвать предметы, которые он сдавал в этом семестре (пример закономерного тренда развития IT-образования).
То самым сильным положительным впечатлением была статья на ICCV (А*) про оптический поток, первым автором которой является наш третьекурсник. ТРЕТЬЕКУРСНИК, Карл!
В общем — кто-то прокачивает А*, а кто-то прокачивает React/Angular/Vue. Посмотрим, кто из них где будет через 3-5 лет 😉 Ибо по факту А* сегодня, это способность выиграть соревнование по скорости с китайцами, которых, вы видите, на тренировочной для них А уже 95% 🤷♂️😉
Замечу, что я люблю пробивать авторов статей и довольно регулярно вижу в китайских статьях первым автором магистра. Но и бакалавры встречаются! Считаю, что по этому параметру наша лаборатория догнала топовые китайские! Ye-e-e-e-es!!! 😁😂😁
Также замечу, что IFAIK на ВМК более никто из аспирантов других лабораторий не публикуется последние 5 лет на А*, с аффилиацией МГУ по крайней мере (пока найти не удалось, если знаете, пишите в комментарии, плз). Ну и к нам в этом году хочет поступить рекордное число в аспирантуру. Будет запредельно интересно, сколько сможем взять. 😁
И еще из хорошего за июнь. На процедуре выбора тем научной работы весенний набор дружно кинулся на самые сложные темы!!! Первый раз такое видел за много лет! 😲 Что-то точно меняется в этом мире! 😉
Работаем! 😁
#pro_conferences
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍8😢1
Господа!
К вопросу об изменении ландшафта специальности программист. 😉
Как знают внимательные читатели, я давно и с интересом слежу за SWE-bench (тык, тык, тык, тык...). В числе участников там Amazon, Google, IBM, Alibaba, ByteDance, Anthropic и другие вполне серьезные товарищи. Ровно поэтому этот бенчмарк и показателен.
Если стартапы очень часто ради раунда инвестиций затачиваются под датасет, то у больших компаний такое тоже бывает (что уж там, мы когда-то активно поучаствовали во вскрытии мухлежа Microsoft), но, как правило, результат серьезных дядь намного более воспроизводим и при независимых тестах похож.
Какие мысли, глядя на свежий топ номинации Verified (наиболее показательной):
1. Обратите внимание — практически весь топ — новые (последние 3 месяца). Обновление топа идет очень быстро!
2. ByteDance со свежим trae.ai всех порвали, выбив 75%, но важнее, что их агент опенсорсный
https://github.com/bytedance/trae-agent! Думаю, что это многих забустит!
3. На мой вкус крайне интересен прогресс Google. Их последняя Gemini выстрелила очень неплохо! Обратим внимание, что последний раз они сабмиттили модель аж в декабре. Скорее всего публичных сабмитов нет, поскольку они не первые (а показывать, что они в топе им не нужно), но топ явственно полнее, чем мы видим.
В целом можно констатировать, что SWE-bench довольно быстро насыщается!
Программистских агентов ругают, но главный аргумент в их пользу — где вы найдете такого джуна за 20$? 😁
Понятно, что на пути прогресса много чудного, например, вот недавняя история как раз с использованием Gemini 2.5 Pro в Cursor:
Что-то подсказывает, что агент Google скоро научится прямо говорить ("а ты, дорогой, не офигел ли такую сложную задачу давать?"))) и такое поведение починят, но сейчас это прям на редкость прекрасно 😉
———
Недавно меня пригласили выступить на вручении дипломов магистров ВМК.
Я долго думал, что сказать. Ограничиться ли обычными словами о том, какие все молодцы или сказатьгорькую правду. Выбрал второе. И сказал, что при текущей скорости прогресса с огромной вероятностью через 3 года модели будут уверенно решать задачи, на которые прокачанным программистам нужно 2-3 дня. А через 4 года дойдет до недели. Это значит, что агенты начнут выполнять задачи уровня спринта. И это будет революция, поскольку компании начнут сокращать мидлов и частично синьоров. В этом плане главный экзамен для сегодняшних выпускников будет через 4 года — останутся они в профессии (и начнут получать скорее всего больше) или будут вынуждены сменить профессию? Я попытался смягчить как мог, но зал, очевидно, напрягся. Наверное больше меня не позовут 😂 Незачем людям портить праздник) 😉
Господа, вы живете в феерически интересное время!
#SWE_benchmarking
К вопросу об изменении ландшафта специальности программист. 😉
Как знают внимательные читатели, я давно и с интересом слежу за SWE-bench (тык, тык, тык, тык...). В числе участников там Amazon, Google, IBM, Alibaba, ByteDance, Anthropic и другие вполне серьезные товарищи. Ровно поэтому этот бенчмарк и показателен.
Если стартапы очень часто ради раунда инвестиций затачиваются под датасет, то у больших компаний такое тоже бывает (что уж там, мы когда-то активно поучаствовали во вскрытии мухлежа Microsoft), но, как правило, результат серьезных дядь намного более воспроизводим и при независимых тестах похож.
Какие мысли, глядя на свежий топ номинации Verified (наиболее показательной):
1. Обратите внимание — практически весь топ — новые (последние 3 месяца). Обновление топа идет очень быстро!
2. ByteDance со свежим trae.ai всех порвали, выбив 75%, но важнее, что их агент опенсорсный
https://github.com/bytedance/trae-agent! Думаю, что это многих забустит!
3. На мой вкус крайне интересен прогресс Google. Их последняя Gemini выстрелила очень неплохо! Обратим внимание, что последний раз они сабмиттили модель аж в декабре. Скорее всего публичных сабмитов нет, поскольку они не первые (а показывать, что они в топе им не нужно), но топ явственно полнее, чем мы видим.
В целом можно констатировать, что SWE-bench довольно быстро насыщается!
Программистских агентов ругают, но главный аргумент в их пользу — где вы найдете такого джуна за 20$? 😁
Понятно, что на пути прогресса много чудного, например, вот недавняя история как раз с использованием Gemini 2.5 Pro в Cursor:
При решении весьма стандартной задачи ИИ-агент впал в отчаяние и депрессию, а в конечном итоге и в режим саморазрушения, решив удалить весь код 😱 Все шаги сопровождались очень персональными сообщениями, похожими на поведение человека в отчаянии и депрессии.
Что-то подсказывает, что агент Google скоро научится прямо говорить ("а ты, дорогой, не офигел ли такую сложную задачу давать?"))) и такое поведение починят, но сейчас это прям на редкость прекрасно 😉
———
Недавно меня пригласили выступить на вручении дипломов магистров ВМК.
Я долго думал, что сказать. Ограничиться ли обычными словами о том, какие все молодцы или сказать
Господа, вы живете в феерически интересное время!
#SWE_benchmarking
❤16👍5😁2👎1
Господа!
Я уже не раз писал про программу AI Masters, где мы читаем:
* "Computer Vision & Video Processing" совместно с Сергеем Загоруйко, соавтором DETR
* И этой весной в первый раз прочитали "Безопасность, интерпретируемость и устойчивость в машинном обучении" от группы метрик, усилиями Рашида Бадера и Насти Анциферовой.
Ключевое про программу:
* 2 года, вечернее обучение, онлайн
* 2 трека: Data Science и Business Intelligence, 30+ курсов
* преподаватели из МГУ, МФТИ, ВШЭ, Skoltech, Газпромбанк, Yandex, Ozon tech, Wildberries
* первый год обучения в Институте ИИ МГУ, второй - на Факультете ИИ МГУ
Программа составит основу магистерской программы нового факультета ИИ МГУ и, думаю, станет намного лучше! ))) (работа над этим прямо сейчас идет!)
Мы набираем с программы в свои исследовательские группы (на дипломную работы в рамках программы), так что это один из способов попасть к нам (и прокачаться).
Сегодня в 16.00 будет день открытых дверей!
Ссылка на подключение
Увидимся)
Я уже не раз писал про программу AI Masters, где мы читаем:
* "Computer Vision & Video Processing" совместно с Сергеем Загоруйко, соавтором DETR
* И этой весной в первый раз прочитали "Безопасность, интерпретируемость и устойчивость в машинном обучении" от группы метрик, усилиями Рашида Бадера и Насти Анциферовой.
Ключевое про программу:
* 2 года, вечернее обучение, онлайн
* 2 трека: Data Science и Business Intelligence, 30+ курсов
* преподаватели из МГУ, МФТИ, ВШЭ, Skoltech, Газпромбанк, Yandex, Ozon tech, Wildberries
* первый год обучения в Институте ИИ МГУ, второй - на Факультете ИИ МГУ
Программа составит основу магистерской программы нового факультета ИИ МГУ и, думаю, станет намного лучше! ))) (работа над этим прямо сейчас идет!)
Мы набираем с программы в свои исследовательские группы (на дипломную работы в рамках программы), так что это один из способов попасть к нам (и прокачаться).
Сегодня в 16.00 будет день открытых дверей!
Ссылка на подключение
Увидимся)
❤13🔥3👍1
Господа!
За последний месяц было море новостей про конские зарплаты и бонусы при наборе в Superintelligence team в [запрещенной компании]. $100 миллионов бонусов в год, $200 миллионов за 2 года и даже $1 миллиард за 4 года ("One received an offer for more than $1 billion" (с) Wired). А ведь совсем недавно OpenAI пришлось раздавать бонусы на $2 миллиона и пакеты на $20 лямов, чтобы удержать от ухода к Суцкеверу, а тут новая напасть. 😲😁
Причина роста зарплат — бурный рост доходов. OpenAI вышла на ARR 12 ярдов в июне. Чтобы понять масштаб — столько было у всего Яндекса в прошлом году (по текущему курсу рубля 😉))). При этом у Яндекса условно 30 тысяч сотрудников, а у OpenAI 3 тысячи, т.е. OpenAI может платить существенно больше на брата (хотя они до сих пор убыточны и как не в себя вкладывают в компьют). Яндекс вырос на 37% в прошлом году 👍, но у Open AI рост в 3+ раза за последний год и 4 раза за прошлый. 😲 Другие темпы. 🤯💪
Meta* явно пробовала своими силами топовые результаты затащить, успехи были, но недостаточные (провал Llama 4). Отсюда решение потратить 2+ миллиарда долларов напереманивание бонусы исследователей и на создание Superintelligence team.
Еще со времен своего Карена Симоняна я с интересом отслеживаю траектории "мультимиллионеров от ресеча" из наших палестин.
Какие в целом мысли при вдумчивом изучении списка 44 сотрудников Superintelligence team (картинка выше):
Вывод 1: Система образования Китая рулит!
50+% — китайцы. Причина — мощная реформа образования 30 лет назад, которая дала стране много инженеров и ученых сейчас.
Вывод 2: PhD рулит! На 30 (тридцать!) Research Scientist без степени 1 (один)!
Кстати, русский)))
Вывод 3: Однако ВМК и Мехмат МГУ рулят!
Посмотрим подробнее их траекторию:
* Александр Колесников — в 2012 году закончил специалитет ВМК (ММП). С середины 4 курса работал в Яндексе (отработал 2 года 9 месяцев). Через год после окончания университета поступил в аспирантуру в Австрии, которую закончил через 5 лет.
Вообще, как я вижу, это основная ловушка сегодня. Переход из Яндекс в аспирантуру (даже европейскую), это ВСЕГДА жесткий даунгрейд по деньгам. Причем НА ГОДЫ. Это супер сложно в молодом возрасте, особенно когда однокурсники и бывшие коллеги постят фоточки из серии "как я с заей сгонял на Мальдивы на выходные"... А ты фигачишь статьи...
Впрочем, профиль в сколаре показывает, что Александр в аспирантуре времени не терял, а уже на первом году аспы затащил ECCV (A*) первым автором. Оч круто! И дальше еще А* одна за другой!
Наилучшая статья по цитированиям (почти 70к) у него в соавторстве с Александром Досовицким (кстати, также бывший аспирант мехмата МГУ) через 2 года после окончания аспирантуры в 2020 во время работы в Google Brain — о том, как успешно применять трансформеры для картинок. Статья ввела Vision Transformer (ViT), заменивший сверточные сетки и ставший стандартом. Дальше был OpenAI, а сейчас Meta. Всего я насчитал 16 А*, и, похоже, это не все (часть архивных не матчил).
* Антон Бахтин — закончил мехмат годом ранее в 2011. В 2012 поступил в ШАД и пошел в Яндекс. Через 3 года смог пройти собес в Google (Bay Area). Через 2 года — в Facebook*, через 5 лет в Anthropic, еще через 2 в Superintelligence team. По статьям у него не так густо (хотя 4 NeurIPS, 3 ICLR, одна ICML + еще есть). Короче, с А* сильно выше среднего.
Какие мысли:
* Глубокое образование рулит. Во всех смыслах.
* Я думаю, что много мехмата по той же причине, по которой А* статьи за пределами нашей лаборатории в МГУ только на мехмате и физфаке. На ВМК атмосфера "кто не работает, тот лох". И толпалеммингов уносит даже многих талантливых людей в прод. При том, что ролять все больше начинает ресеч.
Что Александр Колесников ВМК — супер (в таблице ошибка, поправил после коммента)
* У Яндекса неплохая система отбора лучших. Главное вовремя уйти 😉
* Максимальной ценности для индустрии наиболее дорогие кадры достигают через 10-15 лет после окончания университета (через 3-10 лет после окончания аспы).
А сколько будешь получать через 10 лет после окончания университета ты [%%USERNAME%%]? 😉
За последний месяц было море новостей про конские зарплаты и бонусы при наборе в Superintelligence team в [запрещенной компании]. $100 миллионов бонусов в год, $200 миллионов за 2 года и даже $1 миллиард за 4 года ("One received an offer for more than $1 billion" (с) Wired). А ведь совсем недавно OpenAI пришлось раздавать бонусы на $2 миллиона и пакеты на $20 лямов, чтобы удержать от ухода к Суцкеверу, а тут новая напасть. 😲😁
Причина роста зарплат — бурный рост доходов. OpenAI вышла на ARR 12 ярдов в июне. Чтобы понять масштаб — столько было у всего Яндекса в прошлом году (по текущему курсу рубля 😉))). При этом у Яндекса условно 30 тысяч сотрудников, а у OpenAI 3 тысячи, т.е. OpenAI может платить существенно больше на брата (хотя они до сих пор убыточны и как не в себя вкладывают в компьют). Яндекс вырос на 37% в прошлом году 👍, но у Open AI рост в 3+ раза за последний год и 4 раза за прошлый. 😲 Другие темпы. 🤯
Meta* явно пробовала своими силами топовые результаты затащить, успехи были, но недостаточные (провал Llama 4). Отсюда решение потратить 2+ миллиарда долларов на
Еще со времен своего Карена Симоняна я с интересом отслеживаю траектории "мультимиллионеров от ресеча" из наших палестин.
Какие в целом мысли при вдумчивом изучении списка 44 сотрудников Superintelligence team (картинка выше):
Вывод 1: Система образования Китая рулит!
50+% — китайцы. Причина — мощная реформа образования 30 лет назад, которая дала стране много инженеров и ученых сейчас.
Вывод 2: PhD рулит! На 30 (тридцать!) Research Scientist без степени 1 (один)!
Кстати, русский)))
Вывод 3: Однако ВМК и Мехмат МГУ рулят!
Посмотрим подробнее их траекторию:
* Александр Колесников — в 2012 году закончил специалитет ВМК (ММП). С середины 4 курса работал в Яндексе (отработал 2 года 9 месяцев). Через год после окончания университета поступил в аспирантуру в Австрии, которую закончил через 5 лет.
Вообще, как я вижу, это основная ловушка сегодня. Переход из Яндекс в аспирантуру (даже европейскую), это ВСЕГДА жесткий даунгрейд по деньгам. Причем НА ГОДЫ. Это супер сложно в молодом возрасте, особенно когда однокурсники и бывшие коллеги постят фоточки из серии "как я с заей сгонял на Мальдивы на выходные"... А ты фигачишь статьи...
Впрочем, профиль в сколаре показывает, что Александр в аспирантуре времени не терял, а уже на первом году аспы затащил ECCV (A*) первым автором. Оч круто! И дальше еще А* одна за другой!
Наилучшая статья по цитированиям (почти 70к) у него в соавторстве с Александром Досовицким (кстати, также бывший аспирант мехмата МГУ) через 2 года после окончания аспирантуры в 2020 во время работы в Google Brain — о том, как успешно применять трансформеры для картинок. Статья ввела Vision Transformer (ViT), заменивший сверточные сетки и ставший стандартом. Дальше был OpenAI, а сейчас Meta. Всего я насчитал 16 А*, и, похоже, это не все (часть архивных не матчил).
* Антон Бахтин — закончил мехмат годом ранее в 2011. В 2012 поступил в ШАД и пошел в Яндекс. Через 3 года смог пройти собес в Google (Bay Area). Через 2 года — в Facebook*, через 5 лет в Anthropic, еще через 2 в Superintelligence team. По статьям у него не так густо (хотя 4 NeurIPS, 3 ICLR, одна ICML + еще есть). Короче, с А* сильно выше среднего.
Какие мысли:
* Глубокое образование рулит. Во всех смыслах.
* Я думаю, что много мехмата по той же причине, по которой А* статьи за пределами нашей лаборатории в МГУ только на мехмате и физфаке. На ВМК атмосфера "кто не работает, тот лох". И толпа
Что Александр Колесников ВМК — супер (в таблице ошибка, поправил после коммента)
* У Яндекса неплохая система отбора лучших. Главное вовремя уйти 😉
* Максимальной ценности для индустрии наиболее дорогие кадры достигают через 10-15 лет после окончания университета (через 3-10 лет после окончания аспы).
А сколько будешь получать через 10 лет после окончания университета ты [%%USERNAME%%]? 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🤔2😁1🤩1