Господа!
У нас праздник — статья Виктории Леоненковой зашла на IEEE International Conference on Pervasive Computing and Communications (Италия, Пиза, середина марта), которая A* устойчиво c 2013 года! Это значит, что у нас уже 8-й человек за 4 года стал первым автором А*, причем статья практически была написана на 4 курсе!
🥳 🥳 🥳 🙂 👏 🙂 🥳 🥳 🥳
Сейчас Вика в магистратуре в Лондоне (и ей там хорошо). Если брать из наших прошлых студентов, то Максим Синюков (сейчас в аспирантуре в University of Southern California) в позапрошлом году стал соавтором на ECCV (А*), а в прошлом первым автором на ICCV (A*) и он такой не один, так что наш список первых авторов А*, если брать прошлых студентов больше, и это все без читов типа "equal contribution" (когда можно несколько добавить за одну публикацию)! 😁
Также на этой неделе у Георгия Готина (4 курс!) зашла статья в "Big Data and Cognitive Computing" (Q1)🙂 👏 🙂 🙂 👏 🙂 🙂 👏 🙂 Заметим, что и эта статья, и статья Виктории написаны в соавторстве с нашей лучшей аспиранткой первого года Екатериной Шумицкой (5 А* на данный момент, что для середины первого года аспирантуры просто это очень-очень-очень празднично 💪 💪 💪 🙂 🙂 🙂 💪 💪 💪 ) и лучшей сотрудницей Анастасией Анциферовой. 🙂 🙂 🙂 Сила! 💪 💪 💪
Ну и до кучи у Сергея Муравлева (тоже 4 курс!) на этой неделе зашла статья на ICASSP-2026! Это только В, но Барселона на майские это тоже, в принципе, неплохо 😉
А куда на 4 курсе зашла статья у тебя %%USER_NAME%%?
В целом же хотелось бы дойти до ситуации, когда у нас будет 4 А* статьи при поступлении в аспирантуру, как у Кати Шумицкой.
Работаем! Stay tuned! 😁
#pro_conferences #our_successes
@vgcourse
У нас праздник — статья Виктории Леоненковой зашла на IEEE International Conference on Pervasive Computing and Communications (Италия, Пиза, середина марта), которая A* устойчиво c 2013 года! Это значит, что у нас уже 8-й человек за 4 года стал первым автором А*, причем статья практически была написана на 4 курсе!
Сейчас Вика в магистратуре в Лондоне (и ей там хорошо). Если брать из наших прошлых студентов, то Максим Синюков (сейчас в аспирантуре в University of Southern California) в позапрошлом году стал соавтором на ECCV (А*), а в прошлом первым автором на ICCV (A*) и он такой не один, так что наш список первых авторов А*, если брать прошлых студентов больше, и это все без читов типа "equal contribution" (когда можно несколько добавить за одну публикацию)! 😁
Также на этой неделе у Георгия Готина (4 курс!) зашла статья в "Big Data and Cognitive Computing" (Q1)
Ну и до кучи у Сергея Муравлева (тоже 4 курс!) на этой неделе зашла статья на ICASSP-2026! Это только В, но Барселона на майские это тоже, в принципе, неплохо 😉
А куда на 4 курсе зашла статья у тебя %%USER_NAME%%?
В целом же хотелось бы дойти до ситуации, когда у нас будет 4 А* статьи при поступлении в аспирантуру, как у Кати Шумицкой.
Работаем! Stay tuned! 😁
#pro_conferences #our_successes
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩13❤10🔥6🥴4👏2🎉2🤔1
Господа!
Тут неделю назад Райан Даль (наиболее известный проект Node.js) написал предельно прямо "the era of humans writing code is over".
А 5 дней назад на Международном Экономическом Форуме в Давосе была дискуссия Демиса Хассабиса и Дарио Амодея, где товарищ Дарио заявил:
Я слежу за темой давно. Два года назад на OpenTalks.ai в Тбилиси я с большим интересом пообщался со специалистами в LLM (а GPT тогда как раз год, как хайпанула, и много докладов было про LLM), причем тогда была накладка с залом и конференция проводилась кулуарно практически для докладчиков с записью для всех. Была отличная возможность обедать и ужинать с докладчиками. И меня тогда поразил жесткий прогноз "через 5 лет 80% программистов или сильно изменятся или потеряют работу". Заметим, Cursor тогда был в стадии глубокой беты и о нем никто не знал.
Тогда же Дженсен Хуанг жег "не отдавайте детей изучать программирование". Хайповал!)
В марте 2025 Дарио заявил, что через 6 месяцев 90% кода будет писать AI, а через год, возможно весь код. Он прообещался, но ненамного, ибо в конце 2025 года (с выходом Claude Opus 4.5 и GPT-5.2 Pro) произошел очередной качественный скачек.
Впрочем еще тогда же в марте Джефф Дин из Гугла говорил, что у них в Google AI генерирует уже 25% кода.
Тем показательнее изменение ситуации сейчас. Вот реакция на последнее выступление Дарио от Product Director @ T-Bank AI:
Опрос знакомых дает похожую картину, кто-то говорит, что производительность выросла примерно в 3 раза за счет, кто-то, что очень много использует подписки. Четкой статистики нет, но очень похожая картина.
Шикарную историю на днях опубликовали в блоге Anthropic. Они 2,5 года назад сделали тестовое задание для предварительного отсева кандидатов. Задание по оптимизации параллельного кода на Python, дававшееся на 4 часа, причем в нем МОЖНО было использовать ИИ. Оно было с хорошей глубиной по сложности, не требовало специфичных знаний и было интересным. Его выполнило более 1000 человек и большинство их текущей команды оптимизации были набраны после его выполнения. НО! В мае 2025 Claude 3.7 Sonnet стал настолько хорош, что 50% кандидатов было выгоднее полностью делегировать Claude выполнение, чем делать самому (ибо время). А Claude Opus 4 за 4 часа обгонял почти всех кандидатов...
Задание пришлось обновлять до 2.0. Время было сокращено до 2 часов, стартовый код стал проще... НО! Это помогло ненадолго.🫨 Claude Opus 4.5 побил ВСЕХ людей на этой задаче за это время. Они обсуждали запретить использовать ИИ (не вариант для Антропик), поменять задачу (не смогли найти!!! 🤔 ), и сделать синтетическое решение (головоломка, которая зашла)... Автор пишет: "Мне до сих пор грустно отказываться от реальной задачи... Но реализм может быть роскошью, которой у нас больше нет". Реальных задач много в трейне, поэтому на них Claude работает лучше. Лучше всех людей... 🤔 Настоятельно рекомендую прочитать этот грустный пост! ☹️
В Давосе CEO Антропик хвастался, что у них был $100 млн ДОХОД в 2023, $1 млрд в 2024 и $10 млрд в 2025🤩 . Сколько у них будет в 2026? 🚀
Какова твоя стратегия на ближайшие 3 года %%USER_NAME%%?🤔
Это ведь только начало... 😁
#speed_of_progress
@vgcourse
Тут неделю назад Райан Даль (наиболее известный проект Node.js) написал предельно прямо "the era of humans writing code is over".
А 5 дней назад на Международном Экономическом Форуме в Давосе была дискуссия Демиса Хассабиса и Дарио Амодея, где товарищ Дарио заявил:
У нас в Anthropic есть инженеры, которые говорят: "Я больше вообще не пишу код. Я просто даю модели написать код, потом редактирую его и занимаюсь сопутствующими задачами".
Я думаю — хотя не знаю наверняка — что нас отделяет от 6 до 12 месяцев от момента, когда модель будет выполнять большую часть, а может быть и абсолютно всю работу инженеров-программистов от начала до конца.
Я слежу за темой давно. Два года назад на OpenTalks.ai в Тбилиси я с большим интересом пообщался со специалистами в LLM (а GPT тогда как раз год, как хайпанула, и много докладов было про LLM), причем тогда была накладка с залом и конференция проводилась кулуарно практически для докладчиков с записью для всех. Была отличная возможность обедать и ужинать с докладчиками. И меня тогда поразил жесткий прогноз "через 5 лет 80% программистов или сильно изменятся или потеряют работу". Заметим, Cursor тогда был в стадии глубокой беты и о нем никто не знал.
Тогда же Дженсен Хуанг жег "не отдавайте детей изучать программирование". Хайповал!)
В марте 2025 Дарио заявил, что через 6 месяцев 90% кода будет писать AI, а через год, возможно весь код. Он прообещался, но ненамного, ибо в конце 2025 года (с выходом Claude Opus 4.5 и GPT-5.2 Pro) произошел очередной качественный скачек.
Впрочем еще тогда же в марте Джефф Дин из Гугла говорил, что у них в Google AI генерирует уже 25% кода.
Тем показательнее изменение ситуации сейчас. Вот реакция на последнее выступление Дарио от Product Director @ T-Bank AI:
Год назад на все предикты Дарио большая часть моих знакомых смотрела, крутя палец у виска. Сейчас почти все мои знакомые SWE, начиная от стартапа и заканчивая бигтехом, пишут руками меньше 20% кода, а всё остальное делает агент. Я сам давно уже не программист, поэтому не показатель, но с появлением Cursor и Claude Code редко пишу код руками. С появлением Opus 4.5 — все 100% кода пишутся им в Claude Code. Более того, я в терминале работаю через Claude Code — настолько лень стало писать bash-команды самому.
Опрос знакомых дает похожую картину, кто-то говорит, что производительность выросла примерно в 3 раза за счет, кто-то, что очень много использует подписки. Четкой статистики нет, но очень похожая картина.
Шикарную историю на днях опубликовали в блоге Anthropic. Они 2,5 года назад сделали тестовое задание для предварительного отсева кандидатов. Задание по оптимизации параллельного кода на Python, дававшееся на 4 часа, причем в нем МОЖНО было использовать ИИ. Оно было с хорошей глубиной по сложности, не требовало специфичных знаний и было интересным. Его выполнило более 1000 человек и большинство их текущей команды оптимизации были набраны после его выполнения. НО! В мае 2025 Claude 3.7 Sonnet стал настолько хорош, что 50% кандидатов было выгоднее полностью делегировать Claude выполнение, чем делать самому (ибо время). А Claude Opus 4 за 4 часа обгонял почти всех кандидатов...
Задание пришлось обновлять до 2.0. Время было сокращено до 2 часов, стартовый код стал проще... НО! Это помогло ненадолго.
В Давосе CEO Антропик хвастался, что у них был $100 млн ДОХОД в 2023, $1 млрд в 2024 и $10 млрд в 2025
Какова твоя стратегия на ближайшие 3 года %%USER_NAME%%?
Это ведь только начало... 😁
#speed_of_progress
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥2🤔2
Господа!
Однако история прошлого поста (благодаря Ивану Молодецких 🤝) получила продолжение! 😲
Антропик выложили код задания в открытый доступ (ссылка в прошлом посте была), и народ создал сайт https://www.kerneloptimization.fun/, на котором подняли среду проверки и прикрутили лидерборд с правилами (не больше 5 сабмитов в час, не больше 30 секунд на задание и т.п.)
Короче! У Антропика в статье было "если у вас будет меньше 1487 циклов, пришлите нам свой код и резюме". 1487 циклов, это 11,5 часов работы Claude Opus 4.5(!!!).
На сайте уже сейчас 150 решений лучше 1487 (!!!). Более того, из них 105 решений лучше результата 1363 циклов Claude Opus 4.5 "in an improved test time compute harness after many hours" (сколько точно часов не раскрывается, но явно заметно больше 11,5).
Однако, если всем миром, то кожаные еще вполне себе могут!💪 😁
В побивших рекорд Claude есть никнеймы вида MaksymSherman и GeorgiZlatarev, твиттер каждого приведен, но в топе заметное число (включая первое место) пустые. Второе место — выпускник Оксфорда из Шотландии.
В общем все, как в исследования группы METR, о которых я писал тут и тут. На длинных дистанциях люди бьют LLM довольно уверенно.
Впрочем, как говорил Хассабис, ситуация в отдельных задачах напоминает шахматы. Сначала программы играли плохо. Потом начали обыгрывать гроссмейстеров. Потом лучше всего играли в связке человек-компьютер, а потом человек в задачах на скорость уже только мешал. 🤷♂️😉
В общем кожаные вполнепока могут этому выскочке Claude надрать задницу, причем во вполне товарных количествах! 👏 💪 👏 Расходимся! 😁 (Кто-то к привычным занятия, а кто-то обдумывать новую стратегию. И именно для них последние два поста). 😉
Stay tuned! Продолжение следует! 😉
@vgcourse
Однако история прошлого поста (благодаря Ивану Молодецких 🤝) получила продолжение! 😲
Антропик выложили код задания в открытый доступ (ссылка в прошлом посте была), и народ создал сайт https://www.kerneloptimization.fun/, на котором подняли среду проверки и прикрутили лидерборд с правилами (не больше 5 сабмитов в час, не больше 30 секунд на задание и т.п.)
Короче! У Антропика в статье было "если у вас будет меньше 1487 циклов, пришлите нам свой код и резюме". 1487 циклов, это 11,5 часов работы Claude Opus 4.5(!!!).
На сайте уже сейчас 150 решений лучше 1487 (!!!). Более того, из них 105 решений лучше результата 1363 циклов Claude Opus 4.5 "in an improved test time compute harness after many hours" (сколько точно часов не раскрывается, но явно заметно больше 11,5).
Однако, если всем миром, то кожаные еще вполне себе могут!
В побивших рекорд Claude есть никнеймы вида MaksymSherman и GeorgiZlatarev, твиттер каждого приведен, но в топе заметное число (включая первое место) пустые. Второе место — выпускник Оксфорда из Шотландии.
В общем все, как в исследования группы METR, о которых я писал тут и тут. На длинных дистанциях люди бьют LLM довольно уверенно.
Впрочем, как говорил Хассабис, ситуация в отдельных задачах напоминает шахматы. Сначала программы играли плохо. Потом начали обыгрывать гроссмейстеров. Потом лучше всего играли в связке человек-компьютер, а потом человек в задачах на скорость уже только мешал. 🤷♂️😉
В общем кожаные вполне
Stay tuned! Продолжение следует! 😉
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤2🤔1
Господа!
У нас очередной праздник!
У Жени Богатырева (2 курс маги) первым автором зашла статья на ICLR 2026 в основной трек!
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
🙂 💪 🙂 💪 🙂 💪 🙂 💪 🙂 💪 🙂 💪 🙂
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
Итого у нас уже 9-й человек (!) за 4 года пополнил наш клуб первых авторов А*! (и это не считая затащивших в других местах! 😉)
Яндекс, напомню, как и другие компании (включая ооочень известные иностранные), первых авторов любят и не зря! Сегодня это во многом способность быть "быстрее китайцев", что сложно и очень ценится.
У статьи, к слову, была очень непростая судьба.
Первый раз она была подана еще на CVPR 2025 в ноябре 2024 (снята), потом ICML 2025 (Reject), NeurIPS 2025 (снята), AAAI 2026 (Reject) и, наконец, с 5-й переподачи ICLR 2026 (Accept!). 😲
Вдумчивый читатель, сопоставив даты, спросит: так это работа была выполнена в бакалавриате? Типа того! 😁 Это к вопросу о том, как правильно проводить бакалавриат.
Статья постоянно совершенствовалась. По материалу, тексту, подаче. Я уже писал, что у нас иногда на rebuttal (процесс жесткого спора с рецензентами) пишется текста столько же (и даже было больше!), сколько в основной статье! Причем часто этот текст столь же содержателен и хорошо структурирован (это сильно помогает пройти). Как следствие, далее эти материалы идут в supplementary материалы статьи, что сильно помогает пройти следующий rebuttal. 😁 Основной риск тут в novelty — новизне, за отсутствие которой бьют сильнее всего. Если за время этих увлекательных многомесячных циклов появятся похожие работы, это [белый пушной зверек]!🤧 Нужно начинать новую статью...🤷♂️
Короче! Женя (сотоварищи) изначально получили 6444 (не фонтан, это где-то топ-34%). Причем первый ревьювер (с 6) был LLM-reviewer (огромная проблема сейчас), статью не читал и выкатил огромный текст с замечаниями, которые в статье уже покрыты. И не ответил на ответ (жутко дизморалещее поведение, заметим).
У второго и третьего были схожие замечания, что недостаточный novelty и то, что гейн по метрикам был в основном из-за датасета, а не от архитектуры. Ответ был, что в силу того, что модель real-time, сложную архитектуру реализовать по сути невозможно, а гейн у нас из-за того, что взяли идеи от лучших моделей в области. И в introduction фокус статьи поменяли на датасет, сделав его главным contribution (бери хорошие данные делай еще лучше!). После этого оба ревьювера ответили почти одинаково: "Спасибо за детальное объяснение, повышаю оценку до 6".
Последний ревьювер лучше всех разбирался в теме. Помимо вопросов про простоту модели (что вообще-то с точки зрения практики огромный плюс, но у науки свои приоритеты), и т.п. попросил проверить, насколько метод hardware-friendly — перегнать в ONNX и замерить гейн относительно существующих моделей. Женя это добавил, и он даже без комментариев (что создало проблемы) поднял оценку до 6.
Короче, у нас ВТОРОЙ раз в нашей истории ТРИ ревьювера подняли оценки!🥳 🥳 🥳 (в прошлый раз это было на ICML 2025 у Саши Гущина). И статья внезапно переместилась в Топ-4% лучших статей (~гарантированное прохождение!!!).
Но судьбе было угодно еще потрепать нервы! 🤷♂️ Сайт взломали, ревьюверов деанонимизировали. И они массово бросились поднимать оценки (удивительно! с чего бы??? 😂). В итоге орги принялисоломоново решение сбросить вообще все оценки к начальным 🤔 и перетусовать Area Coordinators (принимающих решения). 😢 Причем переписка сохранилась и новому AC было видно, что двое подняли (а повышение третьего, увы, не видно).
Но все равно этого хватило для прохождения! Уфффф! 😁
Вообще, когда студенты изучают DL и выполняют все эти fast-way-2-win задания, создается иллюзия, что все просто. Берешь данные, архитектору помоднее, фигак-фигак ив продакшн готово 😂. А дальше в реальной жизни оно почему-то так не работает. Вчера общался со своим выпускником, который в Яндекс сейчас увольняет трех подчиненных, не затащивших на испытательном. Наша задача, увеличить число круто затаскивающих, причем в практичных быстрых алгоритмах (см название статьи). 😁
Женю и соавторов еще раз горячо поздравляю!👏 👏 👏
Работаем! 😁
#pro_conferences #our_successes
@vgcourse
У нас очередной праздник!
У Жени Богатырева (2 курс маги) первым автором зашла статья на ICLR 2026 в основной трек!
Итого у нас уже 9-й человек (!) за 4 года пополнил наш клуб первых авторов А*! (и это не считая затащивших в других местах! 😉)
Яндекс, напомню, как и другие компании (включая ооочень известные иностранные), первых авторов любят и не зря! Сегодня это во многом способность быть "быстрее китайцев", что сложно и очень ценится.
У статьи, к слову, была очень непростая судьба.
Первый раз она была подана еще на CVPR 2025 в ноябре 2024 (снята), потом ICML 2025 (Reject), NeurIPS 2025 (снята), AAAI 2026 (Reject) и, наконец, с 5-й переподачи ICLR 2026 (Accept!). 😲
Вдумчивый читатель, сопоставив даты, спросит: так это работа была выполнена в бакалавриате? Типа того! 😁 Это к вопросу о том, как правильно проводить бакалавриат.
Статья постоянно совершенствовалась. По материалу, тексту, подаче. Я уже писал, что у нас иногда на rebuttal (процесс жесткого спора с рецензентами) пишется текста столько же (и даже было больше!), сколько в основной статье! Причем часто этот текст столь же содержателен и хорошо структурирован (это сильно помогает пройти). Как следствие, далее эти материалы идут в supplementary материалы статьи, что сильно помогает пройти следующий rebuttal. 😁 Основной риск тут в novelty — новизне, за отсутствие которой бьют сильнее всего. Если за время этих увлекательных многомесячных циклов появятся похожие работы, это [белый пушной зверек]!
Короче! Женя (сотоварищи) изначально получили 6444 (не фонтан, это где-то топ-34%). Причем первый ревьювер (с 6) был LLM-reviewer (огромная проблема сейчас), статью не читал и выкатил огромный текст с замечаниями, которые в статье уже покрыты. И не ответил на ответ (жутко дизморалещее поведение, заметим).
У второго и третьего были схожие замечания, что недостаточный novelty и то, что гейн по метрикам был в основном из-за датасета, а не от архитектуры. Ответ был, что в силу того, что модель real-time, сложную архитектуру реализовать по сути невозможно, а гейн у нас из-за того, что взяли идеи от лучших моделей в области. И в introduction фокус статьи поменяли на датасет, сделав его главным contribution (бери хорошие данные делай еще лучше!). После этого оба ревьювера ответили почти одинаково: "Спасибо за детальное объяснение, повышаю оценку до 6".
Последний ревьювер лучше всех разбирался в теме. Помимо вопросов про простоту модели (что вообще-то с точки зрения практики огромный плюс, но у науки свои приоритеты), и т.п. попросил проверить, насколько метод hardware-friendly — перегнать в ONNX и замерить гейн относительно существующих моделей. Женя это добавил, и он даже без комментариев (что создало проблемы) поднял оценку до 6.
Короче, у нас ВТОРОЙ раз в нашей истории ТРИ ревьювера подняли оценки!
Но судьбе было угодно еще потрепать нервы! 🤷♂️ Сайт взломали, ревьюверов деанонимизировали. И они массово бросились поднимать оценки (удивительно! с чего бы??? 😂). В итоге орги приняли
Но все равно этого хватило для прохождения! Уфффф! 😁
Вообще, когда студенты изучают DL и выполняют все эти fast-way-2-win задания, создается иллюзия, что все просто. Берешь данные, архитектору помоднее, фигак-фигак и
Женю и соавторов еще раз горячо поздравляю!
Работаем! 😁
#pro_conferences #our_successes
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25🔥10🤔3
Господа!
Одна из наиболее интересных бенчмарков последнего времени, это METR Time Horizon (про который я писал тык, тык), неделю назад без особой помпы обновился до версии 1.1.
Этот бенчмарк интересен тем, что построен на закрытом датасете (сегодня такие бенчмарки хотя бы относительно что-то показывают), т.е. в первой версии 64 задачи (из 189) было открыто и 125 закрыто. Суммарно на его разметку было потрачено 1500 часов работы людей и он неплохо показывает скорость усложнения задач, с которыми справляются модели.
В Time Horizon 1.1 они:
* на 34% увеличили число задач (до 228)
* удалили 15 задач (посчитанных неудачными)
* обновили 53 задачи (описание, либо уточнена оценка по времени).
* на графике выше видно, что существенно выросло число длинных задач, с одной стороны наиболее дорогих в разметке, с другой — наиболее интересных с текущей скоростью развития агентов.
Увы статьи еще нет, только пост, поэтому неизвестно, сколько новых задач будет раскрыто (есть ссылка на гитхаб, но я его не парсил).
Также много мелких (но важных для точности и удобства оценки) изменений в методике, типа того, что они сменили фреймворк оценки с самописного на получивший популярность. Это явно удешевит развитие.
У меня впечатление, что они прямо старались остаться в рамках старых доверительных интервалов, но в любом случае:
* Общий тренд с 2019 года: время удвоения горизонта ~196 дней (≈7 месяцев), что соответствует предыдущим оценкам
* С 2023 года: время удвоения сократилось со 165 дней (TH1) до 131 дня (TH1.1) — прогресс на 20% быстрее
* С 2024 года: время удвоения составляет всего 89 дней (TH1.1) против 109 дней (TH1)
Это означает, что они констатируют УВЕЛИЧЕНИЕ ВРЕМЕНИ УСПЕШНО РЕШАЕМЫХ ЗАДАЧ БОЛЬШЕ, ЧЕМ В 16 РАЗ ЗА ГОД последние два года! 😲
Важная оговорка — они рассматривают 50% и 80% success rate, что в большинстве задач заметно ниже типичных требований работодателя. Но 80% растет примерно с той же скоростью!
В этой новостью хорошо рифмуется вчерашняя новость, как команда агентов на Opus 4.6 Антропиков за неделю написала полноценный С-компилятор на Rust под платформы x86, ARM и RISC-V (собирать под несколько платформ это очень круто, кто понимает). Агенты потратили 20000$ через API, написали 100000 строк кода компилятора, который может собрать ядро Linux 6.9! Я когда-то пересобирал ручками ядро Linux под не самое стандартное железо, тогда даже на gcc это было эпопеей. Заняло неделю... Кроме этого у них собрались SQLite и Doom (код которых не самый тривиальный из-за оптимизаций).
Здесь впечатляет именно быстрый рост сложности задачи. Если бы в начале 2023 после выхода GPT сказали, что через 3 года агенты будут писать компилятор ядра Линукса за неделю, то крутили бы пальцем у виска примерно все, кто хоть сколько-нибудь понимает в теме. А создатели моделей достигли этого и продолжают увеличивать сложность задач.
Что у них будет следующей планкой по уровню? 🤔
Смотрю на ситуацию в легком обалдении! Пока скорость наступления будущего растет.
Больше материалов на тему:
#speed_of_progress@vgcourse
@vgcourse
Одна из наиболее интересных бенчмарков последнего времени, это METR Time Horizon (про который я писал тык, тык), неделю назад без особой помпы обновился до версии 1.1.
Этот бенчмарк интересен тем, что построен на закрытом датасете (сегодня такие бенчмарки хотя бы относительно что-то показывают), т.е. в первой версии 64 задачи (из 189) было открыто и 125 закрыто. Суммарно на его разметку было потрачено 1500 часов работы людей и он неплохо показывает скорость усложнения задач, с которыми справляются модели.
В Time Horizon 1.1 они:
* на 34% увеличили число задач (до 228)
* удалили 15 задач (посчитанных неудачными)
* обновили 53 задачи (описание, либо уточнена оценка по времени).
* на графике выше видно, что существенно выросло число длинных задач, с одной стороны наиболее дорогих в разметке, с другой — наиболее интересных с текущей скоростью развития агентов.
Увы статьи еще нет, только пост, поэтому неизвестно, сколько новых задач будет раскрыто (есть ссылка на гитхаб, но я его не парсил).
Также много мелких (но важных для точности и удобства оценки) изменений в методике, типа того, что они сменили фреймворк оценки с самописного на получивший популярность. Это явно удешевит развитие.
У меня впечатление, что они прямо старались остаться в рамках старых доверительных интервалов, но в любом случае:
* Общий тренд с 2019 года: время удвоения горизонта ~196 дней (≈7 месяцев), что соответствует предыдущим оценкам
* С 2023 года: время удвоения сократилось со 165 дней (TH1) до 131 дня (TH1.1) — прогресс на 20% быстрее
* С 2024 года: время удвоения составляет всего 89 дней (TH1.1) против 109 дней (TH1)
Это означает, что они констатируют УВЕЛИЧЕНИЕ ВРЕМЕНИ УСПЕШНО РЕШАЕМЫХ ЗАДАЧ БОЛЬШЕ, ЧЕМ В 16 РАЗ ЗА ГОД последние два года! 😲
Важная оговорка — они рассматривают 50% и 80% success rate, что в большинстве задач заметно ниже типичных требований работодателя. Но 80% растет примерно с той же скоростью!
В этой новостью хорошо рифмуется вчерашняя новость, как команда агентов на Opus 4.6 Антропиков за неделю написала полноценный С-компилятор на Rust под платформы x86, ARM и RISC-V (собирать под несколько платформ это очень круто, кто понимает). Агенты потратили 20000$ через API, написали 100000 строк кода компилятора, который может собрать ядро Linux 6.9! Я когда-то пересобирал ручками ядро Linux под не самое стандартное железо, тогда даже на gcc это было эпопеей. Заняло неделю... Кроме этого у них собрались SQLite и Doom (код которых не самый тривиальный из-за оптимизаций).
Здесь впечатляет именно быстрый рост сложности задачи. Если бы в начале 2023 после выхода GPT сказали, что через 3 года агенты будут писать компилятор ядра Линукса за неделю, то крутили бы пальцем у виска примерно все, кто хоть сколько-нибудь понимает в теме. А создатели моделей достигли этого и продолжают увеличивать сложность задач.
Что у них будет следующей планкой по уровню? 🤔
Смотрю на ситуацию в легком обалдении! Пока скорость наступления будущего растет.
Больше материалов на тему:
#speed_of_progress@vgcourse
@vgcourse
❤3
Господа!
Мы в этом году снова участвуем в челленджах 11-го CVPR NTIRE (New Trends in Image Restoration and Enhancement, хотя за 11 лет там уже давно далеко не только восстановление и улучшение). И если в прошлом году у нас прошел только один челлендж по улучшению пользовательского видео, то в этом два — челлендж детекторов дипфеков картинок и челлендж предсказания карт салиентности (куда смотрит человек в видео).
Соревнование еще в самом разгаре (на первой картинке внизу таймлайн), но уже можно сказать, что челлендж дипфейков существенно перекрывает по популярности все соревнования, которые мы проводили (сейчас 173 участника и 609 сабмитов)! Более того, оно сейчас на первом месте среди 44 соревнований этого года на всем NTIRE!
Причем по опыту часть сильных участников засылают свои решения в последний момент, а часть засылает, но не дает добро показать их в лидерборде (в том числе сильные, и мы это видим).
Смысл соревнования в том что сегодня детекторы дипфейков уже довольно неплохо работают, однако когда в реальной жизни их результат заливают в соцсеть, его жмут. Иногда жмут сильно (ну типа много пережимали, когда пересылали). И на этих сжатых точность детекторов резко падает. Наш лидерборд строится по результатам после 18 преобразований деградации. Т.е. измеряет лучше всего выживающих.
Всего мы подключили 42 генератора картинок (как опенсорсные, так и коммерческие). В трейн из них ушло 20 генераторов. Датасет постарались сделать максимально без неявных дата-ликов (когда, например, у коллег мера эстетики сгенерированных была заметно выше, чем у реальных, а мерам эстетики, кто помнит, была посвящена наша Highlight paper на ICCV прошлого года... или, например, все реальные картинки были пожаты JPEG, а все сгенерированные вообще не сжимались, что сегодня тоже легко детектится). Тем не менее текущие результаты оказались довольно просты для детекторов (см вторую картинку), хотя решения типа с 0,99 на данных без искажений и 0,80 (огромная ошибка по нынешним временам) на данных с искажениями встречаются.
Но дальше будет интереснее. Самые лучшие решения, это те, где результат лучше всего генерализуется. В идеальном мире у нас не должно быть ситуации, что выходит, новый генератор и детекторы полностью перестают на нем работать. Или все дружно переходят на вышедший в сентябре прошлого года JPEG AI и детекторы массово умирают. В общем для участников будет интрига, насколько изменится датасет в финале, а там точно будут новые генераторы, ибо мы меньше половины генераторов из нашего датасета задействовали (мы заявили 25 генераторов на Validation и 35 на private). Новые сложные преобразования в приватном также заявлены) А для нас будет интрига, кто из участников откроет в конце код (и войдет в финальный лидерборд статьи). Ибо часть участников (включая лидеров) код может не открыть.
Забавно, что сейчас лидер, см скриншот — Ant International (и судя по описанию в профиле это они, да) — сингапурская финансовая компания, часть холдинга Ant Group (наиболее известный продукт — Alipay). Если кто следил, то нашумевший год назад Deepseek был создан также финансистами — китайским хэдж фондом. Сейчас Ant International на первом месте. И интрига в том, потеряют ли они его и откроют ли код. Велика вероятность, что не откроют (особенно если не потеряют))). Но в любом случае очевидно, что код открывших будет внимательно изучен и улучшит другие решения. Ну и мы внимательно изучим, естественно. 😉
Очевидно для нас челлендж — это великолепная возможность проверить качество датасета. Ибо мы планируем самый большой (и самый качественный) датасет такого рода в мире подготовить. И уже много для этого сделали. Также мы планируем следующий челлендж сделать на детекторы дипфейков в видео (намного более сложная тема, в том числе чисто вычислительно для нас).
Буду держать вас в курсе этой интереснейшей темы! 😁
Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
Мы в этом году снова участвуем в челленджах 11-го CVPR NTIRE (New Trends in Image Restoration and Enhancement, хотя за 11 лет там уже давно далеко не только восстановление и улучшение). И если в прошлом году у нас прошел только один челлендж по улучшению пользовательского видео, то в этом два — челлендж детекторов дипфеков картинок и челлендж предсказания карт салиентности (куда смотрит человек в видео).
Соревнование еще в самом разгаре (на первой картинке внизу таймлайн), но уже можно сказать, что челлендж дипфейков существенно перекрывает по популярности все соревнования, которые мы проводили (сейчас 173 участника и 609 сабмитов)! Более того, оно сейчас на первом месте среди 44 соревнований этого года на всем NTIRE!
Причем по опыту часть сильных участников засылают свои решения в последний момент, а часть засылает, но не дает добро показать их в лидерборде (в том числе сильные, и мы это видим).
Смысл соревнования в том что сегодня детекторы дипфейков уже довольно неплохо работают, однако когда в реальной жизни их результат заливают в соцсеть, его жмут. Иногда жмут сильно (ну типа много пережимали, когда пересылали). И на этих сжатых точность детекторов резко падает. Наш лидерборд строится по результатам после 18 преобразований деградации. Т.е. измеряет лучше всего выживающих.
Всего мы подключили 42 генератора картинок (как опенсорсные, так и коммерческие). В трейн из них ушло 20 генераторов. Датасет постарались сделать максимально без неявных дата-ликов (когда, например, у коллег мера эстетики сгенерированных была заметно выше, чем у реальных, а мерам эстетики, кто помнит, была посвящена наша Highlight paper на ICCV прошлого года... или, например, все реальные картинки были пожаты JPEG, а все сгенерированные вообще не сжимались, что сегодня тоже легко детектится). Тем не менее текущие результаты оказались довольно просты для детекторов (см вторую картинку), хотя решения типа с 0,99 на данных без искажений и 0,80 (огромная ошибка по нынешним временам) на данных с искажениями встречаются.
Но дальше будет интереснее. Самые лучшие решения, это те, где результат лучше всего генерализуется. В идеальном мире у нас не должно быть ситуации, что выходит, новый генератор и детекторы полностью перестают на нем работать. Или все дружно переходят на вышедший в сентябре прошлого года JPEG AI и детекторы массово умирают. В общем для участников будет интрига, насколько изменится датасет в финале, а там точно будут новые генераторы, ибо мы меньше половины генераторов из нашего датасета задействовали (мы заявили 25 генераторов на Validation и 35 на private). Новые сложные преобразования в приватном также заявлены) А для нас будет интрига, кто из участников откроет в конце код (и войдет в финальный лидерборд статьи). Ибо часть участников (включая лидеров) код может не открыть.
Забавно, что сейчас лидер, см скриншот — Ant International (и судя по описанию в профиле это они, да) — сингапурская финансовая компания, часть холдинга Ant Group (наиболее известный продукт — Alipay). Если кто следил, то нашумевший год назад Deepseek был создан также финансистами — китайским хэдж фондом. Сейчас Ant International на первом месте. И интрига в том, потеряют ли они его и откроют ли код. Велика вероятность, что не откроют (особенно если не потеряют))). Но в любом случае очевидно, что код открывших будет внимательно изучен и улучшит другие решения. Ну и мы внимательно изучим, естественно. 😉
Очевидно для нас челлендж — это великолепная возможность проверить качество датасета. Ибо мы планируем самый большой (и самый качественный) датасет такого рода в мире подготовить. И уже много для этого сделали. Также мы планируем следующий челлендж сделать на детекторы дипфейков в видео (намного более сложная тема, в том числе чисто вычислительно для нас).
Буду держать вас в курсе этой интереснейшей темы! 😁
Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
👍7🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Уже в эту среду, 18 февраля пройдет первая лекция спецкурса «Интеллектуальные методы обработки видео», на котором вы узнаете:
• Какие существуют современные тренды в обработке видео
• Как правильно использовать машинное обучение и нейросети в этой области
• Почему существуют мыльные картинки и как от них избавиться
• В чем заключается магия пленоптики, или как устроены 4D видео
Если ты учишься на 2-4 курсе и хочешь попасть в видеогруппу нашей лаборатории – этот курс твой счастливый пропуск!
Присоединяйся к чату курса
• Какие существуют современные тренды в обработке видео
• Как правильно использовать машинное обучение и нейросети в этой области
• Почему существуют мыльные картинки и как от них избавиться
• В чем заключается магия пленоптики, или как устроены 4D видео
Если ты учишься на 2-4 курсе и хочешь попасть в видеогруппу нашей лаборатории – этот курс твой счастливый пропуск!
Присоединяйся к чату курса
❤7👍4
Господа!
Ровно неделю назад я писал про наш новый челленжд по дипфейкам на CVPR NTIRE, который вырвался на 1 место среди 44 челленджей по количеству участников и сабмитов.
Короче! За неделю количество сабмитов УДВОИЛОСЬ (!) до 1231 (условно идет +100 в день, в выходные чуть меньше), а число участников перевалило за 200 (пруф выше).
Мы продолжаем держаться на 1 месте по популярности среди 44 челленджей CVPR NTIRE и по участникам, и по сабмитам!💪 🙂
Сейчас забавно читать, как год назад, 15 февраля 2025 я писал про наше первое участие в NTIRE:
По сравнению с тремя челленджами ECCV это тогда было реально круто. И вот через год мы драйвим самый большой на данный момент по участникам и сабмитам челлендж NTIRE. Хороший прогресс! 😁
Для нас это серьезное испытание качества нашего свежесозданного датасета. Его, кстати, только на HuggingFace уже скачали больше 500 раз, при том, что мы его выложили там позже (меньше 2 недель назад), поскольку люди жаловались на сложности скачивания с нашего сервера. Т.е. общих скачиваний больше. Очень неплохо заходит, особенно учитывая, что это только часть гораздо более крупного запланированного датасета, на который будет, собственно, основная статья.
Из любопытного:
* Текущий датасет пока (до планового расширения) оказался слишком легким. Борьба сейчас идет за 3-й знак после запятой! 😲 Усложнение уже добавили в табличку (чтобы морально подготовить участников, см вторую картинку).
* В этом плане сейчас место — это переобучение под эти данные (что вредно для генерализации, заметим). Но видно, как китайцы тем не менее кладут новые и новые сабмиты, чтобы выбить побольше. 😉 Забавно было наблюдать, как Ant International сдвинули на 2 место, а потом на 3. Они сначала сняли результат из лидерборда. А потом выложили новый результат, который 1 место выбил. А сейчас они опять на втором) Китайцев хлебом не корми, дай посоревноваться! С ними очень непросто конкурировать.
* Забавно, что на 26 месте сейчас компания Reagvis Labs, которая была создана прошлым летом и работает на рынке детекторов дипфейков на картинках, видео, аудио и документах. Они явно не парятся перезаточкой под данные, но вангую, что в финале их место существенно вырастет (хотя не факт, что они раскроют код).
На днях поговорил с нашим выпускником, который сейчас работает за рубежом в компании, которая также занимается детектом дипфейков. Он много интересного рассказал, в том числе о том, как они в челленджах участвуют с разного рода хитростями (когда код раскрывается, но это свежесозданный вайбкод, например). Будем этот опыт учитывать! 😁
Еще забавно, что на втором месте по популярности NTIRE этого года также бенчмарк детекторов дипфейков, но мы пока удерживаем лидерство 😉
И самый смак, конечно, будет в анализе результатов.
Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
Ровно неделю назад я писал про наш новый челленжд по дипфейкам на CVPR NTIRE, который вырвался на 1 место среди 44 челленджей по количеству участников и сабмитов.
Короче! За неделю количество сабмитов УДВОИЛОСЬ (!) до 1231 (условно идет +100 в день, в выходные чуть меньше), а число участников перевалило за 200 (пруф выше).
Мы продолжаем держаться на 1 месте по популярности среди 44 челленджей CVPR NTIRE и по участникам, и по сабмитам!
Сейчас забавно читать, как год назад, 15 февраля 2025 я писал про наше первое участие в NTIRE:
Соревнование по сути только началось (первый этап), а у нас (будучи почищено от тестовых и странных) 45 участников, 22 сабмита (17 из них уникальных). Это ОЧЕНЬ круто!
По сравнению с тремя челленджами ECCV это тогда было реально круто. И вот через год мы драйвим самый большой на данный момент по участникам и сабмитам челлендж NTIRE. Хороший прогресс! 😁
Для нас это серьезное испытание качества нашего свежесозданного датасета. Его, кстати, только на HuggingFace уже скачали больше 500 раз, при том, что мы его выложили там позже (меньше 2 недель назад), поскольку люди жаловались на сложности скачивания с нашего сервера. Т.е. общих скачиваний больше. Очень неплохо заходит, особенно учитывая, что это только часть гораздо более крупного запланированного датасета, на который будет, собственно, основная статья.
Из любопытного:
* Текущий датасет пока (до планового расширения) оказался слишком легким. Борьба сейчас идет за 3-й знак после запятой! 😲 Усложнение уже добавили в табличку (чтобы морально подготовить участников, см вторую картинку).
* В этом плане сейчас место — это переобучение под эти данные (что вредно для генерализации, заметим). Но видно, как китайцы тем не менее кладут новые и новые сабмиты, чтобы выбить побольше. 😉 Забавно было наблюдать, как Ant International сдвинули на 2 место, а потом на 3. Они сначала сняли результат из лидерборда. А потом выложили новый результат, который 1 место выбил. А сейчас они опять на втором) Китайцев хлебом не корми, дай посоревноваться! С ними очень непросто конкурировать.
* Забавно, что на 26 месте сейчас компания Reagvis Labs, которая была создана прошлым летом и работает на рынке детекторов дипфейков на картинках, видео, аудио и документах. Они явно не парятся перезаточкой под данные, но вангую, что в финале их место существенно вырастет (хотя не факт, что они раскроют код).
На днях поговорил с нашим выпускником, который сейчас работает за рубежом в компании, которая также занимается детектом дипфейков. Он много интересного рассказал, в том числе о том, как они в челленджах участвуют с разного рода хитростями (когда код раскрывается, но это свежесозданный вайбкод, например). Будем этот опыт учитывать! 😁
Еще забавно, что на втором месте по популярности NTIRE этого года также бенчмарк детекторов дипфейков, но мы пока удерживаем лидерство 😉
И самый смак, конечно, будет в анализе результатов.
Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Всем привет, уже завтра стартует спецкурс «Интеллектуальные методы обработки видео».
На первой лекции мы расскажем о нашей лаборатории и наших проектах, а также наши аспиранты поведают о своем исследовательском пути в ней
Ждем всех желающих в 14:35 в аудитории 612 на ВМК
P.S. на гифке изображен четырехмерный кадр, который вы научитесь получать сами в последнем задании курса)
На первой лекции мы расскажем о нашей лаборатории и наших проектах, а также наши аспиранты поведают о своем исследовательском пути в ней
Ждем всех желающих в 14:35 в аудитории 612 на ВМК
P.S. на гифке изображен четырехмерный кадр, который вы научитесь получать сами в последнем задании курса)
🔥8👍2
Господа!
Из свежего забавного. На прошлой неделе оживленные споры в рассылке университета Иннополис вызвал анонс выступления Марка Обозова, который типа "руководитель исследовательской команды в Т-банке, мейтнейнер PyTorch и исследователь института ИИ Иннополиса" при том, что ему всего 15 лет. 😲
Сразу скажу, что на странице мейнтейнеров PyTorch найти такую фамилию не удалось, зато удалось найти профиль https://openreview.net/profile?id=~Mark_Obozov1. Для тех, кто не в курсе — большинство А* конференций рецензируются на сайте openreview и по профилю там можно посмотреть, какой опыт у человека. Прямо скажем далеко не у каждого аспиранта ВМК такой же богатый профиль openreview. Я бы даже сказал, что это найти аспиранта с сопоставимым профилем — это редкость 😲😁. При этом статьи в основном за прошлый год, когда молодому человеку было, надо полагать, 14. 🤯
На github в torchtune у Марка 9 место среди контрибьюторов, очень неплохо!🙂
В качестве научного руководителя у него указан Александр Гасников — ректор университета Иннополис, который не только один из самых молодых ректоров, но и единственный ректор в России, у которого несколько десятков А* статей по ИИ.
Что я по поводу этого всего думаю 😉
Когда-то давно я был олимпиадником и еще будучи школьником получил в научные руководители сотрудника академического института РАН, который сам был вундеркиндом, его жена была вундеркиндом и их ребенок с 6 лет активно программировал и выдающиеся результаты показывал. Этот замечательный человек на своем и пачке чужих примеров популярно объяснил мне, что одной из самых болезненных проблем вундеркиндов является то, что раннее развитие далеко не всегда означает выдающееся развитие в зрелом возрасте. Скорее наоборот — это редкость. 🤷♂️
И гораздо чаще возникают ситуации, когда в детстве молодой человек избалован успехами, интервью в СМИ, участием в передачах и т.п., а к 25-30 годам лучшие из сверстников не только догоняют, но и перегоняют. Упс! И это нередко крайне болезненно воспринимается. Тебя уже не показывают каждый месяц по телевизору к радости бабушки🤔 😭
При этом нейропластичность никто не отменял и то, что у вас в раннем возрасте научный руководитель будетректор университета сильно выше среднего, это очень мощный потенциальный бустинг. Который кто-то использует, а кто-то нет. Все как всегда, короче! 😉
Выступление Марка, кстати, можно посмотреть тут! Там час выступления и 10 минут вопросов. Ничего особенного. Чел просто рано прокачивается делать научные доклады и работать с аудиторией 😉
И дальше для вас вопрос, когда созреете прокачиваться вы. Мы с коллегами наблюдаем сейчас абсолютно рекордное количество желающих прокачаться среди закончивших университет 3-7 лет назад. Ибо они ощущают, что жаренным в воздухе попахивает. Подобная Марку зубастая молодежь весьма бодро шуршит.
Всем конкурентоспособности! 😁
@vgcourse
#neuroplasticity
#нейропластичность
Из свежего забавного. На прошлой неделе оживленные споры в рассылке университета Иннополис вызвал анонс выступления Марка Обозова, который типа "руководитель исследовательской команды в Т-банке, мейтнейнер PyTorch и исследователь института ИИ Иннополиса" при том, что ему всего 15 лет. 😲
Сразу скажу, что на странице мейнтейнеров PyTorch найти такую фамилию не удалось, зато удалось найти профиль https://openreview.net/profile?id=~Mark_Obozov1. Для тех, кто не в курсе — большинство А* конференций рецензируются на сайте openreview и по профилю там можно посмотреть, какой опыт у человека. Прямо скажем далеко не у каждого аспиранта ВМК такой же богатый профиль openreview. Я бы даже сказал, что это найти аспиранта с сопоставимым профилем — это редкость 😲😁. При этом статьи в основном за прошлый год, когда молодому человеку было, надо полагать, 14. 🤯
На github в torchtune у Марка 9 место среди контрибьюторов, очень неплохо!
В качестве научного руководителя у него указан Александр Гасников — ректор университета Иннополис, который не только один из самых молодых ректоров, но и единственный ректор в России, у которого несколько десятков А* статей по ИИ.
Что я по поводу этого всего думаю 😉
Когда-то давно я был олимпиадником и еще будучи школьником получил в научные руководители сотрудника академического института РАН, который сам был вундеркиндом, его жена была вундеркиндом и их ребенок с 6 лет активно программировал и выдающиеся результаты показывал. Этот замечательный человек на своем и пачке чужих примеров популярно объяснил мне, что одной из самых болезненных проблем вундеркиндов является то, что раннее развитие далеко не всегда означает выдающееся развитие в зрелом возрасте. Скорее наоборот — это редкость. 🤷♂️
И гораздо чаще возникают ситуации, когда в детстве молодой человек избалован успехами, интервью в СМИ, участием в передачах и т.п., а к 25-30 годам лучшие из сверстников не только догоняют, но и перегоняют. Упс! И это нередко крайне болезненно воспринимается. Тебя уже не показывают каждый месяц по телевизору к радости бабушки
При этом нейропластичность никто не отменял и то, что у вас в раннем возрасте научный руководитель будет
Выступление Марка, кстати, можно посмотреть тут! Там час выступления и 10 минут вопросов. Ничего особенного. Чел просто рано прокачивается делать научные доклады и работать с аудиторией 😉
И дальше для вас вопрос, когда созреете прокачиваться вы. Мы с коллегами наблюдаем сейчас абсолютно рекордное количество желающих прокачаться среди закончивших университет 3-7 лет назад. Ибо они ощущают, что жаренным в воздухе попахивает. Подобная Марку зубастая молодежь весьма бодро шуршит.
Всем конкурентоспособности! 😁
@vgcourse
#neuroplasticity
#нейропластичность
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15😁4🤔3
Господа!
Работал на прошлой неделе над повышением доходов студентов. 😁
На лекции задал вопросы (со слайдов):
— Кто хочет получать больше 1 млн рублей в месяц?
(лес рук)
— Кто хочет получать больше 1 млн долларов в год?
(смех, лес рук)
— Почему вам будут их платить в 2030 году, учитывая скорость развития ИИ?
(тут аудитория подзависла)
Были варианты:
— Потому что мы будем работать много.
А другие желающие получать много будут работать мало? 😉
— Потому что мы умеем учиться.
Другие не умеют? 😉
— Мы будем предлагать нестандартные решения.
А другие не будут? 😉
— Мы будем уметь находить и извлекать информацию.
А других их не будут уметь? 😉
— Потому что мы будем делать то, что другие не могут.
Ваш покорный слуга:
— Отлично! А что именно вы будете делать, что другие не могут? Я ж не против! А что именно?
И дальше молчание аудитории...
Я, увы, не смог выбить из аудитории второкурсников конкретные знания и навыки, за которые много платят в век ИИ... (уверен, что среди подписчиков ситуация была бы сильно лучше)))
Забавно, что первое домашнее задание цикла "Путь лемминга", который я уже больше 10 лет читаю, заключается ровно в составлении списка, чему нужно научиться в университете. Очень полезное домашнее задание, замечу. Выписать КОНКРЕТНЫЕ навыки, которые будут цениться на интервью на топовые позиции.
В качестве намека: какое-то время назад в статье с характерным названием "Дефицит компетенций стал главным барьером развития искусственного интеллекта" директор по развитию технологий ИИ "Яндекса" Александр Крайнов ехидно отмечал, что хотяпо бумагам наши вузы выпускают миллионы миллиардов специалистов в ИИ, Яндекс не может их обнаружить:
И он прав! Таких людей ОЧЕНЬ мало среди выпускников! Забавно, что прошлым летом я делал пост о том, что такое фундаментальные знания, которые может давать университет сегодня, который очень хорошо рифмуется с уважаемым директором по ИИ:
Также деликатно замечу, что способность ЧИТАТЬ, намного слабее способности ПИСАТЬ. И если человек серийно ПИШЕТ в основные треки топовых конференций, он гораздо больше понимает, почему именно статьи написаны так, а не иначе (ибо там много-много байесов, порождающих fake science). И успешнее создает топовые технологии.
У нас за 4 года уже 9 первых авторов А* статей по ИИ (а с выпускниками 11). Тот же Александр Крайнов не раз заявлял, что Яндекс ведет список первых авторов А* для HR (при этом наибольшее число первых авторов А* в России работает почему-то в Сбере😉 )
Как тут шутят в одном известном канале:
2024: Промпт-инженер
2025: Вайб-кодер
2026: Менеджер ИИ-агентов
2027: Безработный
В этом плане вангую, что к 2030 году сегодняшние студенты поделятся на тех, кто будет обоснованно считать, что Яндекс безобразно мало платит (и уйдет получать больше!) и тех, кто лихо промптил и вайбкодил в университете 😂
Все меняется очень быстро! Ответ на первое домашнее задание за 5 лет поменялся очень заметно (и продолжает меняться!). Но вы можете его не делать! Большинство не делает. Как писалось в одной старой книжке "Много званных, но мало избранных". А в это время кто-то тихо и методично прокачивает А* с 14 лет (где он будет в 24, и где будешь в 24 ты?).
Sapienti sat.
Всем конкурентоспособности! 😁
@vgcourse
Работал на прошлой неделе над повышением доходов студентов. 😁
На лекции задал вопросы (со слайдов):
— Кто хочет получать больше 1 млн рублей в месяц?
(лес рук)
— Кто хочет получать больше 1 млн долларов в год?
(смех, лес рук)
— Почему вам будут их платить в 2030 году, учитывая скорость развития ИИ?
(тут аудитория подзависла)
Были варианты:
— Потому что мы будем работать много.
А другие желающие получать много будут работать мало? 😉
— Потому что мы умеем учиться.
Другие не умеют? 😉
— Мы будем предлагать нестандартные решения.
А другие не будут? 😉
— Мы будем уметь находить и извлекать информацию.
А других их не будут уметь? 😉
— Потому что мы будем делать то, что другие не могут.
Ваш покорный слуга:
— Отлично! А что именно вы будете делать, что другие не могут? Я ж не против! А что именно?
И дальше молчание аудитории...
Я, увы, не смог выбить из аудитории второкурсников конкретные знания и навыки, за которые много платят в век ИИ... (уверен, что среди подписчиков ситуация была бы сильно лучше)))
Забавно, что первое домашнее задание цикла "Путь лемминга", который я уже больше 10 лет читаю, заключается ровно в составлении списка, чему нужно научиться в университете. Очень полезное домашнее задание, замечу. Выписать КОНКРЕТНЫЕ навыки, которые будут цениться на интервью на топовые позиции.
В качестве намека: какое-то время назад в статье с характерным названием "Дефицит компетенций стал главным барьером развития искусственного интеллекта" директор по развитию технологий ИИ "Яндекса" Александр Крайнов ехидно отмечал, что хотя
"Когда мы приглашаем специалиста, то он должен уметь простую вещь. Он должен взять последнюю научную публикацию по теме ИИ, объяснить, что там написано, сравнить с другими и оценить ее. И это не тестовое задание, это его будущая работа. Теперь внимание, сколько выпускников справляется с такой задачей. Мы видим, что есть буквально три вуза в стране, где мы можем в год брать больше десяти человек, обладающих такими компетенциями. Далее длинный хвост, где можно пригласить одного, двух человека из ВУЗа"
И он прав! Таких людей ОЧЕНЬ мало среди выпускников! Забавно, что прошлым летом я делал пост о том, что такое фундаментальные знания, которые может давать университет сегодня, который очень хорошо рифмуется с уважаемым директором по ИИ:
Хороший критерий — способность самостоятельно (без GPT) читать свежие статьи по теме с топовых конференций типа CVPR, ICML, ICLR, ICCV, ECCV, AAAI etc.
Существует довольно много работающих с младших курсов молодых людей, считающих, что они все им нужное от университета получили, которые этот критерий не проходят. И не считают нужным проходить. И слава богу!
Также деликатно замечу, что способность ЧИТАТЬ, намного слабее способности ПИСАТЬ. И если человек серийно ПИШЕТ в основные треки топовых конференций, он гораздо больше понимает, почему именно статьи написаны так, а не иначе (ибо там много-много байесов, порождающих fake science). И успешнее создает топовые технологии.
У нас за 4 года уже 9 первых авторов А* статей по ИИ (а с выпускниками 11). Тот же Александр Крайнов не раз заявлял, что Яндекс ведет список первых авторов А* для HR (при этом наибольшее число первых авторов А* в России работает почему-то в Сбере
Как тут шутят в одном известном канале:
2024: Промпт-инженер
2025: Вайб-кодер
2026: Менеджер ИИ-агентов
2027: Безработный
В этом плане вангую, что к 2030 году сегодняшние студенты поделятся на тех, кто будет обоснованно считать, что Яндекс безобразно мало платит (и уйдет получать больше!) и тех, кто лихо промптил и вайбкодил в университете 😂
Все меняется очень быстро! Ответ на первое домашнее задание за 5 лет поменялся очень заметно (и продолжает меняться!). Но вы можете его не делать! Большинство не делает. Как писалось в одной старой книжке "Много званных, но мало избранных". А в это время кто-то тихо и методично прокачивает А* с 14 лет (где он будет в 24, и где будешь в 24 ты?).
Sapienti sat.
Всем конкурентоспособности! 😁
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍5🔥3🤔2😁1
Господа!
Мы меж тем продолжаем драйвить самый популярный челлендж CVPR NTIRE (на графике выше число участников во всех 44 челленджах, выделены наши два). Видно, что челлендж детекторов дипфейков лидирует с отрывом.💪 💪 👍
До окончания соревнования осталось две недели и мы планово выложили набор Hard Validation (ранее Validation 2). Безобразие с борьбой за третий знак тут же прекратилось, набор действительно оказался заметно сложнее (привет, улучшение датасета!))). При том, что мы постарались сохранить достаточно реалистичные искажения (например, сжатие JPEG 2000 и JPEG AI), более реалистичные, чем у конкурента. Сейчас даже у сохранившего первое место Ant International 0.9587. А ведь дальше будет еще одно плановое повышение сложности (писал об этом)! В общем благодаря сравнительно легкому входу удалось собрать много участников и сейчас начинается самая жара.🔥
Счетчик сабмитов замедлился, поскольку количество посылок в день пришлось ограничить одной (было 5) для уменьшения заточки под датасет, поэтому у нас будет 2 место по сабмитам среди соревнований NTIRE, но зато более адекватные результаты финального лидерборда. Однозначно выбираем второе! 😁
В целом детекторы выступили заметно лучше, чем мы изначально ожидали. Например, у нас нет очень сложного (но все более популярного) кейса — редактирования картинки, когда большая часть дипфейка является реальным изображением. Такие примеры детекторы сломают массово, но такого рода датасет кардинально сложнее и дороже готовить. В общем, есть, куда расти! 😉
Очень греет, что только с huggingface датасет скачали уже ~700 раз (при том, что он выложен в двух местах, а открывших результат в лидерборд участников только 107, т.е. датасет активно качают и не участвующие в соревновании). Он на глазах становится нашим самым популярным датасетом, при том, что будет только маленькой частью большого датасета, который опубликуем с А* статьей. Работа, очевидно, заходит!
Когда опубликуем результаты по генераторам (очевидно, разные детекторы разные генераторы в разным успехом распознают), будут сюрпризы!🎁
Stay tuned! 😁
#our_successes@vgcourse
@vgcourse
Мы меж тем продолжаем драйвить самый популярный челлендж CVPR NTIRE (на графике выше число участников во всех 44 челленджах, выделены наши два). Видно, что челлендж детекторов дипфейков лидирует с отрывом.
До окончания соревнования осталось две недели и мы планово выложили набор Hard Validation (ранее Validation 2). Безобразие с борьбой за третий знак тут же прекратилось, набор действительно оказался заметно сложнее (привет, улучшение датасета!))). При том, что мы постарались сохранить достаточно реалистичные искажения (например, сжатие JPEG 2000 и JPEG AI), более реалистичные, чем у конкурента. Сейчас даже у сохранившего первое место Ant International 0.9587. А ведь дальше будет еще одно плановое повышение сложности (писал об этом)! В общем благодаря сравнительно легкому входу удалось собрать много участников и сейчас начинается самая жара.
Счетчик сабмитов замедлился, поскольку количество посылок в день пришлось ограничить одной (было 5) для уменьшения заточки под датасет, поэтому у нас будет 2 место по сабмитам среди соревнований NTIRE, но зато более адекватные результаты финального лидерборда. Однозначно выбираем второе! 😁
В целом детекторы выступили заметно лучше, чем мы изначально ожидали. Например, у нас нет очень сложного (но все более популярного) кейса — редактирования картинки, когда большая часть дипфейка является реальным изображением. Такие примеры детекторы сломают массово, но такого рода датасет кардинально сложнее и дороже готовить. В общем, есть, куда расти! 😉
Очень греет, что только с huggingface датасет скачали уже ~700 раз (при том, что он выложен в двух местах, а открывших результат в лидерборд участников только 107, т.е. датасет активно качают и не участвующие в соревновании). Он на глазах становится нашим самым популярным датасетом, при том, что будет только маленькой частью большого датасета, который опубликуем с А* статьей. Работа, очевидно, заходит!
Когда опубликуем результаты по генераторам (очевидно, разные детекторы разные генераторы в разным успехом распознают), будут сюрпризы!
Stay tuned! 😁
#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥7👏2
Господа!
У нас тут идет активное обсуждение модного в этом сезоне Agentic AI и его применения в ресече. В частности, наш сотрудник настроил контейнер с изоляцией на сервере c GPU для запуска Super-Resolution (SR) и так вчера описал результат:
Свежие SOTA методы SR содержат довольно много кода и с ними обычно хватает приключений!
Это праздник! 😁
Короче, стажер остался без задачи. 🤷♂️
Все шустро сделал Agentic AI! 🤩
Эта история вызвала много обсуждений) Наш выпускник (руководящий довольно крупной командой) вчера написал:
Интересно, что в предыдущие двое выходных я 5 часов общался по зуму со своими выпускниками в Англии, Испании и США. И двое из трех говорят, что у них то же самое — корпоративные подписки на Антропик, OpenAI, гугл и перестают нанимать джунов!
Другой выпускник вчера вечером пишет мне:
Какие мысли по поводу:
* Agentic AI помощники на глазах совершенствуются и оказываются в состоянии делать все более и более сложные рутинные задачи (которые ранее отнимали кучу времени и сил). А старые задачи делает все дешевле и дешевле.
* Как следствие — быстро повышается уровень абстракции (уровень понимания), который необходим для адекватного решения задач. На сложных задачах разница в производительности между синьором (с AI) и джуном (с AI) растет, а необходимость в джунах падает.
* Мы сейчас находимся на этапе наиболее быстрого совершенствования технологий. Далее, думаю, что скорость улучшения AI замедлится (поскольку растет сложность), но все равно останется довольно большой (там есть и куда улучшать, и как).
* Параллельно будет происходить довольно инертный процесс адаптации бизнеса к новой ситуации, появление нового железа и другие "медленные" процессы. Это даст плавный массовый рост успешного использования.
Это революция создаст много новых возможностей, но и увеличит конкуренцию. (Всячески пытаюсь поднять вашу зарплату через 5 лет).
Всем конкурентоспособности! 😁
Sapienti sat.
@vgcourse
У нас тут идет активное обсуждение модного в этом сезоне Agentic AI и его применения в ресече. В частности, наш сотрудник настроил контейнер с изоляцией на сервере c GPU для запуска Super-Resolution (SR) и так вчера описал результат:
Дальше я взял копайлот с Opus 4.6 и сказал ему что-то вроде "вот ссылка на гитхаб с SR, склонируй и разберись, как добавить в нашу систему прогона". Где-то через час-два с буквально парой моих подсказок, и 10-минутной проверки результата, в систему нормально добавлен нетривиальный SR.
Свежие SOTA методы SR содержат довольно много кода и с ними обычно хватает приключений!
А потом ещё один. А потом ещё один. А потом ещё один. И все как полагается с ужасным китайским кодом. За два дня я передобавлял в систему почти все остававшиеся SR, которые есть у нас в статье!
То есть оно само находит репозиторий, клонирует его, дальше само (долго и упорно) разбирается с ужасными god forsaken зависимостями в ужасном питоновском коде [ужасных] китайских учёных, само чистит ненужные для инференса файлы, само разбирается где и пишет скрипт, чтобы скачать веса, само адаптирует китайско-учёные скрипты инференса под мою систему прогона, и само проверяет, что докер собирается, веса скачиваются, инференс работает, и на выходе прилично выглядящие картинки!
Это праздник! 😁
В общем, работающая песочница и правильный agentic loop рулят (но я на это за два дня потратил где-то половину своего месячного copilot pro)
Правда, теперь надо искать другие задачи для нашего студента из AI Masters, когда он закроет, наконец, вопрос со своей пересдачей!
Короче, стажер остался без задачи. 🤷♂️
Все шустро сделал Agentic AI! 🤩
Эта история вызвала много обсуждений) Наш выпускник (руководящий довольно крупной командой) вчера написал:
Я себя программистом уже не считаю и мне не надо доказывать кому-то, что ИИшка пишет плохой код, а я лучше ;) (болезнь очень многих хороших программистов, к сожалению)
Так вот, пока моя команда несколько месяцев делала нормальную прод-версию onpremise ИИ-ассистента на базе RAG-системы для заказчика, я за пару дней с помощью codex сделал MVP версию систему, почти не отличимую от прода по функциональности (включая весь фронт и бек - чего я вообще не знаю). И ее мы уже показывали заказчику для обсуждение разных нюансов.
[...]
После этого я понял, что джуны-разработчики уже не нужны, да и мидлы почти тоже :)
Интересно, что в предыдущие двое выходных я 5 часов общался по зуму со своими выпускниками в Англии, Испании и США. И двое из трех говорят, что у них то же самое — корпоративные подписки на Антропик, OpenAI, гугл и перестают нанимать джунов!
Другой выпускник вчера вечером пишет мне:
Моя новая позиция — программистам остался год…
Клод 4.6 опус пишет отличный рабочий код, который прекрасно вписывается в проект на 100к+ строк. И делает это быстро
[...]
У нас скорость написания новых фич куда критичнее количества сжигаемых токенов. И сжигаем мы очень много)
Какие мысли по поводу:
* Agentic AI помощники на глазах совершенствуются и оказываются в состоянии делать все более и более сложные рутинные задачи (которые ранее отнимали кучу времени и сил). А старые задачи делает все дешевле и дешевле.
* Как следствие — быстро повышается уровень абстракции (уровень понимания), который необходим для адекватного решения задач. На сложных задачах разница в производительности между синьором (с AI) и джуном (с AI) растет, а необходимость в джунах падает.
* Мы сейчас находимся на этапе наиболее быстрого совершенствования технологий. Далее, думаю, что скорость улучшения AI замедлится (поскольку растет сложность), но все равно останется довольно большой (там есть и куда улучшать, и как).
* Параллельно будет происходить довольно инертный процесс адаптации бизнеса к новой ситуации, появление нового железа и другие "медленные" процессы. Это даст плавный массовый рост успешного использования.
Это революция создаст много новых возможностей, но и увеличит конкуренцию. (Всячески пытаюсь поднять вашу зарплату через 5 лет).
Всем конкурентоспособности! 😁
Sapienti sat.
@vgcourse
❤12🔥4🤔4👏1
Господа!
У нас очередная отличная новость!🙂 🎉🙂
Вчера успешно защитил диссертацию наш сотрудник и мой зам лаборатории в институте ИИ МГУ Сергей Лаврушкин (соавторство в 4 А* на данный момент)!
Вопросов было немного. Решение единогласное!
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
На этой неделе разговаривал с одним директором компании, он говорит: "Предпочитаю на ресеч брать кандидатов наук. Они лучше умеют сделать то, что нужно сделать, даже если не хочется и доводят задачу до результата".
Кстати, диплом вуза в наши времена массовых уходов в академ ту же функцию играет. На привлекательные вакансии слишком много желающих и установить требования по образование или степени — это просто способ отфильтровать кандидатов на интервью.
Я уж молчу про то, что тот же Google любит брать PhD даже на обычные инженерные позиции. У них типа, по статистике перформанс лучше. Могут себе позволить, что тут сказать 😁
Напомню, что еще летом писал, что в Superintelligence team 29 из 30 Scientific Researcher — PhD.
Также любопытно обсуждениебыть или не быть To PhD or not to PhD в Реддите, где приводят статистику, что 99.9% Research Scientist в DeepMind с PhD (и неудивительно, это первое требование на работу к ним). У Anthropic сейчас примерно половина сотрудников с PhD (но у них и девопсы, и тестировщики, и маркетологи есть), т.е. среди программистов доля очень велика. PhD есть у большинства в ядре xAI и т.д.
Естественно, сама по себе степень ничего не гарантирует (как и диплом не гарантирует знаний, особенно сегодня), но если знания и навыки целенаправленно прокачаны — это реально бустит!💪
У нас сейчас 12 аспирантов, так что не будем останавливаться на достигнутом! 😁
Сергею еще раз горячие поздравления!🎉 🥳 🎉 🥳 🎉 🥳 🎉 🥳 🎉 🥳 🎉
Stay tuned! 😁
#our_successes@vgcourse
@vgcourse
У нас очередная отличная новость!
Вчера успешно защитил диссертацию наш сотрудник и мой зам лаборатории в институте ИИ МГУ Сергей Лаврушкин (соавторство в 4 А* на данный момент)!
Вопросов было немного. Решение единогласное!
На этой неделе разговаривал с одним директором компании, он говорит: "Предпочитаю на ресеч брать кандидатов наук. Они лучше умеют сделать то, что нужно сделать, даже если не хочется и доводят задачу до результата".
Кстати, диплом вуза в наши времена массовых уходов в академ ту же функцию играет. На привлекательные вакансии слишком много желающих и установить требования по образование или степени — это просто способ отфильтровать кандидатов на интервью.
Я уж молчу про то, что тот же Google любит брать PhD даже на обычные инженерные позиции. У них типа, по статистике перформанс лучше. Могут себе позволить, что тут сказать 😁
Напомню, что еще летом писал, что в Superintelligence team 29 из 30 Scientific Researcher — PhD.
Также любопытно обсуждение
Естественно, сама по себе степень ничего не гарантирует (как и диплом не гарантирует знаний, особенно сегодня), но если знания и навыки целенаправленно прокачаны — это реально бустит!
У нас сейчас 12 аспирантов, так что не будем останавливаться на достигнутом! 😁
Сергею еще раз горячие поздравления!
Stay tuned! 😁
#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉30🔥9❤6🤩3
Дорогие дамы!
Вы уже знаете, что девочки у нас жгут не по-детски!
Начала жечь Настя Анциферова, ставшая первым автором нашей первой А* на NeurIPS-2022 (всего у нее 10 А* на данный момент, если нигде со счета не сбился)))
Продолжила жечь Катя Шумицкая — первый автор нашей второй А* (ICLR 2023), которая в прошлом году ПОСТУПАЛА в аспирантуру имея в багаже 4 А* (две - первым автором). Сильно не у всех аспирантов в МГУ столько на выпуске из аспирантуры есть (я бы сказал, таких почти нет))). Сейчас у нее 5 А* и к концу аспирантуры там будет, думаю, очень богато 😁
Продолжает жечь Виктория Леоненкова, которая свою первую А* первым автором затащила недавно в январе на 1 курсе магистратуры.🙂
Таких девушек мы очень любим и очень ими гордимся! 💐💐💪 💐💐
Год назад, кстати, звал парней догонять. Парни не подвели! У нас двое бакалавров А* первыми авторами затащили в прошлом году, составляя достойную компанию нашим девушкам (а то они скучали на пьедестале)))
В общем — наших замечательных девушек и всех читающих девочек, девушек и женщин с праздником весны! 😁
P.S. Картинка символизирует нейросетевой праздничный датасет из изображений и видео 😂 (подарочный вариант)))
@vgcourse
Вы уже знаете, что девочки у нас жгут не по-детски!
Начала жечь Настя Анциферова, ставшая первым автором нашей первой А* на NeurIPS-2022 (всего у нее 10 А* на данный момент, если нигде со счета не сбился)))
Продолжила жечь Катя Шумицкая — первый автор нашей второй А* (ICLR 2023), которая в прошлом году ПОСТУПАЛА в аспирантуру имея в багаже 4 А* (две - первым автором). Сильно не у всех аспирантов в МГУ столько на выпуске из аспирантуры есть (я бы сказал, таких почти нет))). Сейчас у нее 5 А* и к концу аспирантуры там будет, думаю, очень богато 😁
Продолжает жечь Виктория Леоненкова, которая свою первую А* первым автором затащила недавно в январе на 1 курсе магистратуры.
Таких девушек мы очень любим и очень ими гордимся! 💐💐
Год назад, кстати, звал парней догонять. Парни не подвели! У нас двое бакалавров А* первыми авторами затащили в прошлом году, составляя достойную компанию нашим девушкам (а то они скучали на пьедестале)))
В общем — наших замечательных девушек и всех читающих девочек, девушек и женщин с праздником весны! 😁
P.S. Картинка символизирует нейросетевой праздничный датасет из изображений и видео 😂 (подарочный вариант)))
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18🔥7
Господа!
Из текущего любопытного.
Не знаю, как проводили выходные вы, а я наконец-то дослушал два подкаста от 12 и 19 февраля. Первый, от Бориса Черного — одессита, закончившего UCSD, доросшего до принципал инженера в запрещенной компании (очень круто!), руководящего разработкой Claude Code в Anthropic (суперхайповый проект сейчас), 350 тысяч просмотров. Второй, от Шервина Ву, китайца, закончившего MIT, и руководителя отдела разработки API и платформы для разработчиков OpenAI, 70 тысяч просмотров. Оба подкаста в гостях у Ленни Рачитского — одессита, закончившего UCSD))) (да, два одессита таки имели, что нам сказать за LLM, но на хорошем английском))).
Оба подкаста по факту были посвящены тому, как сейчас устроено программирование внутри этих компаний.
В силу концепции догфудинга, оба стартапа крайне активно используют свои собственные инструменты Claude Code и OpenAI Codex для внутренней разработки, получая с одной стороны опыт разного рода косяков (и понимание, что надо исправлять) и увеличивая сложность делегируемых задач с другой. Второе по сути означает увеличение эффективности работы команд.
Оба отмечают существенный рост производительности. Борис говорит про 200% и что с ноября он не написал руками ни строчки кода. И даже ни одной правки не сделал. Для человека, который крайне профессионально 17 лет писал код (и был одним из самых продуктивных инженеров в Запрещеногорамме!) это звучит сильно. Аналогично лучшие разработчики Spotify не написали ни строчки кода с декабря.
Оба отмечают усиление использования API. Борис говорит об удвоении активных пользователей Claude Code за последний месяц.
Момент, который впечатлил меня лично: Борис утверждает, что в Антропике некоторые инженеры тратят на токены сотни тысяч долларов в месяц ("hundreds of thousands of dollars a month"). И компания поощряет тратить много, набирая статистику и эффективные практики. Благо они могут себе это позволить — Антропик сейчас зарабатывает порядка 19 миллиардов долларов в год (пересчет среднемесячного), а Яндекс в прошлом году заработал, для сравнения, 15 миллиардов. Но в Антропике все еще работает меньше 3 тысяч человек, а в Яндексе больше 30 тысяч. Это сильно меняет дело.
Понятно, что это все еще эксперимент, но масштабы поражают. Основной риск — рост технического долга, особенно при написании high-load частей кода (а в обеих компаниях такой, конечно, есть). И здесь уровень квалификации программистов становится критичен.
Любопытных моментов много, в том числе история появления и развития Claude Code и Claude Cowork внутри компании.
Рекомендую сначала послушать Бориса, а потом на 2х Шервина и сравнить — у них очень много одинаковых моментов)
Революция обычно идет по логистической кривой. Такое впечатление, что мы выходим на участок максимальной скорости с одной стороны и уменьшения ускорения с другой.
В заголовке статьи график годичной давности изменения стоимости токенов за 2 года. Видно, что если бы тренд сохранился, то линии тренда уже пробили бы 0и компании платили бы нам за использование LLM 😉 Очевидно долго такое быстрое сокращение стоимости происходить не могло и сейчас падение продолжается, но уже не столь быстро, как в первые два года "эры GPT". В любом случае это означает кратное сокращение стоимости токенов за год при увеличении качества результата (быстрее всего падала стоимость токена для наиболее сложных задач, обратите внимание). Т.е. то, на что сегодня тратят сотни тысяч за токены в месяц завтра превратится в тысячи. Так будет выглядеть продолжение этой революции.
Мы живем в удивительнейшее время! 😲😁
Больше материалов на тему:
#speed_of_progress@vgcourse
@vgcourse
Из текущего любопытного.
Не знаю, как проводили выходные вы, а я наконец-то дослушал два подкаста от 12 и 19 февраля. Первый, от Бориса Черного — одессита, закончившего UCSD, доросшего до принципал инженера в запрещенной компании (очень круто!), руководящего разработкой Claude Code в Anthropic (суперхайповый проект сейчас), 350 тысяч просмотров. Второй, от Шервина Ву, китайца, закончившего MIT, и руководителя отдела разработки API и платформы для разработчиков OpenAI, 70 тысяч просмотров. Оба подкаста в гостях у Ленни Рачитского — одессита, закончившего UCSD))) (да, два одессита таки имели, что нам сказать за LLM, но на хорошем английском))).
Оба подкаста по факту были посвящены тому, как сейчас устроено программирование внутри этих компаний.
В силу концепции догфудинга, оба стартапа крайне активно используют свои собственные инструменты Claude Code и OpenAI Codex для внутренней разработки, получая с одной стороны опыт разного рода косяков (и понимание, что надо исправлять) и увеличивая сложность делегируемых задач с другой. Второе по сути означает увеличение эффективности работы команд.
Оба отмечают существенный рост производительности. Борис говорит про 200% и что с ноября он не написал руками ни строчки кода. И даже ни одной правки не сделал. Для человека, который крайне профессионально 17 лет писал код (и был одним из самых продуктивных инженеров в Запрещеногорамме!) это звучит сильно. Аналогично лучшие разработчики Spotify не написали ни строчки кода с декабря.
Оба отмечают усиление использования API. Борис говорит об удвоении активных пользователей Claude Code за последний месяц.
Момент, который впечатлил меня лично: Борис утверждает, что в Антропике некоторые инженеры тратят на токены сотни тысяч долларов в месяц ("hundreds of thousands of dollars a month"). И компания поощряет тратить много, набирая статистику и эффективные практики. Благо они могут себе это позволить — Антропик сейчас зарабатывает порядка 19 миллиардов долларов в год (пересчет среднемесячного), а Яндекс в прошлом году заработал, для сравнения, 15 миллиардов. Но в Антропике все еще работает меньше 3 тысяч человек, а в Яндексе больше 30 тысяч. Это сильно меняет дело.
Понятно, что это все еще эксперимент, но масштабы поражают. Основной риск — рост технического долга, особенно при написании high-load частей кода (а в обеих компаниях такой, конечно, есть). И здесь уровень квалификации программистов становится критичен.
Любопытных моментов много, в том числе история появления и развития Claude Code и Claude Cowork внутри компании.
Рекомендую сначала послушать Бориса, а потом на 2х Шервина и сравнить — у них очень много одинаковых моментов)
Революция обычно идет по логистической кривой. Такое впечатление, что мы выходим на участок максимальной скорости с одной стороны и уменьшения ускорения с другой.
В заголовке статьи график годичной давности изменения стоимости токенов за 2 года. Видно, что если бы тренд сохранился, то линии тренда уже пробили бы 0
Мы живем в удивительнейшее время! 😲😁
Больше материалов на тему:
#speed_of_progress@vgcourse
@vgcourse
❤10🤔1
Господа!
У нас продолжается увлекательнейший процесс проведения самого популярного челленджа CVPR NTIRE 2026! (писал про это тут, тут и тут)
Какие новости к этому часу:
* Количество участников доросло до 477 😲 И там еще подходят участники (есть шанс дотянуть до 500!))) Информации по этому году еще нет, но в прошлом году 500 не было ни в одном челлендже CVPR 😲😁 По крайней мере найти не смог, кто поможет буду признателен!
* Количество залитых решений перевалило за 3000!
* Количество скачиваний датасетов c huggingface доросло до 1248 и 827 (рекорд для нас по скорости популяризации наших датасетов) + утром выложен третий датасет.
* Сегодня ночью завершился этап валидации и началась последняя тестовая фаза. Утром сделали рассылку со словами:
Были явно участники, которые тюнились. Усложнили им жизнь с 3 сабмитами на фазу. 😉 Датасет также в очередной раз планово усложнен, т.е. планка каждый раз повышается от достаточно низкого входного порога в самом начале до ощутимо сложного сейчас. Там явно кто-то регистрировал фейковые команды, пришлось их блокировать ручками (и довольно много). В общем работа идет)
Профиль у большинства участвующих команд недозаполнен, но по редким заполнившим картина по странам такая:
Китай — 35 участников 🐲 (подавляющее большинство!)
Южная Корея — 5
Индия — 4
США — 3
Франция, Сингапур, Вьетнам — по 2
И дальше по одной команде из Греции, Алжира, Непала, Саудовской Аравии, Норвегии, Испании, Италии, Греции, России. Есть Макао и Гонконг — тоже, Китай, практически. Есть даже одна команда из Ирана! 😲
Отдельно потом подведем размер команд. Обычно это 3-6 человек, но команда из Франции, например, 23 человека! 🇫🇷😎
В списке команд от компаний вижу:
* ByteDance (150 тысяч сотрудников, 155$ млрд выручки)
* Tencent (105 тысяч сотрудников, 92$ млрд выручки)
* ZTE (75 тысяч сотрудников, 15-17$ млрд выручки)
* Xiaomi (44 тысячи, 53$ млрд выручки)
* несколько команд Ant Group (16 тысяч, ~17$ млрд выручки), у которых на Validation Hard два первых места сейчас🙂 (так что не смотрите, что они меньше других, они, похоже, твердо намерены первое место удержать!)
и т.д.
Есть несколько специализированных компаний типа CheckAI, Reagvis Labs, ML1.ai и, наконец, Instsig (разработчики популярного приложения CamScanner, третье место на Validation Hard — красавцы, учитывая крутизну других участников!).
Удивляет количество команд от известных университетов и лабораторий. Ранее их знали только по публикациям. Смотрим, как коллеги активно и бодро меняют темы и достигают хороших результатов в сложных конкурентных областях. Есть чему поучиться.
На 22 месте (т.е. довольно высоко) сейчас товарищ с ником
Две ключевых интриги на данный момент сохраняются:
* Как поменяются места на тестовой фазе с генераторами, которых не было ранее (т.е. насколько детекторы сохраняют устойчивость на неизвестных генераторах)
* И кто выложит код в конце (здесь скорее всего тихо уйдут в туман многие интересные решения компаний и на первый план выйдут университеты, речь о которых впереди... продвигая науку и давая компаниям новые идеи)))
Не переключайтесь! Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
У нас продолжается увлекательнейший процесс проведения самого популярного челленджа CVPR NTIRE 2026! (писал про это тут, тут и тут)
Какие новости к этому часу:
* Количество участников доросло до 477 😲 И там еще подходят участники (есть шанс дотянуть до 500!))) Информации по этому году еще нет, но в прошлом году 500 не было ни в одном челлендже CVPR 😲😁 По крайней мере найти не смог, кто поможет буду признателен!
* Количество залитых решений перевалило за 3000!
* Количество скачиваний датасетов c huggingface доросло до 1248 и 827 (рекорд для нас по скорости популяризации наших датасетов) + утром выложен третий датасет.
* Сегодня ночью завершился этап валидации и началась последняя тестовая фаза. Утром сделали рассылку со словами:
Submission Limits
To keep the evaluation process manageable, the following limits apply during the final submission phase:
* Maximum 1 submission per day
* Maximum 3 submissions IN TOTAL during the entire final phase
Please use your submissions carefully.
Были явно участники, которые тюнились. Усложнили им жизнь с 3 сабмитами на фазу. 😉 Датасет также в очередной раз планово усложнен, т.е. планка каждый раз повышается от достаточно низкого входного порога в самом начале до ощутимо сложного сейчас. Там явно кто-то регистрировал фейковые команды, пришлось их блокировать ручками (и довольно много). В общем работа идет)
Профиль у большинства участвующих команд недозаполнен, но по редким заполнившим картина по странам такая:
Китай — 35 участников 🐲 (подавляющее большинство!)
Южная Корея — 5
Индия — 4
США — 3
Франция, Сингапур, Вьетнам — по 2
И дальше по одной команде из Греции, Алжира, Непала, Саудовской Аравии, Норвегии, Испании, Италии, Греции, России. Есть Макао и Гонконг — тоже, Китай, практически. Есть даже одна команда из Ирана! 😲
Отдельно потом подведем размер команд. Обычно это 3-6 человек, но команда из Франции, например, 23 человека! 🇫🇷😎
В списке команд от компаний вижу:
* ByteDance (150 тысяч сотрудников, 155$ млрд выручки)
* Tencent (105 тысяч сотрудников, 92$ млрд выручки)
* ZTE (75 тысяч сотрудников, 15-17$ млрд выручки)
* Xiaomi (44 тысячи, 53$ млрд выручки)
* несколько команд Ant Group (16 тысяч, ~17$ млрд выручки), у которых на Validation Hard два первых места сейчас
и т.д.
Есть несколько специализированных компаний типа CheckAI, Reagvis Labs, ML1.ai и, наконец, Instsig (разработчики популярного приложения CamScanner, третье место на Validation Hard — красавцы, учитывая крутизну других участников!).
Удивляет количество команд от известных университетов и лабораторий. Ранее их знали только по публикациям. Смотрим, как коллеги активно и бодро меняют темы и достигают хороших результатов в сложных конкурентных областях. Есть чему поучиться.
На 22 месте (т.е. довольно высоко) сейчас товарищ с ником
i_need_job 😁 В общем, он даже вполне может ее найти с таким местом! И даже неплохую 😂Две ключевых интриги на данный момент сохраняются:
* Как поменяются места на тестовой фазе с генераторами, которых не было ранее (т.е. насколько детекторы сохраняют устойчивость на неизвестных генераторах)
* И кто выложит код в конце (здесь скорее всего тихо уйдут в туман многие интересные решения компаний и на первый план выйдут университеты, речь о которых впереди... продвигая науку и давая компаниям новые идеи)))
Не переключайтесь! Stay tuned! 😉
#our_successes@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤3🤔1
Господа!
Один из моих любимых авторов Андрей Карпаты (раз, два, три, четыре, пять) на днях выпустил очень интересный анализ "Справочника Бюро статистики труда США перспективам профессий", в котором дается статистика по 342 профессиям, покрывающим 143 миллиона рабочих мест в США (почти всю экономику по сути).
Карпаты взял 3 величины:
* Прогноз роста/сокращения числа рабочих мест из справочника
* Медианную зарплату
* Минимальное образование, требуемое для профессии
И добавил к ним 4 компоненту — влияние AI на профессию, которую "прикинул" с помощью Gemini Flash и все это визуализировал (цветом — величину, прямоугольником — количество людей с такой профессией).
Получилось очень наглядно и прикольно.
Что любопытного видно сходу:
* Часть специальностей (34.1 млн рабочих мест) быстро сокращается. Например, быстро падает число кассиров супермаркетов (прогноз BLS: -10% за 10 лет, 3.2 млн) и General Office Clerks (-7%, 2.6 млн). А часть специальностей растет, например, Home Health and Personal Care Aides (+17%, 4,3 млн)
* Очень любопытно кликать на зарплату и образование. Наглядно видно, как во многих специальностях более высокие требования к образованию конвертируются в большие зарплаты. Заметим, что PhD в среднем получают сильно больше закончивших магистратуру, но при этом закончившие бакалавриат получают чуть больше закончивших магистратуру (первая картинка)!
* Но самая жесть начинается при анализе влияния ИИ. Общая логика такова, что чем больше профессия связана с работой за экраном компьютера, тем сильнее на нее повлияет ИИ. И дальшевнезапно ожидаемо оказывается, что многие не очень высоко оплачиваемые специальности типа рабочих стройки (1.6 млн) оказываются практически неподвержены влиянию ИИ (за ними роботы придут позже))), а вот многие профессии с высокой оплатой оказываются наиболее подвержены! Причем из них сильнее всего те, для которых хватает бакалавриата.
Для постоянных читателей канала в этом нет ничего нового, поскольку еще в августе я писал про масштабное научное исследование, с тем же выводом:
Дальше история была более драматична. В воскресенье Илон наш Маск по поводу Карпаты отхайповал в Х: "Все профессии станут необязательны. Будет всеобщий высокий доход". Пост набрал 2.6 миллиона просмотров и понеслоооось...
Журналисты прочитали и начали строчить тоннами заголовки "Соучредитель OpenAI и бывший директор по AI Tesla предсказал, что все профессии заменит ИИ!!!!!!!!111"🤦♂️
Карпаты посмотрел на это безумие и снес репозиторий. 🤷♂️ Ибо это всего лишь прикидка на основе жалкого Gemini Flash, навайбкоженная с Клодом за субботу, которая очень много параметров не учитывает (если моделировать все минимально более серьезно). Но были успевшие сделать форк...✌️ И он все вернул 😉
Какие выводы:
* Даже после начала СВО у нас студенты поступают в магистратуру за рубежом. Один мой студент закончил магу в Калифорнии в прошлом году, другой учится сейчас в маге в Германии, третья в Лондоне (поступила этой осенью). По факту все отмечают другую атмосферу и заметно большую нацеленность на учебу. Дословно "намного проще учиться, когда тебя не окружают мидлы Яндекса".
* В этом плане массовый уход студентов на работу и иногда достаточно презрительное отношение "мидлов Яндекса" к тем, кто учится, однозначно снизило качество образования. Я как-нибудь выложу вопросы, которыми "валю" студентов на госах магистратуры. Для многих из старших поколений это будет шок) Впрочем, если кто собесы проводит — ничего нового. Да, выпускники сейчас элементарного не знают 🤷♂️ Как следствие, в России аналогичная статистика будет верна и для магистратуры.
Настоятельно рекомендую визуализацию Карпаты вдумчиво потыкать! 😁 Она про наше ближайшее будущее)
Sapienti sat! 😁 (в переводе латинского, вроде, "Что-то для умных" 😉)
#winter_is_coming
@vgcourse
Один из моих любимых авторов Андрей Карпаты (раз, два, три, четыре, пять) на днях выпустил очень интересный анализ "Справочника Бюро статистики труда США перспективам профессий", в котором дается статистика по 342 профессиям, покрывающим 143 миллиона рабочих мест в США (почти всю экономику по сути).
Карпаты взял 3 величины:
* Прогноз роста/сокращения числа рабочих мест из справочника
* Медианную зарплату
* Минимальное образование, требуемое для профессии
И добавил к ним 4 компоненту — влияние AI на профессию, которую "прикинул" с помощью Gemini Flash и все это визуализировал (цветом — величину, прямоугольником — количество людей с такой профессией).
Получилось очень наглядно и прикольно.
Что любопытного видно сходу:
* Часть специальностей (34.1 млн рабочих мест) быстро сокращается. Например, быстро падает число кассиров супермаркетов (прогноз BLS: -10% за 10 лет, 3.2 млн) и General Office Clerks (-7%, 2.6 млн). А часть специальностей растет, например, Home Health and Personal Care Aides (+17%, 4,3 млн)
* Очень любопытно кликать на зарплату и образование. Наглядно видно, как во многих специальностях более высокие требования к образованию конвертируются в большие зарплаты. Заметим, что PhD в среднем получают сильно больше закончивших магистратуру, но при этом закончившие бакалавриат получают чуть больше закончивших магистратуру (первая картинка)!
* Но самая жесть начинается при анализе влияния ИИ. Общая логика такова, что чем больше профессия связана с работой за экраном компьютера, тем сильнее на нее повлияет ИИ. И дальше
Для постоянных читателей канала в этом нет ничего нового, поскольку еще в августе я писал про масштабное научное исследование, с тем же выводом:
наиболее заменимы [...] профессии, для которых хватает диплома бакалавра
Дальше история была более драматична. В воскресенье Илон наш Маск по поводу Карпаты отхайповал в Х: "Все профессии станут необязательны. Будет всеобщий высокий доход". Пост набрал 2.6 миллиона просмотров и понеслоооось...
Журналисты прочитали и начали строчить тоннами заголовки "Соучредитель OpenAI и бывший директор по AI Tesla предсказал, что все профессии заменит ИИ!!!!!!!!111"
Карпаты посмотрел на это безумие и снес репозиторий. 🤷♂️ Ибо это всего лишь прикидка на основе жалкого Gemini Flash, навайбкоженная с Клодом за субботу, которая очень много параметров не учитывает (если моделировать все минимально более серьезно). Но были успевшие сделать форк...
Какие выводы:
* Даже после начала СВО у нас студенты поступают в магистратуру за рубежом. Один мой студент закончил магу в Калифорнии в прошлом году, другой учится сейчас в маге в Германии, третья в Лондоне (поступила этой осенью). По факту все отмечают другую атмосферу и заметно большую нацеленность на учебу. Дословно "намного проще учиться, когда тебя не окружают мидлы Яндекса".
* В этом плане массовый уход студентов на работу и иногда достаточно презрительное отношение "мидлов Яндекса" к тем, кто учится, однозначно снизило качество образования. Я как-нибудь выложу вопросы, которыми "валю" студентов на госах магистратуры. Для многих из старших поколений это будет шок) Впрочем, если кто собесы проводит — ничего нового. Да, выпускники сейчас элементарного не знают 🤷♂️ Как следствие, в России аналогичная статистика будет верна и для магистратуры.
Настоятельно рекомендую визуализацию Карпаты вдумчиво потыкать! 😁 Она про наше ближайшее будущее)
Sapienti sat! 😁 (в переводе латинского, вроде, "Что-то для умных" 😉)
#winter_is_coming
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏7❤4🤔1