Господа!
Вчера досмотрел на удивление интересное интервью "AI без хайпа: как всё работает на самом деле?" (Apple Podcast, Youtube, VK, Rutube, 3 часа). Личный топ последнего времени! Причем единственное интервью в моем топе на русском языке. 😲👍
Главный герой — Александр Машрабов, дважды финалист ACM ICPC, закончил Физтех, немного поработал в Яндекс, в 2018 основал компанию AI Factory, которую через 2 года продал Snap Inc за $166 млн. Компания делала те самые "масочки", которые так популяризировали Snap среди школьников. Далее он отработал 3 года Head of Generative AI в Snap и 2,5 года назад создал свой стартап Higgsfield.AI, который получил очередной раунд инвестиций по оценке 1.3 миллиарда долларов (!) в январе этого года — т.е. сделал единорога (компанию с капитализацией больше миллиарда). С ней вошел в список Forbes 30 Under 30. Очень крутой путь.
Что было любопытного:
* Очень интересным был рассказ про начало пути в программирование, олимпиадное программирование, ICPC и т.д. Рекомендовал бы всем олимпиадникам посмотреть. 😉
* Для меня любопытно, что человек много лет занимается видео. Сначала — эффектами поверх видео, сейчас видеогенераторами. Тема эта довольно сложная и алгоритмически, и инженерно. И они тянут!
* Очень интересен был рассказ про компанию. И как он команду собирал, и как они сейчас вышли на скорость 1 фича в день! Александр декларирует "300 релизов в год" (каждый рабочий день). В лучшем случае у них от обсуждения фичи до ее релиза проходит меньше суток. Это совершенно фантастическая скорость движения вперед, возможная только с ИИ и с ней возникает совершенно недетский челлендж по удержанию управляемости кодовой базы.
* У них неплохо с заработками, они за 9 месяцев достигли $200 млн ARR, удвоившись с $100 млн всего за 2 месяца. Сейчас у них цель достичь планки $0,5 млрд в год.
* Интересны его подходы к инвестированию. Он пару своих успешных инвестиций привел, в частности он очень рано стал инвестором Antropic и сделал там уже практически х100 + он инвестировал в Scale.AI, но позже и не настолько удачно.
Забавно, что вчера я выступал перед "информатами" в СУНЦ МГУ. В аудитории было 16 всеросников по информатике и активные олимпиадники. Очень интересно наложилось, как я горячо призывал талантливых школьников прокачиваться. И буквально через 3 часа слушал, как Александр сетовал, что слишком мало выходил из зоны комфорта в 18 лет. В общем начало и конец школьникам-олимпиадникам рекомендую🙂 Середину, думаю, будет сложно. С другой стороны станет, возможно, понятнее как много нужно прокачать!
Всем успешной прокачки!)
Stay tuned! 😁
@vgcourse
Вчера досмотрел на удивление интересное интервью "AI без хайпа: как всё работает на самом деле?" (Apple Podcast, Youtube, VK, Rutube, 3 часа). Личный топ последнего времени! Причем единственное интервью в моем топе на русском языке. 😲👍
Главный герой — Александр Машрабов, дважды финалист ACM ICPC, закончил Физтех, немного поработал в Яндекс, в 2018 основал компанию AI Factory, которую через 2 года продал Snap Inc за $166 млн. Компания делала те самые "масочки", которые так популяризировали Snap среди школьников. Далее он отработал 3 года Head of Generative AI в Snap и 2,5 года назад создал свой стартап Higgsfield.AI, который получил очередной раунд инвестиций по оценке 1.3 миллиарда долларов (!) в январе этого года — т.е. сделал единорога (компанию с капитализацией больше миллиарда). С ней вошел в список Forbes 30 Under 30. Очень крутой путь.
Что было любопытного:
* Очень интересным был рассказ про начало пути в программирование, олимпиадное программирование, ICPC и т.д. Рекомендовал бы всем олимпиадникам посмотреть. 😉
* Для меня любопытно, что человек много лет занимается видео. Сначала — эффектами поверх видео, сейчас видеогенераторами. Тема эта довольно сложная и алгоритмически, и инженерно. И они тянут!
* Очень интересен был рассказ про компанию. И как он команду собирал, и как они сейчас вышли на скорость 1 фича в день! Александр декларирует "300 релизов в год" (каждый рабочий день). В лучшем случае у них от обсуждения фичи до ее релиза проходит меньше суток. Это совершенно фантастическая скорость движения вперед, возможная только с ИИ и с ней возникает совершенно недетский челлендж по удержанию управляемости кодовой базы.
* У них неплохо с заработками, они за 9 месяцев достигли $200 млн ARR, удвоившись с $100 млн всего за 2 месяца. Сейчас у них цель достичь планки $0,5 млрд в год.
* Интересны его подходы к инвестированию. Он пару своих успешных инвестиций привел, в частности он очень рано стал инвестором Antropic и сделал там уже практически х100 + он инвестировал в Scale.AI, но позже и не настолько удачно.
Забавно, что вчера я выступал перед "информатами" в СУНЦ МГУ. В аудитории было 16 всеросников по информатике и активные олимпиадники. Очень интересно наложилось, как я горячо призывал талантливых школьников прокачиваться. И буквально через 3 часа слушал, как Александр сетовал, что слишком мало выходил из зоны комфорта в 18 лет. В общем начало и конец школьникам-олимпиадникам рекомендую
Всем успешной прокачки!)
Stay tuned! 😁
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥3🤔1
Господа!
Из текущего интересного. Вчера был не у компа, прочитал небольшую книжку "Не откладывай на завтра. Краткий гид по борьбе с прокрастинацией".
Автор Тимоти Пичил — канадский психолог, профессор психологии Карлтонского университета в Оттаве, ведущий iProcrastinate Podcast на iTunes (Spotify, архив), создатель www.procrastination.ca. На пике у его подкаста были сотни тысяч слушателей, как следствие он получил довольно обширную статистику работающих и не работающих стратегий.
По его наблюдениям прокрастинация актуальна для всех, просто разные люди справляется с ней с разной степенью успеха. С моими наблюдениями это утверждение вполне совпадает. 😉 Хроническая прокрастинация на начало века была примерно у 20% людей, думаю, что сейчас (судя по студентам) процент заметно вырос.
Книга сознательно написана очень кратко (97 страниц в печатном виде), чтобы прокрастинаторы могли дочитать))) Обратная сторона этого — очень многие моменты описаны буквально парой абзацев. Это минус для тех, кто влет не схватывает.
Например:
* Сложная тема расстановки приоритетов очень хорошо раскрыта в книге Стивена Кови "Семь навыков высокоэффективных людей" (есть аудиокнига, кстати)))
* Как справляться с длинными списками дел описано в классической "Getting Things Done" (GTD) Дэвида Аллена. Похоже это единственная книга, в честь которой назван хаб на Хабре, где довольно много статей.
* Как качать мышцу воли (и как она устроена) шикарно раскрыто книжке профессора Стенфорда Келли Макгонигал «Сила воли. Как развить и укрепить».
Список не полный. 😉
В этом плане было скорее интересно, что автор в столь короткую книгу счел нужным собрать, исходя из своего обширного опыта.
Ну и почитал комментарии о книге. Самое сложное, как обычно, это knowledge-action gap. Многие "простые" рекомендации не так просты в исполнении (особенно для тех, у кого ситуация на грани хронической). Естественно им просто жесточайшим образом требуется оправдание своего бездействия (базовая потребность психики), поэтому "оно не работает"! Конечно! Для них, естественно, не работает! 😂
Проспойлерю:Сквозной инструмент, описанный или упоминаемый на всех 5 фазах, базирующийся на работах профессора психологии Питера Голлвитцера, потому постоянно и рекомендуется, что достаточно эффективен даже при истощённой силе воли и низкой мотивации. 😉
Короче, пожелаю всем регулярно успешно съедать больших-больших слонов! По частям, да! 😁 Вы будете сытые и довольные и по данной шкале ближе к успешно справляющимся с этой напастью нашего информационного века🙂 😁
Stay tuned! 😁
@vgcourse
Из текущего интересного. Вчера был не у компа, прочитал небольшую книжку "Не откладывай на завтра. Краткий гид по борьбе с прокрастинацией".
Автор Тимоти Пичил — канадский психолог, профессор психологии Карлтонского университета в Оттаве, ведущий iProcrastinate Podcast на iTunes (Spotify, архив), создатель www.procrastination.ca. На пике у его подкаста были сотни тысяч слушателей, как следствие он получил довольно обширную статистику работающих и не работающих стратегий.
По его наблюдениям прокрастинация актуальна для всех, просто разные люди справляется с ней с разной степенью успеха. С моими наблюдениями это утверждение вполне совпадает. 😉 Хроническая прокрастинация на начало века была примерно у 20% людей, думаю, что сейчас (судя по студентам) процент заметно вырос.
Книга сознательно написана очень кратко (97 страниц в печатном виде), чтобы прокрастинаторы могли дочитать))) Обратная сторона этого — очень многие моменты описаны буквально парой абзацев. Это минус для тех, кто влет не схватывает.
Например:
* Сложная тема расстановки приоритетов очень хорошо раскрыта в книге Стивена Кови "Семь навыков высокоэффективных людей" (есть аудиокнига, кстати)))
* Как справляться с длинными списками дел описано в классической "Getting Things Done" (GTD) Дэвида Аллена. Похоже это единственная книга, в честь которой назван хаб на Хабре, где довольно много статей.
* Как качать мышцу воли (и как она устроена) шикарно раскрыто книжке профессора Стенфорда Келли Макгонигал «Сила воли. Как развить и укрепить».
Список не полный. 😉
В этом плане было скорее интересно, что автор в столь короткую книгу счел нужным собрать, исходя из своего обширного опыта.
Ну и почитал комментарии о книге. Самое сложное, как обычно, это knowledge-action gap. Многие "простые" рекомендации не так просты в исполнении (особенно для тех, у кого ситуация на грани хронической). Естественно им просто жесточайшим образом требуется оправдание своего бездействия (базовая потребность психики), поэтому "оно не работает"! Конечно! Для них, естественно, не работает! 😂
Проспойлерю:
Короче, пожелаю всем регулярно успешно съедать больших-больших слонов! По частям, да! 😁 Вы будете сытые и довольные и по данной шкале ближе к успешно справляющимся с этой напастью нашего информационного века
Stay tuned! 😁
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🤔1
Господа!
У меня на полке стоит четырехтомник академика Бориса Евсеевича Чертока "Ракеты и люди", который мне подарили два года назад и который я на удивление быстро прочитал (учитывая, что там томики до 700 страниц))).
Борис Евсеевич описывает события начиная со своего детства и работы в юности на заводе по производству бомбардировщиков. Дальше получение образования, работа в конструкторских бюро, работа во время войны над первым реактивным истребителем. В конце войны он руководил подразделением и входил в комиссию по изучению немецкой ракеты Фау-2, успел расписаться на рейхстаге 2 мая 1945 года (когда в Берлине еще стреляли), а позже активно работал над советскими ракетами. В том числе в книжке шикарно описана выигранная гонка с первым спутником🛰 , с первым космонавтом (65 лет полету которого исполняется сегодня) , а заканчивается четырехтомник отдельным томом о проигранной лунной гонке. 🚀
Кстати, он прожил почти 100 лет и в Центре Управления Полетами у него было отдельное кресло, откуда он, уже давно будучи на пенсии, мог наблюдать старты.
Вчера мне вернули очередной прочитанный том, поэтому могу порадовать вас свежей сегодняшней фотографией полного четырехтомника)
Для меня лично книжка была интересна тем, что Черток отвечал сначала за телеметрию 📡, а потом и за управление. Это значит, что каждый раз, когда ракета взрывалась на взлете (а поначалу такого было очень много), поиск причин был с его плотным участием. И в книге очень интересно описано, какими мерами увеличивали надежность ракет. Также управление — это задачи ранней кибернетики, которые изначально решались на аналоговых схемах — в плане того, как начиналось программирование очень любопытно. 🛰
Ну и так сложилось, что я дважды был с большими трехдневными экскурсиями в Звездном городке. Селили нас в общежитии для гостей, куда во время отбора селят кандидатов в отряд космонавтов (в здании большая сушилка для одежды, как на спортбазах, и очень интересный вайб))). Так что я тоже несколько раз разбил МКС при стыковке в ручном режиме на тренажере, пытался закрутить гайку в перчатке космонавта в камере с откачанным воздухом, примерял скафандр, задал много вопросов читавшим нам лекции технарям, космонавтам и выживальщикам (последние учат космонавта выживать, если корабль нештатно приземлится в пустыню, джунгли, на воду, в тайгу и т.д. — суперинтересные люди).🌍
В общем, когда пару лет назад вышел фильм "Вызов" — первый в истории художественный фильм, снятый в космосе, о проведении медицинской операции на борту МКС, с космонавтами, сыгравшими там космонавтов, Пётром Дубровым и Антоном Шкаплеровым я оказался знаком) (у Петра были очень хорошие лекции). А сейчас ко мне едет книга "Это космос, детка!" Юлии Пересильд о том, как она попала в этот проект и какие впечатления у нее были от года подготовки к полету в космос. С одной стороны они летели как туристы, с другой — им там нужно было реально работу работать — сделать качественные съемки, с учетом, что мог полететь только один режиссер-оператор (работавший за всю съемочную команду). Большинство (включая профессиональных космонавтов) думали, что у них не получится. Как минимум в полном объеме. У них получилось!🚀
С днем космонавтики, короче! Пусть у вас тоже получается!🚀 💪 🚀
@vgcourse
У меня на полке стоит четырехтомник академика Бориса Евсеевича Чертока "Ракеты и люди", который мне подарили два года назад и который я на удивление быстро прочитал (учитывая, что там томики до 700 страниц))).
Борис Евсеевич описывает события начиная со своего детства и работы в юности на заводе по производству бомбардировщиков. Дальше получение образования, работа в конструкторских бюро, работа во время войны над первым реактивным истребителем. В конце войны он руководил подразделением и входил в комиссию по изучению немецкой ракеты Фау-2, успел расписаться на рейхстаге 2 мая 1945 года (когда в Берлине еще стреляли), а позже активно работал над советскими ракетами. В том числе в книжке шикарно описана выигранная гонка с первым спутником
Кстати, он прожил почти 100 лет и в Центре Управления Полетами у него было отдельное кресло, откуда он, уже давно будучи на пенсии, мог наблюдать старты.
Вчера мне вернули очередной прочитанный том, поэтому могу порадовать вас свежей сегодняшней фотографией полного четырехтомника)
Для меня лично книжка была интересна тем, что Черток отвечал сначала за телеметрию 📡, а потом и за управление. Это значит, что каждый раз, когда ракета взрывалась на взлете (а поначалу такого было очень много), поиск причин был с его плотным участием. И в книге очень интересно описано, какими мерами увеличивали надежность ракет. Также управление — это задачи ранней кибернетики, которые изначально решались на аналоговых схемах — в плане того, как начиналось программирование очень любопытно. 🛰
Ну и так сложилось, что я дважды был с большими трехдневными экскурсиями в Звездном городке. Селили нас в общежитии для гостей, куда во время отбора селят кандидатов в отряд космонавтов (в здании большая сушилка для одежды, как на спортбазах, и очень интересный вайб))). Так что я тоже несколько раз разбил МКС при стыковке в ручном режиме на тренажере, пытался закрутить гайку в перчатке космонавта в камере с откачанным воздухом, примерял скафандр, задал много вопросов читавшим нам лекции технарям, космонавтам и выживальщикам (последние учат космонавта выживать, если корабль нештатно приземлится в пустыню, джунгли, на воду, в тайгу и т.д. — суперинтересные люди).
В общем, когда пару лет назад вышел фильм "Вызов" — первый в истории художественный фильм, снятый в космосе, о проведении медицинской операции на борту МКС, с космонавтами, сыгравшими там космонавтов, Пётром Дубровым и Антоном Шкаплеровым я оказался знаком) (у Петра были очень хорошие лекции). А сейчас ко мне едет книга "Это космос, детка!" Юлии Пересильд о том, как она попала в этот проект и какие впечатления у нее были от года подготовки к полету в космос. С одной стороны они летели как туристы, с другой — им там нужно было реально работу работать — сделать качественные съемки, с учетом, что мог полететь только один режиссер-оператор (работавший за всю съемочную команду). Большинство (включая профессиональных космонавтов) думали, что у них не получится. Как минимум в полном объеме. У них получилось!
С днем космонавтики, короче! Пусть у вас тоже получается!
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤6🤔1🥴1
Господа!
На прошлой неделе прошла конференция Data Fusion 2026 от ВТБ (и примкнувших). На DF рекордное количество panel discussion и множество интереснейших спикеров. Вообще, на конференциях по-моему большинство самых интересных разговоров происходят в спикерских (чисто по составу участников). 😁 Я там, в том числе, вел секцию "Научный прорыв года в ИИ" (13 работ из 141 поданной — acceptance rate круче, чем на А* 😂).
Были интереснейшие дискуссии по поводу А* и будущего стремительно меняющейся науки. Про будущее потом, а вот чем полезны А* сформулирую:
* Для прохождения на А* критична novelty. Результат должен быть новым в мире. Это значит, что вы должны быть не только в состоянии добежать до быстро уходящего вперед научного фронтира, но и спланировать свои исследования таким образом, чтобы успеть выполнить их и написать статью быстрее китайцев. Это КРАЙНЕ нетривиально. Очень частая ситуация, когда придумана хорошая гипотеза и дальше пока вы делаете работу (через месяц или за неделю до публикации) китайцы (как правило) публикуют на www.arxiv.org что-то очень-очень похожее. И дальше это найдут ревьюверы и зарубят статью по novelty (самая частая ситуация и очень серьезный риск). И дальше все по кругу. В наиболее актуальных областях, где статьи выходят каждый день, умение выиграть это соревнование у китайцев — это крайне нетривиальный скилсет (нужно и хорошо ориентироваться в быстро меняющемся ландшафте научного фронтира, и верно оценивать сколько есть времени для присмотренной полянки, быстро ресечить и писать и т.д.). Это тянут не все.
* Для прохождения на А* важен significant contribution. Не получится сделать что-то небольшое по-быстрому. Оно не пройдет. Наш прошлогодний второй ICCV Highlight IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models содержательно это 3 работы, каждая из которых довольно интересна и нова. Потому и Highlight (топ-9.7% принятых статей).
* Для прохождения на А* критично доказательство годности результата. Разного рода читерства и deep fake science очень много. В нашей области videoprocessing мало хороших крупных датасетов и очень частая ситуация, когда многочисленные "типа SOTA" методы не воспроизводятся на других данных. На нашем флагманском по популярности и размеру в своей области датасете CVQAD до сих пор SOTA — VMAF (метод от Netflix ДЕСЯТИЛЕТНЕЙ (!) давности, датасет обучения которой Netflix не раскрыла, но он, очевидно, был не маленьким). Т.е. 10 летнаука гора рожала мышь! В области выходит до 3000 статей в год (много улучшений и разных более узких кейсов), но в базовой задаче при большом числе "типа SOTA" все плохо. Как следствие, ревьюверы А* крайне скептичны (и крайне злы). И малейшей неаккуратности в описании сравнения результата не прощают. Это формирует крайне важный скилсет — умение четко выстроить методику сравнения и четко доказательно донести результат.
Забавно, что в своей области на многочисленных модных конференциях российских компаний по ИИ я регулярно слышу ужасные (методологически) сравнения своих результатов с другими. Причем докладчики без опыта А* часто совершенно искренне не понимают, в чем проблема 😁🤷♂️. Ну и по novelty нередко слышу как наши компании компании хвастаются, но не публикуются ("так-то я легко марафон пробегу, просто времени нет", а у Google 175+ статей только на одной (!) NeurIPS 2025, 140+ на ICML 2025 и 125+ на ICLR 2025, у них время есть, да))) 😉
AI — мощнейший усилитель. Если есть ум и навыки, то ума и навыков, если нет, то их отсутствия. Что мы в ближайшее время радостно пронаблюдаем (уже, собственно). 😁
В этом плане есть те (люди и компании), кто считает, что ему (им) эти навыки не нужны. Посмотрим на результат. Счет будет (и уже есть) на табло. Я лично ставлю на Google 😁
Всем конкурентоспособности!🙂
Stay tuned! 😁
@vgcourse
На прошлой неделе прошла конференция Data Fusion 2026 от ВТБ (и примкнувших). На DF рекордное количество panel discussion и множество интереснейших спикеров. Вообще, на конференциях по-моему большинство самых интересных разговоров происходят в спикерских (чисто по составу участников). 😁 Я там, в том числе, вел секцию "Научный прорыв года в ИИ" (13 работ из 141 поданной — acceptance rate круче, чем на А* 😂).
Были интереснейшие дискуссии по поводу А* и будущего стремительно меняющейся науки. Про будущее потом, а вот чем полезны А* сформулирую:
* Для прохождения на А* критична novelty. Результат должен быть новым в мире. Это значит, что вы должны быть не только в состоянии добежать до быстро уходящего вперед научного фронтира, но и спланировать свои исследования таким образом, чтобы успеть выполнить их и написать статью быстрее китайцев. Это КРАЙНЕ нетривиально. Очень частая ситуация, когда придумана хорошая гипотеза и дальше пока вы делаете работу (через месяц или за неделю до публикации) китайцы (как правило) публикуют на www.arxiv.org что-то очень-очень похожее. И дальше это найдут ревьюверы и зарубят статью по novelty (самая частая ситуация и очень серьезный риск). И дальше все по кругу. В наиболее актуальных областях, где статьи выходят каждый день, умение выиграть это соревнование у китайцев — это крайне нетривиальный скилсет (нужно и хорошо ориентироваться в быстро меняющемся ландшафте научного фронтира, и верно оценивать сколько есть времени для присмотренной полянки, быстро ресечить и писать и т.д.). Это тянут не все.
* Для прохождения на А* важен significant contribution. Не получится сделать что-то небольшое по-быстрому. Оно не пройдет. Наш прошлогодний второй ICCV Highlight IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models содержательно это 3 работы, каждая из которых довольно интересна и нова. Потому и Highlight (топ-9.7% принятых статей).
* Для прохождения на А* критично доказательство годности результата. Разного рода читерства и deep fake science очень много. В нашей области videoprocessing мало хороших крупных датасетов и очень частая ситуация, когда многочисленные "типа SOTA" методы не воспроизводятся на других данных. На нашем флагманском по популярности и размеру в своей области датасете CVQAD до сих пор SOTA — VMAF (метод от Netflix ДЕСЯТИЛЕТНЕЙ (!) давности, датасет обучения которой Netflix не раскрыла, но он, очевидно, был не маленьким). Т.е. 10 лет
Забавно, что в своей области на многочисленных модных конференциях российских компаний по ИИ я регулярно слышу ужасные (методологически) сравнения своих результатов с другими. Причем докладчики без опыта А* часто совершенно искренне не понимают, в чем проблема 😁🤷♂️. Ну и по novelty нередко слышу как наши компании компании хвастаются, но не публикуются ("так-то я легко марафон пробегу, просто времени нет", а у Google 175+ статей только на одной (!) NeurIPS 2025, 140+ на ICML 2025 и 125+ на ICLR 2025, у них время есть, да))) 😉
AI — мощнейший усилитель. Если есть ум и навыки, то ума и навыков, если нет, то их отсутствия. Что мы в ближайшее время радостно пронаблюдаем (уже, собственно). 😁
В этом плане есть те (люди и компании), кто считает, что ему (им) эти навыки не нужны. Посмотрим на результат. Счет будет (и уже есть) на табло. Я лично ставлю на Google 😁
Всем конкурентоспособности!
Stay tuned! 😁
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13🤔4🥴1
Господа!
Поговорим о развитии железа)
Тут недавно на архиве вышла любопытная (хотя и водянистая местами) статья "AI+HW 2035: Shaping the Next Decade" — формирование следующего десятилетия в железе для ИИ, короче! В авторах NVIDIA, Google, AMD, OpenAI, Oracle AI, HP, IBM, SK Hynix (производство HMB), Synopsys (софт для проектирования железа) молодые AI-HW стартапы типа SEMRON, SambaNova Systems, EnCharge AI, Agentrys и куча университетов, занимающихся железом. В общем они собрали довольно много конкурентов и коллег в одном месте)
Статья написана по материалам осеннего одноименного семинара (куча слайдов презентаций университетов и компаний доступна тут, но такое впечатление, что компании свои секреты старались максимально не выдавать))).
Какие мысли по поводу:
* В последнее время регулярно слышу, что мол скоро токены в цене возрастут, поскольку уже реальный дефицит датацентры строить не успевают. К вашему сведению: компетентные товарищи уверенно декларируют 100-кратное увеличение энергоэффективности чипов для LLM в ближайшие 5 лет и 1000-кратное увеличение (с умеренной вероятностью, по крайней мере на текущих технологиях) в ближайшие 10 лет.
Даже 100 раз — это очень много. Это значит, что через 5 лет токены будут примерно в 100 дешевле даже если алгоритмы остановятся в развитии (что, конечно, не так).
И это выглядит совершенно реальным. NVIDIA ровно за 2 года показала в GB200 в 25 раз более высокую энергоэффективность по сравнению с H100, а Ultra B300 в 50 раз.
AMD также на своих чипах MI350X декларирует рост энергоэффективности в 35 раз за 5 лет.
Понятно, что это часто "в прыжке" (в наиболее эффективном кейсе), т.е. измеряется например, производительность в новых модных FP4, которые ранее почти не использовались, но тем не менее измеряется часто опенсорсный DeepSeek, т.е. вполне реальная сложная модель.
* Bottleneck смещается с арифметики на data movement. Забавно, что я про это писал еще в далеком 2019 на Хабре, но с тех пор из арифметики удалось выжать еще очень много! Соответственно вангуется, наконец, переход от compute-centric к memory-centric и data-centric архитектурам. Ибо иначе "стена".
В этом плане вполне может наступить время стартапов типа SambaNova и SEMRON. Суммарно AI-чип-стартапы привлекли $7.6 млрд венчурного капитала в мире за 2024–2025 г. Это ОЧЕНЬ много. Для них сейчас годы золотого дождя после десятилетий засухи, когда получить деньги на чип было нереально.
* Параллельно идет AI-driven автоматизация проектирования чипов (епархия Synopsys и Agentrys.ai), которая существенно ускоряет процесс создания новых эффективных чипов.
Учитывая, конкуренцию NVIDIA, Google (с TPU), AMD, (Intel, который может купит SambaNova) и китайских производителей (которых на семинаре и в статье нет от слова совсем), прямо скажем есть кому позаботиться о том, чтобы стоимость вычислений очень ощутимо падала.
Мы живем в удивительнейшее время! 😁
Больше материалов на тему:
#speed_of_progress@vgcourse
Stay tuned! 😁
@vgcourse
Поговорим о развитии железа)
Тут недавно на архиве вышла любопытная (хотя и водянистая местами) статья "AI+HW 2035: Shaping the Next Decade" — формирование следующего десятилетия в железе для ИИ, короче! В авторах NVIDIA, Google, AMD, OpenAI, Oracle AI, HP, IBM, SK Hynix (производство HMB), Synopsys (софт для проектирования железа) молодые AI-HW стартапы типа SEMRON, SambaNova Systems, EnCharge AI, Agentrys и куча университетов, занимающихся железом. В общем они собрали довольно много конкурентов и коллег в одном месте)
Статья написана по материалам осеннего одноименного семинара (куча слайдов презентаций университетов и компаний доступна тут, но такое впечатление, что компании свои секреты старались максимально не выдавать))).
Какие мысли по поводу:
* В последнее время регулярно слышу, что мол скоро токены в цене возрастут, поскольку уже реальный дефицит датацентры строить не успевают. К вашему сведению: компетентные товарищи уверенно декларируют 100-кратное увеличение энергоэффективности чипов для LLM в ближайшие 5 лет и 1000-кратное увеличение (с умеренной вероятностью, по крайней мере на текущих технологиях) в ближайшие 10 лет.
Даже 100 раз — это очень много. Это значит, что через 5 лет токены будут примерно в 100 дешевле даже если алгоритмы остановятся в развитии (что, конечно, не так).
И это выглядит совершенно реальным. NVIDIA ровно за 2 года показала в GB200 в 25 раз более высокую энергоэффективность по сравнению с H100, а Ultra B300 в 50 раз.
AMD также на своих чипах MI350X декларирует рост энергоэффективности в 35 раз за 5 лет.
Понятно, что это часто "в прыжке" (в наиболее эффективном кейсе), т.е. измеряется например, производительность в новых модных FP4, которые ранее почти не использовались, но тем не менее измеряется часто опенсорсный DeepSeek, т.е. вполне реальная сложная модель.
* Bottleneck смещается с арифметики на data movement. Забавно, что я про это писал еще в далеком 2019 на Хабре, но с тех пор из арифметики удалось выжать еще очень много! Соответственно вангуется, наконец, переход от compute-centric к memory-centric и data-centric архитектурам. Ибо иначе "стена".
В этом плане вполне может наступить время стартапов типа SambaNova и SEMRON. Суммарно AI-чип-стартапы привлекли $7.6 млрд венчурного капитала в мире за 2024–2025 г. Это ОЧЕНЬ много. Для них сейчас годы золотого дождя после десятилетий засухи, когда получить деньги на чип было нереально.
* Параллельно идет AI-driven автоматизация проектирования чипов (епархия Synopsys и Agentrys.ai), которая существенно ускоряет процесс создания новых эффективных чипов.
Учитывая, конкуренцию NVIDIA, Google (с TPU), AMD, (Intel, который может купит SambaNova) и китайских производителей (которых на семинаре и в статье нет от слова совсем), прямо скажем есть кому позаботиться о том, чтобы стоимость вычислений очень ощутимо падала.
Мы живем в удивительнейшее время! 😁
Больше материалов на тему:
#speed_of_progress@vgcourse
Stay tuned! 😁
@vgcourse
🔥3🤔2❤1
Господа!
Неделю назад вышло любопытное интервью CEO NVIDIA Дженсона Хуанга. Посмотрел его еще на выходных, но руки не доходили написать. Исправляюсь)
Какие мысли:
* Понятно, что в таких интервью очень частая задача — дать точку зрения своей компании (которая может не совпадать с реальностью, естественно). В частности, если послушать Дженсена, то их чипы первые и тут, и тут и еще тут (и вообще непонятно, зачем нужны конкуренты (часть высказываний захотелось фактчекнуть))) Ну и хочется, конечно, сравнивать производительность в пересчете на стоимость чипа. Ибо маржа у них уже до 88% на чип (H100 SXM5, например, продается по ~$25 000–30 000, при себестоимости по данным tomshardware ~$3 320).
* Дваркеш бил не в бровь, а в глаз. Факт: две из трех наиболее сильных LLM — гугловая Gemini и антропиковский Cloud обучаются на TPU гугла, а не на картах NVIDIA. Дженсен признал, что Антропик приходили к ним и просили адекватных условий на карточки для обучения. Но NVIDIA не согласилась, после чего те обратились в Google и получили добро. Надо понимать, что обучение довольно сильно оптимизируется под железо (просто потому, что там каждый процент экономии это натурально миллионы долларов). И это большая работа. В этом смысле компании сменить карты для обучения — довольно дорогое решение. И NVIDIA, считая себя царем горы, оттолкнула взлетающий Антропик. О чем Дженсен жалеет.
* Большой кусок интервью (почти треть) был посвящен спору — продавать или не продавать мощные карты в Китай. Жесткая позиция Дваркеша была — ни в коем случае. А Дженсен пытался объяснить что США сами мотивируют выращивать в Китае свою экосистему вокруг китайских чипов, которые развиваются очень и очень быстро. А NVIDIA, напротив, долю в экосистеме теряет (ибо в силу специфики Китая, Китай намного больше США контрибьютит неплохой open source в экосистеме NVIDIA). Очень познавательный кусок интервью про Китай.
* Ну и прошлый пост был посвящен статье "AI+HW 2035: Shaping the Next Decade", в которой вангуется с высокой вероятность улучшение энергоэффективности в 100 раз за 5 лет и с умеренной эффективности в 1000 раз за 6-10 лет. Дженсен подчеркивает, что они кардинально улучшили энергоэффективность (например, улучшение с A100 до B200 — 4 года между релизами — достигает 40 раз). Это чистое железо, но при квантовании до FP4. На FP8 без оптимизации (т.е. можно оптимизировать и цифры будут выше) улучшение около 14 раз. На FP16 — 5-6 раз. Очень хороший прогресс, который будет сложен с прогрессом в алгоритмах)
Ближайшие годы будут запредельно интересны! 😁
Больше материалов на тему:
#speed_of_progress@vgcourse
Ну и я сейчас на ICLR в Рио! Море общения, информации и впечатлений 🤩
Stay tuned! 😁
@vgcourse
Неделю назад вышло любопытное интервью CEO NVIDIA Дженсона Хуанга. Посмотрел его еще на выходных, но руки не доходили написать. Исправляюсь)
Какие мысли:
* Понятно, что в таких интервью очень частая задача — дать точку зрения своей компании (которая может не совпадать с реальностью, естественно). В частности, если послушать Дженсена, то их чипы первые и тут, и тут и еще тут (и вообще непонятно, зачем нужны конкуренты (часть высказываний захотелось фактчекнуть))) Ну и хочется, конечно, сравнивать производительность в пересчете на стоимость чипа. Ибо маржа у них уже до 88% на чип (H100 SXM5, например, продается по ~$25 000–30 000, при себестоимости по данным tomshardware ~$3 320).
* Дваркеш бил не в бровь, а в глаз. Факт: две из трех наиболее сильных LLM — гугловая Gemini и антропиковский Cloud обучаются на TPU гугла, а не на картах NVIDIA. Дженсен признал, что Антропик приходили к ним и просили адекватных условий на карточки для обучения. Но NVIDIA не согласилась, после чего те обратились в Google и получили добро. Надо понимать, что обучение довольно сильно оптимизируется под железо (просто потому, что там каждый процент экономии это натурально миллионы долларов). И это большая работа. В этом смысле компании сменить карты для обучения — довольно дорогое решение. И NVIDIA, считая себя царем горы, оттолкнула взлетающий Антропик. О чем Дженсен жалеет.
* Большой кусок интервью (почти треть) был посвящен спору — продавать или не продавать мощные карты в Китай. Жесткая позиция Дваркеша была — ни в коем случае. А Дженсен пытался объяснить что США сами мотивируют выращивать в Китае свою экосистему вокруг китайских чипов, которые развиваются очень и очень быстро. А NVIDIA, напротив, долю в экосистеме теряет (ибо в силу специфики Китая, Китай намного больше США контрибьютит неплохой open source в экосистеме NVIDIA). Очень познавательный кусок интервью про Китай.
* Ну и прошлый пост был посвящен статье "AI+HW 2035: Shaping the Next Decade", в которой вангуется с высокой вероятность улучшение энергоэффективности в 100 раз за 5 лет и с умеренной эффективности в 1000 раз за 6-10 лет. Дженсен подчеркивает, что они кардинально улучшили энергоэффективность (например, улучшение с A100 до B200 — 4 года между релизами — достигает 40 раз). Это чистое железо, но при квантовании до FP4. На FP8 без оптимизации (т.е. можно оптимизировать и цифры будут выше) улучшение около 14 раз. На FP16 — 5-6 раз. Очень хороший прогресс, который будет сложен с прогрессом в алгоритмах)
Ближайшие годы будут запредельно интересны! 😁
Больше материалов на тему:
#speed_of_progress@vgcourse
Ну и я сейчас на ICLR в Рио! Море общения, информации и впечатлений 🤩
Stay tuned! 😁
@vgcourse
🔥9❤1🤔1
Бом диа, амигос, из солнечного Рио! 😍
Тут идет конференция ICLR, которая мощно растет и в прошлом году по числу участников вышла на второе место среди ведущих конференций по ИИ в мире по числу участников (см. график, реально крупное событие!).
Замечу, что ICLR — самая молодая из ведущих ИИ конференций!
Они стартовали в 2013 году с 23 (двадцати трех!) принятых статей!
В 2017 у них было уже 198 статей
В 2022 — 1095 статей
В 2026 — 5339 статей 😲🔥
На графике выше виден их фантастический рост по числу участников практически с нуля.
Конференция создана Яном Ле Куном и Джошуа Бенджио (крестные отцы глубокого обучения с 460 тысячами и миллионом+ цитирований — на секундочку это №1 по цитированиям среди всех ученых мира из ныне живущих).
Но интереснее даже не это, а то что ЛеКун считал, что многие хорошие статьи неправомерно отклоняются из-за непрозрачности и низкого качества рецензий (сколько людей в этот момент дружно издали крик души "Дааааааа!")))), и хотел исправить это через открытый процесс. Именно на основе моделей, предложенных ЛеКуном, ICLR изначально использует открытое рецензирование.
Что это значит:
* ВСЕ статьи с момента подачи сразу видны ВСЕМ желающим
* ВСЕ рецензии с момента подачи также видны ВСЕМ желающим
* Зарегистрированные участники могут оставлять комментарии, которые также видны ВСЕМ.
* При этом рецензирование Double-blind (рецензенты не знают имён авторов, авторы не знают имён рецензентов).
Данная открытость позволяет как бы невзначай написать в твиттере что-то типа: "А не кажется ли вам, многоуважаемые доны, что второй рецензент статьи [по ссылке] в замечании 2 строчки 467-492 статьи не осилил?" )))
И таких случаев (внезапно!) было действительно очень очень много (боже, как было бы здорово, если бы так можно было делать в журналах! особенно некоторых! И некоторых других конференциях!!!)))
По сути оставляемые в статьях открытые жесткие комментарииумственных способностей ре... с содержательными разносами рецензий позволяли подсветить для хронически перегруженных Area Chair недобросовестных ревьюверов (коих всегда хватает) и принять меры. Ну и открытость также является стимулом для Area Chair не забивать на процесс, ибо дальше (если история начнет вируситься) спросят уже с него.
В итоге качество рецензий на ICLR в среднем выше, что обеспечило уверенный быстрый рост ее популярности. ICLR на 32 года моложе ICML (1980) и на 19 лет моложе NeurIPS (1987), но сейчас по факту в одной категории с ними по популярности и растет!
Также замечу, что ставший сегодня стандартом рецензирования для А* сайт openreview.net в свое время был создан специально для ICLR. И уже дальше был подхвачен фактически всеми основными конференциями. Ибо организация процесс подачи там была ощутимо выше, чем на других платформах.
Означает ли это что на ICLR нет проблем? О, безусловно нет. 😁 Тут прямо очень хорошо видно море других проблем роста (и проблем хайпа, кстати). Означает ли это, что рецензенты на ICLR в среднем больше опасаются косячить и жестить? Да, безусловно.
Лекун, кстати, на конференции нос показывал и среди русскоязычных участников (коих тут больше 200) были те, кто рядом с ним успел постоять))) Но недолго)))
Еще про этот ICLR скоро будет! (у меня перегруз по впечатлениям и нехватка времени на сон)))
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
@vgcourse
Тут идет конференция ICLR, которая мощно растет и в прошлом году по числу участников вышла на второе место среди ведущих конференций по ИИ в мире по числу участников (см. график, реально крупное событие!).
Замечу, что ICLR — самая молодая из ведущих ИИ конференций!
Они стартовали в 2013 году с 23 (двадцати трех!) принятых статей!
В 2017 у них было уже 198 статей
В 2022 — 1095 статей
В 2026 — 5339 статей 😲🔥
На графике выше виден их фантастический рост по числу участников практически с нуля.
Конференция создана Яном Ле Куном и Джошуа Бенджио (крестные отцы глубокого обучения с 460 тысячами и миллионом+ цитирований — на секундочку это №1 по цитированиям среди всех ученых мира из ныне живущих).
Но интереснее даже не это, а то что ЛеКун считал, что многие хорошие статьи неправомерно отклоняются из-за непрозрачности и низкого качества рецензий (сколько людей в этот момент дружно издали крик души "Дааааааа!")))), и хотел исправить это через открытый процесс. Именно на основе моделей, предложенных ЛеКуном, ICLR изначально использует открытое рецензирование.
Что это значит:
* ВСЕ статьи с момента подачи сразу видны ВСЕМ желающим
* ВСЕ рецензии с момента подачи также видны ВСЕМ желающим
* Зарегистрированные участники могут оставлять комментарии, которые также видны ВСЕМ.
* При этом рецензирование Double-blind (рецензенты не знают имён авторов, авторы не знают имён рецензентов).
Данная открытость позволяет как бы невзначай написать в твиттере что-то типа: "А не кажется ли вам, многоуважаемые доны, что второй рецензент статьи [по ссылке] в замечании 2 строчки 467-492 статьи не осилил?" )))
И таких случаев (внезапно!) было действительно очень очень много (боже, как было бы здорово, если бы так можно было делать в журналах! особенно некоторых! И некоторых других конференциях!!!)))
По сути оставляемые в статьях открытые жесткие комментарии
В итоге качество рецензий на ICLR в среднем выше, что обеспечило уверенный быстрый рост ее популярности. ICLR на 32 года моложе ICML (1980) и на 19 лет моложе NeurIPS (1987), но сейчас по факту в одной категории с ними по популярности и растет!
Также замечу, что ставший сегодня стандартом рецензирования для А* сайт openreview.net в свое время был создан специально для ICLR. И уже дальше был подхвачен фактически всеми основными конференциями. Ибо организация процесс подачи там была ощутимо выше, чем на других платформах.
Означает ли это что на ICLR нет проблем? О, безусловно нет. 😁 Тут прямо очень хорошо видно море других проблем роста (и проблем хайпа, кстати). Означает ли это, что рецензенты на ICLR в среднем больше опасаются косячить и жестить? Да, безусловно.
Лекун, кстати, на конференции нос показывал и среди русскоязычных участников (коих тут больше 200) были те, кто рядом с ним успел постоять))) Но недолго)))
Еще про этот ICLR скоро будет! (у меня перегруз по впечатлениям и нехватка времени на сон)))
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩10🔥7❤1🤔1
Господа!
Я тут только наконец отоспался (проспав почти 11 часов!) после прилета с ICLR (20+ часов в самолетах, больше суток в дороге, сейчас буду приводить в порядок впечатления (коих масса))).
Но сначала главная новость этой недели!
Мы затащили 2 статьи в основной трек ICML!!! Йеееее!!!
🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳 🥳
Из больших плюсов — ICML этого года проходит в Корее, куда с недавних пор на приезд до 60 дней визу получать не надо. Т.е. всех вот этих приключений, которых у нас много было (в основном неудачных) с получением визы в США не будет. Нужно электронное разрешение на въезд (которое действует 3 года), но если его нет, можно, как пишут, заполнить миграционную карту в аэропорту и все. Короче, праздник! 🇰🇷🇰🇷 🇰🇷😁
Обе прошедшие статьи с первыми авторами аспирантами. Когда Настя ездила на NeurIPS в США, она познакомилась там с девушкой аспиранткой из Камеруна, у которой это была третья А* и которая сказала, что у них в лаборатории в Камеруне пока у человека нет трех А* его к защите не допускают.🤔 С тех пор у нас появился локальный мем "Догнать и перегнать Камерун" 🇨🇲😂🇨🇲 Плотно (и успешно) работаем над этим! Как писал, у Кати Шумицкой, поступившей в аспирантуру в прошлом году, на момент поступления уже было 4 А* (две первым автором). Женя Богатырев, с которым я ездил на ICLR, в этом году только поступает в аспирантуру — у него одна А* первым автором уже есть. А у поступающего в этом году Халеда Абуда есть 5 А* (одна первым автором), причем к моменту поступления скорее всего будет больше 😉 (работа над этим кипит). Ну и вот 2 свежих статьи аспирантов. Плавно догоняем Камерун, короче (параллельно подтверждая статус лучшей лаборатории по ИИ в МГУ)! 😁🇨🇲💪
При этом прямо сейчас идет кранч подач на NeurIPS и начинаются ребаттлы ECCV.🥵
Про ICLR и прошедшие статьи постараюсь рассказать (там на много постов материала хватит, время бы найти)))
Stay tuned! 😁
Больше про наши успехи:
#our_successes@vgcourse
Я тут только наконец отоспался (проспав почти 11 часов!) после прилета с ICLR (20+ часов в самолетах, больше суток в дороге, сейчас буду приводить в порядок впечатления (коих масса))).
Но сначала главная новость этой недели!
Мы затащили 2 статьи в основной трек ICML!!! Йеееее!!!
Из больших плюсов — ICML этого года проходит в Корее, куда с недавних пор на приезд до 60 дней визу получать не надо. Т.е. всех вот этих приключений, которых у нас много было (в основном неудачных) с получением визы в США не будет. Нужно электронное разрешение на въезд (которое действует 3 года), но если его нет, можно, как пишут, заполнить миграционную карту в аэропорту и все. Короче, праздник! 🇰🇷
Обе прошедшие статьи с первыми авторами аспирантами. Когда Настя ездила на NeurIPS в США, она познакомилась там с девушкой аспиранткой из Камеруна, у которой это была третья А* и которая сказала, что у них в лаборатории в Камеруне пока у человека нет трех А* его к защите не допускают.
При этом прямо сейчас идет кранч подач на NeurIPS и начинаются ребаттлы ECCV.
Про ICLR и прошедшие статьи постараюсь рассказать (там на много постов материала хватит, время бы найти)))
Stay tuned! 😁
Больше про наши успехи:
#our_successes@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤10👍2🤔1🥴1
Итак! ICLR 2026, часть 2.
Краткое содержание предыдущей серии: Крестные отцы AI посчитали, что много хороших статей отклоняется из-за непрозрачности и низкого качества рецензий и решили замутить в 2013 новую конференцию (кстати, ICLR читается как "I CLeaR" — я чист))), где ВСЕ статьи и ВСЕ рецензии видны ВСЕМ с момента подачи, причем можно оставлять комментарии под любой статьей (невиданный уровень прозрачности). На созданную под ICLR платформу рецензирования openreview.net переехали все топовые конференции (увеличив прозрачности своих процессов, но не до уровня ICLR, ехидно заметим))), а ICLR быстро догнала лидеров в AI по числу участников.
Быстрый рост числа статей стал испытанием на прочность для ICLR. Только за последние 2 года число поданных статей утроилось. В итоге приходится рекрутировать в рецензенты аспирантов и даже магистров из авторов (3.2% рецензентов по статистике). Качество ревью упало...
А 27 ноября 2025 у конференции появилась новая расшифровка названия
Баг был закрыт за час, но оказалось, что датасет с ~10000 статьями и их деталями в виде деанонимизированных ревьюверов уже гуляет по интернету. И не было гарантий, что не было деанонимизировано больше (там надо было набрать волшебный URL
Прикол был в том, что когда информация о деанонимизации распространилась, большое количество ревьюверов бросились поднимать свои оценки! (Интересно, почему они так поступили?))) В итоге в тот же день ICLR замораживает внесение изменений в рецензии.
28 ноября некий добрый человек, пользуясь возможностью добавлять комментарии, примерно под 600 статьями оставил автоматический комментарий, раскрывая их рецензентов. Комментарии удалили, доброго человека заблокировали, публичные комментарии заморозили.
Неординарная ситуация требовала неординарных действий. И к вечеру 28 ноября все оценки ревьюверов по итогам ребаттла были откачены, а AC (Area Chairs) переназначены. Для нас это была локальная трагедия, поскольку как я уже писал в январе у этой статьи 3 ревьювера подняли оценки и статья переместилась в 9% лучших статей (гарантированное прохождение), а тут такое! Причем если пара ревьюверов подняли оценку и написали об этом в комментариях, то третий просто молча поднял, ничего не написал. И его оценка сбросилась без следа...🤔 В целом мы с большой вероятностью все равно проходили, но... всякое бывает.
Параллельно всплывало много интересного. ICLR привлекает своей открытостью и еще 18 ноября было опубликовано исследование, в котором были проанализированы все рецензии ICLR 2026 с весьма неутешительным выводом о полностью сгенерированных 21% рецензий (вторая картинка к посту — анализ 10К рецензий ICLR 2022 тем же алгоритмом).
Короче, вы поняли! 😁 После взлома стали известны их имена!
Забавно, что у нас у одной из статей оказался ревьювер из антитоп-50 всех ревьюверов конференции (он всем статьям ставил низкий балл). Увы, это не было автоматически обработано. А жаль! Также въедливые авторы нашли несколько ревьюверов, делавших все рецензии по одному шаблону. В общем — за счет того, что стало возможным сматчить рецензентов разных статей появилась уникальная возможность выявить много разных системных злоупотреблений ревьюверов, которые по-хорошему могли бы выявлять огранизаторы конференции. И с большой вероятностью что-то подобное в итоге будет сделано (ибо кризис процесса рецензирования сейчас конкретный)!
Из забавного — я прогнал через детектор AI текста многие наши статьи, а также наши дипломы 2020 и 2025 годов. Результаты получились довольно интересные. Но об этом позже, а следующая серия будет про ICLR)))
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
Краткое содержание предыдущей серии: Крестные отцы AI посчитали, что много хороших статей отклоняется из-за непрозрачности и низкого качества рецензий и решили замутить в 2013 новую конференцию (кстати, ICLR читается как "I CLeaR" — я чист))), где ВСЕ статьи и ВСЕ рецензии видны ВСЕМ с момента подачи, причем можно оставлять комментарии под любой статьей (невиданный уровень прозрачности). На созданную под ICLR платформу рецензирования openreview.net переехали все топовые конференции (увеличив прозрачности своих процессов, но не до уровня ICLR, ехидно заметим))), а ICLR быстро догнала лидеров в AI по числу участников.
Быстрый рост числа статей стал испытанием на прочность для ICLR. Только за последние 2 года число поданных статей утроилось. В итоге приходится рекрутировать в рецензенты аспирантов и даже магистров из авторов (3.2% рецензентов по статистике). Качество ревью упало...
А 27 ноября 2025 у конференции появилась новая расшифровка названия
ICLR = I Can Locate Reviewer. Из-за бага на openreview.net в течении примерно 2 недель можно было для каждой статьи и каждого ее ревьювера получить имя, email, место работы, научного руководителя, ORCID и даже год рождения 🙈😁. Послать что-нибудь halloween-style в день рождения ревьювера ему на почту? Наконец сбываются все мечты! 🤩 Баг был закрыт за час, но оказалось, что датасет с ~10000 статьями и их деталями в виде деанонимизированных ревьюверов уже гуляет по интернету. И не было гарантий, что не было деанонимизировано больше (там надо было набрать волшебный URL
/Submission{paper_id}/Reviewer_{k} и все выдавало даже без авторизации🙈). Прикол был в том, что когда информация о деанонимизации распространилась, большое количество ревьюверов бросились поднимать свои оценки! (Интересно, почему они так поступили?))) В итоге в тот же день ICLR замораживает внесение изменений в рецензии.
28 ноября некий добрый человек, пользуясь возможностью добавлять комментарии, примерно под 600 статьями оставил автоматический комментарий, раскрывая их рецензентов. Комментарии удалили, доброго человека заблокировали, публичные комментарии заморозили.
Неординарная ситуация требовала неординарных действий. И к вечеру 28 ноября все оценки ревьюверов по итогам ребаттла были откачены, а AC (Area Chairs) переназначены. Для нас это была локальная трагедия, поскольку как я уже писал в январе у этой статьи 3 ревьювера подняли оценки и статья переместилась в 9% лучших статей (гарантированное прохождение), а тут такое! Причем если пара ревьюверов подняли оценку и написали об этом в комментариях, то третий просто молча поднял, ничего не написал. И его оценка сбросилась без следа...
Параллельно всплывало много интересного. ICLR привлекает своей открытостью и еще 18 ноября было опубликовано исследование, в котором были проанализированы все рецензии ICLR 2026 с весьма неутешительным выводом о полностью сгенерированных 21% рецензий (вторая картинка к посту — анализ 10К рецензий ICLR 2022 тем же алгоритмом).
Короче, вы поняли! 😁 После взлома стали известны их имена!
Забавно, что у нас у одной из статей оказался ревьювер из антитоп-50 всех ревьюверов конференции (он всем статьям ставил низкий балл). Увы, это не было автоматически обработано. А жаль! Также въедливые авторы нашли несколько ревьюверов, делавших все рецензии по одному шаблону. В общем — за счет того, что стало возможным сматчить рецензентов разных статей появилась уникальная возможность выявить много разных системных злоупотреблений ревьюверов, которые по-хорошему могли бы выявлять огранизаторы конференции. И с большой вероятностью что-то подобное в итоге будет сделано (ибо кризис процесса рецензирования сейчас конкретный)!
Из забавного — я прогнал через детектор AI текста многие наши статьи, а также наши дипломы 2020 и 2025 годов. Результаты получились довольно интересные. Но об этом позже, а следующая серия будет про ICLR)))
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10😁5🔥1
Коллеги!
Выкроил время дописать про ICLR)
Итак, как уже писал ICLR в прошлом году вышел 2 место среди ИИ конференций по числу участников и организовать такое непросто. В обычные Conference Centers поместиться уже сложно, поэтому был арендован Exhibition Center — место проведения выставок. Там был некоторый дефицит площадок для обычных секций, зато места для постеров было очень много. Вошло бы еще в 5-10 раз больше постеров легко. Есть куда расти! 😂
Из каких-то высших соображений ICLR перемешивают постеры (размещают их без кластеризации по темам), поэтому, если хочешь по своей или интересующей теме постеры обежать, приходилось наматывать натурально километры (у меня часы показывали 20, 26 и даже 30 тысяч шагов в день).
Еще в прошлом году я считал, что в какой-то момент наступит насыщение А* статьями и будет выход на плато, как это было с прошлыми хайпами, например, хайпом 3D в 2010-2015 годах. В этом году стало совершенно очевидно, что в этот раз все будет по-другому. На конференции на глаз было видно много "статей с длинными названиями", когда скрещивание ужа с ежом поставлено на поток, ощутимо автоматизировано и позволяет клепать статьи тоннами (там море fake science, особенно на небольших датасетах).
В этой ситуации остро стоит вопрос "Как сделать, чтобы тебя заметили среди тысяч работ?" (когда твоя работа висит всего 3 часа и дальше сменяется следующей). Старый добрый научный приоритет перестает работать, когда на одну А* конференцию принимается одновременно несколько статей с одинаковой идеей (таких случаев стало много). Какую из них цитировать? Которая выделилась! Причем достаточно небольшого приоритета по цитатам в самом начале, как новые статьи с цитатами съедаются поисковиками и модельками и дальше вавтоматизированных обзорах все начинают дружно ссылаться на "лидера". 😉
Короче! Второе фото — человек сделал постер в стиле аниме серии Fate (😲🤯😁 спорная идея, но постер точно необычный). Дальше мой фаворит — шикарный дизайнерский постер со стилизацией под стол, на котором слева лежит почти "классический" постер к статье, справа иллюстрации применения метода, зеленая лампа и даже boarding pass билетов в Рио 😂. Дальше прикольный синий постер с мостами Шредингера. Кто-то необычно одевался 🙈😂. Дальше видео перед началом нашей постерной секции, Женя понял, что надо делать постер совершенно по-другому (наша секция прошла неплохо, кстати, и мы даже не звали к себе в чатике на 300 русскоязычных участников, где народ кидал, чтобы не так скучно было стоять). Забавно, что один товарищ из США не получил визу в Бразилию (нам виза была не нужна) и 3 часа презентовал через прикрепленный к постеру планшет))).
Также были постерные секции на воркшопах ICLR (последнее видео) и мне они понравились даже больше. Во-первых, все постеры на смежные темы и обсуждения явно были более плотными и интересными. Во-вторых, общих invited talks было всего 6 и они явно были поражены распространенной сегодня в США болезнью diversity (поэтому докладывали не наиболее крутые, а представители научных меньшинств). В этом плане invited доклады воркшопов были, конечно, более разнородные по уровню, но и более интересные.
Много было разного рода читерства. В частности, из 7 постеров на тему SR висело всего 3 (т.е. авторы 4 не только не приехали, но даже не стали ни с кем договариваться повесить свои постеры — о времена, о нравы!!! 🤷♂️), а приехали (считая нас!) только авторы 2 докладов из 7! Во-вторых, часто свободные места занимали соседи под свои постеры других секций (чтобы они висели большее число раз). Были даже случаи, когда люди вешали постеры rejected докладов 🤯🙈😁. Ну и забавно читерили на воркшопах. На последнем видео видно, как кто-то повесил постер на двери (самое ходовое место). И такое было не раз) 😂
В общем, мы живем в уникальное время. Идет девятый вал статей, созданных в обнимку с агентами. Скорость исследований объективно быстро растет и удержаться на переднем крае становится все сложнее! Тем выше будут цениться те, кто сможет и сможет хорошо!
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
@vgcourse
Выкроил время дописать про ICLR)
Итак, как уже писал ICLR в прошлом году вышел 2 место среди ИИ конференций по числу участников и организовать такое непросто. В обычные Conference Centers поместиться уже сложно, поэтому был арендован Exhibition Center — место проведения выставок. Там был некоторый дефицит площадок для обычных секций, зато места для постеров было очень много. Вошло бы еще в 5-10 раз больше постеров легко. Есть куда расти! 😂
Из каких-то высших соображений ICLR перемешивают постеры (размещают их без кластеризации по темам), поэтому, если хочешь по своей или интересующей теме постеры обежать, приходилось наматывать натурально километры (у меня часы показывали 20, 26 и даже 30 тысяч шагов в день).
Еще в прошлом году я считал, что в какой-то момент наступит насыщение А* статьями и будет выход на плато, как это было с прошлыми хайпами, например, хайпом 3D в 2010-2015 годах. В этом году стало совершенно очевидно, что в этот раз все будет по-другому. На конференции на глаз было видно много "статей с длинными названиями", когда скрещивание ужа с ежом поставлено на поток, ощутимо автоматизировано и позволяет клепать статьи тоннами (там море fake science, особенно на небольших датасетах).
В этой ситуации остро стоит вопрос "Как сделать, чтобы тебя заметили среди тысяч работ?" (когда твоя работа висит всего 3 часа и дальше сменяется следующей). Старый добрый научный приоритет перестает работать, когда на одну А* конференцию принимается одновременно несколько статей с одинаковой идеей (таких случаев стало много). Какую из них цитировать? Которая выделилась! Причем достаточно небольшого приоритета по цитатам в самом начале, как новые статьи с цитатами съедаются поисковиками и модельками и дальше в
Короче! Второе фото — человек сделал постер в стиле аниме серии Fate (😲🤯😁 спорная идея, но постер точно необычный). Дальше мой фаворит — шикарный дизайнерский постер со стилизацией под стол, на котором слева лежит почти "классический" постер к статье, справа иллюстрации применения метода, зеленая лампа и даже boarding pass билетов в Рио 😂. Дальше прикольный синий постер с мостами Шредингера. Кто-то необычно одевался 🙈😂. Дальше видео перед началом нашей постерной секции, Женя понял, что надо делать постер совершенно по-другому (наша секция прошла неплохо, кстати, и мы даже не звали к себе в чатике на 300 русскоязычных участников, где народ кидал, чтобы не так скучно было стоять). Забавно, что один товарищ из США не получил визу в Бразилию (нам виза была не нужна) и 3 часа презентовал через прикрепленный к постеру планшет))).
Также были постерные секции на воркшопах ICLR (последнее видео) и мне они понравились даже больше. Во-первых, все постеры на смежные темы и обсуждения явно были более плотными и интересными. Во-вторых, общих invited talks было всего 6 и они явно были поражены распространенной сегодня в США болезнью diversity (поэтому докладывали не наиболее крутые, а представители научных меньшинств). В этом плане invited доклады воркшопов были, конечно, более разнородные по уровню, но и более интересные.
Много было разного рода читерства. В частности, из 7 постеров на тему SR висело всего 3 (т.е. авторы 4 не только не приехали, но даже не стали ни с кем договариваться повесить свои постеры — о времена, о нравы!!! 🤷♂️), а приехали (считая нас!) только авторы 2 докладов из 7! Во-вторых, часто свободные места занимали соседи под свои постеры других секций (чтобы они висели большее число раз). Были даже случаи, когда люди вешали постеры rejected докладов 🤯🙈😁. Ну и забавно читерили на воркшопах. На последнем видео видно, как кто-то повесил постер на двери (самое ходовое место). И такое было не раз) 😂
В общем, мы живем в уникальное время. Идет девятый вал статей, созданных в обнимку с агентами. Скорость исследований объективно быстро растет и удержаться на переднем крае становится все сложнее! Тем выше будут цениться те, кто сможет и сможет хорошо!
Stay tuned! 😁
Больше про конференции:
#pro_conferences@vgcourse
@vgcourse
🔥9❤3🤔2