Sinекура
3.84K subscribers
1.2K photos
18 videos
337 links
Канал Сергея Николенко обо всём, но в основном об AI.

Сайт с выступлениями, лекциями и публикациями: https://sergeynikolenko.ru/
Download Telegram
Забыл запостить фото со вчерашнего семинара.

Доклад был, кстати, очень интересный, и главное, что Александр кучу новых задач поставил, которыми, надеюсь, кто-нибудь у нас в итоге заинтересуется.

#seminar #markovlab #spsu
16👍4🔥2
В четверг в курсе "Введение в глубокое обучение" в ЮФУ продолжали разговоры о всяких разных нейросетевых архитектурах:

ЮФУ — 2026.03.19 — Рекуррентные нейронные сети
(слайды и доска на странице курса)

Рекуррентные сети — это настолько же старая идея, как и свёрточные. В 1980-х и начале 1990-х, правда, обучать их "по-честному", таская градиенты через всю последовательность, было вычислительно очень сложно. Но конструкции были уже вполне современные.

А самую главную конструкцию рекуррентных сетей, которая до сих пор активно используется, — LSTM — придумали Хохрайтер со Шмидхубером ещё в 1995 году, а в совсем современном виде в 2000-м. И что бы потом ни изобретали, LSTM в рекуррентных сетях так и не умер: GRU вот были очень популярны, но потом оказалось, что GRU хороши, быстры и экономны для относительно простых задач, а для сложных всё равно LSTM побеждает (Cahuantzi et al., 2021).

Кстати, на базовых лекциях я об этом не рассказываю, конечно, но было недавнее исследование (Feng et al., 2024), где из LSTM и GRU сделали их мини-версии, которые на удивление хорошо работают! Но это уже надо рассказывать в контексте SSM (state space models), до которых мы явно не дойдём.

Да и сами SSM в целом появились как шаг от трансформеров в сторону рекуррентных сетей. Но это уже всё-таки совсем другая история.

#sfu #lectures #dsfrontiers
7👍3🔥2
С новым контентом сложно, вчера ещё и внезапно разболелся — правда, сегодня уже, тьфу-тьфу, гораздо лучше.

Зато вспомнил про старый контент — OpenTalks.ai выложили фотографии с конференции. Так что вот минутка самолюбования. Первая, по-моему, вообще огонь вышла.)

#events #talks #ai
🔥11😍32👍2💯1
Следующий доклад на семинаре лаборатории Маркова не могу не порекомендовать особенно. Я вчера вспомнил OpenTalks по ассоциации, потому что самой запомнившейся именно научной идеей там была лекция Дмитрия Ветрова об их недавно начавшемся подходе, устанавливающем связь между глубоким обучением (точнее, свойствами стохастического градиентного спуска) и... термодинамикой. Я тогда так впечатлился, что написал пост с введением в эту тему и начал с Дмитрием и его группой более подробно об этом общаться.

И вот к нам на семинар придёт (виртуально) собственно первый автор той статьи, который расскажет обо всём, надеюсь, ещё подробнее и понятнее:

О масштабно-инвариантных нейросетях и идеальных газах
Ссылка на трансляцию (пятница 27 марта, 14:00)

Ильдус Садртдинов (Constructor University, Bremen)

На этом семинаре мы вспомним школьный курс термодинамики и поговорим о модели идеального газа. Оказывается, что у идеального газа есть довольно точная аналогия в мире стохастической оптимизации — масштабно-инвариантные (МИ) нейронные сети.

В отличие от существующих работ по поиску взаимосвязей между термодинамикой и оптимизацией, которые главным образом оперируют с температурой T, мы покажем, что МИ-сети позволяют естественное определение величин давления p и объёма V, а также приводят к уравнению идеального газа pV/T=const (при некоторых ограничениях на матрицу ковариаций шума стохастических градиентов). Подобная аналогия улучшает понимание, как гиперпараметры обучения (такие как learning rate и weight decay) влияют на стационарное распределение стохастического градиентного спуска.

Этот рассказ будет в первую очередь о математической красоте, когда в двух совершенно разных мирах (термодинамике и оптимизации) находятся две по сути одинаковые конструкции.

#markovlab #seminar #spsu
🔥163👍2
В курсе "Графические вероятностные модели" в пятницу была основная лекция про, собственно говоря, графические вероятностные модели:

СПбГУ — 2026.03.20 — Графические модели, фактор-графы, алгоритм передачи сообщений
(слайды и доска, как всегда, на странице курса)

Это классическая идея с очень долгой историей: кажется очень интуитивным нарисовать граф, выражающий, что "одна переменная зависит от другой". Но что это реально математически значит? Зависимость в вероятностном смысле (а нам в итоге нужен именно он, мы же обучать что-то хотим в этом графе) — это не то чтобы однозначно направленное ребро. Да и зависимости и независимости обычно бывают условными: в модели всё со всем связано (иначе зачем она такая нужна), но связано опосредованно, одни переменные связаны через другие.

Графические вероятностные модели — это о том, как всё-таки нарисовать что-то так, чтобы оно имело и наглядный интуитивный смысл, и формальный математический. Бывают направленные и ненаправленные модели, и у них внезапно довольно сложные взаимоотношения: не любые вероятностные предположения можно нарисовать, причём разными моделями можно нарисовать разные случаи. А ещё бывают фактор-графы, и ими уже можно нарисовать всё буквально по определению, но люди как-то больше привыкли рисовать именно направленные модели.

В общем, мы это всё обсудили, и обсудили алгоритм передачи сообщений, которым можно вести точный вывод на фактор-графе, являющемся деревом. Но, конечно, интересные и практически важные графы деревьями обычно не являются, и именно для этого нужен приближённый вывод. Об этом мы начнём говорить в следующий раз.

#spsu #lectures #pgm2026
👍94🔥3😁1
Когда-то давным-давно, в прошлой жизни, я работал в Лаборатории интернет-исследований (ЛИНИС) в питерской ВШЭ, под руководством Олеси и Сергея Кольцовых. Мы занимались чем-то на грани машинного обучения и социологии, лично я в основном делал тогда разного рода тематическое моделирование (поищите здесь "Koltsov", немало всякого найдёте). Было это давно, мы все были куда моложе, и надо сказать, что это было отличное время, и большое Олесе и Сергею спасибо за те годы и то сотрудничество!

После этого на какое-то время мы с Кольцовыми почти потеряли контакт, но в последний где-то год опять его восстановили и продолжаем сотрудничать; надеюсь, смогу вскорости поделиться плодами этого сотрудничества. С тех пор ЛИНИС расширилась и, в частности, породила из своего чрева Лабораторию социальной и когнитивной информатики (СКИЛА).

И вот теперь Сергей меня попросил расшарить их вакансию; если интересуетесь тонкой гранью ML и социальных наук, думаю, дело хорошее.)

=====

Научный сотрудник (постдок)
НИУ ВШЭ, Санкт-Петербург · от 140 000 ₽ (до НДФЛ)

Опыт: от 3 лет · Полная занятость · Срок: 1 год (с продлением)
Подразделение: Лаборатория социальной и когнитивной информатики

Проект: анализ взаимодействия человека с информацией и развитие AI/ML-алгоритмов

Задачи:
• оптимизация нейросетевых моделей (в т.ч. с параметризованными/энтропийными подходами);
• анализ текстовых данных и аффективных состояний;
• интерпретация моделей (визуализация, причины ошибок);
• разработка прототипа AI-сервиса;
• построение воспроизводимых ML-пайплайнов (Hugging Face, ollama, Unsloth, docker).

Требования:
• ученая степень (канд./PhD);
• опыт в ML и математическом моделировании;
• Python, PyTorch, Transformers;
• английский (технический);
• готовность к исследованиям и командной работе.

Дополнительно:
• участие в конференциях, публикациях, open-source;
• наставничество студентов, участие в прикладных проектах.

Условия:
• междисциплинарная команда;
• доступ к HPC (Charisma);
• поддержка научной активности.

Подробности у Сергея Николаевича Кольцова (skoltsov@hse.ru)

#work
12🤡6🤔4🤯2🤣2
Выложил видео последнего доклада с семинара лаборатории Маркова:

CayleyPy-4: AI-Holography. Towards analogs of holographic string dualities for AI tasks
(слайды на странице семинара)

Сложные комбинаторные задачи часто живут на графах состояний, между которыми есть рёбра-переходы. Графы часто будут получаться астрономического размера: представьте себе, например, граф состояний для кубика Рубика, а потом для шахмат, а потом для го... Основная идея CayleyPy (как я её понял) — заменить сложное графовое описание на геометрическое, в котором состояние превращается в путь по многоугольнику / многограннику, а, например, поиск кратчайших путей превращается в площадь между двумя путями.

Это и есть та самая голография (в смысле holographic principle), и из этого, как показывают авторы, могут получаться очень эффективные алгоритмы для решения тех самых задач.

Если честно, более глобальные аналогии, тем паче из теории струн, я из доклада не очень понял, образования не хватило. Но надеюсь, что там тоже есть интересное содержание. А главное — надеюсь, что коллеги заинтересовались, и из этого доклада действительно выйдет некое научное сотрудничество.

#spsu #seminar #markovlab
13👍4🤯1
В пятничном посте сегодня два представителя жанра high weirdness: одна очень крутая, другая — скорее провал. Но обе очень необычные! Пост сокращаю, полный по ссылке:

Странные игры: ENA: Dream BBQ и Dreams of Another

Есть такой жанр игр, в которых на экране происходит буквально чёрт знает что, напоминающее мультфильмы Роберта Саакянца (очень рекомендую!) или эксперименты Терри Гиллиама в Monty Python. Намеренно странные игры, в которых абсурд и хаос становятся основным содержанием.

К этому жанру относятся, например, Hylics, Wattam, Jazzpunk или рассмотренный мной недавно The Norwood Suite. Сегодня — две игры из этого ряда.

ENA: Dream BBQ

Это первая интерактивная часть серии ENA, созданной перуанским аниматором Хоэлем Герра (Joel G). Проект начался в 2020 году как мультсериал на YouTube. [...] Главная героиня ENA — гуманоид с двуцветным телом, чей дизайн вдохновлён картиной Пикассо “Девушка перед зеркалом” и бразильским художником Ромеро Бритто, а движения — фильмами Джеки Чана. Всё понятно?

Визуал здесь — калейдоскопическая смесь всего на свете: эстетика CD-i игр, раннеинтернетная графика, ретро-3D в духе PS1, плоские 2D-персонажи поверх трёхмерных сцен, текстуры из каких-то параллельных реальностей. Всё это круто работает вместе и создаёт какой-то свой особенный визуальный язык. Каждый экран хочется заскринить, и я себе особо не отказывал.

А ещё звук! Точнее, не сам звук в смысле саундтрек — на него я как-то даже не обратил внимания — а диалоги. Каждый персонаж говорит на своём языке: два главных героя ведут диалог один на английском, а другой на японском, есть и экспрессивная итальянская речь, и греческий, и испанский, и даже русский. При этом все друг друга прекрасно понимают. Это очень обаятельно звучит.

Геймплей стандартный: надо ходить и выполнять нехитрые квесты. Главная героиня ENA ищет некоего “Босса”. [...] Главная задача первой части — добраться до туалета. Здесь есть немножко платформинга, немножко головоломок, есть разветвления — но всё это скорее просто повод для того, чтобы показать вам очередную невероятную локацию и познакомить с очередным невероятным персонажем.

Так что да, получил много удовольствия!

Dreams of Another

А вот это high weirdness, на мой взгляд, в плохом смысле слова. Это проект мультимедийного художника Baiyon (Томохиса Курамицу). [...] Издателем выступила Sony, что само по себе уже значит, что это не совсем домашняя поделка.

Игра по сути не игра, а интерактивное искусство, и оно очень, очень старается звучать глубокомысленно. Девиз проекта — “No Creation Without Destruction”, и вся механика построена вокруг этого: вы стреляете из автомата, но автомат здесь не разрушает, а высекает из расплывчатого point cloud объекты окружающего мира.

Концепция, конечно, красивая, и визуальный стиль действительно уникальный — мир построен на тех самых point clouds. [...] Кстати, со многими неживыми объектами здесь можно поговорить, и они выдают “философские” сентенции о смысле бытия. [...]

Вы встретите:
— клоуна, построившего гигантский монумент-кольцо, переплавив обручальные кольца разведённых людей,
— рыбок, которые хотят добраться до океана,
— кротов, чей обряд инициации состоит в том, чтобы забраться на огромный скалодром и прозвенеть в колокол городской башни,
— а главное — странствующего солдата, который не может заставить себя стрелять в людей. [...]

Но всё это длится очень, очень долго. Сценки постоянно повторяют одни и те же места действия, и их надо сначала раскрыть, расстреляв облака точек, что каждый раз занимает по несколько минут...

Признаюсь в грехе: когда я совсем устал от этого псевдофилософствования, я подглядел в прохождение и увидел, что за 2.5 часа я продвинулся только до середины игры. И немедленно бросил.

В общем, держитесь подальше.

#games #tgif
6👍3🥱1