Sinекура

Побывал на летней школе "Управление, информация и оптимизация" имени Бориса Теодоровича Поляка. Огромное спасибо Александру Гасникову за приглашение! Я ещё обязательно напишу, а пока просто выложу первую часть своей лекции, их тут стримили и выкладывали в прямом эфире.

Сейчас тут, кстати, в том же прямом эфире круглый стол начинается.)

https://vkvideo.ru/video-56385969_456239619

VK Видео

AI Safety: Готовы ли мы к сильному искусственному интеллекту. Часть 1.

Лекция старшего научного сотрудника ПОМИ РАН Сергея Николенко в рамках XVI традиционной молодёжной школы «Управление, информация и оптимизация» имени математика Бориса Поляка. Организаторы — Университет Иннополис и МФТИ при поддержке Т-Банка. Нас можно найти…

🔥22❤2👍2

2.3K viewsedited 14:00

Sinекура

К школе имени Поляка ещё вернусь, пока у меня продолжается довольно безумное время с частыми перебоями с интернетом. Но пятничный пост по расписанию! На этой неделе вот школа Jam's cool выложила (не прошло и полугода :) ) ещё один пост с моей пианинкой.

Кстати, самонадеянно кажется, что даже за эти несколько месяцев у меня пианинка стала немножко получше, тут, конечно, весьма грустно всё это звучит. Но уж что есть.)

Пост на стене школы

Видеоклип напрямую

0:52

Школа музыки Jam`s cool (Джем скул) СПб on VK Clips

Dream A Little Dream of Me 🎹 - Сергей Николенко

❤36🔥12👍7😍3

2.23K viewsedited 08:52

Sinекура

Возвращаюсь из Тулы, где был большой и традиционный ЧГК-турнир "Ultima Tule". Играл за команду ff, и хочу сказать, что это было очень круто. Серёжа, Лёша, Руслан, Дима, Денис, спасибо огромное за приглашение, доверие и потрясающую атмосферу!! Играть с вами было чертовски приятно — зовите ещё!

Результаты тоже не подкачали: мы заняли третье место в командной "Своей игре", выиграли командную игру на скорость без фальстартов (брейн, но без фальстартов) и разделили 2-3 место с легендарным "Миражом" в основной дисциплине, с очень большим отрывом как от победившего "Борского корабела" (что неудивительно), так и от четвёртого места (что уже куда приятнее): 74-66-66-60. Даже проигранная перестрелка за второе место совершенно не испортила настроение.

А по пути на место игр в Туле была большая барахолка, причём даже не в каком-то отдельном месте вроде рынка, а буквально вдоль одной из улиц, два или три квартала подряд. Обнаружил там кипу журналов "Крокодил" из начала восьмидесятых по 50 рублей штука и тут же, конечно, купил целую пачку. Обожаю такие вещи.)

🔥21❤15👍4🤓2

2.11K views18:05

Sinекура

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Я говорил, что будут интересные новости про Synthesis AI — и вот они! Synthesis AI сделал pivot в сторону порождения видео, и теперь мы будем называться Mach Labs.

Сайт Mach Labs

Этот проект развивается уже достаточно долго, и я могу показать кое-какой уникальный контент. Вот посмотрите, в каком мире мы живём прямо сейчас. Для создания этих видео я приложил одну свою стандартную фотографию, которую и здесь прилагаю, наговорил секунд тридцать голосом по-английски (совершенно другой текст, чем в видео, я просто rambled for a bit), а затем дал запрос породить видео с заданным текстом:

Hello everyone! This is a test video that I am generating with Mach Labs. This is my voice, and this is my picture, but the video is totally fake. Enjoy!

Больше ничего делать не понадобилось. Enjoy, как говорится. Мимика и жестикуляция на мои не идеально похожи, но модель и не видела моей мимики, у неё было только одно статичное фото. Кстати, насколько я понимаю, вы и сами можете попробовать: если зарегистрироваться на сайте, можно получить тестовые кредиты, которых хватит для создания нескольких видео подобного размера.

Как думаете, мы (человечество) полностью готовы к тому, что даже вот эта одна конкретная технология, не самая важная и не самая страшная, уже сейчас работает хорошо, а скоро станет работать совсем замечательно?..

😱29🔥24❤6👏2🆒2

2.64K views10:01

Sinекура

В субботу 5 июля CS Space, то самое возрождение прекрасной идеи Computer Science Club, в котором я в марте делал инаугурационные лекции (State of AI и State of AI Safety), организует митап: "LLM в математике и алгоритмах" Я там, кажется, главный гвоздь программы.…

Обещал, что договорюсь — и договорился! Завтра в 11 часов утра организаторы митапа должны добавить ещё мест в регистрацию, специально для моих читателей. Тсссссс...

❤15🔥5👍4🥰2

2.02K views19:17

Sinекура

В июне прошёл интересный спор, вызванный статьёй от исследователей из Apple "The Illusion of Thinking". Спор привлёк внимание таких известных исследователей, как C. Opus и G. Pro, а также вышел на весьма любопытный мета-уровень, так что я написал об этом небольшой пост:

The Illusion of The Illusion of The Illusion of Thinking

Tl;dr — никакого потрясения основ из этой статьи, конечно, не получилось. В ней нашлись очень смешные ошибки (читайте пост, если ещё не в курсе), а рассуждающие модели как работали, так и работают. Это оказался даже не то чтобы хороший пример jagged frontier возможностей LLM, о котором действительно есть смысл говорить.

Но кажется, что случай интересный: во-первых, он породил интересную дискуссию, а во-вторых, в этой дискуссии уже открытым текстом слышен голос языковых моделей. Кажется, и академический мир уже не будет прежним...

❤17👍3

2.4K viewsedited 10:41

Sinекура

Sinекура pinned a photo

09:51

Sinекура

Пятничный пост снова про игры, всего две, но обе симпатичные.

The Operator

Маленькая, на четыре часа, но весьма интересная история. Вы становитесь "оператором" федерального бюро FDI (видимо, комбинация FBI и CIA), то есть ваша задача — помогать агентам FDI с поиском информации, "пробивать по базам", пытаться совмещать разные данные и так далее.

Что понравилось — в первую очередь сама история. Хотя каждый персонаж здесь максимально клиширован (опытный полевой агент-техасец, начинающий агент-девушка, взламывающий всё на свете кулхацкер и т.д.), в сюжете есть пара крутых твистов, которые я не буду спойлерить. Следить за развитием событий было интересно.

Что не понравилось — то, что хотя игра пытается создать впечатление игрового процесса, по сути ты тут именно что следишь за развитием событий. Загадки тривиальные, плюс тебе всегда рад подсказать шеф, никаких выборов ты ни в какой момент не делаешь, отказаться от кое-каких "заманчивых предложений" на самом деле нельзя, и вся история едет по рельсам к интересной, но единственной развязке. Но в целом безусловно рекомендую, игра точно не успевает наскучить.

Harold Halibut

Ужасно милая игра, very, very cute. Первое и главное — это, конечно, стиль. Студия Slow Bros, оправдывая своё название, делала её двенадцать лет: сначала собирались сделать прямо stop motion анимацию, но потом всё-таки оцифровали свои куклы. Но все куклы и обстановка реально были сделаны физически! В итоге получился уникальный художественный стиль, который я по задумке, объёму работы и результату могу сравнить разве что с The Neverhood.

Во-вторых, история, точнее даже не столько история, сколько персонажи. Заглавный персонаж, Гарольд, — разнорабочий на космической станции, который всем помогает делать то, на что им жалко тратить время. Ему уже, кажется, под тридцать, он совсем не глуп и часто задаётся вопросом о том, неужели это и есть его место в жизни и предназначение. И все остальные персонажи тоже хорошо прописаны, колоритны и снабжены отличными полностью озвученными диалогами.

Всё это происходит на космической станции, которая улетела с Земли, потому что на Земле становилось невозможно жить. Этот ковчег человечества так и не нашёл полностью пригодной для жизни планеты и в итоге застрял на одной из планет под водой с неочевидными шансами выбраться. Но тем временем на Земле всё наладилось, так что все глобальные события в игре тоже поднимают ту же тему бессмысленности жизни. А дальше эта тема развивается и приходит к кульминации через новые твисты, которые я спойлерить не буду.

Минусов здесь два. Во-первых, всё очень медленно. Показательно, что игра даже не подсказывает, где там кнопка бега; она есть, но её всё равно недостаточно. Ты всё время бегаешь туда-сюда и смотришь непропускаемые анимации перехода между локациями (поездки по их Tube). Во-вторых, совсем нет геймплея, причём по неясным причинам. По форме это квест, там есть задания, и есть даже мини-игры, которые очень приятно оформлены; авторам ничего бы не стоило сделать настоящий разнообразный и интересный квест. Но абсолютно все задания и все мини-игры совершенно тривиальны; не в смысле "загадки для детей", а в смысле буквального отсутствия загадок: приди в указанное место, поговори с человеком, rinse, repeat. Даже мини-игры тоже такие: человек тебе говорит, какие три кнопки надо нажать, а потом... ты их нажимаешь!

Но эти минусы не мешают насладиться игрой. Просто понимайте, что подписываетесь на медленный и расслабленный симулятор ходьбы, и наслаждайтесь редкой красоты арт-стилем, ламповой кукольной анимацией, интересным сюжетом и прекрасной озвучкой.

❤10👍6✍1👀1

1.81K views13:26

Sinекура

Вчерашний митап "LLM в математике и алгоритмах" прошёл категорически успешно. Напишу о нём, когда появятся хорошие фотографии, а сейчас расскажу вам о квизе, который я для митапа подготовил и провёл. Вот полная версия поста:

Люди против роботов: пьеса в трёх модальностях

Идея была в том, чтобы сделать такой квиз, на котором LLM смогут соревноваться с людьми, и ни у людей, ни у "роботов" не будет заведомого преимущества. Про один из туров — обычное ЧГК из базы — у меня особых сомнений не было: хотя я ещё в октябре 2024 года заметил, что рассуждающие LLM могут играть в ЧГК, тут пока несложно найти вопросы, на которых заведомого преимущества не будет. Например, у всех LLM сложно с игрой в буквы, потому что токены с буквами не сходятся (да, считать r в strawberry тоже сложно именно по этой причине), а если это ещё и по-русски происходит, то вообще, скорее всего, до свидания.

Но хотелось и как-то разнообразить программу, например сделать туры с разными модальностями. Это бы тоже могло оказаться сложным или хотя бы интересным для LLM. Спросил об этом Claude... и, конечно, тут же получил прекрасные идеи. Вот буквально под номерами 1 и 2 шли идеи, которые в итоге и попали в квиз (рис. 2).

Так что для второго тура я подобрал несколько интересных фотографий рукописей великих математиков. Получилось, кажется, действительно интересное задание (см в посте и презентации примеры).

А со звуком опять попросил Claude написать код, который этот звук сгенерирует — и он, конечно же, без проблем справился. Правда, в итоге выяснилось, что эту конкретную идею всё-таки Claude не сам придумал, а взял из "Sound of Sorting" Тимо Бингманна, так что звуки алгоритмов поиска я сгенерировал, а для алгоритмов сортировки взял из готового видео.

Квиз мы больше нигде играть не будем, так что вот, выкладываю финальную презентацию:

Квиз против LLM — LLM в математике и алгоритмах — 5 июля 2025 года

И вот на рис. 3 результаты (ссылка на таблицу).

Как и ожидалось, LLM было сложно со звуком: Claude просто не принимает звук на вход, так что из раунда был дисквалифицирован, а вот o3-pro и o4-mini-high, казалось бы, всё поняли, но почему-то ответов правильных дали мало. На рис. 4 o3-pro идеально разложил аргументы про алгоритмы сортировки (аудио можно послушать в видео)... но почему-то все перепутал, я даже засомневался, не было ли какой ошибки в названиях файлов.

С картинками LLM справились почти идеально, в этом они куда лучше людей. Только задание про первую языковую модель Андрея Андреевича Маркова вызвало серьёзные проблемы у LLM — справился только o3-pro, а остальные писали что-то про криптографию.

А вот с ЧГК получилось, как я и ожидал, по-разному. Например, вот первый вопрос:

Алгоритм Дейкстры позволяет искать в графе кратчайшие пути, начинающиеся в стартовой вершине. Есть вариант его запуска из стартовой и конечной вершин одновременно. Юрий Натаров предложил для этой модификации в название алгоритма добавить четыре буквы. Какие?

Здесь я ожидал, что с буквами будут проблемы, и действительно, из LLM не взял никто; правда, проблемы оказались скорее с юмором и пониманием сути ЧГК, потому что почти все модели ответили Bidi от bidirectional, что логично, но совершенно не смешно и не повод для вопроса. Лучше всех здесь снова выступила o3-pro — её идея не соответствует форме вопроса, но это всё равно гениально; см. рис. 5.

В посте ещё пару примеров привожу, здесь уже не помещается.

А в целом вышло так, что только o3-pro по сумме трёх раундов победила всех человеков. Да и то скорее за счёт того, что картинки рукописей o3-pro скорее всего подгугливала, и запретить ей это не получалось. Но очевидно, что этот фронтир тоже потихоньку движется вперёд; надеюсь, что LLM скоро всё-таки смогут и юмор понимать, и буквы переставлять, и вообще станут полноценными ЧГК-помощниками и тренерами.

В этом уж точно нет ничего апокалиптического, сплошные плюсы.

❤27🔥17🎉2

2.08K views09:13

About

Blog

Apps

Platform