DEKSDEN notes

⚪️ Топ Кодер за свои деньги!

Тут 5.6 не вышла, зато вышел Xiaomi Mimo Code 0.1.0. Штука основана на openCode, идет в комплекте с моделями Сяоми - временно бесплатно Mimo Auto на Mimi v2.5 (не Про!). Есть русская локализация, что конечно странно выглядит - меняется /lang

Что можно отметить? Блог весьма концептуально подает дизайн агента.

▶️ Они сделали управление компьютом при работе агента: встроенный мультисемплинг (режим Max) - включает создание 5 независимых сэмплов решения на каждый ход, причем, модель создает только цепочку размышлений и план вызова тулов, не реализуя саму эту схему. Далее модель выбирает из 5 решений лучшее, и его делает. То есть буквально релизуется поговорка "7 (тут - 5 по дефолту) раз отмерь, один - отрежь!".

▶️ Сразу сделали режим Goal чтобы на самом деле доделывать задачу.

▶️ Предложили заменить JSON вызов тулов на форму CLI вызова как для bash - считают что так лучше. Правда, убедиться что это так пока нельзя, так как они это только придумали, но не сделали. Мысль, в целом, интересная и в меру оригинальная.

▶️ Уперли Dynamic Workflows один в один: и даже js функции названы идентично. Только вот workflow() позволяет большую глубину вложенных вызовов.

▶️ Unlimited Context: агентный цикл состоит из основного агента (работает как обычно) и writer агента, который постоянно пишет состояние сессии на диск. Как только заполняется контекст, основной агент сбрасывает контекст и восстанавливает его по записям от writer. Они назвали это циклом (cycle). Говорят, что не делают handoff при приблежении к полному заполнению контекста, потому что способности модели с ростом контекста деградируют, и полный контекст модель обрабатывает сильно хуже чем неполный. Логично. Чекпоинты с сохранением состояния они делают на 20%, 45% и 70% контекста.

👉 Также они вывели, что основной агент хуже ведет лог работы, чем специализированный - потому что лог его отвлекает. Тоже логично. Чекпоин состоит из 11 пунктов (типичный handoff файл, который во мнгих флоу присутствует). checkpoint.md называется этот уровень памяти - сессионный лог.

👉 Проектная память - в memory.md: архитектура, правила, тех факты. Writer поднимает в этот слой факты, когда они присутствуют в нескольких чекпоинтах как стабилизированные решения.

👉 Глобальная память: на уровне профиля пользователя - применяется ко всем проектам.

👉 История: база данных всех сессий (полный трейс, сообщения и тулколы), с индексированием. Агент может обратиться к этой памяти, если данных нет в других слоях памяти.

👉 Памятью заниается только writer агент, у основного агента доступ read only. Но у основного агента есть notes.md файл - это записная книжка для агента (scratchpad), в которую он может записывать что-то, что ему кажется важным. На каждом чекпоинте writer агент анализирует содержимое этого файла, и, при необходимости, поднимает содержимое по уровням памяти, очищая записную книжку.

👉 Ребилд контекста при новом цикле: список todo - чекпоинт - последние сообщения пользователя (без сжатия, чтобы не утерять/не исказить намерения и задачи пользователя) - memory.md - global memory - notes -

▶️ Само-развивающаяся система: предыдущий раздел - это работа агента на уровне агентного хода / сессии.

Агент ведет память проекта в виде md файлов. Логика - в возможности пользователя смотреть чего там агент упомнил про проект. Система ведет полнотекстовый индекс для ускорения чтения этих файлов.

Dream: каждый 7 дней обслуживается файл памяти - специальный агент читает сессии, фай памяти, верифицирует пути, выполняет дедупликацию, мержи, поднимает знания в глбальную память.

Distill: каждые 30 дней специальный агент аткже читает все сессии, но "достает" оттуда не знания, а процессы - и обновляет скиллы, CLI команды, кастомных агентов, и прочие такие штуки.

... окончание там: https://t.me/deksden_notes/858

@deksden_notes

1👍13🔥9❤2

1.45K viewsedited 20:18