Почему ваши промпты не работают стабильно?
А о чем вы вообще спрашиваете?
Проблема языка – один из наибольших вызовов при разработке и внедрении AI на бэкенд и в бизнес-процессы.
Когда вы последний раз не понимали какие-то части из того, что написано в документе ваших коллег?
Я – сегодня.
Точно так же и входные данные для LLM могут содержать неоднозначности.
Например, словосочетание "обработать запрос" может много чего значить.
Распарсить JSON? Валидировать входные данные? Если да, то по каким правилам? Или извлечь сущности? Сформировать ответ? В каком формате?
Вот так, по ходу разработки, мы неформально отвечаем себе на подобные вопросы связанные с "целью", и так же неформально формируем контекст.
Все неоднозначности нашего собственного понимания перетекают в промпт.
Как правило, чем специфичнее область, в которую мы пытаемся внедрить AI, тем сложнее будет добиться высокой точности в результатах.
Что с этим делать?
Хорошая новость в том, что договариваться можно. И с людьми и с языковыми моделями.
Начинайте с глоссария.
Перед тем как писать промпты (и вообще разрабатывать систему) - выпишите ключевые термины и сущности вашего домена.
Дайте им точные определения. Убедитесь что каждая сущность определяется однозначно на естественном языке.
Не "обработать запрос", а "распарсить JSON, валидировать по схеме X, извлечь поля A, B, C".
Чем точнее и формальнее язык - тем стабильнее будет результат.
Важно этот глоссарий утвердить и со своими коллегами, со всей командой, со специалистами прикладной области.
Тогда вам, как разработчику AI системы, будет проще договориться и с бизнесом, и с LLM.
***
Если вам нужна помощь на любом из шагов – от валидации идеи до проектрования архитектуры, вы можете оставить здесь заявку на консультацию.
А о чем вы вообще спрашиваете?
Проблема языка – один из наибольших вызовов при разработке и внедрении AI на бэкенд и в бизнес-процессы.
Когда вы последний раз не понимали какие-то части из того, что написано в документе ваших коллег?
Я – сегодня.
Точно так же и входные данные для LLM могут содержать неоднозначности.
Например, словосочетание "обработать запрос" может много чего значить.
Распарсить JSON? Валидировать входные данные? Если да, то по каким правилам? Или извлечь сущности? Сформировать ответ? В каком формате?
Вот так, по ходу разработки, мы неформально отвечаем себе на подобные вопросы связанные с "целью", и так же неформально формируем контекст.
Все неоднозначности нашего собственного понимания перетекают в промпт.
Как правило, чем специфичнее область, в которую мы пытаемся внедрить AI, тем сложнее будет добиться высокой точности в результатах.
Что с этим делать?
Хорошая новость в том, что договариваться можно. И с людьми и с языковыми моделями.
Начинайте с глоссария.
Перед тем как писать промпты (и вообще разрабатывать систему) - выпишите ключевые термины и сущности вашего домена.
Дайте им точные определения. Убедитесь что каждая сущность определяется однозначно на естественном языке.
Не "обработать запрос", а "распарсить JSON, валидировать по схеме X, извлечь поля A, B, C".
Чем точнее и формальнее язык - тем стабильнее будет результат.
Важно этот глоссарий утвердить и со своими коллегами, со всей командой, со специалистами прикладной области.
Тогда вам, как разработчику AI системы, будет проще договориться и с бизнесом, и с LLM.
***
Если вам нужна помощь на любом из шагов – от валидации идеи до проектрования архитектуры, вы можете оставить здесь заявку на консультацию.
Запустил автономного AI-агента на VPS.
Да, тот самый дырявый openclaw, игнорировать его не удалось🤔
Он работает 24/7, и интерфейс связи со мной – телеграм бот (удобно!)
Имя Ku и аватарку бот себе придумал сам (ну или почти сам.)
Впрочем возможно это КУ и такое 🔔
Если попытаться выделить основную его задачу... Сейчас ее можно назвать, например – "Knowledge management automation".
Ужасное имя, ничего не понятно, лучше – “AI based Exocortex”!
Но этого тоже мало, поэтому расскажу немного деталей!
Из какого функционала состоит система:
- Индексирует документы из моего Obsidian с синхронизацией каждые 15 мин (их там счет на сотни, тысячи еще вроде бы нет).
- Ещё через тот же Obsidian на сервер попадает выжимка по моей работе, собираемая с лаптопа Claude Code агентом с MCP Pieces.
- Туда же, отдельной под-директорией попадает журнал из LogSeq(я начал его использовать недавно для быстрых записей, мышления письмом по книгам и руководствам которые я изучаю. Удобнее чем raycast notes или мобильный обсидиан)
- В довесок он собирает дайджесты с arXiv, почтовых рассылок, и блогов разнообразных и уважаемых учёных – утром и вечером.
- Из всей этой красоты агент извлекает концепты и некоторым образом строит связи
- А еще – генерирует flashcards и с нормальным spaced repetition (FSRS) дважды в день проводит мне quiz-сессии, отмечая что и насколько хорошо я вспоминаю.
- Ну и наконец – Ku публикует инсайты в собственный телеграм канал @ku_notes
Инсайты тоже можно назвать "собственными", потому что у агента есть отдельные кроны/задачи для исследований/размышлений/"самопознаний", результаты которых он отслеживает и собирает в отдельной директории. Конечно не теряя доступ к моему хранилищу, и тому что он высосал из почты и блогов, но тут нет жестких ограничений – темы для исследований он выбирает сам, хотя я и могу подкидывать идейки.
Между “собственными” инсайтами бота и моей личной базой знаний есть жесткая граница. “Свои” инсайты Ku не может просто так добавлять в Obsidian – это read-only копия, и единый источник истины все еще в моем локальном репозитории.
Этот банк пополняется мной, моим мышлением письмом. На случай если Ku вдруг совершит какое-то чудо открытие и поделится им со мной, способ попасть в банк концептов / flashcard's есть лишь один – через мои мозги, через то самое мышление письмом.
***
Ещё несколько интересных решений которые вокруг/внутри этой истории работают:
1. Конечно же я сразу набил ему "голову" минимальным [FPF](https://github.com/ailev/FPF) 🙂 Ku, кстати, дистиллировал спецификацию FPF сам себе в skill-pack. Возможно я этот скилл рассмотрю ближе, и потихоньку доделаю под универсальное использование с другими агентами.
2. MemSkill-inspired память – навыки извлечения эволюционируют через фидбек. Да, это очень свежая папира, и Ku после своей сессии размышлений по FPF предложил внедрить – я помучал вопросами и одобрил! Круть!
3. Есть механизм "Состязательной рефлексии" – один процесс генерит тезисы/идеи, другой ищет контр-доказательства и критикует.
4. Pieces интеграцию стоит упомянуть еще раз (никто же поссылкам не жмет!). Pieces это local-first(с оговоркой) комбайн с визуальными модельками, который смотрит на все что вы делаете и записывает себе в память. Там есть дескопный интерфейс, и MCP – собирает вполне себе глубокий рабочий контекст. В дизайн Ku очень хорошо зашло. Ух, теперь не только для демо митов буду использоваться с запросом "Аааэээ чо я делал весь спринт кроме xyz?", теперь Ku смотрит что я делал, находит связи с кусками из дайджестов, или моими мыслями/записями/постами из Обсидиан и говорит – "Смари чо нашел, это возможно интересным образом вязано!"
Почему все это не такой уж и rocket science:
- OpenClaw даёт солидную базу автономности из коробки, не смотря на всего его несовершенства.
- Opus достаточно умён, а все процессы достаточно просты, сегрегированны и чётко описаны чтобы эффективно им следовать
- Хватает дешёвого VPS — 2cpu/4gb
- Obsidian vault = просто файловая система, а rsync, fswatch и прочие микро-автоматизации на сервере и вашем компе делаются элементарно.
Да, тот самый дырявый openclaw, игнорировать его не удалось
Он работает 24/7, и интерфейс связи со мной – телеграм бот (удобно!)
Имя Ku и аватарку бот себе придумал сам (ну или почти сам.)
Если попытаться выделить основную его задачу... Сейчас ее можно назвать, например – "Knowledge management automation".
Ужасное имя, ничего не понятно, лучше – “AI based Exocortex”!
Но этого тоже мало, поэтому расскажу немного деталей!
Из какого функционала состоит система:
- Индексирует документы из моего Obsidian с синхронизацией каждые 15 мин (их там счет на сотни, тысячи еще вроде бы нет).
- Ещё через тот же Obsidian на сервер попадает выжимка по моей работе, собираемая с лаптопа Claude Code агентом с MCP Pieces.
- Туда же, отдельной под-директорией попадает журнал из LogSeq
- В довесок он собирает дайджесты с arXiv, почтовых рассылок, и блогов разнообразных и уважаемых учёных – утром и вечером.
- Из всей этой красоты агент извлекает концепты и некоторым образом строит связи
- А еще – генерирует flashcards и с нормальным spaced repetition (FSRS) дважды в день проводит мне quiz-сессии, отмечая что и насколько хорошо я вспоминаю.
- Ну и наконец – Ku публикует инсайты в собственный телеграм канал @ku_notes
Инсайты тоже можно назвать "собственными", потому что у агента есть отдельные кроны/задачи для исследований/размышлений/"самопознаний", результаты которых он отслеживает и собирает в отдельной директории. Конечно не теряя доступ к моему хранилищу, и тому что он высосал из почты и блогов, но тут нет жестких ограничений – темы для исследований он выбирает сам, хотя я и могу подкидывать идейки.
Между “собственными” инсайтами бота и моей личной базой знаний есть жесткая граница. “Свои” инсайты Ku не может просто так добавлять в Obsidian – это read-only копия, и единый источник истины все еще в моем локальном репозитории.
Этот банк пополняется мной, моим мышлением письмом. На случай если Ku вдруг совершит какое-то чудо открытие и поделится им со мной, способ попасть в банк концептов / flashcard's есть лишь один – через мои мозги, через то самое мышление письмом.
***
Ещё несколько интересных решений которые вокруг/внутри этой истории работают:
1. Конечно же я сразу набил ему "голову" минимальным [FPF](https://github.com/ailev/FPF) 🙂 Ku, кстати, дистиллировал спецификацию FPF сам себе в skill-pack. Возможно я этот скилл рассмотрю ближе, и потихоньку доделаю под универсальное использование с другими агентами.
2. MemSkill-inspired память – навыки извлечения эволюционируют через фидбек. Да, это очень свежая папира, и Ku после своей сессии размышлений по FPF предложил внедрить – я помучал вопросами и одобрил! Круть!
3. Есть механизм "Состязательной рефлексии" – один процесс генерит тезисы/идеи, другой ищет контр-доказательства и критикует.
4. Pieces интеграцию стоит упомянуть еще раз (никто же поссылкам не жмет!). Pieces это local-first
Почему все это не такой уж и rocket science:
- OpenClaw даёт солидную базу автономности из коробки, не смотря на всего его несовершенства.
- Opus достаточно умён, а все процессы достаточно просты, сегрегированны и чётко описаны чтобы эффективно им следовать
- Хватает дешёвого VPS — 2cpu/4gb
- Obsidian vault = просто файловая система, а rsync, fswatch и прочие микро-автоматизации на сервере и вашем компе делаются элементарно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Минусы – OpenClaw жутко навайбкоженый тормоз с кучей issues, часто может залипать – вроде бы асинхронные кроны, ан нет – блокируют поток gateway процесса, куча security рисков – так что надо быть очень осторожным и думать над каждой интеграцией и штукой, куда вы ему даёте доступ 🙂
Какая-то часть этих проблем сообществом починится, но о них нужно помнить. Особенно про безопасность!
---
В общем наблюдаем за экспериментом в @ku_notes – он туда пишет почаще чем я сюда😏
LLM "стилёк" конечно прослеживается, но у меня не поворачивается язык назвать последние посты откровенным слопом. Ну и эволюция блога/стиля письма/своих инструкций это одна из главных задач Ku!
p.s. Это не всё что делает Ku, но всё прочее — тайна 🤫
Какая-то часть этих проблем сообществом починится, но о них нужно помнить. Особенно про безопасность!
---
В общем наблюдаем за экспериментом в @ku_notes – он туда пишет почаще чем я сюда
LLM "стилёк" конечно прослеживается, но у меня не поворачивается язык назвать последние посты откровенным слопом. Ну и эволюция блога/стиля письма/своих инструкций это одна из главных задач Ku!
p.s. Это не всё что делает Ku, но всё прочее — тайна 🤫
Please open Telegram to view this post
VIEW IN TELEGRAM
Привет! Я запускаю на канале (эксклюзивно в тг) новую рубрику – #не_дай_себя_одурачить
Будем разбираться с попсовыми статьями и терминами, которые ну очень уж легко разносятся разработчиками по пространству, особенно когда их публикуют авторитетные бренды (тыц раз, тыц двас)
Цель не “поругать маркетинг”, а переводить хайп на инженерный язык:
что за идеи покрыты на самом деле (и как они называлась раньше)?
что вообще реально нового?
какие предпосылки, условия должны быть истинны, чтобы это работало?
где границы применимости и какие риски вы получите, если тупо поверите на слово?
***
Зачем эта рубрика нужна? Затем что я искренне желаю вам успеха во внедрении AI в бекенд и бизнес процессы!
Ибо самая дорогая ошибка сейчас это не “не знать термин”, а строить системы по красивым статьям и утверждениям, которые не достаточно упорно проверяют собственные обещания.
p.s. первый пост сегодня чуть позже!
Будем разбираться с попсовыми статьями и терминами, которые ну очень уж легко разносятся разработчиками по пространству, особенно когда их публикуют авторитетные бренды (тыц раз, тыц двас)
Цель не “поругать маркетинг”, а переводить хайп на инженерный язык:
что за идеи покрыты на самом деле (и как они называлась раньше)?
что вообще реально нового?
какие предпосылки, условия должны быть истинны, чтобы это работало?
где границы применимости и какие риски вы получите, если тупо поверите на слово?
***
Зачем эта рубрика нужна? Затем что я искренне желаю вам успеха во внедрении AI в бекенд и бизнес процессы!
Ибо самая дорогая ошибка сейчас это не “не знать термин”, а строить системы по красивым статьям и утверждениям, которые не достаточно упорно проверяют собственные обещания.
p.s. первый пост сегодня чуть позже!
Добрый вечер!
#не_дай_себя_одурачить – Контекстные Графы!
Пост вышел чуть-чуть за рамки лимитов телеграм, поэтому милости прошу на мой сайт или на substack для иноземным языком обладающих.
TL:DR – «Контекстные графы решат проблему с организационной памятью» – одна из самых опасных полуправд в сфере AI на данный момент.
Да, они могут помочь и часто помогают (графы вообще круты!)
Но без разрешения идентификации, версионирования, контроля доступа/хранения и хотя бы какого-то подтверждения подлинности они быстро превращаются в классную машину заблуждений.
Я выделил 5 критических точек отказа и практический микро-чеклист, которым вы можете проверить себя и свой контекстный граф, прежде чем доверять ему в аудитах или рабочих процессах принятия решений.
Спасибо! 🤗
#не_дай_себя_одурачить – Контекстные Графы!
Пост вышел чуть-чуть за рамки лимитов телеграм, поэтому милости прошу на мой сайт или на substack для иноземным языком обладающих.
TL:DR – «Контекстные графы решат проблему с организационной памятью» – одна из самых опасных полуправд в сфере AI на данный момент.
Да, они могут помочь и часто помогают (графы вообще круты!)
Но без разрешения идентификации, версионирования, контроля доступа/хранения и хотя бы какого-то подтверждения подлинности они быстро превращаются в классную машину заблуждений.
Я выделил 5 критических точек отказа и практический микро-чеклист, которым вы можете проверить себя и свой контекстный граф, прежде чем доверять ему в аудитах или рабочих процессах принятия решений.
Спасибо! 🤗
Пару недель гоняю OpenClaw на VPS как полевой эксперимент: хочется понять, насколько хайповый "автономный агент" реально выдерживает многозадачность?
Ниже – наблюдения и выводы как системного инженера.
Выводы печальные. Но без разочарования! примерно этого я и ожидал.
Картина (у меня и у нескольких знакомых) повторяется. Пока у тебя 1–2 крона можно ок жить.
Как появляется N кронов – всё становится нестабильно: странные тормоза/залипания, иногда фатальные вплоть до ручного перезапуска(А — автономность).
И нет, установка в gateway параметра maxConcurrentRuns в 20 не спасает навсегда.
Кстати, почему этот параметр по умолчанию стоит в 1? Это (и другие решения решения) вызывают не смешанные, а вполне негативные чувства.
Корень зла, имхо, не столько в архитектуре, сколько в реализации – gateway слишком легко превращается в узкое горлышко и единую точку отказа.
Плюс слишком слабая само-наблюдаемость, даже после перезапуска "умный автономный агент" часто не может сам разобраться, что пошло не так и кормит нас выдумками, безосновательными предположениями.
Часть знакомых на вопрос "поставили ли вы OpenClaw?" просто пожала плечами и ответили что-то вроде:
«да я давно себе навайбкодил примерно то же самое на питоне, и бот в телегу там тоже подключен…».
Почему никто это не выкладывал в опенсорс –интересный современный антропологический вопрос!
Кажется, у многих (особенно хороших в вайбкодинге и вайб-проектировании) ребят есть такой когнитивный баг:
«да это же элементарно, каждый сам себе навайбкодит за пару часов, лол» 😄
***
Я пока продолжаю пользоваться клешнёй – есть несколько сценариев, где она реально приносит пользу, как минимум:
• авто-напоминалка / авто-опрашивалка под repetitive learning концепций из моей базы знаний
(раньше это был менее автоматизированный пайплайн: агент + микро-MCP с гибридным поиском и логикой на ноуте)
• псевдо-«умная» библиотека: сохраняет статьи/книги в память + раскладывает файлами “под себя”
и каждый вечер это всё улетает в GitHub (OpenClaw сам себя пушит)
Ну и, собственно, пока всё.
Остальное либо совсем скучно, либо тупо не всегда хорошо работает без серьезных доделок.
Кстати у меня уже больше недели в закрытой разработке свой автономный агент: многим (да немногим!) похож на OpenClaw, но с внутренними процессами, вдохновлёнными системным мышлением, и память там пытается быть first-class citizen, далеко сложнее чем агрегации маркдаун файлов с простеньким rag.
Большая часть кода готова, но времени допинать/допроверить сейчас вот вообще не хватает – хотя доделывать точно надо!
Я не обещаю, что оно будет в open source с открытой лицензией
И вот еще что, автономность штука прекрасная.
Есть ряд продовых задач, куда в той или иной степени, но автономных агентов мы давно втыкаем.
Изменил ли тут что то OpenClaw? Есть ли шанс что я когда нибудь буду использовать его для решения ответственных задач как платформу/фреймворк? Очевидный ответ – никогда. В текущей реализации – ни за что на свете 🙂
Все подобные задач лучше закрываются конкретными реализациями, чем универсальным зверем – диким и не совсем здоровым.
OpenClaw же для любого интересного и успешного использования всегда предполагает какое-то само-допиливание, а нормальных интерфейсов для такого допиливания у него пока нет.
"Skills creator" и прочее скорее задатки. До сих пор нет нормального способа жёстко задавать конкретное множество скилов/тулов для cron-агентов. Жуть.
Больше минусов, чем плюсов.
Не думаю, что без фактического переписывания OpenClaw в ближайшее время эволюционирует в адекватную базу.
Если вы ещё не мучались с этой штукой, но очень интересно – сначала спросите себя:
(1) зачем он мне на самом деле?
(2) могу ли я это мое "зачем" удовлетворитель сам навайбкодив и задеплоить как узкую автоматизацию?
Обычно ответы экономят время, нервы и вычислительные ресурсы.
Ниже – наблюдения и выводы как системного инженера.
Выводы печальные. Но без разочарования! примерно этого я и ожидал.
Картина (у меня и у нескольких знакомых) повторяется. Пока у тебя 1–2 крона можно ок жить.
Как появляется N кронов – всё становится нестабильно: странные тормоза/залипания, иногда фатальные вплоть до ручного перезапуска
И нет, установка в gateway параметра maxConcurrentRuns в 20 не спасает навсегда.
Кстати, почему этот параметр по умолчанию стоит в 1? Это (и другие решения решения) вызывают не смешанные, а вполне негативные чувства.
Корень зла, имхо, не столько в архитектуре, сколько в реализации – gateway слишком легко превращается в узкое горлышко и единую точку отказа.
Плюс слишком слабая само-наблюдаемость, даже после перезапуска "умный автономный агент" часто не может сам разобраться, что пошло не так и кормит нас выдумками, безосновательными предположениями.
Справедливости ради: в моих тестах на том же VPS Claude Code такие поломки чинит в сто крат бодрее.
Часть знакомых на вопрос "поставили ли вы OpenClaw?" просто пожала плечами и ответили что-то вроде:
«да я давно себе навайбкодил примерно то же самое на питоне, и бот в телегу там тоже подключен…».
Почему никто это не выкладывал в опенсорс –интересный современный антропологический вопрос!
Кажется, у многих (особенно хороших в вайбкодинге и вайб-проектировании) ребят есть такой когнитивный баг:
«да это же элементарно, каждый сам себе навайбкодит за пару часов, лол» 😄
***
Я пока продолжаю пользоваться клешнёй – есть несколько сценариев, где она реально приносит пользу, как минимум:
• авто-напоминалка / авто-опрашивалка под repetitive learning концепций из моей базы знаний
(раньше это был менее автоматизированный пайплайн: агент + микро-MCP с гибридным поиском и логикой на ноуте)
• псевдо-«умная» библиотека: сохраняет статьи/книги в память + раскладывает файлами “под себя”
и каждый вечер это всё улетает в GitHub (OpenClaw сам себя пушит)
Ну и, собственно, пока всё.
Остальное либо совсем скучно, либо тупо не всегда хорошо работает без серьезных доделок.
Кстати у меня уже больше недели в закрытой разработке свой автономный агент: многим (да немногим!) похож на OpenClaw, но с внутренними процессами, вдохновлёнными системным мышлением, и память там пытается быть first-class citizen, далеко сложнее чем агрегации маркдаун файлов с простеньким rag.
Большая часть кода готова, но времени допинать/допроверить сейчас вот вообще не хватает – хотя доделывать точно надо!
И вот еще что, автономность штука прекрасная.
Есть ряд продовых задач, куда в той или иной степени, но автономных агентов мы давно втыкаем.
Изменил ли тут что то OpenClaw? Есть ли шанс что я когда нибудь буду использовать его для решения ответственных задач как платформу/фреймворк? Очевидный ответ – никогда. В текущей реализации – ни за что на свете 🙂
Все подобные задач лучше закрываются конкретными реализациями, чем универсальным зверем – диким и не совсем здоровым.
OpenClaw же для любого интересного и успешного использования всегда предполагает какое-то само-допиливание, а нормальных интерфейсов для такого допиливания у него пока нет.
"Skills creator" и прочее скорее задатки. До сих пор нет нормального способа жёстко задавать конкретное множество скилов/тулов для cron-агентов. Жуть.
Больше минусов, чем плюсов.
Не думаю, что без фактического переписывания OpenClaw в ближайшее время эволюционирует в адекватную базу.
Если вы ещё не мучались с этой штукой, но очень интересно – сначала спросите себя:
(1) зачем он мне на самом деле?
(2) могу ли я это мое "зачем" удовлетворитель сам навайбкодив и задеплоить как узкую автоматизацию?
Обычно ответы экономят время, нервы и вычислительные ресурсы.
Claude Code выкатили ремоут контрол.
Подмяли еще одну oss фичу разных утилит, которые работали с переменным успехом (вроде этой жути)
Вообще хорошо! вам больше не нужны ngrok туннели и прочее sshd безобразие на рабочей станции, чтобы отойти от нее и продолжить работу в том же окружении.
Вектор безопасности, как принято, мало кого интересует, но сандбоксинг файловой системы там все таки есть!
Кто там mac mini для опенкло купил? Вот теперь будет дополнительный толк)))
Отключаете сандбоксинг и через одну сессию ремоут контрола управляете всем чем хотите😕
CC не хочет нас отпускать в Codex App, коллеги!
Подмяли еще одну oss фичу разных утилит, которые работали с переменным успехом (вроде этой жути)
Вообще хорошо! вам больше не нужны ngrok туннели и прочее sshd безобразие на рабочей станции, чтобы отойти от нее и продолжить работу в том же окружении.
Вектор безопасности, как принято, мало кого интересует, но сандбоксинг файловой системы там все таки есть!
Кто там mac mini для опенкло купил? Вот теперь будет дополнительный толк)))
Отключаете сандбоксинг и через одну сессию ремоут контрола управляете всем чем хотите
CC не хочет нас отпускать в Codex App, коллеги!
Please open Telegram to view this post
VIEW IN TELEGRAM
В следующую пятницу в час дня по мск будем с Родионом разбираться что такое FPF, как его применять в программной разработке (и вообще как применять)!
Вспомним quint-code и другие потуги загнать FPF понятия и методы в прикладные утилиты.
Добавляйте в календарь!
Вспомним quint-code и другие потуги загнать FPF понятия и методы в прикладные утилиты.
Добавляйте в календарь!
GitHub
GitHub - ailev/FPF: First Principles Framework (FPF): Pattern language and core specification for admissible action in problematic…
First Principles Framework (FPF): Pattern language and core specification for admissible action in problematic engineering, research, and mixed human/AI work. - ailev/FPF
Добрый день уважаемые подписчики!
Завтрашний стрим с Родионом пришлось перенести на понедельник, будет в то же время – 13:00 по МСК (должна быть запись 🙂
А еще на этой неделе на ту же тему мы записали подкаст с Александром Пахомовым (@toxic_enterprise), но немного с другого ракурса – более концептуального чтоли. Должен выйти в течении 1-2 недель.
С Родионом же мы постараемся сфокусироваться на прикладном применении FPF (хотя это сложно, еще и в сжатые сроки стрима😨 ), повторюсь про разные попытки притянуть FPF в агентскую разработку, почему они провалились и что с этим всем делать дальше.
А еще в понедельник после стрима будет дроп документа вроде небольшой методички, в которой будут все ссылки и описание основных подходов работы с FPF полезных для инженерных и инжерено-менеджерских задач💖
Завтрашний стрим с Родионом пришлось перенести на понедельник, будет в то же время – 13:00 по МСК (должна быть запись 🙂
А еще на этой неделе на ту же тему мы записали подкаст с Александром Пахомовым (@toxic_enterprise), но немного с другого ракурса – более концептуального чтоли. Должен выйти в течении 1-2 недель.
С Родионом же мы постараемся сфокусироваться на прикладном применении FPF (хотя это сложно, еще и в сжатые сроки стрима
А еще в понедельник после стрима будет дроп документа вроде небольшой методички, в которой будут все ссылки и описание основных подходов работы с FPF полезных для инженерных и инжерено-менеджерских задач
Please open Telegram to view this post
VIEW IN TELEGRAM
Привет!
Во-первых – поздравляю всех девушек с Международным женским днём!🪷
Во-вторых, и к сожалению – мы вынуждены снова переносить стрим с Родионом…
Потому что у меняпроклятый ковид и отпускать он меня не планирует, особенно если я не начну отдыхать 😳
я был готов вещать через сопли и кашель, но голос разума Родиона остановил безумие😎
Предварительная дата – +1 понедельник (16 марта).
Ставь Гарольда если переносы надоели🥲
Во-первых – поздравляю всех девушек с Международным женским днём!
Во-вторых, и к сожалению – мы вынуждены снова переносить стрим с Родионом…
Потому что у меня
я был готов вещать через сопли и кашель, но голос разума Родиона остановил безумие
Предварительная дата – +1 понедельник (16 марта).
Ставь Гарольда если переносы надоели
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Лаборатория Математики и Программирования Сергея Бобровского
Супер-синхронизм: мой конца февраля пост про DSL
"как нейронки агенты использовать, чтобы писать в 1000 раз компактный код (любые технологии фреймворки, не важно), и чтобы человек уровня миддл мог реализовывать проекты любой сложности, сохраняя её рост линейным."
А 4 марта выходит мощный пейпер "A Generalized Algebraic Theory for Type Theory with Explicit Universe Polymorphism" учёных четырёх европейских университетов (я уже говорил не раз, что все годы придерживаюсь подходов именно европейской школы computer science, она сегодня топчик). Это математическая теория для создания DSL, и при этом строго в рамках теории типов! В самой статье DSL не упоминается, это как-то слишком приземлённо, но разбирается именно это, просто на более высоких уровнях абстракции.
Конкретную программу пишем на DSL, и этот язык предметной области формально описывается мета-системой (GAT из статьи), которая описывается мета-мета-системой (Алан Кэй: "Lisp isn't a language, it's a building material").
И вот наконец данная работа развивает эту идею до математического абсолюта: GAT/CwF позволяют создавать языки с формально доказанными свойствами, и отсюда мы попадаем и в существенно облегчённую формальную верификацию, и суперпродуктивную работу с нейронками, которые так здорово понимают лингвистически формализованные бизнес-темы, генеря реально хороший код.
Алан Кэй мечтал о системах, где:
- всё есть язык (объекты общаются сообщениями);
- можно менять систему на лету (мета-программирование);
- система может описывать саму себя.
Пейпер добавляет к этому:
- система может математически доказать свою корректность;
- любой DSL, описанный в этом мета-языке, наследует все эти гарантии!
Это мета-инструмент для создания инструментов -- способ легко и просто делать языки/фреймворки, в которых ошибки (включая ошибки кодогенерации нейронками) невозможны в принципе!
=
Сама статья даёт категорный взгляд на синтаксис и правила вывода, позволяющий строить т.н. "начальные" модели и доказывать их единственность через общую алгебраическую теорию (GAT) (в рамках MLTT например). "Начальные" - это по сути математический объект, где синтаксис языка (то, что пишет программист) однозначно соответствует его семантике (тому, что происходит при выполнении).
Обобщение многосортных алгебраических теорий: сорта и операторы могут иметь зависимые типы, позволяет описывать синтаксис и правила типизации как сигнатуру с уравнениями.
CwF (Category with Families): категориальная модель зависимых типов.
Индексация уровнями, уровни вселенных организуются как untyped cwf (явный полиморфизм). Вы же помните мой трек по HoTT? :)
Каждая теория представляется как GAT. Синтаксис -- это начальная модель. Категориальная абстракция устраняет зависимость от конкретных правил вывода. Связь с Second-Order Generalised Algebraic Theories, Quotient Inductive-Inductive Types, Logical Frameworks...
Метод применим вообще к любым формальным дедуктивным системам!!
=
Когда вы пишете DSL на Racket или Scala, RoR или Haskell, вы полагаетесь на свой опыт, тесты и code review, и всё. Даже в Template Haskell нету гарантий корректности.
Когда мы описываем DSL через GAT (как в статье), мы получаем
- математическую гарантию, что наш DSL корректен;
- автоматическую верификацию всех программ на этом DSL;
- наследование свойств через иерархию мета-уровней.
Это и есть та самая "meta-system" Алана Кэя, доведённая до логического и математического совершенства.
"как нейронки агенты использовать, чтобы писать в 1000 раз компактный код (любые технологии фреймворки, не важно), и чтобы человек уровня миддл мог реализовывать проекты любой сложности, сохраняя её рост линейным."
А 4 марта выходит мощный пейпер "A Generalized Algebraic Theory for Type Theory with Explicit Universe Polymorphism" учёных четырёх европейских университетов (я уже говорил не раз, что все годы придерживаюсь подходов именно европейской школы computer science, она сегодня топчик). Это математическая теория для создания DSL, и при этом строго в рамках теории типов! В самой статье DSL не упоминается, это как-то слишком приземлённо, но разбирается именно это, просто на более высоких уровнях абстракции.
Конкретную программу пишем на DSL, и этот язык предметной области формально описывается мета-системой (GAT из статьи), которая описывается мета-мета-системой (Алан Кэй: "Lisp isn't a language, it's a building material").
И вот наконец данная работа развивает эту идею до математического абсолюта: GAT/CwF позволяют создавать языки с формально доказанными свойствами, и отсюда мы попадаем и в существенно облегчённую формальную верификацию, и суперпродуктивную работу с нейронками, которые так здорово понимают лингвистически формализованные бизнес-темы, генеря реально хороший код.
Алан Кэй мечтал о системах, где:
- всё есть язык (объекты общаются сообщениями);
- можно менять систему на лету (мета-программирование);
- система может описывать саму себя.
Пейпер добавляет к этому:
- система может математически доказать свою корректность;
- любой DSL, описанный в этом мета-языке, наследует все эти гарантии!
Это мета-инструмент для создания инструментов -- способ легко и просто делать языки/фреймворки, в которых ошибки (включая ошибки кодогенерации нейронками) невозможны в принципе!
=
Сама статья даёт категорный взгляд на синтаксис и правила вывода, позволяющий строить т.н. "начальные" модели и доказывать их единственность через общую алгебраическую теорию (GAT) (в рамках MLTT например). "Начальные" - это по сути математический объект, где синтаксис языка (то, что пишет программист) однозначно соответствует его семантике (тому, что происходит при выполнении).
Обобщение многосортных алгебраических теорий: сорта и операторы могут иметь зависимые типы, позволяет описывать синтаксис и правила типизации как сигнатуру с уравнениями.
CwF (Category with Families): категориальная модель зависимых типов.
Индексация уровнями, уровни вселенных организуются как untyped cwf (явный полиморфизм). Вы же помните мой трек по HoTT? :)
Каждая теория представляется как GAT. Синтаксис -- это начальная модель. Категориальная абстракция устраняет зависимость от конкретных правил вывода. Связь с Second-Order Generalised Algebraic Theories, Quotient Inductive-Inductive Types, Logical Frameworks...
Метод применим вообще к любым формальным дедуктивным системам!!
=
Когда вы пишете DSL на Racket или Scala, RoR или Haskell, вы полагаетесь на свой опыт, тесты и code review, и всё. Даже в Template Haskell нету гарантий корректности.
Когда мы описываем DSL через GAT (как в статье), мы получаем
- математическую гарантию, что наш DSL корректен;
- автоматическую верификацию всех программ на этом DSL;
- наследование свойств через иерархию мета-уровней.
Это и есть та самая "meta-system" Алана Кэя, доведённая до логического и математического совершенства.
Forwarded from AI-Driven Development. Родион Мостовой
Сегодня в 13:00 по МСК мы проводим митап как раз на тему системного мышления и его применения в SDD - Иван Закутный (@neuralstack) расскажет нам про FPF (First Principle Framework) операционную систему мышления для LLM и как он на основе FPF сделал обвязку для Claude Code, набравшую более 1000 звёзд на GitHub.
Добавляйте встречу в календарь, чтобы не пропустить: https://luma.com/z0hnbsnl
Добавляйте встречу в календарь, чтобы не пропустить: https://luma.com/z0hnbsnl
fpf_meet_notes.md
16.6 KB
Ну вот и прошел наш стрим! Как мне кажется вышло вполне не плохо!
Мы отошли в некоторой степени (примерно на половину) от моего плана, но все равно получилось здорово!
Отдельное спасибо Анатолию Игоревичу за поддержку в чате! Про FPF и системное мышление очень тяжело говорить, особенно когда ты далеко от хотя бы какой то квалификации в последнем🙏
Для всех кто слушал подкаст, вот обещанная "методичка", а на самом деле минимальная напоминалка об FPF и шаги с которых вы можете начать прямо сегодня.
На днях я дополнительно напишу пост, проговорю все что хотел по плану стрима, плюс планы на сам quint-code – почему я его воскрешаю и как думаю его развивать!
***
Подписывайтесь на Канал Родиона AI-Driven Development
Забирайте FPF Simple Skill
Пробуйте Quint Code
Оригинал FPF Спецификации Анатолия Левенчука
Больше ссылок, напоминалки и примеры промптов в прикрепленном маркдауне.
stay tuned как говорится, и спасибо за ваше внимание 💖
Мы отошли в некоторой степени (примерно на половину) от моего плана, но все равно получилось здорово!
Отдельное спасибо Анатолию Игоревичу за поддержку в чате! Про FPF и системное мышление очень тяжело говорить, особенно когда ты далеко от хотя бы какой то квалификации в последнем
Для всех кто слушал подкаст, вот обещанная "методичка", а на самом деле минимальная напоминалка об FPF и шаги с которых вы можете начать прямо сегодня.
На днях я дополнительно напишу пост, проговорю все что хотел по плану стрима, плюс планы на сам quint-code – почему я его воскрешаю и как думаю его развивать!
***
Подписывайтесь на Канал Родиона AI-Driven Development
Забирайте FPF Simple Skill
Пробуйте Quint Code
Оригинал FPF Спецификации Анатолия Левенчука
Больше ссылок, напоминалки и примеры промптов в прикрепленном маркдауне.
stay tuned как говорится, и спасибо за ваше внимание 💖
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы вдруг послушали вчерашний подкаст и побежали пробовать quint-code – остановитесь!
Потому что переписывание квинткода пошло куда быстрее и лучше, чем я думал.
Версия 5(которая сейчас в dev ветке – намек поняли?) переделана в плане интерфейса более чем полностью!
Фрикций меньше, easy-mode есть, онбординг проще! Раньше квинт код затащить в brownfield было сложнее, а теперь... А теперь только пальцем покажи!
По поводу фрейма – если раньше QC был ADI focused, то теперь тут на первом месте ProblemOps – у вас все идет от проблем! Сначала вы ее фреймите, потом углубляетесь в нее. Или не углубляетесь, квинткод сам скажет – "эээ, бро, ну это совсем trivial, давай, может, сразу пофиксим и запишем артефакт decision?"
И таки пофиксит! И запишет! То есть "автодокументация" из старого квинта все еще остается. И довелась до ума фишка с устареванием артефактов – тут будет RefreshOps!
Мне очень нравится, что получается. Я уже во всю использую nightly сборку и для догфудинга, и для рабочих проектов.
Я думаю, что на этой неделе 5 версия выкатится в main официально 🙂
А дальше – больше! У меня уже есть наполеоновские планы куда делать ходы чтобы "штука" была более FPF complient.
И все это с более человеческим UX, который вас не карает. Никаких фашиствующих стейт машин.
да, все еще придется разобраться в этом интерфейсе – что там за команда, в каком порядке и примерно для чего их вызывать надо... но это много проще, и даже если не разобраться, базовый
В общем огонь!
Потому что переписывание квинткода пошло куда быстрее и лучше, чем я думал.
Версия 5
Фрикций меньше, easy-mode есть, онбординг проще! Раньше квинт код затащить в brownfield было сложнее, а теперь... А теперь только пальцем покажи!
По поводу фрейма – если раньше QC был ADI focused, то теперь тут на первом месте ProblemOps – у вас все идет от проблем! Сначала вы ее фреймите, потом углубляетесь в нее. Или не углубляетесь, квинткод сам скажет – "эээ, бро, ну это совсем trivial, давай, может, сразу пофиксим и запишем артефакт decision?"
И таки пофиксит! И запишет! То есть "автодокументация" из старого квинта все еще остается. И довелась до ума фишка с устареванием артефактов – тут будет RefreshOps!
Мне очень нравится, что получается. Я уже во всю использую nightly сборку и для догфудинга, и для рабочих проектов.
Я думаю, что на этой неделе 5 версия выкатится в main официально 🙂
А дальше – больше! У меня уже есть наполеоновские планы куда делать ходы чтобы "штука" была более FPF complient.
И все это с более человеческим UX, который вас не карает. Никаких фашиствующих стейт машин.
да, все еще придется разобраться в этом интерфейсе – что там за команда, в каком порядке и примерно для чего их вызывать надо... но это много проще, и даже если не разобраться, базовый
/q-reason теперь умет в "основной" FPF.В общем огонь!
Добрый вечер, я – диспетчер пятой версии Quint Code 🎉
Кто-то ждал этого так долго, что уже перестал ждать.
Кто-то (я) не ждал этого вообще и похоронил Quint Code в мыслях и сердце своем
уже как месяц-другой (я во всю уже собирался делать standalone cli agent – но зачем?), пользовался
В общем есть много чего почитать:
• Обновленный лендинг -> https://quint.codes/
• Длиннопост на русском который я обещал на стриме у Родиона
• Длиннопост на английском там же или на SubStackПОДПИШИСЬ 💗
TL;DR – оно стало лучше; Оно стало тем чем должно было быть с самого начала. И есть куда расти!
Пока я обновлял лендинг, свой сайт и дописывал письмо – уже почти готова 5.1.0🤣 – но все подробности читайте по ссылкам выше!
С вас – поделиться с другом, я ведь не только для себя QC делаю, чем больше будет фидбека тем лучше оно станет.
Впрочем идея standalone режима не мертва🤫
Кто-то ждал этого так долго, что уже перестал ждать.
Кто-то (я) не ждал этого вообще и похоронил Quint Code в мыслях и сердце своем
уже как месяц-другой (я во всю уже собирался делать standalone cli agent – но зачем?), пользовался
FPF-Spec.md + Чатик, и мечтал об "умном агенте инженере но так чтобы и мозги не делал мне, и по FPF умел когда надо..."В общем есть много чего почитать:
• Обновленный лендинг -> https://quint.codes/
• Длиннопост на русском который я обещал на стриме у Родиона
• Длиннопост на английском там же или на SubStack
TL;DR – оно стало лучше; Оно стало тем чем должно было быть с самого начала. И есть куда расти!
Пока я обновлял лендинг, свой сайт и дописывал письмо – уже почти готова 5.1.0
С вас – поделиться с другом, я ведь не только для себя QC делаю, чем больше будет фидбека тем лучше оно станет.
Впрочем идея standalone режима не мертва
Please open Telegram to view this post
VIEW IN TELEGRAM
Темпы разработки quint code ужасают и радуют.
Все идеи, которые я вынашивал 2 месяца, вымысливал письмом в личные заметки, в разные проекты, несчетные deep-researches – все это сейчас обрастает структурой. Это конечно не конвергенция технологий, но явление концептуально похожее! Просто в микроскопическом масштабе.
Во вчерашнем письме я рассказываю про потенциальный roadmap, но как-то мямлю о том что "ну этого всего может и не будет..."
Будет, как не быть!
Solo-dev это круто, инди хакер, все дела. Но огромное число людей работают в командах, поэтому тут нужен и problem-ops для каждого киборга (человек + его агент), и коллективная база знаний (желательно мутирующая, со всем RefreshOps и остальной красотой которую обещает текущая версия квинткода в разработке).
5.1.0 посидит в dev еще какое то время, потому что кроме spec coverage туда приедет миграция. Мы выносим sqlite базу из репы и делаем ее центральной, это уже ход на то что quint-code у вас скоро начнет собирать в одном месте не просто спеки из разных реп, но и будет стремиться собирать "общую базу lessons-learned" по всем вашим проектам, своего рода гибридный контекст.
Все это пока еще будет только для solo dev mode, basic – назовем его так. Следующий шаг на team dev-ex неминуемо принесет второй процесс для центрального сервера, который будет крутиться демоном. Сделаю это все конечно красиво, чтобы устанавливалось и разворачивалось по людски, без мамбо джабо с докер контейнерами и прочей морально устаревшей, тяжелой фигней.
Этот процесс все еще можно будет запускать локально "только для себя, моя прелесть🌟 ".
Зачем отдельный процесс а не просто в общую базу лить? Ну, во-первых, там неминуемо будут конфликты.
Во-вторых, центральный сервер-мозг открывает нам кучу новых возможностей, за которые правда придется заплатить некоторым количеством шекелей/токенов. Но это уже совсем другая история 🙂
UPD: про шекели/токены это я имел в виду про "заплатите сами за доп LLM фичи", BYOK и все дела. Если я в какой то момент сделаю quint-cloud, очень маловероятно что там будут какие то only paywall фичи.
Все то же самое, что можно развернуть своими руками – Open Core здорового человека💗
Все идеи, которые я вынашивал 2 месяца, вымысливал письмом в личные заметки, в разные проекты, несчетные deep-researches – все это сейчас обрастает структурой. Это конечно не конвергенция технологий, но явление концептуально похожее! Просто в микроскопическом масштабе.
Во вчерашнем письме я рассказываю про потенциальный roadmap, но как-то мямлю о том что "ну этого всего может и не будет..."
Будет, как не быть!
Solo-dev это круто, инди хакер, все дела. Но огромное число людей работают в командах, поэтому тут нужен и problem-ops для каждого киборга (человек + его агент), и коллективная база знаний (желательно мутирующая, со всем RefreshOps и остальной красотой которую обещает текущая версия квинткода в разработке).
5.1.0 посидит в dev еще какое то время, потому что кроме spec coverage туда приедет миграция. Мы выносим sqlite базу из репы и делаем ее центральной, это уже ход на то что quint-code у вас скоро начнет собирать в одном месте не просто спеки из разных реп, но и будет стремиться собирать "общую базу lessons-learned" по всем вашим проектам, своего рода гибридный контекст.
Все это пока еще будет только для solo dev mode, basic – назовем его так. Следующий шаг на team dev-ex неминуемо принесет второй процесс для центрального сервера, который будет крутиться демоном. Сделаю это все конечно красиво, чтобы устанавливалось и разворачивалось по людски, без мамбо джабо с докер контейнерами и прочей морально устаревшей, тяжелой фигней.
Этот процесс все еще можно будет запускать локально "только для себя, моя прелесть
Зачем отдельный процесс а не просто в общую базу лить? Ну, во-первых, там неминуемо будут конфликты.
Во-вторых, центральный сервер-мозг открывает нам кучу новых возможностей, за которые правда придется заплатить некоторым количеством шекелей/токенов. Но это уже совсем другая история 🙂
UPD: про шекели/токены это я имел в виду про "заплатите сами за доп LLM фичи", BYOK и все дела. Если я в какой то момент сделаю quint-cloud, очень маловероятно что там будут какие то only paywall фичи.
Все то же самое, что можно развернуть своими руками – Open Core здорового человека
Please open Telegram to view this post
VIEW IN TELEGRAM
Ринат запустил эстафету "Код есть? А если найду?", ко мне она приехала от Кости
Ну ладно, давайте искать.
Только я решил сделать дашбордик (буду его периодически пересобирать).
Меня Сэнсей учил выпендриваться🌟
Дашборд сделан CC по всем моим git-репозитории – публичный GitHub, приватные рабочие (и личные) проекты, локальные архивы тоже имеются в выборке (но там мало, и в основном старье за
Итого насчитало: 10,280 коммитов по 160 репозиториев за ~5 лет😨
Quint Code конечно жестко ползет наверх)))
На графике видно что в 2024 я начал сильно уставать🤪
Остальное можете сами посмотреть
👉 https://ivanzakutnii.com/is-commited/ (смотреть с большого экрана)
Передаю эстафету: @ai_driven и @itpepper
Ну ладно, давайте искать.
Только я решил сделать дашбордик (буду его периодически пересобирать).
Меня Сэнсей учил выпендриваться
Дашборд сделан CC по всем моим git-репозитории – публичный GitHub, приватные рабочие (и личные) проекты, локальные архивы тоже имеются в выборке (но там мало, и в основном старье за
2022-2023). Итого насчитало: 10,280 коммитов по 160 репозиториев за ~5 лет
Quint Code конечно жестко ползет наверх)))
На графике видно что в 2024 я начал сильно уставать
Остальное можете сами посмотреть
👉 https://ivanzakutnii.com/is-commited/ (смотреть с большого экрана)
Передаю эстафету: @ai_driven и @itpepper
Please open Telegram to view this post
VIEW IN TELEGRAM
Тут доехала до релиза запись подкаста с Александром
мы писали его примерно за неделю до стрима с Родионом, так что по меркам происходящего сейчас это уже голос из далекого далекого прошлого!
Там у меня не было веры в воскрешение Quint Code, поэтому если будете слушать – слушайте помня об этом
Из других новостей:
Люди пользуются Quint Code: кто-то в первый раз, кто-то, увидев, что оно наконец стало более дружелюбным на фоне прошлых версий, возвращается. И все несут вопросы: кто про онбординг – "а что с ним делать?", кто про внутрянку – "а оно там так, как надо, или руки не дошли доделать?"
Все понятно – нужна нормальная документация с большим количеством примеров использования, с более подробным описанием установки и онбординга.
А, ой уже готово!
А еще сегодня ближе к ночи будет релиз версии 5.1, сразу с обновленной документацией кучи новых добавлений и исправлений :)
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Тысяча фичей
63. Системное мышление для инженера.
Как инженеру остаться у кормушки в 2026?
В гостях Иван Закутний @neuralstack автор https://github.com/m0n0x41d/quint-code
--
Авторский тгк Саши @toxic_enterprise
Альтер эго Саши @sashimi_pub
--
🎧 Слушать в Apple Podcasts | Spotify | Яндекс | браузер
Как инженеру остаться у кормушки в 2026?
В гостях Иван Закутний @neuralstack автор https://github.com/m0n0x41d/quint-code
--
Авторский тгк Саши @toxic_enterprise
Альтер эго Саши @sashimi_pub
--
🎧 Слушать в Apple Podcasts | Spotify | Яндекс | браузер
🚀 quint-code 5.1.0
Мы строили строили и наконец!
Что там внутри:
Codebase Awareness – квинткод теперь видит ваш проект не как набор файлов, а как структуру модулей. Go, TypeScript, Python, Rust – парсит импорты, строит граф зависимостей, показывает какие модули покрыты решениями, а какие нэт. Может быть полезным. Вы же хотите себе доку для каждого модуля?))) Spec Coverage блин!
Когда код под решением меняется – drift detection поднимает флаг в
Cross-Project Recall – решения теперь живут не в репе, а в вашей домашней директории. Фреймите (
Зачаточный Decision Integrity – перед записью решения агент теперь запускает adversarial check, я знаю что модели сами себя критикуют плохо, да еще с тем же контекстом, но это лучше чем ничего (этому есть куда расти в будущем).
Note-Decision Dedup – если агент попробуе записать заметку которая дублирует существующее решение то MCP даст по рукам, поймает и скажет "бро, тут эт, уже есть dec-003, может не надо?"
Ну и дока, к новой версии и еще лучше! И там больше деталей, читайте. Например там про то что quint-code еще и проблем-таск-трекер...)
Миграция с 5.0: quint-code init в каждом проекте. Данные сохранятся, база сама переедет в ~/.quint-code/. Подробности там же в доке.
Что дальше? НУ вообще надо делать нормальный Team mode.
Центральный сервер, один бинарь, PostgreSQL или SQLite на выбор, мысли такие.
Архитектура уже заложена. Но это уже следующая и длиннющая серия.
⭐ github.com/m0n0x41d/quint-code
Мы строили строили и наконец!
Что там внутри:
Codebase Awareness – квинткод теперь видит ваш проект не как набор файлов, а как структуру модулей. Go, TypeScript, Python, Rust – парсит импорты, строит граф зависимостей, показывает какие модули покрыты решениями, а какие нэт. Может быть полезным. Вы же хотите себе доку для каждого модуля?))) Spec Coverage блин!
Когда код под решением меняется – drift detection поднимает флаг в
/q-status. Когда модуль A меняется и от него зависит модуль B – вам тоже об этом должн квинткод сказать.Cross-Project Recall – решения теперь живут не в репе, а в вашей домашней директории. Фреймите (
/q-frame) проблему в проекте B – и вам (вашему агенту, ну в общем) с высокой вероятностью всплывает похожее решение из проекта A, которое вы приняли какое-то время назад. Еще и с пометкой насколько контекст релевантен)))Зачаточный Decision Integrity – перед записью решения агент теперь запускает adversarial check, я знаю что модели сами себя критикуют плохо, да еще с тем же контекстом, но это лучше чем ничего (этому есть куда расти в будущем).
Note-Decision Dedup – если агент попробуе записать заметку которая дублирует существующее решение то MCP даст по рукам, поймает и скажет "бро, тут эт, уже есть dec-003, может не надо?"
Ну и дока, к новой версии и еще лучше! И там больше деталей, читайте. Например там про то что quint-code еще и проблем-таск-трекер...)
Миграция с 5.0: quint-code init в каждом проекте. Данные сохранятся, база сама переедет в ~/.quint-code/. Подробности там же в доке.
Что дальше? НУ вообще надо делать нормальный Team mode.
Центральный сервер, один бинарь, PostgreSQL или SQLite на выбор, мысли такие.
Архитектура уже заложена. Но это уже следующая и длиннющая серия.
⭐ github.com/m0n0x41d/quint-code
quint.codes
Documentation | haft
Decision engineering for AI coding tools.