📝 Пост #5. Graph RAG — когда простого поиска недостаточно
Первый пост - что такое RAG
Второй пост - чанки для RAG
Третий пост - Router-LLM
Четвертый пост - Гибридный поиск для RAG
💬 - На первом изображении супер простое пояснение
💬 - На втором то что работает хорошо и то к чему я сейчас стремлюсь разрабатываю ядро Graph Enhanced Realtime Summarization (GERTS) у себя в Orch.so
Где спотыкается классический поиск. Примеры запросов:
- «Кто руководит проектом, где идет диалог про дизайн нового лэндоса?» — нужно 2 прыжка (Чат/задача лендинга → проект → руководитель).
- «Какие главы политики ⚖️ GDPR перекрываются с нашим NDA?» — нужно сопоставить два набора документов.
- Dense / BM25 - SPARSE - дают набор разрозненных чанков и не понимают, как они связаны.
Что даёт граф
- Узлы — сущности (проект, задача, документ).
- Рёбра — отношения («участвует», «руководит», «ссылается»).
- Поиск по графу + текст = мульти-хоп reasoning без галлюцинаций.
- Легко показать путь ответа → повышается доверие.
Мини-pipeline
Быстрый чек-лист внедрения
- Строим KG: Neo4j / AWS Neptune / ArangoDB или любая другая граф ориентированная база данных
- Связываем узлы с ID чанков в векторной базе (Milvus, PgVector and etc)
- GraphRetriever (LangChain) или
- Для многоязычия: храните
- Multi-hop > 3? Летим в recursion: LLM генерирует следующий под-запрос.
Когда точно пригодится
- Cross-project вопросы («Кто ещё использует либу jquery?»).
- Compliance: сопоставление внутренних процедур и внешних регуляций.
- Диагностика багов по цепочке зависимостей.
- Аналитика: «покажи KPI проектов, связанных с клиентом _Рога_и_Корыта_».
Что почитать
- Neo4j — Using a Knowledge Graph to implement a RAG app
- AWS Bedrock GraphRAG
- HopRAG (arXiv 2025)
- KG²RAG / Knowledge-Graph Guided RAG
💬 Следующий пост: выбор моделей и инфраструктуры
Первый пост - что такое RAG
Второй пост - чанки для RAG
Третий пост - Router-LLM
Четвертый пост - Гибридный поиск для RAG
Обычный RAG умеет искать «похожие тексты». Но сложные вопросы — это связи между фактами. Тут в бой идёт граф знаний (Knoweledge graph)
💬 - На первом изображении супер простое пояснение
💬 - На втором то что работает хорошо и то к чему я сейчас стремлюсь разрабатываю ядро Graph Enhanced Realtime Summarization (GERTS) у себя в Orch.so
Где спотыкается классический поиск. Примеры запросов:
- «Кто руководит проектом, где идет диалог про дизайн нового лэндоса?» — нужно 2 прыжка (Чат/задача лендинга → проект → руководитель).
- «Какие главы политики ⚖️ GDPR перекрываются с нашим NDA?» — нужно сопоставить два набора документов.
- Dense / BM25 - SPARSE - дают набор разрозненных чанков и не понимают, как они связаны.
Что даёт граф
- Узлы — сущности (проект, задача, документ).
- Рёбра — отношения («участвует», «руководит», «ссылается»).
- Поиск по графу + текст = мульти-хоп reasoning без галлюцинаций.
- Легко показать путь ответа → повышается доверие.
Мини-pipeline
User query
│
▼
1. Graph traversal (2-3 хопа)
│ ↘ кандидаты узлов
2. Vector search по тексту узлов
│
3. Rerank + цитаты
│
▼
LLM-ответ + путь доказательства
Быстрый чек-лист внедрения
- Строим KG: Neo4j / AWS Neptune / ArangoDB или любая другая граф ориентированная база данных
- Связываем узлы с ID чанков в векторной базе (Milvus, PgVector and etc)
- GraphRetriever (LangChain) или
graph_rag в Bedrock — из коробки. - Для многоязычия: храните
lang в атрибутах узлов и фильтровать на этапе traversal. - Multi-hop > 3? Летим в recursion: LLM генерирует следующий под-запрос.
Когда точно пригодится
- Cross-project вопросы («Кто ещё использует либу jquery?»).
- Compliance: сопоставление внутренних процедур и внешних регуляций.
- Диагностика багов по цепочке зависимостей.
- Аналитика: «покажи KPI проектов, связанных с клиентом _Рога_и_Корыта_».
Что почитать
- Neo4j — Using a Knowledge Graph to implement a RAG app
- AWS Bedrock GraphRAG
- HopRAG (arXiv 2025)
- KG²RAG / Knowledge-Graph Guided RAG
💬 Следующий пост: выбор моделей и инфраструктуры
❤4🔥4👍1
Я обещал статьи про LLM и про GPT, вот первая
Как всегда в след постах будут хронологические ссылки, по ним можно будет прыгать.
Как "Думает" ИИ: А конкретно Большие Языковые Модели - (LLM)?
На западе хайп по ИИ уже очень давно а у нас в православной не так уж. Но зато время уже почти каждый знает что такое ChatGPT, Claude, Gemini и другие чатоподобные штуки с ИИ. Если кратко то это "умные" программы, умеющие писать тексты, отвечать на вопросы, сочинять стихи, делать исследования, писать код и много другое. Их называют Большими Языковыми Моделями (LLM - Large Language Models). Слышать слышали а что это и как это работают не все понимают, а некоторые даже даже приблизительно. Если кому интересно то попробую пояснить на примере... На аналогии животного, например зайца!
Сразу дам несколько терминов и их аналогии из мира животного, нашего зайца.
0. Модель ИИ - Это сам заяц
1. Параметры модели ИИ — Это "Замороженный опыт зайца"
2. Тренировка на данных для ИИ — Это обучение зайца или формирование "Жизненного опыта"
3. Токенизация модели или просто текст — Это цепочка шагов или последовательность действий у зайца.
4. Генерация текста в модели — Это как бы поход или бег зайца по по тропинке.
5. Механизм внимания ИИ — Это когда зайцу нужно было бы вспомнить Всё Важное Сразу при каких то событиях
6. Масштаб данных модели — Это размер и количество знаний в памяти у зайца.
7. Галлюцинации и смещения модели — Это важные Ограничения в работе мозга/памяти зайца
Теперь пояснение что есть что и как работает LLM
1. ИИ — Это "Замороженный Опыт" (Параметры Модели)
- Технический термин: Параметры нейронной сети (миллиарды/триллионы чисел внутри модели).
- Аналогия: Представьте животное, выращенное в уникальных условиях. Всю свою жизнь оно видит определенные пейзажи, слышит звуки, получает пищу в ответ на действия. Этот весь накопленный опыт формирует его мозг — его "настройки". У LLM эти "настройки" — и есть параметры. Их огромное количество (миллиарды или триллионы), и они фиксированы после обучения. Как мозг взрослого животного уже "запрограммирован" его прошлым, так и параметры LLM содержат весь ее "опыт". С людьми +- все тоже самое только в 100500 раз сложнее
Продолжение в следующем посте
Как всегда в след постах будут хронологические ссылки, по ним можно будет прыгать.
Как "Думает" ИИ: А конкретно Большие Языковые Модели - (LLM)?
На западе хайп по ИИ уже очень давно а у нас в православной не так уж. Но зато время уже почти каждый знает что такое ChatGPT, Claude, Gemini и другие чатоподобные штуки с ИИ. Если кратко то это "умные" программы, умеющие писать тексты, отвечать на вопросы, сочинять стихи, делать исследования, писать код и много другое. Их называют Большими Языковыми Моделями (LLM - Large Language Models). Слышать слышали а что это и как это работают не все понимают, а некоторые даже даже приблизительно. Если кому интересно то попробую пояснить на примере... На аналогии животного, например зайца!
Сразу дам несколько терминов и их аналогии из мира животного, нашего зайца.
0. Модель ИИ - Это сам заяц
1. Параметры модели ИИ — Это "Замороженный опыт зайца"
2. Тренировка на данных для ИИ — Это обучение зайца или формирование "Жизненного опыта"
3. Токенизация модели или просто текст — Это цепочка шагов или последовательность действий у зайца.
4. Генерация текста в модели — Это как бы поход или бег зайца по по тропинке.
5. Механизм внимания ИИ — Это когда зайцу нужно было бы вспомнить Всё Важное Сразу при каких то событиях
6. Масштаб данных модели — Это размер и количество знаний в памяти у зайца.
7. Галлюцинации и смещения модели — Это важные Ограничения в работе мозга/памяти зайца
Теперь пояснение что есть что и как работает LLM
1. ИИ — Это "Замороженный Опыт" (Параметры Модели)
- Технический термин: Параметры нейронной сети (миллиарды/триллионы чисел внутри модели).
- Аналогия: Представьте животное, выращенное в уникальных условиях. Всю свою жизнь оно видит определенные пейзажи, слышит звуки, получает пищу в ответ на действия. Этот весь накопленный опыт формирует его мозг — его "настройки". У LLM эти "настройки" — и есть параметры. Их огромное количество (миллиарды или триллионы), и они фиксированы после обучения. Как мозг взрослого животного уже "запрограммирован" его прошлым, так и параметры LLM содержат весь ее "опыт". С людьми +- все тоже самое только в 100500 раз сложнее
Продолжение в следующем посте
❤4👍3🔥3
Пост #2 - про работу LLM на простых аналогиях.
Первый пост - прыг
2. Обучение: Формирование "Опыта" (Тренировка на Данных)
- Технический термин: Обучение на данных (терабайты/петабайты текста из интернета, книг и т.д.).
- Аналогия: Как животное учится в своей среде обитания (находит воду по запаху, прячется от опасности), так LLM "учится", "читая" огромные объемы текста. Она видит триллионы предложений, слов, фраз. Ее задача во время обучения: предсказать, какое слово (токен) будет следующим. Делая это снова и снова, корректируя свои внутренние "настройки" (параметры) на основе ошибок, она выявляет закономерности языка: какие слова часто стоят вместе, как строятся предложения, какие факты связаны. Этот процесс и формирует ее "опыт".
3. Текст = Цепочка Шагов (Токенизация)
- Технический термин: Токенизация (разбиение текста на мелкие части - токены: слова, слоги, символы).
- Аналогия: Представьте, что путь животного по лесу — это цепочка шагов. Каждый шаг ведет к следующему. В LLM любой текст — это тоже цепочка. Но вместо шагов — токены. Ваш вопрос или команда (промпт) сначала разбиваются на эти маленькие кусочки-токены. Это стартовая точка на "тропинке" модели.
4. "Идти по Тропинке" (Генерация Текста)
- Технический термин: Авторегрессивная генерация (предсказание следующего токена на основе предыдущих).
- Аналогия: Вы даете модели промпт (старт). Основываясь на своем "замороженном опыте" (параметрах), модель "видит" перед собой ландшафт возможных "тропинок" — то есть, последовательностей токенов, которые могут следовать за вашим промптом. Каждый ее следующий "шаг" (сгенерированный токен) — это выбор, куда идти дальше в этом ландшафте, исходя из ее "опыта". Она не думает, а следует по наиболее вероятному пути, который заложили в нее параметры, полученные при обучении. Как заяц в знакомой местности инстинктивно выбирает тропу к воде, так LLM "инстинктивно" (статистически) выбирает следующий токен.
5. "Вспомнить Всё Важное Сразу" (Механизм Внимания)
- Технический термин: Самовнимание (Self-Attention) в архитектуре LLM это называется Трансформер.
- Аналогия: Представьте, что животное идет по тропе и видит след хищника. Чтобы понять опасность, ему нужно мгновенно вспомнить весь прошлый опыт, связанный с этим следом, запахом, местностью — даже если это было давно. Механизм внимания в LLM делает нечто подобное! Когда модель генерирует *текущий* "шаг" (токен), она может "оглянуться" на ЛЮБОЙ предыдущий токен в цепочке (промпте и уже сгенерированном тексте) и решить, насколько сильно он важен для выбора *именно этого* следующего шага. Например, для слова "он" в предложении "Кот сел на коврик, потому что он был мягкий", механизм внимания сильно "посмотрит" на слово "коврик". Это позволяет модели учитывать контекст, даже если нужная информация была далеко назад. Это достаточно важный и супер сложный механизм.
Продолжение в след посте
Первый пост - прыг
2. Обучение: Формирование "Опыта" (Тренировка на Данных)
- Технический термин: Обучение на данных (терабайты/петабайты текста из интернета, книг и т.д.).
- Аналогия: Как животное учится в своей среде обитания (находит воду по запаху, прячется от опасности), так LLM "учится", "читая" огромные объемы текста. Она видит триллионы предложений, слов, фраз. Ее задача во время обучения: предсказать, какое слово (токен) будет следующим. Делая это снова и снова, корректируя свои внутренние "настройки" (параметры) на основе ошибок, она выявляет закономерности языка: какие слова часто стоят вместе, как строятся предложения, какие факты связаны. Этот процесс и формирует ее "опыт".
3. Текст = Цепочка Шагов (Токенизация)
- Технический термин: Токенизация (разбиение текста на мелкие части - токены: слова, слоги, символы).
- Аналогия: Представьте, что путь животного по лесу — это цепочка шагов. Каждый шаг ведет к следующему. В LLM любой текст — это тоже цепочка. Но вместо шагов — токены. Ваш вопрос или команда (промпт) сначала разбиваются на эти маленькие кусочки-токены. Это стартовая точка на "тропинке" модели.
4. "Идти по Тропинке" (Генерация Текста)
- Технический термин: Авторегрессивная генерация (предсказание следующего токена на основе предыдущих).
- Аналогия: Вы даете модели промпт (старт). Основываясь на своем "замороженном опыте" (параметрах), модель "видит" перед собой ландшафт возможных "тропинок" — то есть, последовательностей токенов, которые могут следовать за вашим промптом. Каждый ее следующий "шаг" (сгенерированный токен) — это выбор, куда идти дальше в этом ландшафте, исходя из ее "опыта". Она не думает, а следует по наиболее вероятному пути, который заложили в нее параметры, полученные при обучении. Как заяц в знакомой местности инстинктивно выбирает тропу к воде, так LLM "инстинктивно" (статистически) выбирает следующий токен.
5. "Вспомнить Всё Важное Сразу" (Механизм Внимания)
- Технический термин: Самовнимание (Self-Attention) в архитектуре LLM это называется Трансформер.
- Аналогия: Представьте, что животное идет по тропе и видит след хищника. Чтобы понять опасность, ему нужно мгновенно вспомнить весь прошлый опыт, связанный с этим следом, запахом, местностью — даже если это было давно. Механизм внимания в LLM делает нечто подобное! Когда модель генерирует *текущий* "шаг" (токен), она может "оглянуться" на ЛЮБОЙ предыдущий токен в цепочке (промпте и уже сгенерированном тексте) и решить, насколько сильно он важен для выбора *именно этого* следующего шага. Например, для слова "он" в предложении "Кот сел на коврик, потому что он был мягкий", механизм внимания сильно "посмотрит" на слово "коврик". Это позволяет модели учитывать контекст, даже если нужная информация была далеко назад. Это достаточно важный и супер сложный механизм.
Продолжение в след посте
❤3🔥3🦄2
Пост #3 - про работу LLM на простых аналогиях.
Первый пост - прыг
Второй пост - прыг
6. Почему Они "Знают" Так Много? (Масштаб)
- Технический термин: Масштаб данных, модели и вычислений.
- Аналогия: Почему LLM кажутся такими умными? Масштаб!
- Данные: Их "средой обитания" при обучении был практически весь значимый текчт челловечества. Это как если бы животное прожило миллионы жизней в самых разных уголках планеты. Такой прокачанный супер заяц который шел к реке и видел миллиарды проявлений этой вселенной и все познал на своем пути =)
- Параметры: Их "мозг" (количество параметров) колоссален (миллиарды/триллионы связей). Это позволяет "запомнить" невероятно сложные и тонкие закономерности.
- Вычисления: Обучение требует мощнейших компьютеров и много времени. Это как интенсивное, ускоренное формирование опыта. Как если бы заяц получил опыт триллионов вариаций его жизней за 1 секунду. Вот в реальной работе LLM, чтобы добиться таких показателей необходимо много вычислительной мощности. Чтобы не ждать последовательно выполняющихся жизней и кучи времени, когда модель обучится. А просто сделать это параллельно на тысячах серверах одновременно. Это как бы симуляция 100500 вариаций разных событий как уже ранее я пояснил.
7. Важные Ограничения (Галлюцинации, Смещения)
- Технический термин: Галлюцинации (генерация ложной, но правдоподобной информации), Смещения (Bias) (отражение предубеждений в данных).
- Аналогия: Помнишь, LLM — это не разум, а "замороженный статистический опыт" предположительно возможный опыт.
- Галлюцинации: Если животное в новом месте по ошибке принимает куст за хищника (ложная ассоциация), то LLM может "придумать" факт или ссылку, которая *статистически/предположительно правдоподобна* в ее "опыте", но не соответствует реальности. Она не "лжет", она "идет по неверной тропинке", которая кажется ей вероятной.
- Смещения: Если в данных, на которых училась модель, были предубеждения (например, стереотипы о профессиях), они отразятся в ее ответах. Как если бы животное выросло в опасной среде и видело угрозу там, где ее нет. LLM не понимает "хорошо/плохо", она отражает закономерности своих "сценариев обучения". У людей с ПТСР и разными травмами например такое, или у животных которые росли в насильственных условиях. Там суть одна и таже
Итого:
Большая Языковая Модель — это гигантский "замороженный опыт", полученный из океана текста. Ее "мозг" (параметры) настолько сложен, что позволяет ей "идти по тропинкам" слов (токенов), генерируя осмысленный текст. Каждый следующий шаг определяется статистической вероятностью, основанной на этом опыте, и контекстом всего пути (благодаря "вниманию"). Как и поведение животного, сформированного его жизнью, реакцию LLM на ваш запрос можно предсказать, зная ее "опыт" (параметры) и стартовую точку (промпт). Это не какая то магия, а результат колоссального масштаба данных и вычислений, кодирующих закономерности человеческого языка в миллиардах чисел.
Ключевая Мысль:
"Модель идет по тропинке. А тропинку задают параметры, которые в ней есть... Как животное, набравшее опыт, идет предсказуемым путем — так и LLM генерирует текст, следуя по 'тропе' своего замороженного опыта."
Спасибо за внимание, оч надеюсь что смог донести сложную штуку простым языком.
P.S На самом деле там все сложнее и есть 100500 разных нюансов, но я специально уппростил двсе ля понимания. И сделал это так чтобы основная механика работы осталась и не потерялся смысл. Так что в целом это можно использовать для объяснения как работает LLM кому угодно
Люблю лайки, перепосты и комментарии.
Первый пост - прыг
Второй пост - прыг
6. Почему Они "Знают" Так Много? (Масштаб)
- Технический термин: Масштаб данных, модели и вычислений.
- Аналогия: Почему LLM кажутся такими умными? Масштаб!
- Данные: Их "средой обитания" при обучении был практически весь значимый текчт челловечества. Это как если бы животное прожило миллионы жизней в самых разных уголках планеты. Такой прокачанный супер заяц который шел к реке и видел миллиарды проявлений этой вселенной и все познал на своем пути =)
- Параметры: Их "мозг" (количество параметров) колоссален (миллиарды/триллионы связей). Это позволяет "запомнить" невероятно сложные и тонкие закономерности.
- Вычисления: Обучение требует мощнейших компьютеров и много времени. Это как интенсивное, ускоренное формирование опыта. Как если бы заяц получил опыт триллионов вариаций его жизней за 1 секунду. Вот в реальной работе LLM, чтобы добиться таких показателей необходимо много вычислительной мощности. Чтобы не ждать последовательно выполняющихся жизней и кучи времени, когда модель обучится. А просто сделать это параллельно на тысячах серверах одновременно. Это как бы симуляция 100500 вариаций разных событий как уже ранее я пояснил.
7. Важные Ограничения (Галлюцинации, Смещения)
- Технический термин: Галлюцинации (генерация ложной, но правдоподобной информации), Смещения (Bias) (отражение предубеждений в данных).
- Аналогия: Помнишь, LLM — это не разум, а "замороженный статистический опыт" предположительно возможный опыт.
- Галлюцинации: Если животное в новом месте по ошибке принимает куст за хищника (ложная ассоциация), то LLM может "придумать" факт или ссылку, которая *статистически/предположительно правдоподобна* в ее "опыте", но не соответствует реальности. Она не "лжет", она "идет по неверной тропинке", которая кажется ей вероятной.
- Смещения: Если в данных, на которых училась модель, были предубеждения (например, стереотипы о профессиях), они отразятся в ее ответах. Как если бы животное выросло в опасной среде и видело угрозу там, где ее нет. LLM не понимает "хорошо/плохо", она отражает закономерности своих "сценариев обучения". У людей с ПТСР и разными травмами например такое, или у животных которые росли в насильственных условиях. Там суть одна и таже
Итого:
Большая Языковая Модель — это гигантский "замороженный опыт", полученный из океана текста. Ее "мозг" (параметры) настолько сложен, что позволяет ей "идти по тропинкам" слов (токенов), генерируя осмысленный текст. Каждый следующий шаг определяется статистической вероятностью, основанной на этом опыте, и контекстом всего пути (благодаря "вниманию"). Как и поведение животного, сформированного его жизнью, реакцию LLM на ваш запрос можно предсказать, зная ее "опыт" (параметры) и стартовую точку (промпт). Это не какая то магия, а результат колоссального масштаба данных и вычислений, кодирующих закономерности человеческого языка в миллиардах чисел.
Ключевая Мысль:
"Модель идет по тропинке. А тропинку задают параметры, которые в ней есть... Как животное, набравшее опыт, идет предсказуемым путем — так и LLM генерирует текст, следуя по 'тропе' своего замороженного опыта."
Спасибо за внимание, оч надеюсь что смог донести сложную штуку простым языком.
P.S На самом деле там все сложнее и есть 100500 разных нюансов, но я специально уппростил двсе ля понимания. И сделал это так чтобы основная механика работы осталась и не потерялся смысл. Так что в целом это можно использовать для объяснения как работает LLM кому угодно
Люблю лайки, перепосты и комментарии.
❤5👍2🔥2❤🔥1
По просьбам рябят из чата LLM neighbors (здаров парни 🤘) пишу пост о том как я собрал более ста тысяч $ в облачных/AI кредитах для своего стартапа — и как может это сделать почти любой (моя компания https://orch.so имеет поддержку акселератора)
Будет несколько постов
На данный момент мы пока получили 152 600 USD:
- Amazon 25 100 USD (можно увеличить, нужно писать им еще раз)
- Google 25 000 USD (можно увеличить до 350 если выйти на >2k берна в месяц)
- Cloudflare 100 000 USD
- Microsoft 1 000 USD (у этих тоже можно поднять, нужно им еще раз написать, они что то напутали когда заявку обрабатывали. Дали 1к для неаффилированных — до $5k а мы аффилированны)
- Anthropic 1 500 USD
Что дают крупные программы (моя выборка и ориентиры)
Cloudflare for Startups — до $250k кредитов на Developer Platform
- Workers
- R2
- Workers AI и др
C лимитами внутри корзины (например, до $50k на Workers AI и до $10k на R2/Cache Reserve по условиям плана). Кредиты обычно действуют до 1 года или пока не израсходуете.
AWS Activate — до $100k кредитов. Для Portfolio пакета нужен Organization ID вашего акселератора/фонда; есть и Founders путь для self-funded. Типичные критерии: pre-Series B, сайт, возраст компании ≤10 лет. Срок действия кредитов ограничен (чаще 1–2 года, смотрите дату в консоли/письме).
Google for Startups Cloud (AI Program) — до $350k кредитов для AI-стартапов (Scale-tier), плюс стандартные Start/Scale пакеты (например, покрытие до $100k в 1-й год и до $100k на 20% во 2-й для Scale). Срок/инкременты видны в консоли; кредиты имеют дату истечения.
Microsoft for Startups — базовый вход с Azure-кредитами (для неаффилированных — до $5k), а Investor Offer для портфельных — обычно от $100k Azure и выше.
Anthropic for Startups — API-кредиты + повышенные лимиты через VC/акселераторы (подаваться через партнёра/инвестора).
Бонус: у AWS отдельно продвигают кредиты на модели через Bedrock (Anthropic, Cohere, Mistral, Meta и др.) — удобно для быстрых экспериментов.
Что спрашивают в заявках (и как отвечать)
1) «Есть ли у вас поддержка акселератора/фонда?»
Если да — укажите программу и контакт. Для AWS это прямо ключ к Portfolio (нужен Organization ID), для Microsoft — попадание в Investor Network даёт другой уровень бенефитов, у Anthropic — заявки идут через VC/акселераторов.
Пример формулировки:
Да. Мы — портфельная компания X Accelerator (Batch 2025). Контакт менеджера: First name Last Name, email@…
2) «Стадия, возраст, сайт»
Следите за базовыми критериям: < или pre-Series B, возраст до 10 лет, работающий сайт/профиль.
Пример:
Инкорпорированы в 2024, pre-seed, сайт https://…
3) «Как вы используете AI/облако?»
Покажите понятный продуктовый сценарий и план расходования compute (инференс/тренировка, хранение, сеть).
Пример:
Используем Claude/GPT-модели для суммаризации тикетов и RAG. План: 60% инференс в edge (Cloudflare Workers AI), 30% — GCP TPU/GPU на обучение узких моделей, 10% — AWS Bedrock для мульти-моделей и экспериментов.
4) «Когда активировать кредиты?»
Следите за датой истечения — во многих программах кредиты ограничены по сроку и начинают «тикать» с момента выдачи/активации. Проверяйте дату в консоли/писме и условия программы.
Пример:
Активируем поэтапно, чтобы не было параллельного расхода. Контролируем даты в консоли (AWS/GCP показывают expiry).
На данный момент мы пока получили 152 600 USD:
- Amazon 25 100 USD (можно увеличить, нужно писать им еще раз)
- Google 25 000 USD (можно увеличить до 350 если выйти на >2k берна в месяц)
- Cloudflare 100 000 USD
- Microsoft 1 000 USD (у этих тоже можно поднять, нужно им еще раз написать, они что то напутали когда заявку обрабатывали. Дали 1к для неаффилированных — до $5k а мы аффилированны)
- Anthropic 1 500 USD
Пдаваться может почти каждый. Если вы уже в акселераторе/у инвестора — суммы и шанс выше: многие программы проверяют аффилиацию и дают «портфельные» пакеты например,
- у AWS нужен Organization ID партнёра;
- у Microsoft есть Investor Network;
- у Anthropic — стартап-программа через VC/акселераторы
Что дают крупные программы (моя выборка и ориентиры)
Cloudflare for Startups — до $250k кредитов на Developer Platform
- Workers
- R2
- Workers AI и др
C лимитами внутри корзины (например, до $50k на Workers AI и до $10k на R2/Cache Reserve по условиям плана). Кредиты обычно действуют до 1 года или пока не израсходуете.
AWS Activate — до $100k кредитов. Для Portfolio пакета нужен Organization ID вашего акселератора/фонда; есть и Founders путь для self-funded. Типичные критерии: pre-Series B, сайт, возраст компании ≤10 лет. Срок действия кредитов ограничен (чаще 1–2 года, смотрите дату в консоли/письме).
Google for Startups Cloud (AI Program) — до $350k кредитов для AI-стартапов (Scale-tier), плюс стандартные Start/Scale пакеты (например, покрытие до $100k в 1-й год и до $100k на 20% во 2-й для Scale). Срок/инкременты видны в консоли; кредиты имеют дату истечения.
Microsoft for Startups — базовый вход с Azure-кредитами (для неаффилированных — до $5k), а Investor Offer для портфельных — обычно от $100k Azure и выше.
Anthropic for Startups — API-кредиты + повышенные лимиты через VC/акселераторы (подаваться через партнёра/инвестора).
Бонус: у AWS отдельно продвигают кредиты на модели через Bedrock (Anthropic, Cohere, Mistral, Meta и др.) — удобно для быстрых экспериментов.
Что спрашивают в заявках (и как отвечать)
1) «Есть ли у вас поддержка акселератора/фонда?»
Если да — укажите программу и контакт. Для AWS это прямо ключ к Portfolio (нужен Organization ID), для Microsoft — попадание в Investor Network даёт другой уровень бенефитов, у Anthropic — заявки идут через VC/акселераторов.
Пример формулировки:
Да. Мы — портфельная компания X Accelerator (Batch 2025). Контакт менеджера: First name Last Name, email@…
2) «Стадия, возраст, сайт»
Следите за базовыми критериям: < или pre-Series B, возраст до 10 лет, работающий сайт/профиль.
Пример:
Инкорпорированы в 2024, pre-seed, сайт https://…
3) «Как вы используете AI/облако?»
Покажите понятный продуктовый сценарий и план расходования compute (инференс/тренировка, хранение, сеть).
Пример:
Используем Claude/GPT-модели для суммаризации тикетов и RAG. План: 60% инференс в edge (Cloudflare Workers AI), 30% — GCP TPU/GPU на обучение узких моделей, 10% — AWS Bedrock для мульти-моделей и экспериментов.
4) «Когда активировать кредиты?»
Следите за датой истечения — во многих программах кредиты ограничены по сроку и начинают «тикать» с момента выдачи/активации. Проверяйте дату в консоли/писме и условия программы.
Пример:
Активируем поэтапно, чтобы не было параллельного расхода. Контролируем даты в консоли (AWS/GCP показывают expiry).
🔥5❤3❤🔥2👍1
Первый пост про кредиты и поддержку стартапов
Готовые ответы-шаблоны (можно копипастить в формы)
A. «Поддержка акселератора/фонда»
Да. Мы — портфель {название акселератора/VC}, batch {год}. Organization ID для AWS: {XXXX}. Контакт: {Name, email}. Участвуем в программе Microsoft Investor Offer через {фонд/акселератор}.
Нет. Ничего не пишем
B. «Описание продукта и AI-нагрузки»
Мы строим {1-2 предложения о продукте}. Основные AI-задачи: {инференс/файнтюн/обучение}, объёмы — {примерный трафик/час}. Инфраструктура: Workers/edge для LLM-оркестрации, GCP для тренировки/данных, AWS Bedrock для доступа к провайдерам (Anthropic, Cohere, Mistral).
C. «План использования кредитов»
Q1–Q2: миграция фронта/API-шлюзов на Workers, CDN/безопасность, R2. Q2–Q3: эксперименты с Claude/Bedrock, пилотный тренинг на GCP. Q3–Q4: масштабирование стабильных путей, подключение Customer Care/Enhanced Support (GCP) по мере роста.
The Cloudflare Blog
Google Cloud
D. «Комплаенс/биллинг»
Корпоративный домен, платежный метод добавлен. С условиями кредитов и сроками ознакомлены, следим за датой в консоли.
Тактика подачи (чек-лист)
✅ Сначала — статус: кто вы, стадия, ссылка на сайт/дек/демо (некоторые пакеты требуют сайт и возраст компании).
✅ Аффилиации: добавьте в заявку акселератор/VC и Organization ID (AWS), отметьте участие в Microsoft Investor Offer (если применимо)
✅ AI-use-case: 2–3 предложения, какие модели и зачем; укажите план по compute и хранению (edge-инференс / тренировки в облаке).
Полезные ссылки (сохраните)
- Cloudflare for Startups (tiers и срок действия)
- Ограничения корзин (Workers AI/R2/Cache Reserve)
- AWS Activate — кредиты и eligibility
- AWS Activate Portfolio — шаги и требования (Org ID и пр.)
- GCP Startups — до $350k для AI (программа/бенефиты)
- Microsoft for Startups — базовый вход и Investor Offer
- Anthropic for Startups — страница для стартапов и VC-партнёров
Итог:
У каждого стартапа есть шанс собрать значимый «кредит-стек». Аффилиация с акселератором/VC ускоряет и увеличивает пакеты; (подавайтесь в аксели как тольок сможете) многие программы напрямую спрашивают про поддержку и проверяют её через партнёров.
Если кому то нужна помощь, пишите в личку, помогу.
Готовые ответы-шаблоны (можно копипастить в формы)
A. «Поддержка акселератора/фонда»
Да. Мы — портфель {название акселератора/VC}, batch {год}. Organization ID для AWS: {XXXX}. Контакт: {Name, email}. Участвуем в программе Microsoft Investor Offer через {фонд/акселератор}.
Нет. Ничего не пишем
B. «Описание продукта и AI-нагрузки»
Мы строим {1-2 предложения о продукте}. Основные AI-задачи: {инференс/файнтюн/обучение}, объёмы — {примерный трафик/час}. Инфраструктура: Workers/edge для LLM-оркестрации, GCP для тренировки/данных, AWS Bedrock для доступа к провайдерам (Anthropic, Cohere, Mistral).
C. «План использования кредитов»
Q1–Q2: миграция фронта/API-шлюзов на Workers, CDN/безопасность, R2. Q2–Q3: эксперименты с Claude/Bedrock, пилотный тренинг на GCP. Q3–Q4: масштабирование стабильных путей, подключение Customer Care/Enhanced Support (GCP) по мере роста.
The Cloudflare Blog
Google Cloud
D. «Комплаенс/биллинг»
Корпоративный домен, платежный метод добавлен. С условиями кредитов и сроками ознакомлены, следим за датой в консоли.
Тактика подачи (чек-лист)
✅ Сначала — статус: кто вы, стадия, ссылка на сайт/дек/демо (некоторые пакеты требуют сайт и возраст компании).
✅ Аффилиации: добавьте в заявку акселератор/VC и Organization ID (AWS), отметьте участие в Microsoft Investor Offer (если применимо)
✅ AI-use-case: 2–3 предложения, какие модели и зачем; укажите план по compute и хранению (edge-инференс / тренировки в облаке).
Полезные ссылки (сохраните)
- Cloudflare for Startups (tiers и срок действия)
- Ограничения корзин (Workers AI/R2/Cache Reserve)
- AWS Activate — кредиты и eligibility
- AWS Activate Portfolio — шаги и требования (Org ID и пр.)
- GCP Startups — до $350k для AI (программа/бенефиты)
- Microsoft for Startups — базовый вход и Investor Offer
- Anthropic for Startups — страница для стартапов и VC-партнёров
Итог:
У каждого стартапа есть шанс собрать значимый «кредит-стек». Аффилиация с акселератором/VC ускоряет и увеличивает пакеты; (подавайтесь в аксели как тольок сможете) многие программы напрямую спрашивают про поддержку и проверяют её через партнёров.
Если кому то нужна помощь, пишите в личку, помогу.
❤6❤🔥5🔥2
Всем привет!
Как вы?
А я вот с лета прошлого года в активной разработке нового проекта (дам скрины из ЛК чтобы хоть одним глазком посмотреть) и вот только сейчас выдохнул чуть чуть, было очень много работы. В соло и с моими 20+ агентами я написал проект с более чем 1.5 млн строк: фронтенд + бэкенд + ai systems. И это не считая еще более чем 500K строк проектной документации.
В конце прошлого года вышли флагманские модели от Google, Anthropic и OpenAi. И львиная доля людей которые хоть как то касались мира разработки (и не только они) прочуствовала силу разработки с помощью Ai агентов.
Вот основные инсайты:
• Вместо месяцев продумывания и провреки/разработки своей гипотезы/идеи/pet-project или любого другого проекта на который нет много времени и средств, сейчас ты на это тратишь какие то дни.
• Вместо года продуктовой разработки для MVP и многих бессонных ночей, сейчас стало возможным сделать это за 1-2 месяца. И это я говорю про продуктовый проект а не про кривую какую то штуку запиленую на коленке.
• Вместо месяцев ресерчей и прототипирования архитетктуры и месяцев сбора информации и анализа сейчас ты тратишь всего лишь недели.
В данный момент почти любой человек даже не из мира It может достаточно быстро включиться в индустрию. И также быстро и относительно легко получит то что ему нужно.
Это стало чем то фантастическим но уже вполне реальным.
Это стало реальностью и для меня. Я смог сделать первую версию своего решения. Но оно пока в закрытой бете. Сейчас доделываю последние правки для первого пилотного коммерчсекого проекта.
Что это вообще такое, рассказываю:
Я делаю платформу для создания слоя памяти как для думающих агентов так и для построения KMS (Knoweledge managemnt system) Это платформа которая обрабатывает входящие данные и затем позволяет ходить в эти данные и не просто получать а понимать структуру и контекст. Понимать домен данных и работать с данными на языке домена. Например на терминах медицины, it или юриспруденции и других. Тоесть агент обращаясь в Gerts получает карту знаний, сами знания и инструкции как ходить по этим знаниям. Если проводить аналогию то агент получает зрение и инстурменты чтобы ориентироваться в системе знаний с помощью gps и карты. Он видит как данные связаны между собой. Агент может спросить: "Эй! Где я? Какие есть данные? Как мне получить вот это или то? Как они связаны? И дай мне вот такую вот информацию. Дай мне путь до таких вот данных"
Кроме самих знаний там есть многослойная система памяти для агентов. С рефлексией и многим другим что необходимо агентам при построении пайплайнов автоматизаций и не теряться в своих же рассуждениях.
Сайт проекта https://gerts.ai, вы можете попасть в лист ожидания для первого демо показа.
Прикладываю несколько картинок чтобы было что показать (и простите за ужасное качество скринов, в будущем будет лучше)
Как вы?
А я вот с лета прошлого года в активной разработке нового проекта (дам скрины из ЛК чтобы хоть одним глазком посмотреть) и вот только сейчас выдохнул чуть чуть, было очень много работы. В соло и с моими 20+ агентами я написал проект с более чем 1.5 млн строк: фронтенд + бэкенд + ai systems. И это не считая еще более чем 500K строк проектной документации.
В конце прошлого года вышли флагманские модели от Google, Anthropic и OpenAi. И львиная доля людей которые хоть как то касались мира разработки (и не только они) прочуствовала силу разработки с помощью Ai агентов.
Вот основные инсайты:
• Вместо месяцев продумывания и провреки/разработки своей гипотезы/идеи/pet-project или любого другого проекта на который нет много времени и средств, сейчас ты на это тратишь какие то дни.
• Вместо года продуктовой разработки для MVP и многих бессонных ночей, сейчас стало возможным сделать это за 1-2 месяца. И это я говорю про продуктовый проект а не про кривую какую то штуку запиленую на коленке.
• Вместо месяцев ресерчей и прототипирования архитетктуры и месяцев сбора информации и анализа сейчас ты тратишь всего лишь недели.
В данный момент почти любой человек даже не из мира It может достаточно быстро включиться в индустрию. И также быстро и относительно легко получит то что ему нужно.
Это стало чем то фантастическим но уже вполне реальным.
Это стало реальностью и для меня. Я смог сделать первую версию своего решения. Но оно пока в закрытой бете. Сейчас доделываю последние правки для первого пилотного коммерчсекого проекта.
Что это вообще такое, рассказываю:
Я делаю платформу для создания слоя памяти как для думающих агентов так и для построения KMS (Knoweledge managemnt system) Это платформа которая обрабатывает входящие данные и затем позволяет ходить в эти данные и не просто получать а понимать структуру и контекст. Понимать домен данных и работать с данными на языке домена. Например на терминах медицины, it или юриспруденции и других. Тоесть агент обращаясь в Gerts получает карту знаний, сами знания и инструкции как ходить по этим знаниям. Если проводить аналогию то агент получает зрение и инстурменты чтобы ориентироваться в системе знаний с помощью gps и карты. Он видит как данные связаны между собой. Агент может спросить: "Эй! Где я? Какие есть данные? Как мне получить вот это или то? Как они связаны? И дай мне вот такую вот информацию. Дай мне путь до таких вот данных"
Кроме самих знаний там есть многослойная система памяти для агентов. С рефлексией и многим другим что необходимо агентам при построении пайплайнов автоматизаций и не теряться в своих же рассуждениях.
Сайт проекта https://gerts.ai, вы можете попасть в лист ожидания для первого демо показа.
Прикладываю несколько картинок чтобы было что показать (и простите за ужасное качество скринов, в будущем будет лучше)
❤5🔥2👍1🥰1
Всем привет, давно ничего не писал.
Следующие несколько недель открыто рассказываю, что строю.
Я фаундер с четырьмя стеками одновременно.
ForgePlan — инженерный фреймворк решений, главный мой долг прямо сейчас.
Orchestra — управление задачами и общение команды.
Gerts.ai — отдельная история, расскажу когда созреет.
И есть еще https://extraboost.ai + поток обучения который я в данный момент веду, через который я перевожу методологию на человеческий и обучаю разработчиков и не тольок,вайбкодить/кодить с ai/создавать свой личный harness
В голове это не четыре проекта. Это один стек времени, прокрученный через четыре поверхности.
Ближайшие нескольок недель — серия из постов, в которой я честно показываю:
— зачем я вообще начал ForgePlan и какую боль он решает
— самый болезненный баг, который я нашёл сам у себя
— как у меня уживаются четыре (на самом деле больше) проекта одновременно
— что я вижу, когда работаю с разработчиками над AI
— один паттерн, который повторяется везде
— и куда это всё движется через 6 недель / 6 месяцев / 6 кварталов
Без приукрашивания. С конкретными примерами, артефактами и своими ошибками.
Если интересно — лайк.
Если про техническую начинку ForgePlan — есть отдельный канал продукта @forgeplan
🔸GitHub: https://github.com/ForgePlan
🔸ProductPage: https://forgeplan.dev/
🔸Docs: https://forgeplan.dev/docs/methodology/overview
🔸MarketPlace: https://github.com/ForgePlan/marketplace
Следующие несколько недель открыто рассказываю, что строю.
Я фаундер с четырьмя стеками одновременно.
ForgePlan — инженерный фреймворк решений, главный мой долг прямо сейчас.
Orchestra — управление задачами и общение команды.
Gerts.ai — отдельная история, расскажу когда созреет.
И есть еще https://extraboost.ai + поток обучения который я в данный момент веду, через который я перевожу методологию на человеческий и обучаю разработчиков и не тольок,
В голове это не четыре проекта. Это один стек времени, прокрученный через четыре поверхности.
Ближайшие нескольок недель — серия из постов, в которой я честно показываю:
— зачем я вообще начал ForgePlan и какую боль он решает
— самый болезненный баг, который я нашёл сам у себя
— как у меня уживаются четыре (на самом деле больше) проекта одновременно
— что я вижу, когда работаю с разработчиками над AI
— один паттерн, который повторяется везде
— и куда это всё движется через 6 недель / 6 месяцев / 6 кварталов
Без приукрашивания. С конкретными примерами, артефактами и своими ошибками.
Если интересно — лайк.
Если про техническую начинку ForgePlan — есть отдельный канал продукта @forgeplan
🔸GitHub: https://github.com/ForgePlan
🔸ProductPage: https://forgeplan.dev/
🔸Docs: https://forgeplan.dev/docs/methodology/overview
🔸MarketPlace: https://github.com/ForgePlan/marketplace
❤6🔥5👍2
Инструмент честнее автора — и это норма
Шесть дней назад выкатил версию 0.30.0 ForgePlan @forgeplan.
Защитный спринт, одиннадцать починок разом. Среди них одна, которую я добавил буквально, чтобы инструмент ловил меня самого
PROB-059 (артефакт с типом проблема и под номером 059) Звучит сухо. На практике вот что.
Когда я пишу обоснование решения по продукту, в теле документа перечисляю другие решения, на которые опираюсь. Просто пишу: «связано с тем-то и тем-то». Мысленно ставлю галочку: связь обозначена.
И забываю отдельной командой сказать инструменту: «вот этот документ опирается вот на этот». В тексте связь есть. В системе связь не зафиксирована.
С точки зрения читателя — порядок: он видит ссылку. С точки зрения системы — документ висит сам по себе, без входящих связей. Через месяц инструмент найдёт «сирот» и удивится: «а это что такое лежит без родителей?».
Я ловил себя на этом трижды за пару месяцев. Поэтому в 0.30.0 добавил проверку: читает таблицу связей в теле документа, сверяет с формальной разметкой связей в служебной шапке. Расходится — пишет предупреждение с готовой подсказкой, как починить одной строкой.
Через два дня после релиза запускаю проверку на свежем документе. Предупреждение. На моём собственном. В первый же день.
Я написал проверку, чтобы инструмент ловил меня. Выкатил. Она поймала меня в первый запуск. Не подписчика, не «команду из будущего». Меня. Автора. На свежем документе.
Это и есть парадокс собственного "dogfood". Не «дисциплинированный фаундер тестирует продукт». А «инструмент честнее автора, потому что не помнит, кто его написал».
Если я встраиваю проверку для себя — это норма. Это значит, инструмент стал внешним проверяющим, а не помощником, который кивает и поддакивает лишь бы угодить. Как это любит делать семейство моделй и агентво от антропиков =)
Пишу про обвязку вокруг Ai тут
Шесть дней назад выкатил версию 0.30.0 ForgePlan @forgeplan.
Защитный спринт, одиннадцать починок разом. Среди них одна, которую я добавил буквально, чтобы инструмент ловил меня самого
PROB-059 (артефакт с типом проблема и под номером 059) Звучит сухо. На практике вот что.
Когда я пишу обоснование решения по продукту, в теле документа перечисляю другие решения, на которые опираюсь. Просто пишу: «связано с тем-то и тем-то». Мысленно ставлю галочку: связь обозначена.
И забываю отдельной командой сказать инструменту: «вот этот документ опирается вот на этот». В тексте связь есть. В системе связь не зафиксирована.
С точки зрения читателя — порядок: он видит ссылку. С точки зрения системы — документ висит сам по себе, без входящих связей. Через месяц инструмент найдёт «сирот» и удивится: «а это что такое лежит без родителей?».
Я ловил себя на этом трижды за пару месяцев. Поэтому в 0.30.0 добавил проверку: читает таблицу связей в теле документа, сверяет с формальной разметкой связей в служебной шапке. Расходится — пишет предупреждение с готовой подсказкой, как починить одной строкой.
Через два дня после релиза запускаю проверку на свежем документе. Предупреждение. На моём собственном. В первый же день.
Я написал проверку, чтобы инструмент ловил меня. Выкатил. Она поймала меня в первый запуск. Не подписчика, не «команду из будущего». Меня. Автора. На свежем документе.
Это и есть парадокс собственного "dogfood". Не «дисциплинированный фаундер тестирует продукт». А «инструмент честнее автора, потому что не помнит, кто его написал».
Если я встраиваю проверку для себя — это норма. Это значит, инструмент стал внешним проверяющим, а не помощником, который кивает и поддакивает лишь бы угодить. Как это любит делать семейство моделй и агентво от антропиков =)
Пишу про обвязку вокруг Ai тут
🔥4❤1👍1
Обещал рассказать, зачем я ForgePlan вообще начал.
🔸Я делал gerts.ai в соло. Система сложная, многослойная - каждый слой сам по себе нетривиальный, и почти каждый кусок можно было собрать пятью разными способами. Из-за этого вокруг каждого слоя - большой ресёрч и документация: PRD, RFC, ADR, спеки, эпики. В какой-то момент у меня лежало больше тысячи файлов.
🔸Параллельно - другие проекты. Отвлекаюсь на пару недель, возвращаюсь в gerts.ai - и не помню что там уже было. Какой вариант выбрал по этому модулю и тому. Почему именно так. Что уже описал в спеки, а что ещё в работе. Более тысячи файлов есть с артефактами, ориентироваться в голове крайне трудно.
🔸Когда система многослойная, задачи надо закрывать помодульно: эпик, в эпике стори, стори по очереди. Без структуры - перескакиваешь между слоями и ни один до конца не доводишь. Когда используешь агентов.
🔸Я начал ловить себя на том, что второй раз ресёрчу то, что уже ресёрчил месяц назад. И что больнее - похожие ресёрчи никак не связывались с тем, над чем я работаю сейчас. Лежат рядом и не связаны друг с другом.
🔸Открываю папку с каталогами в которых десятки и сотни документов - сам за минуту не скажу, какие релевантны задаче. Агенту я тем более не объясню. А какждый раз посылать агента такое себе. В ответ они пишут дубликаты: уже есть документ про авторизацию - они пишут второй.
🔹Я остановился и выписал, чего не хватает.
- единый формат артефактов по типам
- эпики и стори, чтобы закрывать помодульно
- связный граф документов прямо в артефактах
- сигнал «можно брать задачу в работу или нет», без перечитывания пяти документов
- у каждого решения - аргументы, не «исторически сложилось»
- защита от агентов, которые молча пишут параллельный документ про то же самое
🔸Так начался ForgePlan. Сначала только для gerts.ai. Потом понял, что в любой большой системе с агентами получается то же самое - и инструмент перерос меня.
🔹Сегодня — версия 0.31.0
Почти три сотни артефактов в моём собственном пространстве, около двух тысяч тестов. Каждое решение оставляет след. Каждый след - с подтверждением. Каждое подтверждение честно стареет.
Не «делаю красивый процесс». Просто перестаю забывать сам у себя.
Технические детали — на канале продукта @forgeplan
🔸Я делал gerts.ai в соло. Система сложная, многослойная - каждый слой сам по себе нетривиальный, и почти каждый кусок можно было собрать пятью разными способами. Из-за этого вокруг каждого слоя - большой ресёрч и документация: PRD, RFC, ADR, спеки, эпики. В какой-то момент у меня лежало больше тысячи файлов.
🔸Параллельно - другие проекты. Отвлекаюсь на пару недель, возвращаюсь в gerts.ai - и не помню что там уже было. Какой вариант выбрал по этому модулю и тому. Почему именно так. Что уже описал в спеки, а что ещё в работе. Более тысячи файлов есть с артефактами, ориентироваться в голове крайне трудно.
🔸Когда система многослойная, задачи надо закрывать помодульно: эпик, в эпике стори, стори по очереди. Без структуры - перескакиваешь между слоями и ни один до конца не доводишь. Когда используешь агентов.
🔸Я начал ловить себя на том, что второй раз ресёрчу то, что уже ресёрчил месяц назад. И что больнее - похожие ресёрчи никак не связывались с тем, над чем я работаю сейчас. Лежат рядом и не связаны друг с другом.
🔸Открываю папку с каталогами в которых десятки и сотни документов - сам за минуту не скажу, какие релевантны задаче. Агенту я тем более не объясню. А какждый раз посылать агента такое себе. В ответ они пишут дубликаты: уже есть документ про авторизацию - они пишут второй.
🔹Я остановился и выписал, чего не хватает.
- единый формат артефактов по типам
- эпики и стори, чтобы закрывать помодульно
- связный граф документов прямо в артефактах
- сигнал «можно брать задачу в работу или нет», без перечитывания пяти документов
- у каждого решения - аргументы, не «исторически сложилось»
- защита от агентов, которые молча пишут параллельный документ про то же самое
🔸Так начался ForgePlan. Сначала только для gerts.ai. Потом понял, что в любой большой системе с агентами получается то же самое - и инструмент перерос меня.
🔹Сегодня — версия 0.31.0
Почти три сотни артефактов в моём собственном пространстве, около двух тысяч тестов. Каждое решение оставляет след. Каждый след - с подтверждением. Каждое подтверждение честно стареет.
Не «делаю красивый процесс». Просто перестаю забывать сам у себя.
Технические детали — на канале продукта @forgeplan
🔥3👍2❤1
Пример того что у вас проблемы с сессией в Claude Code. Контекст выше 50% или забит до предела.
Это значит одно, фокус внимания модели на днище. Он забывает то что у него было передано в начале и просьбы из AGENTS.md или из CLAUDE.md будут выпадать и повлиять на это без хуков, невозможно.
А /compact вас тоже не спасет так как он теряет важные артефакты. Эффективность LLM в текущей задаче снижается с 80% до 50-60%
Выход один, не делаем несколько разных задач в одной сессии.
Читайте про внимание моделей и станет понятно о чем я.
Upd:
Главный контекст обязан помнить те правила, которые сам применяет - решения о делегировании, роутинге, безопасности.
МЕТА-правила должны быть в оркестраторе и должны выживать.
Узкие правила исполнения он помнить не должен - они принадлежат агентам и скиллам. Но если в главном контексте перегрев - он перестаёт правильно роутить, и тогда правильно прописанные агенты просто не будут вызваны. Поэтому стратификация: инварианты в хуки, роутинг в оркестратор, исполнение в агентов. И будет мэджик🍑
Это значит одно, фокус внимания модели на днище. Он забывает то что у него было передано в начале и просьбы из AGENTS.md или из CLAUDE.md будут выпадать и повлиять на это без хуков, невозможно.
А /compact вас тоже не спасет так как он теряет важные артефакты. Эффективность LLM в текущей задаче снижается с 80% до 50-60%
Выход один, не делаем несколько разных задач в одной сессии.
Читайте про внимание моделей и станет понятно о чем я.
Upd:
Главный контекст обязан помнить те правила, которые сам применяет - решения о делегировании, роутинге, безопасности.
МЕТА-правила должны быть в оркестраторе и должны выживать.
Узкие правила исполнения он помнить не должен - они принадлежат агентам и скиллам. Но если в главном контексте перегрев - он перестаёт правильно роутить, и тогда правильно прописанные агенты просто не будут вызваны. Поэтому стратификация: инварианты в хуки, роутинг в оркестратор, исполнение в агентов. И будет мэджик
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Попал сегодня в руки вот такой зверек Herdr. Погоняю недельку, расскажу как работает.
Что это:
Терминальный мультиплексер нового поколения. Внешне - как tmux: workspaces, табы, панели, persistent-сессии, переживающие disconnect. Внутри - семантическое понимание состояния AI-агентов: Herdr через process-detection и эвристики по output видит, что Claude Code сейчас working / blocked (ждёт твой "yes") / done / idle - и показывает весь зоопарк в сайдбаре одним взглядом.
Поддержка из коробки: Claude Code, Codex, Droid, Amp, OpenCode, Cursor Agent, Copilot CLI, Grok, Hermes, Kiro, Pi, Gemini, Cline.
Зачем:
Когда ты гоняешь 3-5 агентов параллельно — tmux не понимает, кто из них залип в ожидании approve, а GUI-обёртки (Electron-приложения) тащат браузер в терминал. Herdr закрывает разрыв: остаёшься в шелле, видишь state-bar, можешь по SSH с телефона приконнектиться к работающим агентам.
🔑 Killer-фича - socket API + CLI, через которые сам агент может открывать панели, запускать в них команды, читать чужой output и ждать чужого done:
• herdr pane split 1-1 --direction right
• herdr pane run 1-2 "npm test"
• herdr wait agent-status 1-2 --status done
• herdr pane read 1-2 --source recent --lines 50
Это превращает терминал в runtime для multi-agent orchestration - агенты координируются между собой, а не дёргают человека.
Как пользоваться (за 30 секунд):
• curl -fsSL https://herdr.dev/install.sh | sh # или brew install herdr
• herdr
• herdr integration install claude # forward state
Конфиг - ~/.config/herdr/config.toml.
18 встроенных тем (Catppuccin, Tokyo Night, Gruvbox…).
Запускается внутри tmux без конфликта.
✅ Use cases
• Параллельно гоняешь 2+ AI-агентов на разных тасках и устал переключать окна
• Хочешь видеть «кто работает, кто залип на approve, кто закончил» одним взглядом
• Работаешь по SSH с удалённого сервера / с телефона — нужен лёгкий single-binary без Electron
• Хочешь, чтобы агент сам открывал side-panel для tail -f логов или прогонял тесты в соседней панели, а не просил тебя
• Команда из нескольких разработчиков делит один remote-хост и хочет shared workspace со statefull-сессиями
❌ Не подходит, если
• Один агент, один проект, один таб - голый терминал или tmux достаточно
• Windows (нативной поддержки нет)
• Нужен просто классический мультиплексер без agent-awareness — tmux/zellij стабильнее и легче
• Не работаешь с CLI-агентами вообще - overhead без пользы
• Корпоративная политика запрещает AGPL в продакшене (тогда нужна коммерческая лицензия - hey@herdr.dev)
Что это:
Терминальный мультиплексер нового поколения. Внешне - как tmux: workspaces, табы, панели, persistent-сессии, переживающие disconnect. Внутри - семантическое понимание состояния AI-агентов: Herdr через process-detection и эвристики по output видит, что Claude Code сейчас working / blocked (ждёт твой "yes") / done / idle - и показывает весь зоопарк в сайдбаре одним взглядом.
Поддержка из коробки: Claude Code, Codex, Droid, Amp, OpenCode, Cursor Agent, Copilot CLI, Grok, Hermes, Kiro, Pi, Gemini, Cline.
Зачем:
Когда ты гоняешь 3-5 агентов параллельно — tmux не понимает, кто из них залип в ожидании approve, а GUI-обёртки (Electron-приложения) тащат браузер в терминал. Herdr закрывает разрыв: остаёшься в шелле, видишь state-bar, можешь по SSH с телефона приконнектиться к работающим агентам.
🔑 Killer-фича - socket API + CLI, через которые сам агент может открывать панели, запускать в них команды, читать чужой output и ждать чужого done:
• herdr pane split 1-1 --direction right
• herdr pane run 1-2 "npm test"
• herdr wait agent-status 1-2 --status done
• herdr pane read 1-2 --source recent --lines 50
Это превращает терминал в runtime для multi-agent orchestration - агенты координируются между собой, а не дёргают человека.
Как пользоваться (за 30 секунд):
• curl -fsSL https://herdr.dev/install.sh | sh # или brew install herdr
• herdr
• herdr integration install claude # forward state
Конфиг - ~/.config/herdr/config.toml.
18 встроенных тем (Catppuccin, Tokyo Night, Gruvbox…).
Запускается внутри tmux без конфликта.
✅ Use cases
• Параллельно гоняешь 2+ AI-агентов на разных тасках и устал переключать окна
• Хочешь видеть «кто работает, кто залип на approve, кто закончил» одним взглядом
• Работаешь по SSH с удалённого сервера / с телефона — нужен лёгкий single-binary без Electron
• Хочешь, чтобы агент сам открывал side-panel для tail -f логов или прогонял тесты в соседней панели, а не просил тебя
• Команда из нескольких разработчиков делит один remote-хост и хочет shared workspace со statefull-сессиями
❌ Не подходит, если
• Один агент, один проект, один таб - голый терминал или tmux достаточно
• Windows (нативной поддержки нет)
• Нужен просто классический мультиплексер без agent-awareness — tmux/zellij стабильнее и легче
• Не работаешь с CLI-агентами вообще - overhead без пользы
• Корпоративная политика запрещает AGPL в продакшене (тогда нужна коммерческая лицензия - hey@herdr.dev)
❤3🔥2