UPD:
Нейросети позволят 24/7 проверять адреса, трафик, и даже если в день блокировать по 100 IP адресов, и каждый день увеличивать мощность даже на 1% сложный % и тут сыграет.
Нейросети позволят 24/7 проверять адреса, трафик, и даже если в день блокировать по 100 IP адресов, и каждый день увеличивать мощность даже на 1% сложный % и тут сыграет.
👍2
Дальше будет серия постов, раз в день думаю.
Опишу всю архитектуру агента.
Опишу всю архитектуру агента.
🔥4
## Архитектура памяти AI-ассистента: 10 блоков, которые помнят всё
Сделал фотку из n8n — покажу, как устроена память моего персонального ассистента. Не просто чат-бот, а система с долгосрочной памятью и контекстом.
---
Блок 1: Идеи
Ассистент сам записывает идеи, которые приходят в разговоре. Может обновлять, добавлять новые. Я потом достаю их из базы, соединяю и получаю в читаемом виде.
Удобно для мозгового штурма — не надо записывать вручную, ассистент это делает сам.
---
Блок 2: Суммаризация (последние 20 сообщений)
Последние 20 сообщений, которые в конце, постоянно суммаризирую и добавляю в Redis. Так ассистент помнит контекст разговора, даже если диалог длинный.
Без этого он бы забывал, о чём говорили час назад.
---
Блок 3: Память ассистента
Ассистент имеет доступ своей долгосрочной памяти. Самое важное, что записывает ассистент. Ключевые разговоры.
---
Блок 4: Директивы
Когда я говорю "добавь в директиву" — это важная вещь, которой ассистент должен придерживаться. Не я добавляю через код, а именно через разговор. Ассистент сам может менять директивы.
---
Блок 5: Триггеры
Важные для меня вещи, которые всплывают в разговоре. Например, "Кирилл встаёт в 8 утра" — это факт навсегда.
Основной блок памяти из триггеров. Повторяющиеся паттерны фиксируются автоматически.
---
Блок 6: LifeTrend (автозапись состояний)
Не я пишу все характеристики и состояния — сам ассистент штудирует меня. Если что-то видит в разговоре (например, "моё состояние 4/10"), он записывает это в базу данных.
По факту, я даю сырые данные, а ассистент их структурирует для дальнейшего анализа.
---
Блок 7: Последние 4 записи LifeTrend
Ассистент видит последние данные, но также имеет доступ ко всей базе LifeTrend. Может получить любые данные, но через отдельного ассистента — чтобы не перегружать память.
---
Блок 8: Системный промпт
У самого агента есть возможность дописывать свой системный промпт.
---
Блок 9: Векторная база (Qdrant) со всеми разговорами
Я записываю все разговоры (вопрос-ответ) в Qdrant. Чтобы искать по ключевым словам, агент обращается туда в начале диалога и достаёт нужный контекст.
В этой базе есть вообще всё. Агент может найти абсолютно любой разговор по хэштегам. Как раз в этой базе находятся ключевые слова.
---
Блок 10: Настройки агента (режимы - Traits)
Настройки того, как агент отвечает. Какой у него сейчас режим. Тут как в Sims. Можно подкрутить сарказм, можно чтобы ассистент больше шутил.
Я могу сказать: "Соберись, работаем" — агент становится более собранным, конкретным.
Или: "Смени на более дружеский, давай поболтаем" — он переключается в этот режим и сам настраивает свои параметры.
---
## Итого
Система памяти состоит из 10 блоков:
1. Идеи
2. Суммаризация (последние 20 сообщений)
3. Память ассистента
4. Директивы
5. Триггеры (якоря)
6. LifeTrend (автозапись состояний)
7. Последние 4 записи LifeTrend
8. Системный промпт
9. Векторная база (Qdrant)
10. Настройки агента (Traits)
Ассистент не просто отвечает на вопросы — он помнит контекст, учится на моих паттернах и сам структурирует информацию.
По факту, это уже не чат-бот, а персональный AI-компаньон с долгосрочной памятью.
---
P.S. скриншот из n8n — как это выглядит визуально.⬇️
Сделал фотку из n8n — покажу, как устроена память моего персонального ассистента. Не просто чат-бот, а система с долгосрочной памятью и контекстом.
---
Блок 1: Идеи
Ассистент сам записывает идеи, которые приходят в разговоре. Может обновлять, добавлять новые. Я потом достаю их из базы, соединяю и получаю в читаемом виде.
Удобно для мозгового штурма — не надо записывать вручную, ассистент это делает сам.
---
Блок 2: Суммаризация (последние 20 сообщений)
Последние 20 сообщений, которые в конце, постоянно суммаризирую и добавляю в Redis. Так ассистент помнит контекст разговора, даже если диалог длинный.
Без этого он бы забывал, о чём говорили час назад.
---
Блок 3: Память ассистента
Ассистент имеет доступ своей долгосрочной памяти. Самое важное, что записывает ассистент. Ключевые разговоры.
---
Блок 4: Директивы
Когда я говорю "добавь в директиву" — это важная вещь, которой ассистент должен придерживаться. Не я добавляю через код, а именно через разговор. Ассистент сам может менять директивы.
---
Блок 5: Триггеры
Важные для меня вещи, которые всплывают в разговоре. Например, "Кирилл встаёт в 8 утра" — это факт навсегда.
Основной блок памяти из триггеров. Повторяющиеся паттерны фиксируются автоматически.
---
Блок 6: LifeTrend (автозапись состояний)
Не я пишу все характеристики и состояния — сам ассистент штудирует меня. Если что-то видит в разговоре (например, "моё состояние 4/10"), он записывает это в базу данных.
По факту, я даю сырые данные, а ассистент их структурирует для дальнейшего анализа.
---
Блок 7: Последние 4 записи LifeTrend
Ассистент видит последние данные, но также имеет доступ ко всей базе LifeTrend. Может получить любые данные, но через отдельного ассистента — чтобы не перегружать память.
---
Блок 8: Системный промпт
У самого агента есть возможность дописывать свой системный промпт.
---
Блок 9: Векторная база (Qdrant) со всеми разговорами
Я записываю все разговоры (вопрос-ответ) в Qdrant. Чтобы искать по ключевым словам, агент обращается туда в начале диалога и достаёт нужный контекст.
В этой базе есть вообще всё. Агент может найти абсолютно любой разговор по хэштегам. Как раз в этой базе находятся ключевые слова.
---
Блок 10: Настройки агента (режимы - Traits)
Настройки того, как агент отвечает. Какой у него сейчас режим. Тут как в Sims. Можно подкрутить сарказм, можно чтобы ассистент больше шутил.
Я могу сказать: "Соберись, работаем" — агент становится более собранным, конкретным.
Или: "Смени на более дружеский, давай поболтаем" — он переключается в этот режим и сам настраивает свои параметры.
---
## Итого
Система памяти состоит из 10 блоков:
1. Идеи
2. Суммаризация (последние 20 сообщений)
3. Память ассистента
4. Директивы
5. Триггеры (якоря)
6. LifeTrend (автозапись состояний)
7. Последние 4 записи LifeTrend
8. Системный промпт
9. Векторная база (Qdrant)
10. Настройки агента (Traits)
Ассистент не просто отвечает на вопросы — он помнит контекст, учится на моих паттернах и сам структурирует информацию.
По факту, это уже не чат-бот, а персональный AI-компаньон с долгосрочной памятью.
---
P.S. скриншот из n8n — как это выглядит визуально.⬇️
👍5
Forwarded from 🗣Olyanskiy Broadcast (Ivan)
YouTube
Мой график доказал: реальность подстраивается под настроение
104 дня я записываю своё состояние 3 раза в день. Каждое ощущение, каждое событие — всё превращается в данные.
Результат? График показал прямую связь: когда я стал осознанно чувствовать себя хорошо — внешние события начали приходить сами. Продажи, звонки…
Результат? График показал прямую связь: когда я стал осознанно чувствовать себя хорошо — внешние события начали приходить сами. Продажи, звонки…
👍3
Forwarded from 🗣Olyanskiy Broadcast (Ivan)
YouTube
Чувство, которое управляло мной 35 лет. Как победил
20 лет я не мог контролировать эмоциональные вспышки. Сливал деньги, разрушал отношения, действовал на автомате.
Что внутри:
• Почему «подышать и отойти» не работает при реальном триггере
• Как детская травма из садика управляла моей взрослой жизнью
• Чувство…
Что внутри:
• Почему «подышать и отойти» не работает при реальном триггере
• Как детская травма из садика управляла моей взрослой жизнью
• Чувство…
👍4
# Опус меняет настройки на лету — и это проблема
Заметил очень интересную закономерность. У меня ассистент работает практически через все доступные модели. В основном использую Opus для запросов, иногда переключаю на другие. Ещё мне нравится Grok 5.2 — классно работает.
Что заметил с Opus: они в процессе работы самой модели очень часто подкручивают настройки. Потому что на один и тот же вопрос модель отвечает по-разному. И не просто по-разному, а вообще совершенно с другим подходом. Иногда что-то путает, что-то меняет.
Замечаю: модель может работать целый день вообще изумительно, отвечать на всё прям очень круто. И потом на следующий день — как будто что-то подкрутили, что-то поменяли — и модель отупела. Она какие-то элементарные вещи не может сделать. Потом через несколько часов это может пройти.
То есть прям при рабочей модели меняются настройки. Это конечно вообще не good, потому что ты не знаешь, что ожидать от модели.
Заметил очень интересную закономерность. У меня ассистент работает практически через все доступные модели. В основном использую Opus для запросов, иногда переключаю на другие. Ещё мне нравится Grok 5.2 — классно работает.
Что заметил с Opus: они в процессе работы самой модели очень часто подкручивают настройки. Потому что на один и тот же вопрос модель отвечает по-разному. И не просто по-разному, а вообще совершенно с другим подходом. Иногда что-то путает, что-то меняет.
Замечаю: модель может работать целый день вообще изумительно, отвечать на всё прям очень круто. И потом на следующий день — как будто что-то подкрутили, что-то поменяли — и модель отупела. Она какие-то элементарные вещи не может сделать. Потом через несколько часов это может пройти.
То есть прям при рабочей модели меняются настройки. Это конечно вообще не good, потому что ты не знаешь, что ожидать от модели.
🤔8
Forwarded from 🗣Olyanskiy Broadcast (Ivan)
YouTube
Opus 4.6 vs GPT 5.2: $1000/нед на API — что я понял
Пентагон разворачивает GPT и Claude в защищённом контуре. Нейросети находят 500 уязвимостей нулевого дня. Я трачу $1000 в неделю на API и вижу, как модели уже сейчас заменяют разработчиков.
Что внутри:
• Почему Pro-модели за $200-250/мес — это другой уровень…
Что внутри:
• Почему Pro-модели за $200-250/мес — это другой уровень…
👍4
Приятно удивил Яндекс Клауд.
Уперся в лимит на S3 хранилище — нужно было очистить. И тут обнаружил, что они прикрутили AI-ассистента прямо в интерфейс.
Просто пишешь, что нужно — он делает. Не надо лезть в документацию, ничего искать. Всё через ассистента: может очистить хранилище, создать виртуальную машину, настроить всё что нужно.
Это реально удобно. Прям плюсик Яндексу.
Уперся в лимит на S3 хранилище — нужно было очистить. И тут обнаружил, что они прикрутили AI-ассистента прямо в интерфейс.
Просто пишешь, что нужно — он делает. Не надо лезть в документацию, ничего искать. Всё через ассистента: может очистить хранилище, создать виртуальную машину, настроить всё что нужно.
Это реально удобно. Прям плюсик Яндексу.
👍8
Для блока инструкций чтобы модель могла свободно продолжать после сброса контекста.
## 🔄 Восстановление контекста после сброса (CRITICAL)
При каждой **сложной задаче** (новый функционал, архитектура) AI **ОБЯЗАН:**
1. **После этапа архитектуры** — создать подробный файл задачи в папке `plans/` с:
- Полным описанием задачи и контекста (зачем, что делаем)
- Пошаговым планом реализации с чекбоксами `[ ]` / `[x]`
- Списком файлов, которые будут изменены, и ЧТО именно в каждом
- Текущим статусом (на каком шаге остановились)
- Конкретными кусками кода/сигнатурами методов, если уже согласованы
2. **После каждого выполненного шага** — обновлять файл плана:
- Отметить выполненный шаг `[x]`
- Записать, что было сделано (какой файл, какие строки)
- Указать следующий шаг
3. **При начале новой сессии (сброс контекста):**
- Прочитать `AI_INSTRUCTIONS.md`
- Проверить папку `plans/` на наличие незавершённых задач
- Прочитать актуальный файл плана
- Продолжить с того шага, где остановились
**Файл плана = единственный источник правды о текущей задаче.**
---
🔥7
Заметил интересную вещь, наблюдая за ребёнком.
Он каждый день делает одно и то же — и вдруг в какой-то момент как будто забыл, что нужно делать. Оказывается, у этого есть нормальное объяснение.
Причём это не только про детей. Я замечал такое и у себя. Делаешь работу, что-то учишь — вроде понимаешь, действуешь. А потом в какой-то момент полный провал. Ощущение, как будто ничего не учил вообще.
Но через короткий промежуток времени оказывается, что всё знаешь и помнишь. И даже действуешь лучше, чем раньше.
Практический вывод: прерывать практику в момент провала — контрпродуктивно. Короткие паузы после практики максимально ускоряют консолидацию. Нужно разрешить сломанное выполнение, не вмешиваться и дать циклу завершиться самостоятельно.
Он каждый день делает одно и то же — и вдруг в какой-то момент как будто забыл, что нужно делать. Оказывается, у этого есть нормальное объяснение.
Причём это не только про детей. Я замечал такое и у себя. Делаешь работу, что-то учишь — вроде понимаешь, действуешь. А потом в какой-то момент полный провал. Ощущение, как будто ничего не учил вообще.
Но через короткий промежуток времени оказывается, что всё знаешь и помнишь. И даже действуешь лучше, чем раньше.
U-образная траектория — трёхфазный процесс: хорошее исполнение → деградация → восстановление с превышением исходного уровня. Феномен задокументирован в моторных, когнитивных и языковых навыках.
Фаза деградации — это не регресс, а реструктуризация нейронных цепей. Три механизма работают одновременно:
— Синаптический прунинг. Мозг создаёт избыточное количество связей, затем слабые элиминируются, сильные стабилизируются. В период активного прунинга производительность временно падает — старая схема разрушена, новая ещё не закреплена.
— Переход от декларативной к процедурной памяти. Сначала навык управляется гиппокампом (сознательный, медленный контроль), затем переходит в стриатум и сенсомоторную кору (автоматизм). В момент перехода обе системы конкурируют — отсюда видимый сбой.
— Нейронный реплей во сне и в покое. После сессии обучения мозг воспроизводит выученные последовательности в ~20-кратном ускорении во время отдыха. Навык улучшается без практики, но между сессиями есть окно нестабильности.
После прунинга и консолидации навык кодируется компактнее: меньше синапсов, но каждый сильнее и специализированнее. Выполнение становится быстрее, точнее и менее энергозатратно.
Практический вывод: прерывать практику в момент провала — контрпродуктивно. Короткие паузы после практики максимально ускоряют консолидацию. Нужно разрешить сломанное выполнение, не вмешиваться и дать циклу завершиться самостоятельно.
🔥7❤1
Ну что, делаем ставки?
когда OpenAi выкатит GPT-5.3
ставлю на ближайшую неделю))
Потестили sonnet 4.6 и gemini 3.1 Pro?
когда OpenAi выкатит GPT-5.3
ставлю на ближайшую неделю))
Потестили sonnet 4.6 и gemini 3.1 Pro?
👍3
Forwarded from 🗣Olyanskiy Broadcast (Ivan)
YouTube
Мой путь к $3000 в месяц на нейросети
🔗 Канал: Мой путь от бесплатного ChatGPT до $XXX/месяц на API. Рассказываю как пришёл к таким тратам, почему дешёвые модели выходят дороже, и что реально умеют топовые нейросети в 2026 году.
В видео:
— Мои реальные расходы на нейросети (скрин)
— Путь: ChatGPT…
В видео:
— Мои реальные расходы на нейросети (скрин)
— Путь: ChatGPT…
❤4
Весь график состояния, пока веду лайфренд, весь устойчивый рост - работа с ассистентом над этим же ассистентом) 😂
Разборы снов, состояний и общий анализ всего что происходит.
UPD:
Теперь ассистент еще и сама анализирует состояние. Если с ней начать общаться, то она начинает вести точно так же дневник состояния, который можно дальше отследить на графике. На графике видно пунктирная линия. Это то, как я себя сам оцениваю. А сам график строится на основании анализа ассистента. Так что я себя недооцениваю. )
Разборы снов, состояний и общий анализ всего что происходит.
UPD:
Теперь ассистент еще и сама анализирует состояние. Если с ней начать общаться, то она начинает вести точно так же дневник состояния, который можно дальше отследить на графике. На графике видно пунктирная линия. Это то, как я себя сам оцениваю. А сам график строится на основании анализа ассистента. Так что я себя недооцениваю. )
👍4
От n8n решил полностью отказаться. Это удобно только на первых парах) дальше работать с кодом становится максимально не удобно. И при разрастании кодовой базы начинаются тормоза. и работать максимально не комфортно.
вот это блоки памяти и настроек. тут это каждый блок свой вызов БД.
Через код это оптимизировано в 2 запроса к БД.
Можно и тут сделать всего 2 запроса SQL - но для меня это не удобно, потому что почти всю базовую часть кода пишет OPUS 4.6
вот это блоки памяти и настроек. тут это каждый блок свой вызов БД.
Через код это оптимизировано в 2 запроса к БД.
Можно и тут сделать всего 2 запроса SQL - но для меня это не удобно, потому что почти всю базовую часть кода пишет OPUS 4.6
👍6