🚀 Обновление: Конфиденциальность, GDPR и Структура графиков
🔥 Новое
• Центр конфиденциальности: Добавлены официальные страницы Политики конфиденциальности и Cookie Policy.
• Управление данными: Внедрены инструменты согласия на обработку данных (GDPR) и баннер cookie для соответствия стандартам безопасности.
✨ Улучшения
• Визуализация экспериментов: График аналитики теперь разделен на три независимые секции (Счетчик, Значение, Успех) для более детального разбора прогресса.
• Доступность информации: Ссылки на правовые документы вынесены в подвал (футер) приложения и лендинга.
@LifeTrendBot
lifetrend.ivol.pro
Forwarded from Иван Олянский (Ivan)
LifeTrend, 7 лет выгорания и зачем мне столько данных
Год начался с апгрейда LifeTrend.
Изначально идея была безумной: конвертировать свое состояние в график для трейдинга, накинуть индикатор и предсказывать будущее. Но за два месяца проект трансформировался в полноценную лабораторию.
Что я отслеживаю сейчас:
1. Настроение и уровень энергии (субъективно).
2. Продуктивность и спорт.
3. Здоровье и качество сна.
4. Интенсивность событий (внешний хаос, на который я не влияю) и их эмоциональный окрас.
Философия «Для себя»
Все мои проекты — Sponli Космос Онлайн, «Книга Жизни», торговые боты — всегда создавались под мои личные боли. Sponli — чтобы видеть небо сквозь тучи. Индикаторы — чтобы обуздать эмоции в торговле.
Сейчас я закрываю старые проекты и сайты. Поддерживать их нецелесообразно. LifeTrend объединяет весь мой опыт и текущие интересы в одну систему.
Главный инсайт за 7 лет
Самый жирный плюс трекинга — ты видишь, где теряешь энергию.
Я проанализировал данные и понял: так, как последнюю неделю, я не чувствовал себя 7 лет. С того момента, как влез в крипту и майнинг. Трейдинг высасывал ресурс. Мой индикатор был написан на злости, в попытке убежать от эмоций через инструмент.
Да, на злости можно творить. Но двигаться на позитивной энергии — проще и эффективнее. Блин, это банально приятно — просто быть в хорошем настроении.
Вывод: Надо безжалостно убирать то, что жрет ресурс. Когда есть энергия — есть желание создавать.
Что дальше:
Скоро внедрю в LifeTrend AI-ассистента. Он будет анализировать записи, искать корреляции и давать советы. Даже неделя трекинга даст вам достаточно данных, чтобы понять, что нужно пофиксить в жизни.
@LifeTrendBot
https://lifetrend.ivol.pro
Год начался с апгрейда LifeTrend.
Изначально идея была безумной: конвертировать свое состояние в график для трейдинга, накинуть индикатор и предсказывать будущее. Но за два месяца проект трансформировался в полноценную лабораторию.
Что я отслеживаю сейчас:
1. Настроение и уровень энергии (субъективно).
2. Продуктивность и спорт.
3. Здоровье и качество сна.
4. Интенсивность событий (внешний хаос, на который я не влияю) и их эмоциональный окрас.
Философия «Для себя»
Все мои проекты — Sponli Космос Онлайн, «Книга Жизни», торговые боты — всегда создавались под мои личные боли. Sponli — чтобы видеть небо сквозь тучи. Индикаторы — чтобы обуздать эмоции в торговле.
Сейчас я закрываю старые проекты и сайты. Поддерживать их нецелесообразно. LifeTrend объединяет весь мой опыт и текущие интересы в одну систему.
Главный инсайт за 7 лет
Самый жирный плюс трекинга — ты видишь, где теряешь энергию.
Я проанализировал данные и понял: так, как последнюю неделю, я не чувствовал себя 7 лет. С того момента, как влез в крипту и майнинг. Трейдинг высасывал ресурс. Мой индикатор был написан на злости, в попытке убежать от эмоций через инструмент.
Да, на злости можно творить. Но двигаться на позитивной энергии — проще и эффективнее. Блин, это банально приятно — просто быть в хорошем настроении.
Вывод: Надо безжалостно убирать то, что жрет ресурс. Когда есть энергия — есть желание создавать.
Что дальше:
Скоро внедрю в LifeTrend AI-ассистента. Он будет анализировать записи, искать корреляции и давать советы. Даже неделя трекинга даст вам достаточно данных, чтобы понять, что нужно пофиксить в жизни.
@LifeTrendBot
https://lifetrend.ivol.pro
👍8
Цена автоматизации: когда n8n экономит время, а когда жрет его
Даже в самом начале постановки задачи можно предусмотреть момент: когда n8n сэкономит время, а когда начнет его жрать.
Самое первое, что нужно понять — какими объемами данных мы будем оперировать. Если пакет данных очень большой, сложности начнутся уже на этапе разработки.
У меня в трейдинговом проекте агент скачивает с сервера большие объемы информации — иногда это десятки мегабайт. И когда идет сложная структура, много узлов, где-то нужно добавить код, где-то обработать данные — всё начинает подтупливать.
Все данные, которые идут по узлам, накапливаются в памяти редактора. С каждым шагом интерфейс становится всё тяжелее. В итоге максимум можно сделать один прогон, а потом приходится перезагружать страницу, чтобы просто продолжить работу.
То же самое происходит, когда данных немного, но очень много узлов.
Достать из базы, обработать, где-то перевернуть, где-то заменить. В самом начале, на тестовых маленьких базах, всё работает нормально. Но со временем, когда начинаешь получать, скажем, 200 строк из таблицы, а внутри строк лежат весомые данные — всё начинает очень жестко тормозить.
Какой вывод?
Разрабатывать нужно сразу с прицелом на масштабирование:
1. Тяжелые блоки выносить в отдельные workflow (sub-workflows).
2. Или лучший вариант: отладили в n8n, проверили гипотезу, убедились, что всё работает замечательно — и переписали узкие места на чистый код.
n8n идеален для прототипа, но на больших объемах чистый код выигрывает.
Даже в самом начале постановки задачи можно предусмотреть момент: когда n8n сэкономит время, а когда начнет его жрать.
Самое первое, что нужно понять — какими объемами данных мы будем оперировать. Если пакет данных очень большой, сложности начнутся уже на этапе разработки.
У меня в трейдинговом проекте агент скачивает с сервера большие объемы информации — иногда это десятки мегабайт. И когда идет сложная структура, много узлов, где-то нужно добавить код, где-то обработать данные — всё начинает подтупливать.
Все данные, которые идут по узлам, накапливаются в памяти редактора. С каждым шагом интерфейс становится всё тяжелее. В итоге максимум можно сделать один прогон, а потом приходится перезагружать страницу, чтобы просто продолжить работу.
То же самое происходит, когда данных немного, но очень много узлов.
Достать из базы, обработать, где-то перевернуть, где-то заменить. В самом начале, на тестовых маленьких базах, всё работает нормально. Но со временем, когда начинаешь получать, скажем, 200 строк из таблицы, а внутри строк лежат весомые данные — всё начинает очень жестко тормозить.
Какой вывод?
Разрабатывать нужно сразу с прицелом на масштабирование:
1. Тяжелые блоки выносить в отдельные workflow (sub-workflows).
2. Или лучший вариант: отладили в n8n, проверили гипотезу, убедились, что всё работает замечательно — и переписали узкие места на чистый код.
n8n идеален для прототипа, но на больших объемах чистый код выигрывает.
👍9
Небольшой мануал, как я настраиваю окружение.
Самое первое — создаю файл
В этом файле прописываю технический регламент:
— Нужно ли делать тесты и когда (после каждого добавления или в конце)
— Нужно ли запускать build
— Нужен ли Git и контроль версий
У меня есть готовый шаблон, по которому я заполняю этот файл, но обычно он растет сам в зависимости от работы проекта.
Самое главное требование к AI:
Когда я ставлю задачу, модель должна сначала изучить код, понять контекст и текущую архитектуру. И на основании этого — предложить решение.
Не бросаться сразу в реализацию, а описать план:
1. Как это будет выглядеть
2. Как это будет работать
3. Какие файлы будут затронуты
Архитектура должна быть полностью согласована со мной до того, как начнется кодинг.
Почему так? С какой бы моделью я ни работал — даже Opus косячит. Если не контролировать, они начинают делать то, что я не просил, и постоянно что-то придумывают.
Поэтому добавляю в файл строчку: «Действовать строго по инструкции». Ничего своего не предлагать. Если есть идея лучше — вначале предложи, и только после согласования — делай.
Самое первое — создаю файл
AI_Instruction.md. Добавляю туда все пожелания по проекту и вообще суть того, что мы делаем.В этом файле прописываю технический регламент:
— Нужно ли делать тесты и когда (после каждого добавления или в конце)
— Нужно ли запускать build
— Нужен ли Git и контроль версий
У меня есть готовый шаблон, по которому я заполняю этот файл, но обычно он растет сам в зависимости от работы проекта.
Самое главное требование к AI:
Когда я ставлю задачу, модель должна сначала изучить код, понять контекст и текущую архитектуру. И на основании этого — предложить решение.
Не бросаться сразу в реализацию, а описать план:
1. Как это будет выглядеть
2. Как это будет работать
3. Какие файлы будут затронуты
Архитектура должна быть полностью согласована со мной до того, как начнется кодинг.
Почему так? С какой бы моделью я ни работал — даже Opus косячит. Если не контролировать, они начинают делать то, что я не просил, и постоянно что-то придумывают.
Поэтому добавляю в файл строчку: «Действовать строго по инструкции». Ничего своего не предлагать. Если есть идея лучше — вначале предложи, и только после согласования — делай.
👍8🐳3🔥2
TechnoBlog of Ivan Olyansky
3090 карта
nemotron-3-nano 13.07 токенов/сек 😭😢
qwen3-vl-30b 36.25 токенов/сек
gpt-oss-20b 140.82 токенов/сек 🔥
nemotron-3-nano (21гб) 26.04 токенов/сек
gemma-3-27b-it-abliterated 28.63 токенов/сек
glm-4.6v-flash 55.19 токенов/сек
devstral-small-2-2512 26.95 токенов/сек
qwen3-coder-30b 20.84 токенов/сек
qwen3-48b-a4b 34.09 токенов/сек
Какой вывод:
Если нужны только текстовые модели и не пугает сборка, то дешевле, конечно, собрать из множества карт из P102-100. Если деньги позволяют, то собирать то же самое, только карты использовать 3090. Ну а если деньги не проблема, то, конечно, рассмотреть карты 5090. Ну а если и тут деньги не проблема, то рассмотреть уже специально заточенные GPU-карты.
nemotron-3-nano 13.07 токенов/сек 😭😢
qwen3-vl-30b 36.25 токенов/сек
gpt-oss-20b 140.82 токенов/сек 🔥
nemotron-3-nano (21гб) 26.04 токенов/сек
gemma-3-27b-it-abliterated 28.63 токенов/сек
glm-4.6v-flash 55.19 токенов/сек
devstral-small-2-2512 26.95 токенов/сек
qwen3-coder-30b 20.84 токенов/сек
qwen3-48b-a4b 34.09 токенов/сек
Какой вывод:
Если нужны только текстовые модели и не пугает сборка, то дешевле, конечно, собрать из множества карт из P102-100. Если деньги позволяют, то собирать то же самое, только карты использовать 3090. Ну а если деньги не проблема, то, конечно, рассмотреть карты 5090. Ну а если и тут деньги не проблема, то рассмотреть уже специально заточенные GPU-карты.
🔥7
Как же меня бомбит от версии GPT-5.2.
Какая же она тупая. Вот реально. Либо она оттупела ещё сильнее, либо я не могу понять, чем они там в OpenAi вообще занимаются.
Даю одно и то же задание для Flash 3, для GPT и для Sonnet. В Sonnet немного дорого делать мелкие правки. Gemini перестал работать из-за провайдера. Пришлось работать с GPT. Ну какой же он тупой!
Самое правильное решение, которое принял — больше не использовать его. Парадокс: модель стоит дешевле, но по факту выходит значительно дороже. Приходится трижды переделывать за ней. Из-за косяков и ошибок постоянно нужно либо переделывать полностью, либо доделывать.
Пример: модель занималась переводом одной страницы. Пришлось всю страницу делать заново, потому что она полностью сократила всё, убрала оригинальные названия и заменила их на свои.
В общем, внимательно смотрите за тем, что она делает.
Какая же она тупая. Вот реально. Либо она оттупела ещё сильнее, либо я не могу понять, чем они там в OpenAi вообще занимаются.
Даю одно и то же задание для Flash 3, для GPT и для Sonnet. В Sonnet немного дорого делать мелкие правки. Gemini перестал работать из-за провайдера. Пришлось работать с GPT. Ну какой же он тупой!
Самое правильное решение, которое принял — больше не использовать его. Парадокс: модель стоит дешевле, но по факту выходит значительно дороже. Приходится трижды переделывать за ней. Из-за косяков и ошибок постоянно нужно либо переделывать полностью, либо доделывать.
Пример: модель занималась переводом одной страницы. Пришлось всю страницу делать заново, потому что она полностью сократила всё, убрала оригинальные названия и заменила их на свои.
В общем, внимательно смотрите за тем, что она делает.
🫡6👎1😱1
Если вам нужно передать в n8n изображение агенту, через Телеграм
То все очень просто:
1️⃣ Включить Download Images/Files в триггере Телеграм.
2️⃣ Прям перед агентом поставить Merge
3️⃣ И в агенте включить:
Automatically Passthrough Binary Images
То все очень просто:
1️⃣ Включить Download Images/Files в триггере Телеграм.
2️⃣ Прям перед агентом поставить Merge
3️⃣ И в агенте включить:
Automatically Passthrough Binary Images
👍8
Лайфхак: Управление серверами через IDE и AI
Небольшой лайфхак. Через IDE можно управлять сервером сразу по SSH.
Алгоритм простой:
1. Создаёте папку, открываете её в VS Code.
2. Создаёте файл
(Это если у вас включен вход по ключу).
Там же описываете разрешённые команды и действия. Можно указать правило: «Согласовывай со мной все команды, которые хочешь выполнить». Вы сами будете видеть, что собирается делать нейросеть.
Кстати, OpenSSH Client в Windows 10/11 доступен по умолчанию или ставится в пару кликов. После этого команда
Собственно, после подключения у вас есть инструмент управления.
В файле инструкции можно описать огромное количество серверов. Просто говорите нейросети: «Пройди по всем 10 серверам и установи то-то» или «проверь логи».
По факту, это заменяет очень долгую настройку в n8n. Тут нужна только одна строка для доступа и ваши пожелания, что нужно выполнить.
Небольшой лайфхак. Через IDE можно управлять сервером сразу по SSH.
Алгоритм простой:
1. Создаёте папку, открываете её в VS Code.
2. Создаёте файл
.md с инструкцией по подключению:ssh -i C:\path\to\private_key.pem user@hostname -p 22(Это если у вас включен вход по ключу).
Там же описываете разрешённые команды и действия. Можно указать правило: «Согласовывай со мной все команды, которые хочешь выполнить». Вы сами будете видеть, что собирается делать нейросеть.
Кстати, OpenSSH Client в Windows 10/11 доступен по умолчанию или ставится в пару кликов. После этого команда
ssh работает в терминале без дополнительных настроек.Собственно, после подключения у вас есть инструмент управления.
В файле инструкции можно описать огромное количество серверов. Просто говорите нейросети: «Пройди по всем 10 серверам и установи то-то» или «проверь логи».
По факту, это заменяет очень долгую настройку в n8n. Тут нужна только одна строка для доступа и ваши пожелания, что нужно выполнить.
👍8
Канал проекта
https://t.me/life_trend
Сюда выкладываю все обновления сайта. Свежие фичи, новые возможности и развитие платформы — всё самое актуальное живет здесь.
@LifeTrendBot
https://lifetrend.ivol.pro
https://t.me/life_trend
Сюда выкладываю все обновления сайта. Свежие фичи, новые возможности и развитие платформы — всё самое актуальное живет здесь.
@LifeTrendBot
https://lifetrend.ivol.pro
Telegram
LifeTrend
LifeTrend — дневник осознанности с AI
Отслеживаю своё состояние 3 раза в день. Графики, паттерны, инсайты. Эксперимент над собой в реальном времени.
https://lifetrend.ivol.pro
@LifeTrendBot
Отслеживаю своё состояние 3 раза в день. Графики, паттерны, инсайты. Эксперимент над собой в реальном времени.
https://lifetrend.ivol.pro
@LifeTrendBot
👍5
Вчера обнаружил xAI: Grok Code Fast 1 — оказывается, можно бесплатно программировать.
Через плагин KiloCode.
Работает не только в Visual Studio, но и в PHPStorm эта модель тоже появилась бесплатно. В списке есть и другие модели бесплатные:
MiniMax M2.1
Mistral Devstral 2
KAT-Coder-Pro V1
В данный момент — не знаю, сколько у них там эта акция продлится — но делать какие-то прям очень маленькие вещи делает. И работает хорошо, на удивление.
Я использовал Grok для мелких изменений по коду. Но сразу хочу предупредить насчет контекста.
Как только объем превысит 100 тысяч токенов, модель сразу же начнет тупить. На 120 тысячах у меня она вообще отказалась работать. Она уменьшает, сжимает токены, и делает это очень странно. В итоге забывает, что делала, и начинает творить просто какую-то лютую херню.
Поэтому следить нужно за количеством токенов. Но для очень простых вещей — что-то подсказать, найти, изменить — вообще отлично.
Через плагин KiloCode.
Работает не только в Visual Studio, но и в PHPStorm эта модель тоже появилась бесплатно. В списке есть и другие модели бесплатные:
MiniMax M2.1
Mistral Devstral 2
KAT-Coder-Pro V1
В данный момент — не знаю, сколько у них там эта акция продлится — но делать какие-то прям очень маленькие вещи делает. И работает хорошо, на удивление.
Я использовал Grok для мелких изменений по коду. Но сразу хочу предупредить насчет контекста.
Как только объем превысит 100 тысяч токенов, модель сразу же начнет тупить. На 120 тысячах у меня она вообще отказалась работать. Она уменьшает, сжимает токены, и делает это очень странно. В итоге забывает, что делала, и начинает творить просто какую-то лютую херню.
Поэтому следить нужно за количеством токенов. Но для очень простых вещей — что-то подсказать, найти, изменить — вообще отлично.
👍6🐳1
Forwarded from Иван Олянский (Ivan)
71 день как я веду записи в LifeTrend
И вот такие интересные мысли приходят в голову:
Если бы я начинал заново: главное, что нужно найти первым
https://note.ivol.pro/p/esli-by-a-nacinal-zanovo-glavnoe-cto-nuzno-najti-pervym-1768017369
И вот такие интересные мысли приходят в голову:
Если бы я начинал заново: главное, что нужно найти первым
https://note.ivol.pro/p/esli-by-a-nacinal-zanovo-glavnoe-cto-nuzno-najti-pervym-1768017369
👍4❤1
Эксперименты в LifeTrend: что я исследую
В разделе "Эксперименты" на сайте LifeTrend я тестирую влияние привычек на состояние и продуктивность. Три активных эксперимента прямо сейчас.
1. Ролик (ежедневные упражнения)
Мне было сложно вернуться к спорту. С силовыми тренировками понятно — 2-3 раза в неделю. Но для регулярности я пришёл к простому решению: делать что-то каждый день.
Суть эксперимента: Выполнить 40 повторений с роликом (стоя на коленях). Всего 40 движений — и всё.
Бот присылает напоминания в середине дня и вечером. Отмечаю, сделал или нет. Когда я активно занимаюсь, эта привычка держит меня в тонусе каждый день.
2. Медитация (отключение потока мыслей)
Когда-то я уже практиковал медитацию. Сейчас вернулся к этому.
Для меня медитация — это не обязательно сидеть в позе лотоса. Можно просто лежать 15 минут и слушать музыку. Главное — переключиться и остановить поток мыслей, который постоянно бежит.
Как работает: Бот напоминает, сделал ли я медитацию. Задача — продержаться 15 минут. Записываю всё, что приходит в голову. Если какая-то мысль не даёт усидеть на месте — бросаю медитацию и иду за этим порывом. Пошел за идеей сразу.
3. Состояние → Количество идей
Третий эксперимент — как моё состояние влияет на количество идей, которые приходят для реализации. Не на продуктивность, а именно на идеи.Отслеживаю связь: какое состояние (по шкале от 1 до 10) → сколько идей пришло за день.
Как работает Лаборатория
Суть LifeTrend — вы сами настраиваете любой вопрос для отслеживания.
1. Выбираете параметры (например, "Сделал ли упражнения?", "Медитировал?", "Сколько идей пришло?")
2. Настраиваете, когда бот будет присылать напоминания
3. Отмечаете результаты
4. На странице лаборатории видите график того, как и что отмечали
Следующий шаг: Возможность поговорить с нейросетью о результатах. Сейчас это работает только у меня в тестовом режиме. Скоро будет доступно всем.
В разделе "Эксперименты" на сайте LifeTrend я тестирую влияние привычек на состояние и продуктивность. Три активных эксперимента прямо сейчас.
1. Ролик (ежедневные упражнения)
Мне было сложно вернуться к спорту. С силовыми тренировками понятно — 2-3 раза в неделю. Но для регулярности я пришёл к простому решению: делать что-то каждый день.
Суть эксперимента: Выполнить 40 повторений с роликом (стоя на коленях). Всего 40 движений — и всё.
Бот присылает напоминания в середине дня и вечером. Отмечаю, сделал или нет. Когда я активно занимаюсь, эта привычка держит меня в тонусе каждый день.
2. Медитация (отключение потока мыслей)
Когда-то я уже практиковал медитацию. Сейчас вернулся к этому.
Для меня медитация — это не обязательно сидеть в позе лотоса. Можно просто лежать 15 минут и слушать музыку. Главное — переключиться и остановить поток мыслей, который постоянно бежит.
Как работает: Бот напоминает, сделал ли я медитацию. Задача — продержаться 15 минут. Записываю всё, что приходит в голову. Если какая-то мысль не даёт усидеть на месте — бросаю медитацию и иду за этим порывом. Пошел за идеей сразу.
3. Состояние → Количество идей
Третий эксперимент — как моё состояние влияет на количество идей, которые приходят для реализации. Не на продуктивность, а именно на идеи.Отслеживаю связь: какое состояние (по шкале от 1 до 10) → сколько идей пришло за день.
Как работает Лаборатория
Суть LifeTrend — вы сами настраиваете любой вопрос для отслеживания.
1. Выбираете параметры (например, "Сделал ли упражнения?", "Медитировал?", "Сколько идей пришло?")
2. Настраиваете, когда бот будет присылать напоминания
3. Отмечаете результаты
4. На странице лаборатории видите график того, как и что отмечали
Следующий шаг: Возможность поговорить с нейросетью о результатах. Сейчас это работает только у меня в тестовом режиме. Скоро будет доступно всем.
🐳5🤔1
Хотел просто попрактиковать английский — собрал бота за вечер.
Через неделю он уже сам писал мне первым, озвучивал ответы и понимал мои голосовые, где я мешаю русский с английским.
Рассказываю, как это собрал: n8n + Telegram + пара вечеров.
→ Читать тут - https://note.ivol.pro/p/kak-zelanie-izucit-anglijskij-pereroslo-v-personal-nogo-a-1768267440
Через неделю он уже сам писал мне первым, озвучивал ответы и понимал мои голосовые, где я мешаю русский с английским.
Рассказываю, как это собрал: n8n + Telegram + пара вечеров.
→ Читать тут - https://note.ivol.pro/p/kak-zelanie-izucit-anglijskij-pereroslo-v-personal-nogo-a-1768267440
note.ivol.pro
Как желание изучить английский переросло в персонального AI-ассистента
Появилось желание практиковать английский. Первая мысль — собрать бота, с которым можно просто переписываться. Пишу на русском, он переводит, показывает как...
👍6
Через две недели мой бот начал забывать, о чём мы говорили. Переспрашивал одно и то же.
Перепробовал суммаризацию, выдёргивание фактов, разные промпты — всё равно модель теряла важное.
Решение нашёл случайно: ошибся и сохранил ВСЁ общение в векторную базу. Охренеть как круто оказалось.
Теперь у агента 4 уровня памяти. Рассказываю, как это устроено.
→ Читать тут - https://note.ivol.pro/p/pamat-ai-agenta-cetyre-urovna-1768268971
Перепробовал суммаризацию, выдёргивание фактов, разные промпты — всё равно модель теряла важное.
Решение нашёл случайно: ошибся и сохранил ВСЁ общение в векторную базу. Охренеть как круто оказалось.
Теперь у агента 4 уровня памяти. Рассказываю, как это устроено.
→ Читать тут - https://note.ivol.pro/p/pamat-ai-agenta-cetyre-urovna-1768268971
note.ivol.pro
Память AI-агента: четыре уровня
В первой части я рассказал, как собрал английского бота с памятью в Redis. Схема простая: копим 40 сообщений, сжимаем первые 20, обновляем центральный блок....
🔥6👍3
200 тысяч токенов на входе. Один запрос — 200 рублей.
Подключил агента к своим данным, а он вместо 5 записей загрузил всю таблицу. И это всё висело в памяти, пока не пройдут 40 сообщений.
Сначала сделал фильтрацию — резал середину, оставлял начало и конец. Помогло, но не до конца.
Итоговое решение — ассистент-помощник на слабой модели, который готовит данные для основного агента.
→ Читать тут - https://note.ivol.pro/p/arhitektura-ai-assistenta-integracii-i-assistent-pomosnik-1768269702
Подключил агента к своим данным, а он вместо 5 записей загрузил всю таблицу. И это всё висело в памяти, пока не пройдут 40 сообщений.
Сначала сделал фильтрацию — резал середину, оставлял начало и конец. Помогло, но не до конца.
Итоговое решение — ассистент-помощник на слабой модели, который готовит данные для основного агента.
→ Читать тут - https://note.ivol.pro/p/arhitektura-ai-assistenta-integracii-i-assistent-pomosnik-1768269702
note.ivol.pro
Архитектура AI-ассистента: интеграции и ассистент-помощник
В первой части я рассказал, как собрал английского бота. Во второй — про четыре уровня памяти. Теперь — про то, как всё это связать с внешними данными и не...
🔥5