Forwarded from эйай ньюз
OpenAI релизнули подписку ChatGPT Pro за $100
Он всё так же даёт доступ к GPT 5.4 Pro и прочим фичам Pro подписки (помните про ChatGPT Pulse?), но с меньшими лимитами на Codex. Пользователи нового Pro тира будут получать 5x использования Codex по сравнению с Plus, но до 31 мая действует акция, которая удваивает использование для всех Pro пользователей, то есть на почти два месяца лимиты в 10x больше чем у Plus.
@ai_newz
Он всё так же даёт доступ к GPT 5.4 Pro и прочим фичам Pro подписки (помните про ChatGPT Pulse?), но с меньшими лимитами на Codex. Пользователи нового Pro тира будут получать 5x использования Codex по сравнению с Plus, но до 31 мая действует акция, которая удваивает использование для всех Pro пользователей, то есть на почти два месяца лимиты в 10x больше чем у Plus.
@ai_newz
🔥15👍4❤3
⚪️ Проект выходного дня - SaaS за викэнд
Решил провести небольшой эксперимент, собрать себе маленький домашний СааС за этот уикэнд. В общем, для доступа к ИИ мне нужен нормалный стабильныйVPN КВН. Ну и в тележку еще писать, и твиттер смотреть, и ютуб.
▶️ Я давно себе скрутил решение с серверами в DO, и из-за недавних наших местных ужесточений пришлось местный же серверок себе брать. В общем, вся эта скрученная экспормптом конструкция требовала постоянного внимания: чего то отваливалось, чего то надо было переставлять, случалось это как водится - невовремя. Мне это всё надоело, и я решил сделать себе автоматизацию.
▶️ План был такой: делаем центральный сервис, который управляет пулом vm "здесь" и "там" (облака разные - зеленое грефовское и DO). Тут раскатывается машинка с парой протоколов, и "там" один или два протокола. Центральный сервис должен много задач выполнять:
• должен следить чтобы машинки "тут" (ingres) были живые и поднимать новые по команде админа
• должен управлять пулом серверов "там" в разных датацентрах - "чинить" их по мере необходимости, поднимать и удалять уже ненужные;
• сервера "тут" должны иметь легкую автоматизацию: тестируем коннект, при проблемах меняем канал, проблемный канал "чиним" (перестраиваем конфиг на другие параметры, чтобы он снова работал)
• сервера "там" тупые vm по шаблону.
• хочу видеть статистику доступности и качества канала к каждому серверу; мне надо понимать какой нынче самый стабильный, для ответственных вопросов, когда нужно чтобы не тупило, по возможности;
• хочу иметь возможность на разных серверах "тут" менять каналы (в зависимости от того, что мне надо)
• хочу под руками иметь коннекты на ingress (чтобы актуальные раздавать домашним любителям всяких роблоксов)
👉 Такая вот задача - но не в этом суть, это просто так, для иллюстрации. По мне - так не сильно сложный сервис, но и не одностраничный.
(...) В следующей части как это все реализовывалось
@deksden_notes
Решил провести небольшой эксперимент, собрать себе маленький домашний СааС за этот уикэнд. В общем, для доступа к ИИ мне нужен нормалный стабильный
▶️ Я давно себе скрутил решение с серверами в DO, и из-за недавних наших местных ужесточений пришлось местный же серверок себе брать. В общем, вся эта скрученная экспормптом конструкция требовала постоянного внимания: чего то отваливалось, чего то надо было переставлять, случалось это как водится - невовремя. Мне это всё надоело, и я решил сделать себе автоматизацию.
▶️ План был такой: делаем центральный сервис, который управляет пулом vm "здесь" и "там" (облака разные - зеленое грефовское и DO). Тут раскатывается машинка с парой протоколов, и "там" один или два протокола. Центральный сервис должен много задач выполнять:
• должен следить чтобы машинки "тут" (ingres) были живые и поднимать новые по команде админа
• должен управлять пулом серверов "там" в разных датацентрах - "чинить" их по мере необходимости, поднимать и удалять уже ненужные;
• сервера "тут" должны иметь легкую автоматизацию: тестируем коннект, при проблемах меняем канал, проблемный канал "чиним" (перестраиваем конфиг на другие параметры, чтобы он снова работал)
• сервера "там" тупые vm по шаблону.
• хочу видеть статистику доступности и качества канала к каждому серверу; мне надо понимать какой нынче самый стабильный, для ответственных вопросов, когда нужно чтобы не тупило, по возможности;
• хочу иметь возможность на разных серверах "тут" менять каналы (в зависимости от того, что мне надо)
• хочу под руками иметь коннекты на ingress (чтобы актуальные раздавать домашним любителям всяких роблоксов)
👉 Такая вот задача - но не в этом суть, это просто так, для иллюстрации. По мне - так не сильно сложный сервис, но и не одностраничный.
(...) В следующей части как это все реализовывалось
@deksden_notes
👍12❤4
⚪️ Проект выходного дня - SaaS за уикэнд ч2
(...)
В общем, созрев я стартанул кодекс, засидил им меморибанк с проекта-донора, и начал проговаривать ТЗ. За полдня сделал прототип скриптов (на vm был питон, поэтому на питоне), POC работал вроде норм. Каналы переключал, если надо чинил. Оставил это все крутится под текущую работу, приступил к формированию ТЗ.
▶️ ТЗ формировал долго, остаток субботы беседовали про концепцию. Все утро вс ушло на фоновое создание инфраструктуры под проект:
• пара vercel проектов
• пара supabase аккаунтов (beta/prod)
• resend аккаунт
• купить домен
• заведение домена в simplelogin (не хочу почтовик вешать на такой сервис, но аккаунты ему свои нужны)
• подключение всего ко всему с выгрузкой в .env и последующим раскладыванием куда надо
▶️ Поэтому с большим интересом смотрю на Stripe Projects чтобы раскатывать подобные вещи СУЩЕСТВЕННО быстрее. Можно конечто через $agent-browser, но тут все таки быстрее самому. Dev ops это боль, конечно.
▶️ После нудного подъема пучка сервисов - возвращаемся к ТЗ. Еще раз все полируем вопросами, граундим на созданную инфру, и в товарном виде засылаем на реализацию. Примерно 2:40 это все делается, и - уже вечер, смотрим итоги первого протокола.
👉 Идея эксперимента была в ваншоте по подробной спецификации
👉 ui конечно ИИшный, много всего, запутано и не оч удобно.
👉 ui не такой страшный, как я преполагал
👉 в целом чего то видно, все что прямо проговаривали - да, есть
👉 пользоваться в таком виде можно, но не очень
👉 функционально - основное работает, трафик идет, переключает, работает в проводном и мобильном кейсе, все протоколы;
☝️ Выводы: в принципе, можно и большие таски задавать, но готовить их реально примерно столько же, сколько оно их делает
В UI / UX оно слабо понимает и соображает. Чтобы было удобно, красиво и хорошо - потом большая работа напильником.
Делать сразу десяток фич можно, но не нужно: каждая сделана кривовато, неудобно, и очевидные вещи упущены. Что то не выводится, хотя надо, что то не так сделано.
В общем, как вариант получить быстрый прототип - норм. Но потом прийдется все по каждому аспекту ревизовать и "доработать напильником". Зато имея перед глазами работающую систему делать это гораздо приятнее и проще, чем "из головы".
🟢 Из плюсов: система сразу сделана под все планируемые фичи. Следовательно, не будет варианта когда придумал фичу из-за которой надо половину переделать. Переделывать - всегда долго и сложно, у меня тут пучок сценариев/тестов, их надо будет переписать. А когда делаешь "объемный ваншот" - там уже есть "место под помидоры".
Ощущения смешанные. Не уверен что это оптимальный способ работы, но что то в этом есть. И - да, в каком то смысле запилить саас за уикэнд можно))
@deksden_notes
(...)
В общем, созрев я стартанул кодекс, засидил им меморибанк с проекта-донора, и начал проговаривать ТЗ. За полдня сделал прототип скриптов (на vm был питон, поэтому на питоне), POC работал вроде норм. Каналы переключал, если надо чинил. Оставил это все крутится под текущую работу, приступил к формированию ТЗ.
▶️ ТЗ формировал долго, остаток субботы беседовали про концепцию. Все утро вс ушло на фоновое создание инфраструктуры под проект:
• пара vercel проектов
• пара supabase аккаунтов (beta/prod)
• resend аккаунт
• купить домен
• заведение домена в simplelogin (не хочу почтовик вешать на такой сервис, но аккаунты ему свои нужны)
• подключение всего ко всему с выгрузкой в .env и последующим раскладыванием куда надо
▶️ Поэтому с большим интересом смотрю на Stripe Projects чтобы раскатывать подобные вещи СУЩЕСТВЕННО быстрее. Можно конечто через $agent-browser, но тут все таки быстрее самому. Dev ops это боль, конечно.
▶️ После нудного подъема пучка сервисов - возвращаемся к ТЗ. Еще раз все полируем вопросами, граундим на созданную инфру, и в товарном виде засылаем на реализацию. Примерно 2:40 это все делается, и - уже вечер, смотрим итоги первого протокола.
👉 Идея эксперимента была в ваншоте по подробной спецификации
👉 ui конечно ИИшный, много всего, запутано и не оч удобно.
👉 ui не такой страшный, как я преполагал
👉 в целом чего то видно, все что прямо проговаривали - да, есть
👉 пользоваться в таком виде можно, но не очень
👉 функционально - основное работает, трафик идет, переключает, работает в проводном и мобильном кейсе, все протоколы;
☝️ Выводы: в принципе, можно и большие таски задавать, но готовить их реально примерно столько же, сколько оно их делает
В UI / UX оно слабо понимает и соображает. Чтобы было удобно, красиво и хорошо - потом большая работа напильником.
Делать сразу десяток фич можно, но не нужно: каждая сделана кривовато, неудобно, и очевидные вещи упущены. Что то не выводится, хотя надо, что то не так сделано.
В общем, как вариант получить быстрый прототип - норм. Но потом прийдется все по каждому аспекту ревизовать и "доработать напильником". Зато имея перед глазами работающую систему делать это гораздо приятнее и проще, чем "из головы".
🟢 Из плюсов: система сразу сделана под все планируемые фичи. Следовательно, не будет варианта когда придумал фичу из-за которой надо половину переделать. Переделывать - всегда долго и сложно, у меня тут пучок сценариев/тестов, их надо будет переписать. А когда делаешь "объемный ваншот" - там уже есть "место под помидоры".
Ощущения смешанные. Не уверен что это оптимальный способ работы, но что то в этом есть. И - да, в каком то смысле запилить саас за уикэнд можно))
@deksden_notes
🔥15❤6👍4👻1🆒1
⚪️ Китовые страсти
Тут в обсуждениях Мифоса и ожиданиях Картофеля немного потонули две темы
Первая - это новые ценики зайцев, там примерно х2 к прежним. Ну и алибиби кодовый план за 10 закрыла, теперь только за 50 и пока без обновления моделей (глм 5.1 линейки нету никакой, минимакса 2.7 нету).
Ну и новая лицензия Минимакса 2.7 тоже вызвала легкий шитсторм - там запрещено бесплатное коммерческое использвоание.
🔗 Про лицензию ответ Минимаксов: https://x.com/RyanLeeMiniMax/status/2043573044065820673
▶️ Что я хотел бы прокомментирвоать по этому поводу:
• чудес не бывает, экономика должна сходится. Инференс у китов не бесплатный, что показывает опыт заев, которые перебрали клиентов перед ipo и теперь поставили легкий paywall новым клиентам (берут только маржинальных);
• период бесплатных или очень дешевых китайских моделей слегка кончился - теперь они тоже стоят денег; и хорошо, что пока небольших, все таки поменьше фронтира;
• конкуренция все отрегулирует
Я за выстраивание здоровой экономики - у компаний должны быть ресурсы чтобы развиваться, значит денег им надо платить, это нормально. Бесплатно ничего стороннего быть не может, бесплатно вы сами на себя можете поработать - не более. Всем остальным кто вам что то дает нужно бы дать тех или иных денег, если это вам нужно. Это номрально и правильно, но сколько дать - это у вас уже естьв ыбор по ценам на рынке, кому платить.
👉 В общем, видим развитие рынка, кмк
——
Upd 1️⃣ : минимаксы подтвердили что коммерческая разработка с их моделями, в том числе селф-хостед - вполне возмоджна и приветствуется. Пруф в комментах. Нельзя SaaS бесплатно на их модели сделать, тут надо о коммерческой лицензии с ними договорится. Большинство провайдеров договорилось))
(ц) так и живем!
@deksden_notes
Тут в обсуждениях Мифоса и ожиданиях Картофеля немного потонули две темы
Первая - это новые ценики зайцев, там примерно х2 к прежним. Ну и алибиби кодовый план за 10 закрыла, теперь только за 50 и пока без обновления моделей (глм 5.1 линейки нету никакой, минимакса 2.7 нету).
Ну и новая лицензия Минимакса 2.7 тоже вызвала легкий шитсторм - там запрещено бесплатное коммерческое использвоание.
🔗 Про лицензию ответ Минимаксов: https://x.com/RyanLeeMiniMax/status/2043573044065820673
▶️ Что я хотел бы прокомментирвоать по этому поводу:
• чудес не бывает, экономика должна сходится. Инференс у китов не бесплатный, что показывает опыт заев, которые перебрали клиентов перед ipo и теперь поставили легкий paywall новым клиентам (берут только маржинальных);
• период бесплатных или очень дешевых китайских моделей слегка кончился - теперь они тоже стоят денег; и хорошо, что пока небольших, все таки поменьше фронтира;
• конкуренция все отрегулирует
Я за выстраивание здоровой экономики - у компаний должны быть ресурсы чтобы развиваться, значит денег им надо платить, это нормально. Бесплатно ничего стороннего быть не может, бесплатно вы сами на себя можете поработать - не более. Всем остальным кто вам что то дает нужно бы дать тех или иных денег, если это вам нужно. Это номрально и правильно, но сколько дать - это у вас уже естьв ыбор по ценам на рынке, кому платить.
👉 В общем, видим развитие рынка, кмк
——
Upd 1️⃣ : минимаксы подтвердили что коммерческая разработка с их моделями, в том числе селф-хостед - вполне возмоджна и приветствуется. Пруф в комментах. Нельзя SaaS бесплатно на их модели сделать, тут надо о коммерческой лицензии с ними договорится. Большинство провайдеров договорилось))
(ц) так и живем!
@deksden_notes
X (formerly Twitter)
RyanLee (@RyanLeeMiniMax) on X
Re: M2.7 license — what changed and why
👍19❤5🤓1
⚪️ Про эпохи
Интересный текст, философский - спасибо @o2alex. Прочитайте!
https://m.facebook.com/groups/neognostic/permalink/2345005566011580/
Если кто то конвертнет в телеграф - киньте ссылку в комменты для тех, кому сложно в мордокнигу
——
Upd 1️⃣ : спс @densce
🔗 телеграф тут: https://telegra.ph/neognosticizm-04-13
@deksden_notes
Интересный текст, философский - спасибо @o2alex. Прочитайте!
https://m.facebook.com/groups/neognostic/permalink/2345005566011580/
Если кто то конвертнет в телеграф - киньте ссылку в комменты для тех, кому сложно в мордокнигу
——
Upd 1️⃣ : спс @densce
🔗 телеграф тут: https://telegra.ph/neognosticizm-04-13
@deksden_notes
👍8❤🔥1😁1
⚪️ Codex App превращается, превращается, ...
...в брюки! В какое то подобие IDE. Народ там раскопал такое: встроенный браузер и аннотация элементов для агента (да, как agentation). Ну - удобненько будет, да. Хотя и сейчас ничего не мешает подобный сетап собрать, из пары компонентов.
А еще кто то спрашивал - зачем терминал с баузером?))
Ждемс
Видимо, это следы от супер-аппа. Как минимум жду еще встраивания browser use агента - будет такой коворк. Хотя мне идея использовать свой браузер уже с моими авторизациями кажется ближе.
@deksden_notes
...
А еще кто то спрашивал - зачем терминал с баузером?))
Ждемс
Видимо, это следы от супер-аппа. Как минимум жду еще встраивания browser use агента - будет такой коворк. Хотя мне идея использовать свой браузер уже с моими авторизациями кажется ближе.
@deksden_notes
❤10👍9👎1
⚪️ Управление пулом подписок
Поделюсь актуальной для меня темой - управление пулом подписок. Интенсивное использование ИИ агентов приводит к необходимости пользоваться инференсом в приличных масштабах, об использовании одного аккаунта речи особо не идет.
▶️ Цены и уровни подписок. С появлением подписок за 100 и 200 можно рассмотреть варианты перехода на них, но я пока не особо знаю о количестве инференса в каждой подписке. Пока мне кажется у вариантов покупки аккаунтов плюс на плати маркетах з 300 рублей конкурентов по эоконмике нету! Ведь х20 использования в подписке за 200 - это лишь про 5 часовые сессии, не факт что недельные лимиты там х20. А цена - 300р это $3-4. То есть это х50 к подписке за 200. В общем, каждый сам решает.
▶️ Софтина. Я использую для управления пулом приложение Quotio для macos. Оно рабоатет поверх известного проекта CliproxyAPI, который сам по себе умеет управлять подписками. Кто то использует proxyPal c гитхаба (тоже сделан поверх CLIproxyAPI). Что дает софт? заводите в него подписки, софт настраивает ваших агентов (codex у меня) использовать локальный прокси, а прокси уже при "упирании" в лимит прозрачно перенаправляет аш запрос на другой аккаунт. В итоге работа идет без перерыва, вы просто наблюдаете как таят лимиты))
▶️ Расчеты. В подписки сейчас входят да лимита - на 5 часов и на неделю. Причем, все они важны по разному, но объявляют объем только одного лимита - в 5 часов. Это странно, конечно, но как есть!
▶️ Ротация. Я ставлю в прокси ротацию подписок по принципу "Fill First". Это как раз чтобы посчитать удобнее было. Там есть еще round robin - может быть такое будет удобнее если хочется чтобы 5 часовой лимит сбросился быстрее (тогда каждый аккаунт тихонько потрогают, и он стартует сессию) - но меня смущает кеш в этом случае, возможно, он плохо работает. Поэтому fill first.
▶️ Подсчеты лимитов. Когда пользуешься подписками в режиме fill first, то видно с каким интервалом обновляются аккаунты. У меня получается 45-50 минут между двумя аккаунтами (2 потока с агентами со свармами). Это означает, что если я хочу работать непрерывно "без обеда" - то для покрытия 5 часового лимита: 5 * 60 = 300 / 45 = 6.(6) это 7 аккаунтов минимум в ротации. если слегка "добавить" газа и интервал снизится до 30 минут, то уже 10 аккаунтов. Оценку по непрерывности работы сделали.
▶️ Общий объем. Сейчас одна "выжженая" 5 часовая сессия = 15% недельного лимита (раньше было 30%). Это значит что 45 минут вашей работы - это 15% недельного лимита. То есть 15/45 = 0.(3)% в минуту при ротации аккаунта за 45 минут. Выходит, у вас в одной подписке 303 минуты работы примерно. Если в неделю 7 дней система работает по 10 часов, вам надо 70 часов работы, это 70 * 60 = 4200 минут. То есть в подписках 4200 / 303 = 13.8 ≈ 14. Если оставлять на ночь и будет выходить под 20 часов, то это 12k минут или 40 подписок. Вот вам и диапазон потребления - 14-40 аккаунтов, пока "сделать" больше я не организовал (это облачный оркестратор уже будет, я готовлю - спасибо, exe.dev).
▶️ Подписку за 200 не брал, но мне кажется даже если там х20 - мне ее не хватит)) По мне - это довольно интенсивная работа агентов в день, без "ночных смен", не более. Но на эти деньги пока можно взять 40-50 подписок плюс, что все таки поболее. Инструменты типа cliproxyapi делают удобство использования про/пучка плюсов одинаковым
(ц) вот такая занимательная арифметика!
@deksden_notes
Поделюсь актуальной для меня темой - управление пулом подписок. Интенсивное использование ИИ агентов приводит к необходимости пользоваться инференсом в приличных масштабах, об использовании одного аккаунта речи особо не идет.
▶️ Цены и уровни подписок. С появлением подписок за 100 и 200 можно рассмотреть варианты перехода на них, но я пока не особо знаю о количестве инференса в каждой подписке. Пока мне кажется у вариантов покупки аккаунтов плюс на плати маркетах з 300 рублей конкурентов по эоконмике нету! Ведь х20 использования в подписке за 200 - это лишь про 5 часовые сессии, не факт что недельные лимиты там х20. А цена - 300р это $3-4. То есть это х50 к подписке за 200. В общем, каждый сам решает.
▶️ Софтина. Я использую для управления пулом приложение Quotio для macos. Оно рабоатет поверх известного проекта CliproxyAPI, который сам по себе умеет управлять подписками. Кто то использует proxyPal c гитхаба (тоже сделан поверх CLIproxyAPI). Что дает софт? заводите в него подписки, софт настраивает ваших агентов (codex у меня) использовать локальный прокси, а прокси уже при "упирании" в лимит прозрачно перенаправляет аш запрос на другой аккаунт. В итоге работа идет без перерыва, вы просто наблюдаете как таят лимиты))
▶️ Расчеты. В подписки сейчас входят да лимита - на 5 часов и на неделю. Причем, все они важны по разному, но объявляют объем только одного лимита - в 5 часов. Это странно, конечно, но как есть!
▶️ Ротация. Я ставлю в прокси ротацию подписок по принципу "Fill First". Это как раз чтобы посчитать удобнее было. Там есть еще round robin - может быть такое будет удобнее если хочется чтобы 5 часовой лимит сбросился быстрее (тогда каждый аккаунт тихонько потрогают, и он стартует сессию) - но меня смущает кеш в этом случае, возможно, он плохо работает. Поэтому fill first.
▶️ Подсчеты лимитов. Когда пользуешься подписками в режиме fill first, то видно с каким интервалом обновляются аккаунты. У меня получается 45-50 минут между двумя аккаунтами (2 потока с агентами со свармами). Это означает, что если я хочу работать непрерывно "без обеда" - то для покрытия 5 часового лимита: 5 * 60 = 300 / 45 = 6.(6) это 7 аккаунтов минимум в ротации. если слегка "добавить" газа и интервал снизится до 30 минут, то уже 10 аккаунтов. Оценку по непрерывности работы сделали.
▶️ Общий объем. Сейчас одна "выжженая" 5 часовая сессия = 15% недельного лимита (раньше было 30%). Это значит что 45 минут вашей работы - это 15% недельного лимита. То есть 15/45 = 0.(3)% в минуту при ротации аккаунта за 45 минут. Выходит, у вас в одной подписке 303 минуты работы примерно. Если в неделю 7 дней система работает по 10 часов, вам надо 70 часов работы, это 70 * 60 = 4200 минут. То есть в подписках 4200 / 303 = 13.8 ≈ 14. Если оставлять на ночь и будет выходить под 20 часов, то это 12k минут или 40 подписок. Вот вам и диапазон потребления - 14-40 аккаунтов, пока "сделать" больше я не организовал (это облачный оркестратор уже будет, я готовлю - спасибо, exe.dev).
▶️ Подписку за 200 не брал, но мне кажется даже если там х20 - мне ее не хватит)) По мне - это довольно интенсивная работа агентов в день, без "ночных смен", не более. Но на эти деньги пока можно взять 40-50 подписок плюс, что все таки поболее. Инструменты типа cliproxyapi делают удобство использования про/пучка плюсов одинаковым
(ц) вот такая занимательная арифметика!
@deksden_notes
🔥23❤4🤝2🙉1
⚪️ Озадачен
Я тут решил посмотреть расход токенов и немного удивился.
Да, свармы конечно кушают неплохо, но не настолько же. Это ccusage.
Кто то еще в последнее время считал? Это оно сломалось или я правда мог столько сжечь?
@deksden_notes
Я тут решил посмотреть расход токенов и немного удивился.
Да, свармы конечно кушают неплохо, но не настолько же. Это ccusage.
Кто то еще в последнее время считал? Это оно сломалось или я правда мог столько сжечь?
@deksden_notes
🤷♂5🤬3
⚪️ Как вы разрабатываете свои флоу?
Сейчас все кто работает в AI Dev уже волей-неволей наработали свой флоу, свой подход к решению задач.
Кто то юзает стандартные упряжки, кто то тестирует и пользует разные инструменты, кто то сделал свои.
Кто то берет набор фреймворков и юзает, кто то пилит свои.
Какой ваш ai стек?
1️⃣ базовая упряжка? в какой операционной среде работаете?
2️⃣ флоу? какими процессами пользуетесь?
3️⃣ тулы? какой то дополнительный AI SWE tools?
——
▶️ Я пользую codex в основном с гпт моделями, иногда СС и Опенкод с разными, в основном китовыми моделями.
▶️ Флоу у меня свой, на меморибанке основан и сформированных подходах. Я обязательно изучаю разные фреймворки в поисках каких то идей и подходов, и некоторые адаптирую. Да - все это типа superpowers, beads, openspec, speckit, bmad, oh-my-всякое. Смотрю чего нового получилось - вот последнее это сварм в кодексе, который сейчас активно внедряю в разные этапы флоу (в основном на сбор информации, хотя код тоже пытаюсь писать свармом, когда в стандартной упряжке).
Отработанные моменты флоу, когда они превращаются в рутину - вношу в свой оркестратор, чтобы он детерминированно их применял. Автоматизация по классике. Экспериментальные флоу все идут "в ручном" режиме.
Флоу адаптирую по lessons learned: если что то сделано не так, если какие то проблемы вскрылись, если что то неоптимально - стараюсь не только исправить, но и подумать где во флоу была "дырка" через которую данная проблема попала
▶️ Тулы, да - использую доп тулы. Для UI иногда stitch юзаю. Иногда cmux как оркестратор или что то для удаленной работы. Для автоматизации рутины - свой оркестратор. Конечно специфические приблуды в виде agent browser, playright, agentation.
Скиллы - да, иногда делаю, но думаю тут крупнейшая зона развития у меня: много можно обернуть в скилл, думаю надо что то достать из меморибанка и в скилл заворачивать. Например, операционные ранбуки для проектов. Сценарные вещи в проекте - чтобы агент грамотно оркестрировал помимо детерминированного подхода. Девопс всякий - разворачивание на стейджах, миграции, бэкапы, мониторинги прода, чтение логов и телеметрии, реакция на инциденты. Это все могут быть скиллы, и сюда нужно агентов сажать, конечно.
(ц) так и живем!
Сейчас все кто работает в AI Dev уже волей-неволей наработали свой флоу, свой подход к решению задач.
Кто то юзает стандартные упряжки, кто то тестирует и пользует разные инструменты, кто то сделал свои.
Кто то берет набор фреймворков и юзает, кто то пилит свои.
Какой ваш ai стек?
1️⃣ базовая упряжка? в какой операционной среде работаете?
2️⃣ флоу? какими процессами пользуетесь?
3️⃣ тулы? какой то дополнительный AI SWE tools?
——
▶️ Я пользую codex в основном с гпт моделями, иногда СС и Опенкод с разными, в основном китовыми моделями.
▶️ Флоу у меня свой, на меморибанке основан и сформированных подходах. Я обязательно изучаю разные фреймворки в поисках каких то идей и подходов, и некоторые адаптирую. Да - все это типа superpowers, beads, openspec, speckit, bmad, oh-my-всякое. Смотрю чего нового получилось - вот последнее это сварм в кодексе, который сейчас активно внедряю в разные этапы флоу (в основном на сбор информации, хотя код тоже пытаюсь писать свармом, когда в стандартной упряжке).
Отработанные моменты флоу, когда они превращаются в рутину - вношу в свой оркестратор, чтобы он детерминированно их применял. Автоматизация по классике. Экспериментальные флоу все идут "в ручном" режиме.
Флоу адаптирую по lessons learned: если что то сделано не так, если какие то проблемы вскрылись, если что то неоптимально - стараюсь не только исправить, но и подумать где во флоу была "дырка" через которую данная проблема попала
▶️ Тулы, да - использую доп тулы. Для UI иногда stitch юзаю. Иногда cmux как оркестратор или что то для удаленной работы. Для автоматизации рутины - свой оркестратор. Конечно специфические приблуды в виде agent browser, playright, agentation.
Скиллы - да, иногда делаю, но думаю тут крупнейшая зона развития у меня: много можно обернуть в скилл, думаю надо что то достать из меморибанка и в скилл заворачивать. Например, операционные ранбуки для проектов. Сценарные вещи в проекте - чтобы агент грамотно оркестрировал помимо детерминированного подхода. Девопс всякий - разворачивание на стейджах, миграции, бэкапы, мониторинги прода, чтение логов и телеметрии, реакция на инциденты. Это все могут быть скиллы, и сюда нужно агентов сажать, конечно.
(ц) так и живем!
❤19🔥9👍1🙏1
⚪️ DESIGN.md
Не знаю, отслеживаете ли вы тренды в UI deign tools, но я посматриваю, благо иногда такое надо. Вот, например, если в кодинге Гемини сейчас особо ничем не выделяется, то для дизайна Ститч вполне себе употребим и полезен. Благо он еще и развивается довольно бодро!
Не так давно было крупное обновление, которое в том числе принесло концепцию DESIGN.md файлов. Это как AGENTS.md в корне репо для кодинговых агентов, только для дизайнерских агентов (типа ститча). Это обычный md файлик с описанием дизайн-системы вашего проекта, который дизайнерские агенты должны подхватыать.
🔗 Вот презенташка того обновления Ститча: https://blog.google/innovation-and-ai/models-and-research/google-labs/stitch-ai-ui-design/
🔗 Дока: https://stitch.withgoogle.com/docs/design-md/format
А заметку меня побудил сделать вот этот сайтик, на котором собраны дизайн-стили многих известный сайтов, и теперь их можно одним кликом себе забрать.
👉 https://getdesign.md/
🔗 Еще и гитхаб его : https://github.com/VoltAgent/awesome-design-md
(ц) такое мне представляется полезным
@deksden_notes
Не знаю, отслеживаете ли вы тренды в UI deign tools, но я посматриваю, благо иногда такое надо. Вот, например, если в кодинге Гемини сейчас особо ничем не выделяется, то для дизайна Ститч вполне себе употребим и полезен. Благо он еще и развивается довольно бодро!
Не так давно было крупное обновление, которое в том числе принесло концепцию DESIGN.md файлов. Это как AGENTS.md в корне репо для кодинговых агентов, только для дизайнерских агентов (типа ститча). Это обычный md файлик с описанием дизайн-системы вашего проекта, который дизайнерские агенты должны подхватыать.
🔗 Вот презенташка того обновления Ститча: https://blog.google/innovation-and-ai/models-and-research/google-labs/stitch-ai-ui-design/
🔗 Дока: https://stitch.withgoogle.com/docs/design-md/format
А заметку меня побудил сделать вот этот сайтик, на котором собраны дизайн-стили многих известный сайтов, и теперь их можно одним кликом себе забрать.
👉 https://getdesign.md/
🔗 Еще и гитхаб его : https://github.com/VoltAgent/awesome-design-md
(ц) такое мне представляется полезным
@deksden_notes
5❤🔥12⚡5👍5❤1😁1
⚪️ Доработка плана свармом (plan swarming)
Несколько слов о том, почему я в последнее время перестраиваю свой флоу в том числе на использование свармов (термин тут поясняется - https://t.me/deksden_notes/269).
В общем, пишу я тут планы с агентом. Примерно два-три часа диалога на предмет чего там и как, снимаем gaps, дорабатыаем, все вопросы отвечаем, прописываем. ок - наконец то вкатываем. меморибанк планируемый апдейт: пучкок ADR, Specs с разным (границы сущностей, контракты, протоколы взаимодействия), фичи, интеграционный протокол доработки. Немаленькая штука получается. Агенту все нравися (кодекс 5.4 high).
👉 Тут я и решил экспериментик провести.
1️⃣ Натравил на оригинальный контекст свой промпт на рефлексию/ревью плана (довольно простой, в плане исследования разное по аспектам указано: от С4 структурирования до ui). Для эксперимента это не так важно. Поработав, оно выдает мне 12 (!!!) high/medium risk недоработок по плану! omfg. Читаю - да, там контракты разъехались, тут миграция недопрописана, - в общем, вполне реальные источники багов.
И я понимаю что рефакторинг я затеял не по зубам бюджету внимания. Что делать? Отказываться от габарита задачи и резать на блоки? Ну что за пораженчество, - нет конечно, появился перкрасный повод для эксперимента!)) Правильно подумали - ударим свармом по дефициту внимания! Пускай компьют зальет недостаток голов внимания.
▶️ Запускаем тот же самый промпт, только делаем его сварм-ориентированным: указываем что 5 субагентов на основании письменного задания проводят исследование (каждый смотрит по всему плану ревью), формируют итоговые отчеты, а оркестратор интегрирует их в свой отчет.
‼️ Цель эксперимента: показать что мультисамплинг частично компенсирует недостаток внимания.
Замечу, мы это запускаем после того как разок уже полирнули и устранили 12 важных недостатков.
Итоги эксперимента? Еще 11 issues с которыми согласен оркестратор (а он, между прочим, делал этот план), и из них 5 high приорити. Опять недотянутые контракты, непройденные до конца сценарии.
▶️ Продолжаем. Теперь мы ьерем ТОТ ЖЕ промпт, но просим нарезать план ревью на фокусные аспекты, и по каждому из фокусов запустить отдельного субагента. Обмен - тоже через файлы, конечно.
‼️ Цель эксперимента: показать что фокусировка сильно улучшает качество работы - это все таки значительное сужение габарита задачи
Результат: напомню, что в документации уже ВСЕ выявленные ранее изменения, это мы выкапываем то, что не заметили ранее. Нашли еще 7 недостатков, в том числе один high. Негативные сценарии недоработаны, сценарии доказательств недотянуты, двусмысленности, границы и формализация процессов.
Применяем выявленные исправления. Уже скромнее, да.
▶️ Да, мы не остановимся: теперь мы будем на каждый фокус запускать5 субагентов. Всё то же самое, но 5 раз по каждому фокусу с интеграцией в единый отчет. Сумеем ли мы вытянуть что то существенное?
‼️ Цель эксперимента: показать что мультисемплинг - мощь, которой можно усилить фокусировку.
Результат: получилось 5 фокусов, и 5 семплов, итого 25 запусков субагентов. большей частью уже medium/low, значит что могли почти все нашли. 1-2 high важности, но я не все бы так оценивал. Кстати, оркестратор их и не взял за high по итогу. Но находки вполне полезные - детали стыковок протоколов взаимодействия, контрактов.
Применяем. Уф. Скромнее, но все равно нашли чего то важное! Неплохо. Главное - убедились что модель уже ничего доработать существенного не может, значит точно все что можно нашли.
(...) продолжение: https://t.me/deksden_notes/666
@deksden_notes
Несколько слов о том, почему я в последнее время перестраиваю свой флоу в том числе на использование свармов (термин тут поясняется - https://t.me/deksden_notes/269).
В общем, пишу я тут планы с агентом. Примерно два-три часа диалога на предмет чего там и как, снимаем gaps, дорабатыаем, все вопросы отвечаем, прописываем. ок - наконец то вкатываем. меморибанк планируемый апдейт: пучкок ADR, Specs с разным (границы сущностей, контракты, протоколы взаимодействия), фичи, интеграционный протокол доработки. Немаленькая штука получается. Агенту все нравися (кодекс 5.4 high).
👉 Тут я и решил экспериментик провести.
1️⃣ Натравил на оригинальный контекст свой промпт на рефлексию/ревью плана (довольно простой, в плане исследования разное по аспектам указано: от С4 структурирования до ui). Для эксперимента это не так важно. Поработав, оно выдает мне 12 (!!!) high/medium risk недоработок по плану! omfg. Читаю - да, там контракты разъехались, тут миграция недопрописана, - в общем, вполне реальные источники багов.
И я понимаю что рефакторинг я затеял не по зубам бюджету внимания. Что делать? Отказываться от габарита задачи и резать на блоки? Ну что за пораженчество, - нет конечно, появился перкрасный повод для эксперимента!)) Правильно подумали - ударим свармом по дефициту внимания! Пускай компьют зальет недостаток голов внимания.
▶️ Запускаем тот же самый промпт, только делаем его сварм-ориентированным: указываем что 5 субагентов на основании письменного задания проводят исследование (каждый смотрит по всему плану ревью), формируют итоговые отчеты, а оркестратор интегрирует их в свой отчет.
‼️ Цель эксперимента: показать что мультисамплинг частично компенсирует недостаток внимания.
Замечу, мы это запускаем после того как разок уже полирнули и устранили 12 важных недостатков.
Итоги эксперимента? Еще 11 issues с которыми согласен оркестратор (а он, между прочим, делал этот план), и из них 5 high приорити. Опять недотянутые контракты, непройденные до конца сценарии.
▶️ Продолжаем. Теперь мы ьерем ТОТ ЖЕ промпт, но просим нарезать план ревью на фокусные аспекты, и по каждому из фокусов запустить отдельного субагента. Обмен - тоже через файлы, конечно.
‼️ Цель эксперимента: показать что фокусировка сильно улучшает качество работы - это все таки значительное сужение габарита задачи
Результат: напомню, что в документации уже ВСЕ выявленные ранее изменения, это мы выкапываем то, что не заметили ранее. Нашли еще 7 недостатков, в том числе один high. Негативные сценарии недоработаны, сценарии доказательств недотянуты, двусмысленности, границы и формализация процессов.
Применяем выявленные исправления. Уже скромнее, да.
▶️ Да, мы не остановимся: теперь мы будем на каждый фокус запускать5 субагентов. Всё то же самое, но 5 раз по каждому фокусу с интеграцией в единый отчет. Сумеем ли мы вытянуть что то существенное?
‼️ Цель эксперимента: показать что мультисемплинг - мощь, которой можно усилить фокусировку.
Результат: получилось 5 фокусов, и 5 семплов, итого 25 запусков субагентов. большей частью уже medium/low, значит что могли почти все нашли. 1-2 high важности, но я не все бы так оценивал. Кстати, оркестратор их и не взял за high по итогу. Но находки вполне полезные - детали стыковок протоколов взаимодействия, контрактов.
Применяем. Уф. Скромнее, но все равно нашли чего то важное! Неплохо. Главное - убедились что модель уже ничего доработать существенного не может, значит точно все что можно нашли.
(...) продолжение: https://t.me/deksden_notes/666
@deksden_notes
🔥15❤9👍5⚡2
⚪️ Доработка плана свармом (plan swarming) ч2
(...) начало тут: https://t.me/deksden_notes/665
Даже не спрашивайте сколько токенов ушло! Времени - час наверное. Прогонов? 1 + 5 + 5 + 25 = 36)) Вот вам и "доработка напильником и примерная оценка сколько "стоит" залить компьютом когда модель не очень тянет. Последние 25 прогонов наверное лишние, но можно по 2-3 фокусных семпла сделать. Либо сразу пускать фокусный ревью с мультисемплингом. Хотя итеративно - это все равно сильнее, так как выявленные проблемы фиксим, и точно ищем что осталось, а не одно и то же находим.
👉 Главные выводы: мультисамплинг работает, фокусировка работает. Сварм делает удобным использование и того, и того, и в комбинации - приемлемо и по простоте задействования (стандартная упряжка, простой промпт), и по времены работы (чуть дольше "плоской" работы). Недостатки? Токены жгем как не в себя.
👉 Зачем до идеала допиливать планы: потому как вложенное на этапе планирвоания окупается лучше всего - исправлять при реализации, а тем более после гораздо сложнее и дольше.
(ц) так и живём!
@deksden_notes
(...) начало тут: https://t.me/deksden_notes/665
Даже не спрашивайте сколько токенов ушло! Времени - час наверное. Прогонов? 1 + 5 + 5 + 25 = 36)) Вот вам и "доработка напильником и примерная оценка сколько "стоит" залить компьютом когда модель не очень тянет. Последние 25 прогонов наверное лишние, но можно по 2-3 фокусных семпла сделать. Либо сразу пускать фокусный ревью с мультисемплингом. Хотя итеративно - это все равно сильнее, так как выявленные проблемы фиксим, и точно ищем что осталось, а не одно и то же находим.
👉 Главные выводы: мультисамплинг работает, фокусировка работает. Сварм делает удобным использование и того, и того, и в комбинации - приемлемо и по простоте задействования (стандартная упряжка, простой промпт), и по времены работы (чуть дольше "плоской" работы). Недостатки? Токены жгем как не в себя.
👉 Зачем до идеала допиливать планы: потому как вложенное на этапе планирвоания окупается лучше всего - исправлять при реализации, а тем более после гораздо сложнее и дольше.
(ц) так и живём!
@deksden_notes
Telegram
DEKSDEN notes
⚪️ Доработка плана свармом (plan swarming)
Несколько слов о том, почему я в последнее время перестраиваю свой флоу в том числе на использование свармов (термин тут поясняется - https://t.me/deksden_notes/269).
В общем, пишу я тут планы с агентом. Примерно…
Несколько слов о том, почему я в последнее время перестраиваю свой флоу в том числе на использование свармов (термин тут поясняется - https://t.me/deksden_notes/269).
В общем, пишу я тут планы с агентом. Примерно…
🔥16❤7👍3
⚪️ Gemini CLI ← Subagents
Тут не прошло и года как в Gemini CLI завозят субгентов! Они оч долго держались - видимо, мнение что с контекстом 1m им это зачем? Но ведь субагенты - это не про экономию контекста.. Видимо, и до гугла дошло. Что ж, лучше поздно!..
🔗 Блог: https://developers.googleblog.com/subagents-have-arrived-in-gemini-cli/
(Осторожно, сделать тёмную тему или следовать настройкам системы в режиме отображения гугл в блоге пока не научился. Вот к концу следующей пятилетки соберут совет директоров, одобрят - тогда возможно допилят! Может, к тому времини и gemini CLI научится сделать такое в коде - но пока всех ждет удар в глаза. Это же гугл, а не какой то там стартап, им некогда о таких мелочах думать и некому, мало же народа)
🔗 Дока: https://geminicli.com/docs/core/subagents/
🔗 Анонс: https://x.com/JackWoth98/status/2044446839290622084
В целом, по фичам се довольно стандартно, на уровне того, что было в СС до сварма. До асинхронных субагентов с координацией в реальном времени Гугл пока не дошел, но параллельно пустить агентов можно. С катомными промптами и выбором модели, тулов. В целом ок, но немного не фронтир.
@deksden_notes
Тут не прошло и года как в Gemini CLI завозят субгентов! Они оч долго держались - видимо, мнение что с контекстом 1m им это зачем? Но ведь субагенты - это не про экономию контекста.. Видимо, и до гугла дошло. Что ж, лучше поздно!..
🔗 Блог: https://developers.googleblog.com/subagents-have-arrived-in-gemini-cli/
(Осторожно, сделать тёмную тему или следовать настройкам системы в режиме отображения гугл в блоге пока не научился. Вот к концу следующей пятилетки соберут совет директоров, одобрят - тогда возможно допилят! Может, к тому времини и gemini CLI научится сделать такое в коде - но пока всех ждет удар в глаза. Это же гугл, а не какой то там стартап, им некогда о таких мелочах думать и некому, мало же народа)
🔗 Дока: https://geminicli.com/docs/core/subagents/
🔗 Анонс: https://x.com/JackWoth98/status/2044446839290622084
В целом, по фичам се довольно стандартно, на уровне того, что было в СС до сварма. До асинхронных субагентов с координацией в реальном времени Гугл пока не дошел, но параллельно пустить агентов можно. С катомными промптами и выбором модели, тулов. В целом ок, но немного не фронтир.
@deksden_notes
😁11👍3
⚪️ Gemini App
День гугла на нашем канале какой то!
Но они выпустили нативный Gemini App для мака. Кстати, неплохой. Для М процессоров, интел не предлагать - гугл не может себе позволить второй бинарник в бандле.
Все то же самое что в браузере, но натино. Ну ок - будем картинки генерировать побыстрее. Еще и NotebookLM как источник появилось!..
▶️ Кстати, еще и релиз Flash 3.1 TTS. Лучше, круче, ... - вот это всё. Теперь NotebookLM будет говорить еще естественней (хорошо, да?)
@deksden_notes
День гугла на нашем канале какой то!
Но они выпустили нативный Gemini App для мака. Кстати, неплохой. Для М процессоров, интел не предлагать - гугл не может себе позволить второй бинарник в бандле.
Все то же самое что в браузере, но натино. Ну ок - будем картинки генерировать побыстрее. Еще и NotebookLM как источник появилось!..
▶️ Кстати, еще и релиз Flash 3.1 TTS. Лучше, круче, ... - вот это всё. Теперь NotebookLM будет говорить еще естественней (хорошо, да?)
@deksden_notes
🔥7😁3❤1
⚪️ Ну и новости кратко
▶️ Firecrawl зарелизил фичу Fire-PDF по быстрому преобразованию PDF в md.
🔗 https://docs.firecrawl.dev/features/document-parsing
——
▶️ OpenAI на высоких тирах дают доступ к gpt-5.4-cyber, это специальный тюн gpt-5.4 под кибербезопасность. Надо же контрить Мифоса! Хвастают что их то уже доступен (но не всем - а только кому надо, "сертифицированным хорошим" aka TAC, Trusted Access for Cyber TAC). Кстати, моделька напрямую смотрит бинарники (omfg).
🔗 https://openai.com/index/scaling-trusted-access-for-cyber-defense/
——
▶️ Windsurf 2.0
Вы же помните, да? Была в стародавние времена такая штука как ИДЕ, и одна из них была Windsurf. Оно потом согрешило и получился Антигравити, но я о другом - Winsurf теперь 2.0. Там где-то чего-то и Devin тоже где то.
——
▶️ OpenSource клон CC Routines:
🔗 https://github.com/multica-ai/multica
——
▶️ Google Chrome Skills
продолжаем день гугла - в хроме помимо Gemini вкрутят Skills, как способ промпты частоиспользуемые сохранить.
🔗 https://blog.google/products-and-platforms/products/chrome/skills-in-chrome/
——
▶️ Codex CLI v0.121
Добавили маркетплейс с плагинами и управление памятью
——
(ц) такой #день
@deksden_notes
▶️ Firecrawl зарелизил фичу Fire-PDF по быстрому преобразованию PDF в md.
🔗 https://docs.firecrawl.dev/features/document-parsing
——
▶️ OpenAI на высоких тирах дают доступ к gpt-5.4-cyber, это специальный тюн gpt-5.4 под кибербезопасность. Надо же контрить Мифоса! Хвастают что их то уже доступен (но не всем - а только кому надо, "сертифицированным хорошим" aka TAC, Trusted Access for Cyber TAC). Кстати, моделька напрямую смотрит бинарники (omfg).
🔗 https://openai.com/index/scaling-trusted-access-for-cyber-defense/
——
▶️ Windsurf 2.0
Вы же помните, да? Была в стародавние времена такая штука как ИДЕ, и одна из них была Windsurf. Оно потом согрешило и получился Антигравити, но я о другом - Winsurf теперь 2.0. Там где-то чего-то и Devin тоже где то.
——
▶️ OpenSource клон CC Routines:
🔗 https://github.com/multica-ai/multica
——
▶️ Google Chrome Skills
продолжаем день гугла - в хроме помимо Gemini вкрутят Skills, как способ промпты частоиспользуемые сохранить.
🔗 https://blog.google/products-and-platforms/products/chrome/skills-in-chrome/
——
▶️ Codex CLI v0.121
Добавили маркетплейс с плагинами и управление памятью
——
(ц) такой #день
@deksden_notes
Firecrawl Docs
Document Parsing | Firecrawl
Learn about document parsing capabilities.
🔥14👍8
⚪️ LETTA Memory Blocks
#post
Случайно наткнулся на сабж, по ходу обсуждения - когда Марио (автор pi) ворчал на Cloudflare что они без отсылок заюзали в своей системе его подход к сессиям: он древовидный, что достаточно оригинально и самобытно, поэтому бросилось в глаза. После ворчания, контора добавила отсылки, к слову - и теперь у Марио есть легкая реклама в документации CF. И одной из таких отсылок помимо Pi было - LETTA memory block.
Почитал про сабж.
🔗 И вы почитайте, в блоге: https://www.letta.com/blog/memory-blocks
🔗 и в доке: https://docs.letta.com/guides/core-concepts/memory/memory-blocks/
А вот та страничка в доке CF с отсылками:
🔗 https://developers.cloudflare.com/agents/api-reference/sessions/#acknowledgments
——
▶️ В целом выглядит интересно. LETA вообще ориентируется на память, что мне с моими memorybank подходами весьма близко.
Посмотрел что такое мемори-блок. Это способ организации операционного контекста, не для постоянной памяти. Он структурирован XML-like тегами, что правильно, - всегда сам так делаю. Дает ясную и понятную структуру контекста агентам. Сам блок устроен несложно - описание, метадата, значение. Блок может быть read-only, а так агент его редактирует тулзами.
▶️ Что показалось интересным и полезным.
Во-первых, описание блока description: это позволяет указать зачем нужна эта ячейка памяти. То есть не просто сказать - вот некое значение. А присовокупить рядом ЗАЧЕМ оно может понадобится, с какой целью оно находится в памяти агента. Очень откликается с моей концепцией аннтированных ссылок (я тоже делаю связку ЧТО и ЗАЧЕМ). Это дает практическую пользу, например, при компакте можно проанализировать актуальность, понимая цели этой ячейки, и не строить догадок с чего какая то инфомрация содержится в контексте.
Во вторых, четкое структурирование позволяет не только доабвить ясности агенту (он видит зачем ему что то помнить, но и вторичные цели достигает - можно бюджет на хранение разного рода информации выделить (в токенах), а группировать - теми же тегами в метадате. В метадате вообще можно всякое прописать: например, важность или добавить временной аспект (к какому периоду относится эта ячейка памяти, типа - какие правила действовали в прошлом году если мы анализируем документы компании). Получается довольно функционально.
👉 Вывод: годный дизайн, просто и удобно, понравилось. Не удивлен что CF забрали себе этот кусочек. Надо поступить так же)) Беда, что все подталкивает своего агента сделать - а не очень хочется ввязываться в такой сложный проект.
(ц) такое мы смотрим
@deksden_notes
#post
Случайно наткнулся на сабж, по ходу обсуждения - когда Марио (автор pi) ворчал на Cloudflare что они без отсылок заюзали в своей системе его подход к сессиям: он древовидный, что достаточно оригинально и самобытно, поэтому бросилось в глаза. После ворчания, контора добавила отсылки, к слову - и теперь у Марио есть легкая реклама в документации CF. И одной из таких отсылок помимо Pi было - LETTA memory block.
Почитал про сабж.
🔗 И вы почитайте, в блоге: https://www.letta.com/blog/memory-blocks
🔗 и в доке: https://docs.letta.com/guides/core-concepts/memory/memory-blocks/
А вот та страничка в доке CF с отсылками:
🔗 https://developers.cloudflare.com/agents/api-reference/sessions/#acknowledgments
——
▶️ В целом выглядит интересно. LETA вообще ориентируется на память, что мне с моими memorybank подходами весьма близко.
Посмотрел что такое мемори-блок. Это способ организации операционного контекста, не для постоянной памяти. Он структурирован XML-like тегами, что правильно, - всегда сам так делаю. Дает ясную и понятную структуру контекста агентам. Сам блок устроен несложно - описание, метадата, значение. Блок может быть read-only, а так агент его редактирует тулзами.
▶️ Что показалось интересным и полезным.
Во-первых, описание блока description: это позволяет указать зачем нужна эта ячейка памяти. То есть не просто сказать - вот некое значение. А присовокупить рядом ЗАЧЕМ оно может понадобится, с какой целью оно находится в памяти агента. Очень откликается с моей концепцией аннтированных ссылок (я тоже делаю связку ЧТО и ЗАЧЕМ). Это дает практическую пользу, например, при компакте можно проанализировать актуальность, понимая цели этой ячейки, и не строить догадок с чего какая то инфомрация содержится в контексте.
Во вторых, четкое структурирование позволяет не только доабвить ясности агенту (он видит зачем ему что то помнить, но и вторичные цели достигает - можно бюджет на хранение разного рода информации выделить (в токенах), а группировать - теми же тегами в метадате. В метадате вообще можно всякое прописать: например, важность или добавить временной аспект (к какому периоду относится эта ячейка памяти, типа - какие правила действовали в прошлом году если мы анализируем документы компании). Получается довольно функционально.
👉 Вывод: годный дизайн, просто и удобно, понравилось. Не удивлен что CF забрали себе этот кусочек. Надо поступить так же)) Беда, что все подталкивает своего агента сделать - а не очень хочется ввязываться в такой сложный проект.
(ц) такое мы смотрим
@deksden_notes
Letta
Memory Blocks: The Key to Agentic Context Management | Letta
Memory blocks offer an elegant abstraction for context window management. By structuring the context into discrete, functional units, we can give LLM agents more consistent, usable memory.
👍8❤4🔥3🙏1
⚪️ GitHub Actions - только локально
Встретил такую штуку - показалось полезным. Пока не знаю зачем именно, но сердцем чую что может пригодится)) Делюсь
🔗 Agent-CI: https://agent-ci.dev/
🔗 https://github.com/redwoodjs/agent-ci
Не забудем звездануть автору прям в гитхаб! ⭐️
#tools
@deksden_notes
Встретил такую штуку - показалось полезным. Пока не знаю зачем именно, но сердцем чую что может пригодится)) Делюсь
🔗 Agent-CI: https://agent-ci.dev/
🔗 https://github.com/redwoodjs/agent-ci
Не забудем звездануть автору прям в гитхаб! ⭐️
#tools
@deksden_notes
👍14🔥4❤2
⚪️ XATA теперь OpenSource
Есть такой проект XATA, который интересен тем, что это обычный стандартный и совместимый со всеми дополнениями
PostgreSQL НО с быстрым созданием бранчей.
То есть вы можете мгновенно сделать копию БД для тестирования на ЖИВЫХ данных, или для расследования бага. Полезная фича.
🔗 https://xata.io/
🔗 Блог с анонсом опенсорса: https://xata.io/blog/open-source-postgres-branching-copy-on-write
⭐️ Гитхаб для звезд: https://github.com/xataio/xata
Полезная штука теперь может быть теперь развернута недорого.
#tools
@deksden_notes
Есть такой проект XATA, который интересен тем, что это обычный стандартный и совместимый со всеми дополнениями
PostgreSQL НО с быстрым созданием бранчей.
То есть вы можете мгновенно сделать копию БД для тестирования на ЖИВЫХ данных, или для расследования бага. Полезная фича.
🔗 https://xata.io/
🔗 Блог с анонсом опенсорса: https://xata.io/blog/open-source-postgres-branching-copy-on-write
⭐️ Гитхаб для звезд: https://github.com/xataio/xata
Полезная штука теперь может быть теперь развернута недорого.
#tools
@deksden_notes
👍9❤1🔥1
⚪️ Селфхост на нашем канале!
Раз пошла такая пьянка с селф-хост решениями, скажу про две полезные платформы, может кто не знает
Заменяем Vercel / Netlify / Heroku - делаем self-hosted PaaS, Brr-rr:
1️⃣ Coolify:
🔗 Оффсайт: https://coolify.io/
🔗 Гибхаб: https://github.com/coollabsio/coolify
Фичи:
- Free SSL certificates, auto-renewed
- Automatic database backups to S3
- Pull request preview deployments
- Real-time server terminal in your browser
- Push-to-deploy from GitHub, GitLab, Bitbucket
- Server monitoring with Discord/Telegram/email alerts
2️⃣ Dokploy :
🔗 Оффсайт: https://dokploy.com/
🔗 Гитхаб: https://github.com/dokploy/dokploy
Фичи
• Applications: Deploy any type of application (Node.js, PHP, Python, Go, Ruby, etc.).
• Databases: Create and manage databases with support for MySQL, PostgreSQL, MongoDB, MariaDB, libsql, and Redis.
• Backups: Automate backups for databases to an external storage destination.
• Docker Compose: Native support for Docker Compose to manage complex applications.
• Multi Node: Scale applications to multiple nodes using Docker Swarm to manage the cluster.
• Templates: Deploy open-source templates (Plausible, Pocketbase, Calcom, etc.) with a single click.
• Traefik Integration: Automatically integrates with Traefik for routing and load balancing.
• Real-time Monitoring: Monitor CPU, memory, storage, and network usage for every resource.
• Docker Management: Easily deploy and manage Docker containers.
• CLI/API: Manage your applications and databases using the command line or through the API.
• Notifications: Get notified when your deployments succeed or fail (via Slack, Discord, Telegram, Email, etc.).
• Multi Server: Deploy and manage your applications remotely to external servers.
• Self-Hosted: Self-host Dokploy on your VPS.
Нужен только vps (ц)
#tools
@deksden_notes
Раз пошла такая пьянка с селф-хост решениями, скажу про две полезные платформы, может кто не знает
Заменяем Vercel / Netlify / Heroku - делаем self-hosted PaaS, Brr-rr:
1️⃣ Coolify:
🔗 Оффсайт: https://coolify.io/
🔗 Гибхаб: https://github.com/coollabsio/coolify
Фичи:
- Free SSL certificates, auto-renewed
- Automatic database backups to S3
- Pull request preview deployments
- Real-time server terminal in your browser
- Push-to-deploy from GitHub, GitLab, Bitbucket
- Server monitoring with Discord/Telegram/email alerts
2️⃣ Dokploy :
🔗 Оффсайт: https://dokploy.com/
🔗 Гитхаб: https://github.com/dokploy/dokploy
Фичи
• Applications: Deploy any type of application (Node.js, PHP, Python, Go, Ruby, etc.).
• Databases: Create and manage databases with support for MySQL, PostgreSQL, MongoDB, MariaDB, libsql, and Redis.
• Backups: Automate backups for databases to an external storage destination.
• Docker Compose: Native support for Docker Compose to manage complex applications.
• Multi Node: Scale applications to multiple nodes using Docker Swarm to manage the cluster.
• Templates: Deploy open-source templates (Plausible, Pocketbase, Calcom, etc.) with a single click.
• Traefik Integration: Automatically integrates with Traefik for routing and load balancing.
• Real-time Monitoring: Monitor CPU, memory, storage, and network usage for every resource.
• Docker Management: Easily deploy and manage Docker containers.
• CLI/API: Manage your applications and databases using the command line or through the API.
• Notifications: Get notified when your deployments succeed or fail (via Slack, Discord, Telegram, Email, etc.).
• Multi Server: Deploy and manage your applications remotely to external servers.
• Self-Hosted: Self-host Dokploy on your VPS.
Нужен только vps (ц)
#tools
@deksden_notes
🔥4👍2