Але якщо подивитися статус за тиждень там уовбасить інфру нереально. Тим не менш, зустрічайте https://claude.com/blog/claude-managed-agents
Claude
Claude Managed Agents: get to production 10x faster | Claude
Introducing Claude Managed Agents, a suite of composable APIs for building and deploying cloud-hosted agents at scale.
Сулейман на тему лімітів потужностей. Цікаво що нападки на дата-центри та в принципі історія повторюється як і з 5G https://www.technologyreview.com/2026/04/08/1135398/mustafa-suleyman-ai-future/
MIT Technology Review
Mustafa Suleyman: AI development won’t hit a wall anytime soon—here’s why
The compute explosion is the technological story of our time. And it is still only just beginning.
👍4
" Tip: New For a limited time, Codex is included in your plan for free – let’s build together."
Codex заресетів ліміти, якась в них там проблема, в мене тижневі сьогодні завершились за годину. То openai, поки вирішують, скинули ліміти. Для підписок вище безкоштовної.
Codex заресетів ліміти, якась в них там проблема, в мене тижневі сьогодні завершились за годину. То openai, поки вирішують, скинули ліміти. Для підписок вище безкоштовної.
Друзі, хочу поділитися, релізнув Jucce. З головних розширень це Agent Memory та Awareness loop. Тобто вона формує свою власну памʼять про події довкола, а також рефлексує над подіями та робить свій власний висновок про систему, стан аплікацій і всього що чує та бачить. А чує вона через спілкування, і бачить вона через webrtc і скрін шарінг і навіть камеру. На скріншоті праворуч Voronoi Memory cells, тобто Jucce формує різні комірки (категорії) памʼяті: system identity, факти, патерни, гіпотези, останні зміни, невідомі події. Дуже цікаво як модель самостійно будує своє розуміння світу довкола. А також виникають нові виклики, наприклад, безпекові - адже з нею спілкуються вже десятки різних людей, технічні - як уникнути помилки уявлення, валідація даних і тд. Нова ітерація курсу - для вас вже буде новий рівень задач, друзі :)
🔥24
Чекаємо на генерування прямого байткоду. І здається XAI буде першими?
🤔6
Сьогодні презентував Jucce AI teamate pairup mode: запрошуєш на мітінг Jucce і шариш скрін. Я виводив k9s, обговорювали проблему та шляхи вирішення невідповідно скомпільованого бінарника в контейнері під архитектуру системи.
Jucce має контекст всьго що відбувається в даний момент та минулу історію івентів (реліз, інциденти, RCA, як вирішували), також має памʼять щодо патернів апплікації.
Також Jucce розпізнає учасників команди за іменами, та знає роль та скіли кожного (найбільше вразило колег), що додає ефекту присутності.
Вільно та детально читає, розпізнає та аналізує інформацію на екрані. Після колу може зробити самарі та додати в knowledge тільки ваілдну та підтверджену інформацію.
Думаю до кінця вже цього року саме так ми будемо сплкуватися з агентами.
Jucce має контекст всьго що відбувається в даний момент та минулу історію івентів (реліз, інциденти, RCA, як вирішували), також має памʼять щодо патернів апплікації.
Також Jucce розпізнає учасників команди за іменами, та знає роль та скіли кожного (найбільше вразило колег), що додає ефекту присутності.
Вільно та детально читає, розпізнає та аналізує інформацію на екрані. Після колу може зробити самарі та додати в knowledge тільки ваілдну та підтверджену інформацію.
Думаю до кінця вже цього року саме так ми будемо сплкуватися з агентами.
🔥23
Сьогодні Copilot, глупа поделка, запропонувала покращення до PR, типу привести до корп стандарту неймінг. Ну PR апрувнили і.. винесли базу, запоінтіли сервіс на неіснуючий інстанс і потім підлючали іншого агента, щоб знайти причину чому сервіс ліг. От бл* AI Enablement. Саме тому evals на сьогодні наш quality gates. Ну включати тре власний інтелект..
😁23❤2🤯1
Зайшов подивитися на новий AI сервіс що підняли мої "орли"..
Сервіс валяється. А деви налаштували init контейнер перед основним сервісом (що саме валится), то ініт виконується щоразу.
Ітого 247 рестартів і 55М токенів на ембеддінг Large Model..
Друзі молоді SREшники - ліміти, монітори, алерти та ревʼю всього цього навайбкодженогогівно коду впершу чергу!
Сервіс валяється. А деви налаштували init контейнер перед основним сервісом (що саме валится), то ініт виконується щоразу.
Ітого 247 рестартів і 55М токенів на ембеддінг Large Model..
Друзі молоді SREшники - ліміти, монітори, алерти та ревʼю всього цього навайбкодженого
😁27❤3😱3
Чи варто вже додавати в загальний моніторинг
{"error":{"type":"rate_limit_error","message":"Rate limited.
Please try again later."}} на СС?😁6
Новий досвід. І це вау для мене скажу я вам. LG UltraWide Curved 34WR55QK
👍9❤2
Forwarded from AI no magic
Щойно зробили те, чим реально пишаюся 🚀
Ми запустили систему типу CRM на 25 мільйонів клієнтів. З нуля. Specification Driven Development рулить!
25M записів. 82M пов'язаних рядків. Живий продакшн під навантаженням. І все це — без жодного даунтайму для 18+ систем, які з ним інтегровані.
Я будував це як архітектор і розробник в одній особі — і хочу поділитись тим, що реально спрацювало.
Під капотом:
— CQRS + 5 незалежних мікросервісів (FastAPI / PostgreSQL 16 / Redis / RabbitMQ / K8s)
— Bloom Filter: 0.1ms замість 50ms на кожен lookup. Дрібниця? Ні — при 1000 RPS це вирішує все
— 60+ правил нормалізації: від кириличних апострофів до латиниці в іменах
— Patroni HA-кластер з автофейловером — додатки навіть не знають, яка нода зараз лідер
Що мене найбільше вразило в процесі
Я працював у парі з Claude Code — і це не "AI написав код за мене". Це був реальний co-архітектор і co-developer: SSH на сервери, код в gitlab, pg_dump, аналіз 16MB логів, пошук root cause прямо в продакшені.
Найцінніше відкриття: AI не там де пише — а там де дебажить і фіксить. Коли система вже живе, помилки дивні, логи величезні — ось де пара людина+AI б'є будь-який інший підхід.
Приємно, коли складна система просто працює 🙂 і як завжди - потрібна команда, крута команда. Пишаюсь такою! Далі більше)
Ми запустили систему типу CRM на 25 мільйонів клієнтів. З нуля. Specification Driven Development рулить!
25M записів. 82M пов'язаних рядків. Живий продакшн під навантаженням. І все це — без жодного даунтайму для 18+ систем, які з ним інтегровані.
Я будував це як архітектор і розробник в одній особі — і хочу поділитись тим, що реально спрацювало.
Під капотом:
— CQRS + 5 незалежних мікросервісів (FastAPI / PostgreSQL 16 / Redis / RabbitMQ / K8s)
— Bloom Filter: 0.1ms замість 50ms на кожен lookup. Дрібниця? Ні — при 1000 RPS це вирішує все
— 60+ правил нормалізації: від кириличних апострофів до латиниці в іменах
— Patroni HA-кластер з автофейловером — додатки навіть не знають, яка нода зараз лідер
Що мене найбільше вразило в процесі
Я працював у парі з Claude Code — і це не "AI написав код за мене". Це був реальний co-архітектор і co-developer: SSH на сервери, код в gitlab, pg_dump, аналіз 16MB логів, пошук root cause прямо в продакшені.
Найцінніше відкриття: AI не там де пише — а там де дебажить і фіксить. Коли система вже живе, помилки дивні, логи величезні — ось де пара людина+AI б'є будь-який інший підхід.
Приємно, коли складна система просто працює 🙂 і як завжди - потрібна команда, крута команда. Пишаюсь такою! Далі більше)
👍30🤯9😁2
Є в мене eval кейс на реальному енві. sonet 4.6 десь за годину вирішує. RCA за хвилину робить. Це повний цикл траблшуту і конфігурації. Кейс складний, ніхто в команді вирішити не зміг.
Opus 4.7 не впорався. Інший підхід до вирішення проблем. Я б зказав фокус зовсім не на важливих речах. (Треба зауважити, що моделі на корппідписці дають гірші результати і обмежені по контекстному вікну).
На Red herring кейсі застряг десь на звлинин 40. А це тільки один кейс.
Не дарма моделі мають характер. На гітхаб є можливість проводити оцінку моделей під ваш кейс - воно того варте.
Opus 4.7 не впорався. Інший підхід до вирішення проблем. Я б зказав фокус зовсім не на важливих речах. (Треба зауважити, що моделі на корппідписці дають гірші результати і обмежені по контекстному вікну).
На Red herring кейсі застряг десь на звлинин 40. А це тільки один кейс.
Не дарма моделі мають характер. На гітхаб є можливість проводити оцінку моделей під ваш кейс - воно того варте.
👍7🔥5
Загалом після публічної (в рамках контори) бети, колеги провели більше 150 комунікації з Jucce і доволі вражені. Я проводжу демо майже кожного дня, а іноді по декілька разів. Тема гарача.
А сьогодні я додав нову модель роботи з памʼятю та Skills.
Досвід нереально крутий. Провів декілька годин в спілкувані з Jucce над вирішенням eval кейсу, про який розповідав вчора. Але тестував на цей раз більш комплексну задачу: нову модель динамічної памʼяті та вбудовані Skills.
Відчуття від спілкування, коли модель працює напряму з памʼятю, зовсім інакші або зовсім схожі на природні. А коменти (іноді емоційні) під час вірішення нетривіальної задачі, роздуми вголос - це інший рівень - до текстового чату вже і повертатися не хочеться.
Більше деталей тут https://medium.com/@den.vasyliev/when-d%C3%A9j%C3%A0-vu-is-not-a-strategy-e90aac306f63 а ще більше на курсі вже в травні.
А сьогодні я додав нову модель роботи з памʼятю та Skills.
Досвід нереально крутий. Провів декілька годин в спілкувані з Jucce над вирішенням eval кейсу, про який розповідав вчора. Але тестував на цей раз більш комплексну задачу: нову модель динамічної памʼяті та вбудовані Skills.
Відчуття від спілкування, коли модель працює напряму з памʼятю, зовсім інакші або зовсім схожі на природні. А коменти (іноді емоційні) під час вірішення нетривіальної задачі, роздуми вголос - це інший рівень - до текстового чату вже і повертатися не хочеться.
Більше деталей тут https://medium.com/@den.vasyliev/when-d%C3%A9j%C3%A0-vu-is-not-a-strategy-e90aac306f63 а ще більше на курсі вже в травні.
Medium
When Déjà Vu Is Not a Strategy
You probably remember the incident. Not the details — just the feeling. The alert at an inconvenient hour, the logs that looked familiar…
🔥20❤2👍1