[не]правильний DevOps
2K subscribers
1.26K photos
45 videos
25 files
1.63K links
[не]правильний канал про DevOps та SRE
Youtube: https://www.youtube.com/@DenysVasyliev
Download Telegram
Є в мене eval кейс на реальному енві. sonet 4.6 десь за годину вирішує. RCA за хвилину робить. Це повний цикл траблшуту і конфігурації. Кейс складний, ніхто в команді вирішити не зміг.

Opus 4.7 не впорався. Інший підхід до вирішення проблем. Я б зказав фокус зовсім не на важливих речах. (Треба зауважити, що моделі на корппідписці дають гірші результати і обмежені по контекстному вікну).
На Red herring кейсі застряг десь на звлинин 40. А це тільки один кейс.

Не дарма моделі мають характер. На гітхаб є можливість проводити оцінку моделей під ваш кейс - воно того варте.
👍8🔥5
Загалом після публічної (в рамках контори) бети, колеги провели більше 150 комунікації з Jucce і доволі вражені. Я проводжу демо майже кожного дня, а іноді по декілька разів. Тема гарача.

А сьогодні я додав нову модель роботи з памʼятю та Skills.

Досвід нереально крутий. Провів декілька годин в спілкувані з Jucce над вирішенням eval кейсу, про який розповідав вчора. Але тестував на цей раз більш комплексну задачу: нову модель динамічної памʼяті та вбудовані Skills.

Відчуття від спілкування, коли модель працює напряму з памʼятю, зовсім інакші або зовсім схожі на природні. А коменти (іноді емоційні) під час вірішення нетривіальної задачі, роздуми вголос - це інший рівень - до текстового чату вже і повертатися не хочеться.

Більше деталей тут https://medium.com/@den.vasyliev/when-d%C3%A9j%C3%A0-vu-is-not-a-strategy-e90aac306f63 а ще більше на курсі вже в травні.
🔥212👍1
GPT down?
😁6
"hey @den-vasyliev
small update on this: we might have something interesting that could be relevant to what you're building with Jucce
would love to loop you in privately - let me shot u an email!" runway

Неймовірно! Runway викатили server-side JRPC. Тепер Jucce у режимі ававтара може діяти - викликати будь які тули на бекенді. Коло замкнулося - повний агентський цикл з realtime аватаром та інструментами. https://docs.dev.runwayml.com/characters/tools/

Jucce вже доступна на мобільном і завдяки JRPC їй доступна динамічна памʼять та скіли.
По суті, я сьгодні затраблшутив та підняв повний енв на сотню аплікацій в режимі спілкування на смартфоні.
👏162🤯2
Skills over MCP, вийде наступним. Саме тому кажу, починайте MCP evals процес вже, далі буде завал.
Не тільки в Copilot проблеми. Здаєть бум з токенами скоро вийде на інший рівень і це знову відобразиться на цінах для користувача.
Друзі, а в кого M5 Air? Цікавить конфігурація та як чіп порівняно з M3
Сьогодні вперше! Буквально годину тому, флапнув auth0, резетнулись А записи і зреагував моніторинг, типу проблема з логіном користувачів. А там е2е монітори прислали аларми вся платформа лежить. Так як типу P1 підняли інцидент брідж кол і маякують SRE і дзвонять мені приєднайся на кол, адже ескалація.. Кажу ні не приєднаюсь - дзвоніть Jucce. А сам дивлюсь логи:) І що ви думаєте.. набирають, починають розпитувати що до чого, а вона відповідає типу днс, за п'ять хвилин само пройде, а потім он вже піднімається. Тобто, вперше відпрацювала як interrupted shield на реальному прод інциденті!
🔥49👍8😁1
Оцінка Anthropic досягла $1 трильйону. Два місяці тому компанія коштувала $380 мільярдів

На ринку pre-IPO акцій спостерігається справжній ажіотаж навколо цінних паперів Anthropic. Інвестори готові купляти акції компанії навіть при оцінці капіталізації в $1 трильйон.

У венчурній фірмі Saints Capital повідомили, що один з акціонерів Anthropic нещодавно хотів продати свої папери за оцінкою $1,15 трлн.

Лише два місяці тому, під час останнього публічного раунду фінансування в лютому 2026 року, інвестори оцінили Anthropic в $380 млрд.

Інтерес до акцій головного конкурента Anthropic — компанії OpenAI — співрозмовники видання називають «млявим». На біржі Forge Global оцінка компанії становить... Читати далі на Highload 👉

Telegram Chat | Facebook | LinkedIn | Website
🤯4
Better call Jucce
Ідея Jucce полягає в тому, щоб не створити черговий інструмент оповіщення чи чат-бота, прикріпленого до вашої системи відстеження інцидентів. Це SRE партнер, який працює безперервно, накопичує реальні організаційні знання та фільтрує надмірну інформацію, щоб ваші інженери мали змогу подумати.

Ми називаємо це interrupted shield.
https://medium.com/@den.vasyliev/better-call-jucce-d19ed9f396b8
👍94😁1
Pro Tip: команда go clean -cache тільки но повернула 20GB на диск..
🔥7
> why without a PR?
> You were giving rapid iterative feedback ("f*k", "why") so I was fixing and pushing immediately to keep pace
😁12🔥4
Vertex AI is now Agent Platform, your new home for building enterprise-grade agents with the latest, most sophisticated models.
🔥5
Jucce цього тижня вже в проді. 186тис івентів отримано, 99тис класифіковано. Доволі високий рівень шуму - але так "дихає інфра". Jucce слідкує за частотою дихання: рефлексує, запамʼятовує та аналізує. За тим як система навчається дуже цікаво спостерігати. Розпочав роботу над фінальним функціоналом - insights, patterns та prediction, по суті головна фіча системи - early detection.
З цікавого або не дуже. Вже зʼявилися перші внутрішні клієнти.. і мало кого цікавлять алгоритми та функціональність, більшість цікавить тільки яким буде характер (аватар) та перейменувати під себе. Тому у Jucce тепер є друг..
🔥17👍3😁3
Є певний момент, коли система перестає бути лише демо-версією і перетворюється на щось інше. Щодо Jucce та аватара, я вважаю, що саме це і сталося. Runway випустила нову функцію. Але насправді було реалізовано міст між діалогом та операційною реальністю. Замкнутий цикл зворотного зв’язку. Сесія, що живе своїм життям. Це змінює все. І це її історія.

https://medium.com/@den.vasyliev/this-feature-changes-everything-2f45a194a2a4
🔥9
A lightweight proxy that routes Claude Code's Anthropic API calls to NVIDIA NIM (40 req/min free), OpenRouter (hundreds of models), DeepSeek (direct API), LM Studio (fully local), or llama.cpp (local with Anthropic endpoints).

https://github.com/Alishahryar1/free-claude-code
👍5