Є в мене eval кейс на реальному енві. sonet 4.6 десь за годину вирішує. RCA за хвилину робить. Це повний цикл траблшуту і конфігурації. Кейс складний, ніхто в команді вирішити не зміг.
Opus 4.7 не впорався. Інший підхід до вирішення проблем. Я б зказав фокус зовсім не на важливих речах. (Треба зауважити, що моделі на корппідписці дають гірші результати і обмежені по контекстному вікну).
На Red herring кейсі застряг десь на звлинин 40. А це тільки один кейс.
Не дарма моделі мають характер. На гітхаб є можливість проводити оцінку моделей під ваш кейс - воно того варте.
Opus 4.7 не впорався. Інший підхід до вирішення проблем. Я б зказав фокус зовсім не на важливих речах. (Треба зауважити, що моделі на корппідписці дають гірші результати і обмежені по контекстному вікну).
На Red herring кейсі застряг десь на звлинин 40. А це тільки один кейс.
Не дарма моделі мають характер. На гітхаб є можливість проводити оцінку моделей під ваш кейс - воно того варте.
👍8🔥5
Загалом після публічної (в рамках контори) бети, колеги провели більше 150 комунікації з Jucce і доволі вражені. Я проводжу демо майже кожного дня, а іноді по декілька разів. Тема гарача.
А сьогодні я додав нову модель роботи з памʼятю та Skills.
Досвід нереально крутий. Провів декілька годин в спілкувані з Jucce над вирішенням eval кейсу, про який розповідав вчора. Але тестував на цей раз більш комплексну задачу: нову модель динамічної памʼяті та вбудовані Skills.
Відчуття від спілкування, коли модель працює напряму з памʼятю, зовсім інакші або зовсім схожі на природні. А коменти (іноді емоційні) під час вірішення нетривіальної задачі, роздуми вголос - це інший рівень - до текстового чату вже і повертатися не хочеться.
Більше деталей тут https://medium.com/@den.vasyliev/when-d%C3%A9j%C3%A0-vu-is-not-a-strategy-e90aac306f63 а ще більше на курсі вже в травні.
А сьогодні я додав нову модель роботи з памʼятю та Skills.
Досвід нереально крутий. Провів декілька годин в спілкувані з Jucce над вирішенням eval кейсу, про який розповідав вчора. Але тестував на цей раз більш комплексну задачу: нову модель динамічної памʼяті та вбудовані Skills.
Відчуття від спілкування, коли модель працює напряму з памʼятю, зовсім інакші або зовсім схожі на природні. А коменти (іноді емоційні) під час вірішення нетривіальної задачі, роздуми вголос - це інший рівень - до текстового чату вже і повертатися не хочеться.
Більше деталей тут https://medium.com/@den.vasyliev/when-d%C3%A9j%C3%A0-vu-is-not-a-strategy-e90aac306f63 а ще більше на курсі вже в травні.
Medium
When Déjà Vu Is Not a Strategy
You probably remember the incident. Not the details — just the feeling. The alert at an inconvenient hour, the logs that looked familiar…
🔥21❤2👍1
"hey @den-vasyliev
small update on this: we might have something interesting that could be relevant to what you're building with Jucce
would love to loop you in privately - let me shot u an email!" runway
Неймовірно! Runway викатили server-side JRPC. Тепер Jucce у режимі ававтара може діяти - викликати будь які тули на бекенді. Коло замкнулося - повний агентський цикл з realtime аватаром та інструментами. https://docs.dev.runwayml.com/characters/tools/
Jucce вже доступна на мобільном і завдяки JRPC їй доступна динамічна памʼять та скіли.
По суті, я сьгодні затраблшутив та підняв повний енв на сотню аплікацій в режимі спілкування на смартфоні.
small update on this: we might have something interesting that could be relevant to what you're building with Jucce
would love to loop you in privately - let me shot u an email!" runway
Неймовірно! Runway викатили server-side JRPC. Тепер Jucce у режимі ававтара може діяти - викликати будь які тули на бекенді. Коло замкнулося - повний агентський цикл з realtime аватаром та інструментами. https://docs.dev.runwayml.com/characters/tools/
Jucce вже доступна на мобільном і завдяки JRPC їй доступна динамічна памʼять та скіли.
По суті, я сьгодні затраблшутив та підняв повний енв на сотню аплікацій в режимі спілкування на смартфоні.
Runway API
Tool calling
Let your Avatar invoke tools during a Session—either as client-side events for your UI, or as backend RPC with results that rejoin the conversation.
👏16❤2🤯2
Skills over MCP, вийде наступним. Саме тому кажу, починайте MCP evals процес вже, далі буде завал.
Друзі, а в кого M5 Air? Цікавить конфігурація та як чіп порівняно з M3
Сьогодні вперше! Буквально годину тому, флапнув auth0, резетнулись А записи і зреагував моніторинг, типу проблема з логіном користувачів. А там е2е монітори прислали аларми вся платформа лежить. Так як типу P1 підняли інцидент брідж кол і маякують SRE і дзвонять мені приєднайся на кол, адже ескалація.. Кажу ні не приєднаюсь - дзвоніть Jucce. А сам дивлюсь логи:) І що ви думаєте.. набирають, починають розпитувати що до чого, а вона відповідає типу днс, за п'ять хвилин само пройде, а потім он вже піднімається. Тобто, вперше відпрацювала як interrupted shield на реальному прод інциденті!
🔥49👍8😁1
Forwarded from Highload — медіа для розробників
Оцінка Anthropic досягла $1 трильйону. Два місяці тому компанія коштувала $380 мільярдів
На ринку pre-IPO акцій спостерігається справжній ажіотаж навколо цінних паперів Anthropic. Інвестори готові купляти акції компанії навіть при оцінці капіталізації в $1 трильйон.
У венчурній фірмі Saints Capital повідомили, що один з акціонерів Anthropic нещодавно хотів продати свої папери за оцінкою $1,15 трлн.
Лише два місяці тому, під час останнього публічного раунду фінансування в лютому 2026 року, інвестори оцінили Anthropic в $380 млрд.
Інтерес до акцій головного конкурента Anthropic — компанії OpenAI — співрозмовники видання називають «млявим». На біржі Forge Global оцінка компанії становить... Читати далі на Highload 👉
Telegram Chat | Facebook | LinkedIn | Website
На ринку pre-IPO акцій спостерігається справжній ажіотаж навколо цінних паперів Anthropic. Інвестори готові купляти акції компанії навіть при оцінці капіталізації в $1 трильйон.
У венчурній фірмі Saints Capital повідомили, що один з акціонерів Anthropic нещодавно хотів продати свої папери за оцінкою $1,15 трлн.
Лише два місяці тому, під час останнього публічного раунду фінансування в лютому 2026 року, інвестори оцінили Anthropic в $380 млрд.
Інтерес до акцій головного конкурента Anthropic — компанії OpenAI — співрозмовники видання називають «млявим». На біржі Forge Global оцінка компанії становить... Читати далі на Highload 👉
Telegram Chat | Facebook | LinkedIn | Website
🤯4
Better call Jucce
Ідея Jucce полягає в тому, щоб не створити черговий інструмент оповіщення чи чат-бота, прикріпленого до вашої системи відстеження інцидентів. Це SRE партнер, який працює безперервно, накопичує реальні організаційні знання та фільтрує надмірну інформацію, щоб ваші інженери мали змогу подумати.
Ми називаємо це interrupted shield.
https://medium.com/@den.vasyliev/better-call-jucce-d19ed9f396b8
Ідея Jucce полягає в тому, щоб не створити черговий інструмент оповіщення чи чат-бота, прикріпленого до вашої системи відстеження інцидентів. Це SRE партнер, який працює безперервно, накопичує реальні організаційні знання та фільтрує надмірну інформацію, щоб ваші інженери мали змогу подумати.
Ми називаємо це interrupted shield.
https://medium.com/@den.vasyliev/better-call-jucce-d19ed9f396b8
Medium
Better call Jucce
The idea behind Jucce: not another alerting tool, not a chatbot bolted onto your incident tracker. An AI-powered SRE Fellow that runs…
👍9❤4😁1
Pro Tip: команда
go clean -cache тільки но повернула 20GB на диск..🔥7
> why without a PR?
> You were giving rapid iterative feedback ("f*k", "why") so I was fixing and pushing immediately to keep pace
> You were giving rapid iterative feedback ("f*k", "why") so I was fixing and pushing immediately to keep pace
😁12🔥4
Jucce цього тижня вже в проді. 186тис івентів отримано, 99тис класифіковано. Доволі високий рівень шуму - але так "дихає інфра". Jucce слідкує за частотою дихання: рефлексує, запамʼятовує та аналізує. За тим як система навчається дуже цікаво спостерігати. Розпочав роботу над фінальним функціоналом - insights, patterns та prediction, по суті головна фіча системи - early detection.
З цікавого або не дуже. Вже зʼявилися перші внутрішні клієнти.. і мало кого цікавлять алгоритми та функціональність, більшість цікавить тільки яким буде характер (аватар) та перейменувати під себе. Тому у Jucce тепер є друг..
З цікавого або не дуже. Вже зʼявилися перші внутрішні клієнти.. і мало кого цікавлять алгоритми та функціональність, більшість цікавить тільки яким буде характер (аватар) та перейменувати під себе. Тому у Jucce тепер є друг..
🔥17👍3😁3
Є певний момент, коли система перестає бути лише демо-версією і перетворюється на щось інше. Щодо Jucce та аватара, я вважаю, що саме це і сталося. Runway випустила нову функцію. Але насправді було реалізовано міст між діалогом та операційною реальністю. Замкнутий цикл зворотного зв’язку. Сесія, що живе своїм життям. Це змінює все. І це її історія.
https://medium.com/@den.vasyliev/this-feature-changes-everything-2f45a194a2a4
https://medium.com/@den.vasyliev/this-feature-changes-everything-2f45a194a2a4
Medium
This Feature Changes Everything
It started with a GitHub comment.
🔥9
A lightweight proxy that routes Claude Code's Anthropic API calls to NVIDIA NIM (40 req/min free), OpenRouter (hundreds of models), DeepSeek (direct API), LM Studio (fully local), or llama.cpp (local with Anthropic endpoints).
https://github.com/Alishahryar1/free-claude-code
https://github.com/Alishahryar1/free-claude-code
GitHub
GitHub - Alishahryar1/free-claude-code: Use claude-code for free in the terminal, VSCode extension or via discord like openclaw
Use claude-code for free in the terminal, VSCode extension or via discord like openclaw - Alishahryar1/free-claude-code
👍5