контекст rot
162 subscribers
256 photos
15 videos
42 links
пропаганда htmx + daisyui
Download Telegram
очень скоро во всех вакансиях!
😁2
устали апрувить действия клода? антропик добавили некий АВТОПИЛОТ то есть отдельная модель будет проверять насколько деструктивно действие. честно хз чем это отличается от --dangerous-skip-permission

по сути как будто риски те же, но меньше шанс факапа
🤡1
🤬2💔2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
как же хочется небольшую трешку на Петроградке
👀3
ARC-AGI-3 — новый модный молодёжный интерактивный бенчмарк, где агент закидывается в игровую среду без каких-либо инструкций и должен сам разобраться, что вообще происходит, какая цель, и как её достичь. Это не статические паттерны как в прошлых версиях AGI бенчей — это полноценные мини-игры, где нужно исследовать, строить гипотезы и адаптироваться))

Люди решают 100% задач, все AI-системы по состоянию на март 2026 — ниже 1%. Даж ваш любимый Клод опус 4.6! Запустили прямо на этой неделе на Y Combinator, призовой фонд $2 млн на Kaggle, все решения должны быть open-source.

В целом задачки не то чтобы сложные... ваш уважаемый администратор данного интернет ресурса справился, там прямо в браузере можно поиграть

https://arcprize.org
😁1
ботлнэк не в мощности моделей и не в доступных токенах, уважаемые коллеги(
🤡2
я чето не понял.....я чё.... поздно начал работать над своим пабликом?? я не помню чтобы много кто блоги в 20м году делал.... здесь какая-то ошибка...
😁4
Рынок работодателя, нам остаётся только подстраиваться
😁4
Коллеги, сегодня вирусится твит с новостью о том что можно поставить специальный скилл для запуска Claude Code из Codex. В ру сообществе многие паблики делают репосты.

Напомню что данном канале эту тему подсветили ДВЕ НЕДЕЛИ НАЗАД и прямо показали в терминале более лаконичное решение через CLI, безо всяких скилов!! Ведь мы с вами пониманием что происходит при большом количестве скиллов у агента)) Происходит... context rot

Работаем. Подписаться.
1🤡3🔥2
Исходный код Клод Кода утек. Ничего интересного и секретного пока не нашли - возможность скрывать клода из коммитов, внутренние названия моделей итд, это и так всё было понятно.

GPT 5.4 оценивает качество кода на 6.5/10, не очень высоко.

Задумываюсь, а зачем в своих постах пишу, мол, архитектура важна и файлы в 5 тысяч строк советую избегать... Получилось у них, получится и у нас! Продолжаем работу
😁3
😁5🤡2
я
😁3🔥1
По итогам марта этого года, linux получил в Steam Hardware Survey 5,33% рынка — новый исторический максимум
🔥4