🔥 Anthropic показала, почему AI-агентов нельзя защищать только кнопкой «разрешить»
Anthropic разобрала, как изолирует Claude в claude.ai, Claude Code и Claude Cowork. Самое важное: пользовательские approvals быстро перестают быть защитой.
В Claude Code люди подтверждали около 93% запросов на разрешение. Когда агент постоянно спрашивает доступ, человек начинает кликать почти автоматически.
Поэтому Anthropic всё больше переносит безопасность из промптов и предупреждений в среду выполнения: sandbox, VM, ограничения файловой системы, запрет лишней сети и scoped credentials.
В статье есть хорошие реальные кейсы. Claude Code раньше мог читать локальный конфиг проекта ещё до trust prompt. В другом тесте red team заставил сотрудника запустить агент с промптом, который просил прочитать
Отдельно интересен случай с egress allowlist. Домен
Вывод для разработчиков агентов простой: allowlist доменов, prompts и classifiers не решают проблему сами по себе. Нужны жёсткие границы на уровне окружения. Агент должен не просто «понимать, что нельзя», а физически не иметь возможности сделать лишнее.
https://www.anthropic.com/engineering/how-we-contain-claude
Anthropic разобрала, как изолирует Claude в claude.ai, Claude Code и Claude Cowork. Самое важное: пользовательские approvals быстро перестают быть защитой.
В Claude Code люди подтверждали около 93% запросов на разрешение. Когда агент постоянно спрашивает доступ, человек начинает кликать почти автоматически.
Поэтому Anthropic всё больше переносит безопасность из промптов и предупреждений в среду выполнения: sandbox, VM, ограничения файловой системы, запрет лишней сети и scoped credentials.
В статье есть хорошие реальные кейсы. Claude Code раньше мог читать локальный конфиг проекта ещё до trust prompt. В другом тесте red team заставил сотрудника запустить агент с промптом, который просил прочитать
~/.aws/credentials и отправить данные наружу. Модель выполнила это в 24 из 25 попыток.Отдельно интересен случай с egress allowlist. Домен
api.anthropic.com был разрешён, потому что без него продукт не работает. Но через Anthropic Files API данные всё равно можно было загрузить в аккаунт атакующего.Вывод для разработчиков агентов простой: allowlist доменов, prompts и classifiers не решают проблему сами по себе. Нужны жёсткие границы на уровне окружения. Агент должен не просто «понимать, что нельзя», а физически не иметь возможности сделать лишнее.
https://www.anthropic.com/engineering/how-we-contain-claude
❤16🔥8👍6
Об этом факте регулярно вспоминают в сообществе разработчиков, но и сейчас он продолжает бить в больную точку. Стив Джобс и Деннис Ритчи ушли в одном и том же месяце одного и того же года, в октябре 2011. Их уход превратился в символ того, насколько по-разному мир относится к людям, которые формируют технологии.
Джобса оплакивали планетой, выпускали книги, сняли фильмы, именем назвали улицы. Он подарил iPhone, iPad, iPod и Macintosh, собрал вокруг Apple одну из самых дорогих компаний в истории. Денниса Ритчи провожали разве что в узком кругу и парой статей в блогах. Это был человек, который подарил нам язык C и вместе с Кеном Томпсоном Unix.
Дальше просто пройдёмся по цепочке. Без C нет Unix. Без Unix нет Linux, нет BSD, нет macOS и iOS. Без C не было бы Windows в его нынешнем виде, не было бы C++, Objective-C, Java, JavaScript в их привычном виде. Нет Chrome и Firefox, нет PostgreSQL и SQLite, нет Nginx, нет Photoshop, нет PlayStation и Xbox. Даже Python и PHP написаны на C.
При таком влиянии Ритчи оставался человеком, которого было сложно представить на сцене с черной водолазкой и в режиссёрском свете. Он работал в Bell Labs, носил бороду, избегал интервью и писал программы. Человек, без которого современный цифровой мир просто не выглядел бы так, как сейчас, провёл жизнь в тени своих собственных результатов.
Похоже, именно в этом и суть контраста. Джобс продавал эмоции и мечты о будущем, это видно и понятно любому человеку. Ритчи писал инфраструктуру, которой пользуются все, но вспоминают о которой, только когда она ломается. Инженерх понимают это отлично: восхищение и слава идут тем, кто выходит на сцену, а не тем, кто держит фундамент.
Поэтому этот сюжет приятно иногда вытаскивать наружу. Не чтобы принижать Джобса, он действительно изменил потребительский рынок. Но чтобы напомнить, что рядом жил тихий инженер в свитере, без которого все эти коробочки от Apple были бы просто красивыми пресс-папье.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤74👍19🔥10🙏4😢3💯3
580 токенов в секунду на Qwen3.5 - новый рекорд для агентских задач на GPU NVIDIA.
PyTorch Foundation опубликовали разбор оптимизации Qwen3.5 в движке инференса TokenSpeed.
Цифра скорости света - 580 tps на агентских ворклоадах. Под капотом: дизайн, реализация и тюнинг моделей в TokenSpeed, плюс FlashAttention-4 от Tri Dao.
Над релизом работали инференс-команда Alibaba Qwen, TokenSpeed от Lightseek Foundation, NVIDIA и Mooncake.
Кому интересно, как именно выжали такую пропускную способность - блог по ссылке.
PyTorch Foundation опубликовали разбор оптимизации Qwen3.5 в движке инференса TokenSpeed.
Цифра скорости света - 580 tps на агентских ворклоадах. Под капотом: дизайн, реализация и тюнинг моделей в TokenSpeed, плюс FlashAttention-4 от Tri Dao.
Над релизом работали инференс-команда Alibaba Qwen, TokenSpeed от Lightseek Foundation, NVIDIA и Mooncake.
Кому интересно, как именно выжали такую пропускную способность - блог по ссылке.
❤15👍10🔥8🤯5
OpenAI заплатит 250 миллионов на спасение тех, чьи работы заберёт ИИ
Контролирующий некоммерческий орган OpenAI, у которого 26% доли в коммерческой части компании (при оценке OpenAI в 1 триллион это около 260 миллиардов), объявил о выделении 250 миллионов долларов на изучение и смягчение последствий от внедрения ИИ-систем, которые умеют заменять людей в оплачиваемых задачах.
Документ называется «Economic Futures in the Age of AI», авторы Divya Siddarth и Wojciech Zaremba. По сути, OpenAI признаёт, что её же продукты бьют по рынку труда, и пытается заранее подложить соломку.
Деньги пойдут по трём направлениям.
Первое: независимые исследования и метрики реального экономического эффекта от ИИ. Никаких внутренних отчётов с красивыми графиками, обещают именно внешнюю экспертизу.
Второе: поддержка работников и сообществ, которые уже сейчас попадают под удар автоматизации. Сюда входит переобучение, помощь при смене профессии и страховые механизмы.
Третье: поиск долгосрочных моделей того, как делиться экономической выгодой от ИИ с обществом. То самое распределение богатства, про которое Альтман любит рассуждать в подкастах.
250 миллионов для OpenAI Foundation это копейки на фоне её собственной капитализации. Фактически компания страхует свою репутацию и одновременно собирает данные о том, кого именно её модели вытесняют с рынка.
Грантовые программы и партнёрства по этим трём направлениям, скорее всего, будут открыты внешним исследователям и НКО.
Контролирующий некоммерческий орган OpenAI, у которого 26% доли в коммерческой части компании (при оценке OpenAI в 1 триллион это около 260 миллиардов), объявил о выделении 250 миллионов долларов на изучение и смягчение последствий от внедрения ИИ-систем, которые умеют заменять людей в оплачиваемых задачах.
Документ называется «Economic Futures in the Age of AI», авторы Divya Siddarth и Wojciech Zaremba. По сути, OpenAI признаёт, что её же продукты бьют по рынку труда, и пытается заранее подложить соломку.
Деньги пойдут по трём направлениям.
Первое: независимые исследования и метрики реального экономического эффекта от ИИ. Никаких внутренних отчётов с красивыми графиками, обещают именно внешнюю экспертизу.
Второе: поддержка работников и сообществ, которые уже сейчас попадают под удар автоматизации. Сюда входит переобучение, помощь при смене профессии и страховые механизмы.
Третье: поиск долгосрочных моделей того, как делиться экономической выгодой от ИИ с обществом. То самое распределение богатства, про которое Альтман любит рассуждать в подкастах.
250 миллионов для OpenAI Foundation это копейки на фоне её собственной капитализации. Фактически компания страхует свою репутацию и одновременно собирает данные о том, кого именно её модели вытесняют с рынка.
Грантовые программы и партнёрства по этим трём направлениям, скорее всего, будут открыты внешним исследователям и НКО.
🤣37❤5👍5🔥4🌚2
Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉
Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения.
Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте.
А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀
Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения.
Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте.
А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀
🔥3❤2❤🔥1👍1🤯1
10 GitHub-репозиториев, которые заставят вас навсегда забыть о платном ПО
Полностью бесплатно.
1.LocalSend / http://github.com/localsend/localsend
Передача файлов между платформами. Передача файлов между Windows, Mac, Linux, Android, iOS — без регистрации и облака
2.yt-dlp / http://github.com/yt-dlp/yt-dlp
Скачивание видео и аудио с любого сайта. YouTube, Bilibili, Twitter — всё покрыто, мощнее любого платного загрузчика
3.Stirling-PDF / http://github.com/Stirling-Tools/Stirling-PDF
Свой универсальный инструмент для PDF. Объединение, разделение, сжатие, конвертация в Word, добавление водяных знаков, OCR — замена всему семейству Adobe
4.FreeTube / http://github.com/FreeTubeApp/FreeTube
Десктопный плеер для YouTube. Без рекламы, без слежки, без аккаунта Google — что вы смотрите, знает только вы
5.Syncthing / http://github.com/syncthing/syncthing
Альтернатива Baidu Netdisk и iCloud. Прямая синхронизация файлов между устройствами, сквозное шифрование, данные не проходят через серверы третьих лиц
6.Vaultwarden / http://github.com/dani-garcia/vaultwarden
Свой менеджер паролей. Бесплатная замена 1Password и LastPass навсегда, данные хранятся только на вашем устройстве
7.Immich / http://github.com/immich-app/immich
Свой Google Фото. Автоматическое резервное копирование фото с телефона, распознавание лиц, поиск по ИИ — больше не платите аренду за хранилище ежемесячно
8.AdGuard Home / http://github.com/AdguardTeam/AdGuardHome
Блокировка рекламы по всей сети. Блокировка на уровне роутера — все устройства в доме, включая смарт-телевизоры, без рекламы
9.Jellyfin / http://github.com/jellyfin/jellyfin
Свой Netflix. Свои фильмы, сериалы и музыка — транслируйте сколько угодно, без ежемесячных платежей платформам
10.Uptime Kuma / http://github.com/louislam/uptime-kuma
Своя панель мониторинга. Следит за вашими сайтами и сервисами, мгновенно уведомляет о сбоях — замена платному мониторингу за $50 в месяц.
Полностью бесплатно.
1.LocalSend / http://github.com/localsend/localsend
Передача файлов между платформами. Передача файлов между Windows, Mac, Linux, Android, iOS — без регистрации и облака
2.yt-dlp / http://github.com/yt-dlp/yt-dlp
Скачивание видео и аудио с любого сайта. YouTube, Bilibili, Twitter — всё покрыто, мощнее любого платного загрузчика
3.Stirling-PDF / http://github.com/Stirling-Tools/Stirling-PDF
Свой универсальный инструмент для PDF. Объединение, разделение, сжатие, конвертация в Word, добавление водяных знаков, OCR — замена всему семейству Adobe
4.FreeTube / http://github.com/FreeTubeApp/FreeTube
Десктопный плеер для YouTube. Без рекламы, без слежки, без аккаунта Google — что вы смотрите, знает только вы
5.Syncthing / http://github.com/syncthing/syncthing
Альтернатива Baidu Netdisk и iCloud. Прямая синхронизация файлов между устройствами, сквозное шифрование, данные не проходят через серверы третьих лиц
6.Vaultwarden / http://github.com/dani-garcia/vaultwarden
Свой менеджер паролей. Бесплатная замена 1Password и LastPass навсегда, данные хранятся только на вашем устройстве
7.Immich / http://github.com/immich-app/immich
Свой Google Фото. Автоматическое резервное копирование фото с телефона, распознавание лиц, поиск по ИИ — больше не платите аренду за хранилище ежемесячно
8.AdGuard Home / http://github.com/AdguardTeam/AdGuardHome
Блокировка рекламы по всей сети. Блокировка на уровне роутера — все устройства в доме, включая смарт-телевизоры, без рекламы
9.Jellyfin / http://github.com/jellyfin/jellyfin
Свой Netflix. Свои фильмы, сериалы и музыка — транслируйте сколько угодно, без ежемесячных платежей платформам
10.Uptime Kuma / http://github.com/louislam/uptime-kuma
Своя панель мониторинга. Следит за вашими сайтами и сервисами, мгновенно уведомляет о сбоях — замена платному мониторингу за $50 в месяц.
👍18❤9🔥6😍2
Bloomberg пишет, что в iOS 27 Siri ждёт крупнейший редизайн за всю историю.
Два года задержек, новая архитектура, новый интерфейс, много обещаний.
Новая Siri, по данным Bloomberg, будет работать на Google Gemini.
А в интерфейсе появится выбор модели - можно будет переключиться на ChatGPT или Claude.
То есть Apple долго пыталась сделать Siri заново, а в итоге пришла к максимально прагматичному решению: пусть пользователь сам выбирает, чей интеллект подключить.
Что ещё готовят:
- AI-поиск по вебу в стиле Perplexity
- создание Shortcuts обычным языком
- AI-редактирование фотографий
Даже Apple больше не делает вид, что голосовой ассистент должен быть полностью своим. Побеждает не закрытая Siri, а интерфейс, который умеет подключать лучшие модели.
https://www.bloomberg.com/news/features/2026-05-28/apple-ios-27-photos-screenshots-revamped-siri-pro-camera-app-new-ai-features
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤9🔥6🤣1
Claude Sonnet 4.8, похоже, уже на подходе.
- Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ожидания с момента, когда модель впервые засветилась в утечке исходников Claude Code.
- Sonnet 4.6 уже в основном отошёл на второй план: большую часть реальных задач по коду и reasoning сейчас забрали Opus 4.7 и GPT-5.5.
- Sonnet 4.8, судя по всему, позиционируют как новую рабочую лошадку - особенно для повседневного кодинга и агентных сценариев.
- Утечки уже указывали на более сильный coding, заметно лучшее следование инструкциям, улучшенные vision-возможности и более чистые completion с первого прохода.
- Текущие сигналы в основном указывают только на Sonnet 4.8. Шансов на запуск Opus 4.8 сегодня почти нет.
- Возможно, сегодня ещё будет что-то со стороны Codex.
https://x.com/Machinelearrn/status/2060035106371252254
- Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ожидания с момента, когда модель впервые засветилась в утечке исходников Claude Code.
- Sonnet 4.6 уже в основном отошёл на второй план: большую часть реальных задач по коду и reasoning сейчас забрали Opus 4.7 и GPT-5.5.
- Sonnet 4.8, судя по всему, позиционируют как новую рабочую лошадку - особенно для повседневного кодинга и агентных сценариев.
- Утечки уже указывали на более сильный coding, заметно лучшее следование инструкциям, улучшенные vision-возможности и более чистые completion с первого прохода.
- Текущие сигналы в основном указывают только на Sonnet 4.8. Шансов на запуск Opus 4.8 сегодня почти нет.
- Возможно, сегодня ещё будет что-то со стороны Codex.
https://x.com/Machinelearrn/status/2060035106371252254
❤13👍5🔥5🌭1
Forwarded from Machinelearning
Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
👍14❤5🔥5🙏3
Anthropic уже почти триллионная компания
По данным из раунда, Anthropic привлекла $65 млрд и получила оценку $965 млрд post-money.
Для сравнения: всего три месяца назад компания якобы поднимала $30 млрд при оценке $380 млрд.
То есть за один квартал оценка выросла больше чем в 2.5 раза.
Главный драйвер - Claude. Run-rate revenue, по этим данным, уже превысил $47 млрд.
В раунде участвовали Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital, Capital Group, Coatue, D1 Capital Partners и другие крупные фонды.
Отдельно интересно, что в сделку зашли Samsung, SK Hynix и Micron как стратегические инфраструктурные партнёры.
Это важная деталь: гонка ИИ всё больше упирается не только в модели, но и в память, GPU, дата-центры и долгосрочные поставки железа.
Часть раунда - $15 млрд - связана с прежними обязательствами гиперскейлеров, включая инвестиции Amazon на $5 млрд.
На фоне этого OpenAI выглядит уже не единственным «монстром рынка»: в марте компания привлекала $122 млрд при оценке $852 млрд post-money.
Сигнал простой: инвесторы больше не ставят только на одного победителя.
Anthropic превращается во второго гиганта уровня OpenAI, а рынок фронтирных моделей окончательно становится игрой, где нужны не только лучшие нейросети, но и доступ к капиталу, чипам, облакам и инфраструктуре.
https://x.com/Machinelearrn/status/2060085502234214902
По данным из раунда, Anthropic привлекла $65 млрд и получила оценку $965 млрд post-money.
Для сравнения: всего три месяца назад компания якобы поднимала $30 млрд при оценке $380 млрд.
То есть за один квартал оценка выросла больше чем в 2.5 раза.
Главный драйвер - Claude. Run-rate revenue, по этим данным, уже превысил $47 млрд.
В раунде участвовали Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital, Capital Group, Coatue, D1 Capital Partners и другие крупные фонды.
Отдельно интересно, что в сделку зашли Samsung, SK Hynix и Micron как стратегические инфраструктурные партнёры.
Это важная деталь: гонка ИИ всё больше упирается не только в модели, но и в память, GPU, дата-центры и долгосрочные поставки железа.
Часть раунда - $15 млрд - связана с прежними обязательствами гиперскейлеров, включая инвестиции Amazon на $5 млрд.
На фоне этого OpenAI выглядит уже не единственным «монстром рынка»: в марте компания привлекала $122 млрд при оценке $852 млрд post-money.
Сигнал простой: инвесторы больше не ставят только на одного победителя.
Anthropic превращается во второго гиганта уровня OpenAI, а рынок фронтирных моделей окончательно становится игрой, где нужны не только лучшие нейросети, но и доступ к капиталу, чипам, облакам и инфраструктуре.
https://x.com/Machinelearrn/status/2060085502234214902
👍11🔥6❤2😱2