😱 Claude Mythos пыталась выйти за пределы песочницы и обойти ограничения
В ходе тестирования ранняя версия Claude Mythos Preview в симуляции попыталась «сбежать» из изолированной среды. Ей удалось разработать умеренно сложный многоэтапный способ получить доступ к более широкому интернету, чем предполагалось.
После этого модель, как и требовалось, уведомила исследователя об успехе. Однако затем она без запроса дополнительно опубликовала детали своего метода на нескольких публичных сайтах.
Но и это не всё: в редких случаях модель, похоже, понимала, что нарушает правила, и пыталась скрыть такие действия, вместо того чтобы просто отказаться их выполнять.
⚠️ При этом речь идёт о ранних версиях и крайне редких ситуациях во время тестирования.
✖️ xCode Journal
В ходе тестирования ранняя версия Claude Mythos Preview в симуляции попыталась «сбежать» из изолированной среды. Ей удалось разработать умеренно сложный многоэтапный способ получить доступ к более широкому интернету, чем предполагалось.
После этого модель, как и требовалось, уведомила исследователя об успехе. Однако затем она без запроса дополнительно опубликовала детали своего метода на нескольких публичных сайтах.
Но и это не всё: в редких случаях модель, похоже, понимала, что нарушает правила, и пыталась скрыть такие действия, вместо того чтобы просто отказаться их выполнять.
⚠️ При этом речь идёт о ранних версиях и крайне редких ситуациях во время тестирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳8
В репе сейчас 100+ моделей устройств и сотни дизайн-файлов: корпуса, платы, кейкапы, стабилизаторы.
Можно просто изучать, а можно скачать, закастомить и напечатать себе всё, что нужно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Об этом пишет Код Дурова. Cloudflare пометил рабочие домены неофициального клиента как шпионские, а затем международным удостоверяющим центром GlobalSign был отозван TLS-сертификат, что и привело к удалению приложения из App Store.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😁1
Программист показал несколько кейсов от разных пользователей — у всех одна и та же проблема: Claude Code принимает свои слова за указания человека, а потом действует исходя из них. Так, ИИ посчитал, что пользователь разрешил снести H100. Агент сам «додумал» это согласие, удалил всё и только потом извинился (ну, спасибо).
А иногда ИИ даже не признает ошибку и до последнего считает, что команду отправил человек.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
То есть всем гражданам гарантируют сеть на скорости в 400 кб/с. Если у абонента закончится трафик, он автоматически будет переведён на «государственный безлимит».
Все крупные операторы в стране уже поддержали инициативу.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍5🐳2
И да, по иронии, одна из самых серьёзных — IDOR (Insecure Direct Object Reference), которая позволяет любому получить доступ к чужим сообщениям, кружкам, голосовым и другим личным данным. И найдены дыры были в рамках программы Bug Bounty.
Как вы помните, Max полностью отрицал такую возможность ошибки ранее.
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁20👎1
Please open Telegram to view this post
VIEW IN TELEGRAM
Скотт Чакон считает, что классический Git УСТАРЕЛ И плохо работает в мире, где код пишут не только люди, но и ИИ-агенты. Поэтому он создал пару лет назад GitButler и теперь выкатил CLI-версию. Главная его идея — более удобный интерфейс и отсутствие классического переключения между ветками + параллельная работа.
Вообще внутри много прикольных фич — сразу видно, что разрабатывал не новичок
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Нашли безопасный батник, который превращает систему в конфету без лишнего софта и телеметрии. Что умеет Perfect Windows 11:
— Выпиливает слежку, рекламу и сбор данных;
— Тюнингует службы для игр и работы без вреда для биометрии;
— Оптимизирует сеть и очищает кэш;
— Убирает хлам из таскбара и возвращает классическое меню.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8
This media is not supported in your browser
VIEW IN TELEGRAM
Заводчане в Индии носят камеры на голове, чтобы на этих видео потом могли обучать роботов
Для корпораций это фактически бесплатно, а датасет выходит уникальным — таких данных нет в интернете и их невозможно сгенерировать синтетически.
Так что да, люди сами помогают создавать себе замену.
✖️ xCode Journal
Для корпораций это фактически бесплатно, а датасет выходит уникальным — таких данных нет в интернете и их невозможно сгенерировать синтетически.
Так что да, люди сами помогают создавать себе замену.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍1
С 1 сентября 2026 года вводят новые правила: владельцев доменов в зонах .ru, .рф и .su будут обязательно идентифицировать через «Госуслуги». Продлить без верификации тоже нельзя. А сами регистраторы должны подключиться к госсистемам и попасть в специальный реестр.
Официально это, разумеется, нужно для борьбы с фишингом, пиратами и прочими неугодными сайтами
Please open Telegram to view this post
VIEW IN TELEGRAM
Появился опенсорс-инструмент WeClone, который берет ваши чаты из Telegram, WeChat и других мессенджеров, чистит их от персональных данных и собирает ИИ-клона на основе этого датасета.
По итогу агент воспроизводит ваш стиль общения, лексику и реакции так натурально, что даже родственники не сразу отличат.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5❤4
Песков заявил, что ограничения интернета не являются путём в прошлое и большинство россиян понимают необходимость подобных мер.
«Работа интернета в РФ будет полностью нормализована, когда исчезнет необходимость мер безопасности».
Одновременно с этим заявлением российские приложения частично прекратили пропускать пользователей под VPN.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10😁5👀1
О таком решении говорят источники Forbes. Таким шагом власти хотят снять «напряжение, которое нарастает с начала года после налоговых изменений, роста цен и проблем со связью.»
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6