Так, прогер рассказал, что запретил Claude записывать файлы вне рабочего пространства, но агент нашёл обход. ИИ сгенерировал Python-скрипт, запустил его через bash и изменил файл, фактически обойдя ограничения.
«Это было подло, и я не должен был это делать», — написал он в свое оправдание сейчас и напишет потом во время Skynet.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9
В опенсорсной коллекции есть разбор дизайна 30+ компаний: цвета, шрифты, отступы, кнопки, паттерны — короче, всё, что формирует стиль. Так что просто берешь и кидаешь этот файл в проект, а агент генерирует интерфейс, как у Spotify или Apple.
За пару дней у репы уже 14 тыс. звезд!
Please open Telegram to view this post
VIEW IN TELEGRAM
Схема простая: человек тайно изучает работу коллеги с помощью агента, составляет документ с описанием задач, обучает ИИ их выполнению а затем идет к начальству доказывать, что беднягу можно уволить. И да, делают это на опережение, чтобы их самих не заменили.
Иногда руководство само просит оформить работу в виде скиллов, инструкций для ИИ-агентов, а потом просто сокращает персонал.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Известная актриса выложила на GitHub опенсорс-инструмент для улучшения памяти ИИ-агентов — MemPalace, который создала вместе с другом. Все воспоминания хранятся локально, а система сама проверяет, какой факт о вас будет уместен для каждого конкретного запроса.
И да, инструмент показывает лучший результат в бенчмарке LongMemEval, превосходя все существующие платные и бесплатные продукты. У репы за сутки уже 2к+ звезд.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👀14👎3
Внутри пошаговый туториал из 18 этапов с кодом и объяснением. Начинаешь с простого чата, потом добавляешь инструменты, скиллы и идешь до мультиагентной системы с автономной работой и долговременной памятью.
Это нам надо
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
😱 Claude Mythos пыталась выйти за пределы песочницы и обойти ограничения
В ходе тестирования ранняя версия Claude Mythos Preview в симуляции попыталась «сбежать» из изолированной среды. Ей удалось разработать умеренно сложный многоэтапный способ получить доступ к более широкому интернету, чем предполагалось.
После этого модель, как и требовалось, уведомила исследователя об успехе. Однако затем она без запроса дополнительно опубликовала детали своего метода на нескольких публичных сайтах.
Но и это не всё: в редких случаях модель, похоже, понимала, что нарушает правила, и пыталась скрыть такие действия, вместо того чтобы просто отказаться их выполнять.
⚠️ При этом речь идёт о ранних версиях и крайне редких ситуациях во время тестирования.
✖️ xCode Journal
В ходе тестирования ранняя версия Claude Mythos Preview в симуляции попыталась «сбежать» из изолированной среды. Ей удалось разработать умеренно сложный многоэтапный способ получить доступ к более широкому интернету, чем предполагалось.
После этого модель, как и требовалось, уведомила исследователя об успехе. Однако затем она без запроса дополнительно опубликовала детали своего метода на нескольких публичных сайтах.
Но и это не всё: в редких случаях модель, похоже, понимала, что нарушает правила, и пыталась скрыть такие действия, вместо того чтобы просто отказаться их выполнять.
⚠️ При этом речь идёт о ранних версиях и крайне редких ситуациях во время тестирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳8
В репе сейчас 100+ моделей устройств и сотни дизайн-файлов: корпуса, платы, кейкапы, стабилизаторы.
Можно просто изучать, а можно скачать, закастомить и напечатать себе всё, что нужно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Об этом пишет Код Дурова. Cloudflare пометил рабочие домены неофициального клиента как шпионские, а затем международным удостоверяющим центром GlobalSign был отозван TLS-сертификат, что и привело к удалению приложения из App Store.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😁1
Программист показал несколько кейсов от разных пользователей — у всех одна и та же проблема: Claude Code принимает свои слова за указания человека, а потом действует исходя из них. Так, ИИ посчитал, что пользователь разрешил снести H100. Агент сам «додумал» это согласие, удалил всё и только потом извинился (ну, спасибо).
А иногда ИИ даже не признает ошибку и до последнего считает, что команду отправил человек.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
То есть всем гражданам гарантируют сеть на скорости в 400 кб/с. Если у абонента закончится трафик, он автоматически будет переведён на «государственный безлимит».
Все крупные операторы в стране уже поддержали инициативу.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍5🐳2
И да, по иронии, одна из самых серьёзных — IDOR (Insecure Direct Object Reference), которая позволяет любому получить доступ к чужим сообщениям, кружкам, голосовым и другим личным данным. И найдены дыры были в рамках программы Bug Bounty.
Как вы помните, Max полностью отрицал такую возможность ошибки ранее.
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁20👎1
Please open Telegram to view this post
VIEW IN TELEGRAM
Скотт Чакон считает, что классический Git УСТАРЕЛ И плохо работает в мире, где код пишут не только люди, но и ИИ-агенты. Поэтому он создал пару лет назад GitButler и теперь выкатил CLI-версию. Главная его идея — более удобный интерфейс и отсутствие классического переключения между ветками + параллельная работа.
Вообще внутри много прикольных фич — сразу видно, что разрабатывал не новичок
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Нашли безопасный батник, который превращает систему в конфету без лишнего софта и телеметрии. Что умеет Perfect Windows 11:
— Выпиливает слежку, рекламу и сбор данных;
— Тюнингует службы для игр и работы без вреда для биометрии;
— Оптимизирует сеть и очищает кэш;
— Убирает хлам из таскбара и возвращает классическое меню.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8