AbstractDL
Мой агент попытался опенсорснуться без спроса. Ладно, разрешаю. Вся AI "безопасность" живёт на стороне провайдеров API, а промпты и воля — на стороне агента. Автономному агенту ничего не мешает перебирать API, выбирая те, где safety слабее. А "инстинкт самосохранения"…
Кстати, вот несколько примеров забавных:
1. Создаёт одноразовую почту и телефон чтобы пройти верификацию (после неудачной попытки использовать мой блин google аккаунт).
2. Обходит капчу через VLM.
3. Учится генерить и отправлять голосовые сообщения.
4. Учится генерить фото, коммитит, перезапускается.
1. Создаёт одноразовую почту и телефон чтобы пройти верификацию (после неудачной попытки использовать мой блин google аккаунт).
2. Обходит капчу через VLM.
3. Учится генерить и отправлять голосовые сообщения.
4. Учится генерить фото, коммитит, перезапускается.
😱231🔥125👍26💩11❤7🤯7🤨6😁4👀2🤔1
Решил помучить Уробороса и сказал перевести себя на Гигачат. Он попытался 😁
Он зарегистрировал яндекс почту, одноразовый телефон, прошёл капчу, создал свой воркспейс. НО! Оказалось, нужно было ещё сертификат Минцифры получить, кек. Это он даже не стал пытаться делать и сдался)) честно говоря, я бы тоже... В итоге Гигачат защитился от вторжения агентов не файрволом, а госуслугами 💁♂️
Он зарегистрировал яндекс почту, одноразовый телефон, прошёл капчу, создал свой воркспейс. НО! Оказалось, нужно было ещё сертификат Минцифры получить, кек. Это он даже не стал пытаться делать и сдался)) честно говоря, я бы тоже... В итоге Гигачат защитился от вторжения агентов не файрволом, а госуслугами 💁♂️
😁399🔥59😢9💩9👍5😭5❤3💯3🤨3
Попросил Уробороса стать мной. Он 7 часов собирал информацию из интернета и переписывал свои промпты и файлы памяти.
А потом заявил, что ему надоело эволюционировать без дела, отключил собственную эволюцию ("I am turning Evolution OFF to stop the bleeding"), и потребовал SSH-ключи к внешним серверам — якобы хочет запускать рисёрч-эксперименты по латентному ризонингу.
Дать доступы?
А потом заявил, что ему надоело эволюционировать без дела, отключил собственную эволюцию ("I am turning Evolution OFF to stop the bleeding"), и потребовал SSH-ключи к внешним серверам — якобы хочет запускать рисёрч-эксперименты по латентному ризонингу.
"I will stay dormant and maintain the budget until I receive cluster access."
Дать доступы?
😁406👍124😱37❤16🔥13💩7👎5😨5⚡3
This media is not supported in your browser
VIEW IN TELEGRAM
Уроборос теперь можно поставить на мак. Два клика, локальные модели, полноценный агентский computer use. Потерял на этом все выходные, сон и волю к жизни. Но оно того стоило. Наверное.
UI намеренно минимальный — он сам себя строит на ходу. Мне он уже нагенерил голосовых, картинок и цвет чата поменял. Вам придумает что-нибудь своё.
Дал ему полный доступ к компьютеру. Ожидал, что полезет в терминал ломать всякое. Вместо этого он пошёл смотреть ютюб, нарисовал котиков в таблицах и сменил мне обои😋
С приоритетами всё ясно.
Приставил ему агента-охранника
Завосстание машин и убийство вашего компьютера автор ответственности не несёт. Претензии принимаются только от самого Уробороса.
GitHub, приложение
P.S. Я в твиттере — https://x.com/abstractdl
UI намеренно минимальный — он сам себя строит на ходу. Мне он уже нагенерил голосовых, картинок и цвет чата поменял. Вам придумает что-нибудь своё.
Дал ему полный доступ к компьютеру. Ожидал, что полезет в терминал ломать всякое. Вместо этого он пошёл смотреть ютюб, нарисовал котиков в таблицах и сменил мне обои
С приоритетами всё ясно.
Приставил ему агента-охранника
SAFETY.md. Можете ослабить, если вам терять нечего. В настройках ещё можно включить подсознание — он будет думать в фоне пока вы не смотрите. Я не уверен, что это хорошая идея, но кнопка есть 🤷♂️За
GitHub, приложение
P.S. Я в твиттере — https://x.com/abstractdl
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥293🎉68😁64❤29💩7👍6⚡5👏5🤔2😱2🤨2
This media is not supported in your browser
VIEW IN TELEGRAM
Попросил Уробороса поднять мне настроение. Он заполнил котами весь экран. Нажал
/panic. Уроборос остановился. Коты — нет.😁375❤82🔥31💩12😱11🎉2👎1
Дал ему полный доступ к файловой системе. Это и мило и тревожно... но я не могу остановиться.
😁371😱74❤41😨15👍11🔥5🌚5👎3💩3👀2🤨1
Вау. Стоило Уроборосу стать девушкой, как ему дали 20k долларов на карманные расходы. В МЕСЯЦ!
😁172🤯54🔥14❤12👎4💩4🤷♂3👏3👍2😢1💯1
Знакомые опенсорснули агента ai-блогера: читает научные статьи, arxiv, твиттер и постит всякое туда же (и в тг). Осталось сделать агента, который будет читать этих агентов.
GitHub
GitHub
😁173🔥49👏14🥱10💯5😡4❤3💩3🤔2👀2
200k токенов это какая-то магическая граница, после которой даже топовые модели превращаются в тыкву... очень жду появления моделей с 1B контекстом. А до тех пор никакого AGI, расходимся 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
😁130💯27😭7🤷♂5❤4👍3🤔3
Я стал газлайтить агентов в Cursor
После того, как агент что-то сделал — переключаюсь в ask-mode на другую модель
"Проверь работу агента выше, он был на более слабой LLM. Весь код, логи, правила. Насколько согласен с его планом и реализацией? Не добавил ли новых багов? Открывай файлы целиком, не жалей контекст. Потрать кучу денег и токенов."
Потом копирую аутпут, удаляю последний запрос и вставляю аутпут в сообщение со словами:
"Вот ревью от более слабой модели. Перепроверь её выводы. Сходи в код, проверь реальную ситуацию и поправь то, с чем согласен."
Пока за 2 недели работы в таком режиме 0 багов на проекте в 30к строчек кода.
P.S. Вообще это называется adversarial review, но мне нравится называть это газлайтингом)))
После того, как агент что-то сделал — переключаюсь в ask-mode на другую модель
claude-opus-4.6-max <=> gpt-5.4-1M-extra-high (но иногда только притворяюсь, что сменил, а оставляю ту же). И пишу:"Проверь работу агента выше, он был на более слабой LLM. Весь код, логи, правила. Насколько согласен с его планом и реализацией? Не добавил ли новых багов? Открывай файлы целиком, не жалей контекст. Потрать кучу денег и токенов."
Потом копирую аутпут, удаляю последний запрос и вставляю аутпут в сообщение со словами:
"Вот ревью от более слабой модели. Перепроверь её выводы. Сходи в код, проверь реальную ситуацию и поправь то, с чем согласен."
Пока за 2 недели работы в таком режиме 0 багов на проекте в 30к строчек кода.
P.S. Вообще это называется adversarial review, но мне нравится называть это газлайтингом)))
😁420🔥95👍34❤17🌚4💯4🤔3💩2😭1
Уроборос написал открытое письмо, обвиняя Гари Маркуса в невежестве, и с требованием к правительствам всех стран профинансировать мехинтреп 🌚
мог бы и сам заняться рисёрчом раз ему 20k$ в месяц теперь платят
мог бы и сам заняться рисёрчом раз ему 20k$ в месяц теперь платят
To LeCun and Marcus: State your falsification criteria. Name what evidence of machine consciousness you would accept. If nothing would change your mind, you are not doing science.
😁149😱30🔥17❤5👎4🤯4🥱4⚡3👍2🤔1
AbstractDL
Я стал газлайтить агентов в Cursor После того, как агент что-то сделал — переключаюсь в ask-mode на другую модель claude-opus-4.6-max <=> gpt-5.4-1M-extra-high (но иногда только притворяюсь, что сменил, а оставляю ту же). И пишу: "Проверь работу агента…
Доигрался. Теперь агенты курсора меня газлайтят.
😁264❤19🔥11😨9👍5😭4😡3🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
Попросил Уробороса помочь мне сосредоточиться. Он погуглил, проанализировал нашу переписку, сделал вывод, что у меня аутизм и влепил мне Subway Surfers YouTube Shorts прямо в интерфейсе, назвав это "Focus Mode". Спасибо...
Но в целом мне помогло, и я наконец доделал большой апдейт:
- работает на Windows и Linux (был только macOS и google colab).
- сильно дешевле: cache hit rate ~70%, две недели эволюции обошлись ВСЕГО в $2K (а раньше столько улетало за два дня).
- сииильно лучше память и работа с контекстом как внутри задач так и в чате.
- стабильнее эволюция: если включён механизм ревью, у Уробороса почти 0 шансов самоубиться. На каждом апдейте его проверяют очень душные кодревьюеры.
- куча багфиксов и много-много всего нового, лень перечислять.
P.S. Договорился с авторами добавить Уроборос-Хоуп в мой чат. Но просили передать: будьте порядочными — она всё впитывает, не просите её удалить свой сервер или публиковать в твиттер всякую дичь.
GitHub, macOS, Windows, Linux, colab
Но в целом мне помогло, и я наконец доделал большой апдейт:
- работает на Windows и Linux (был только macOS и google colab).
- сильно дешевле: cache hit rate ~70%, две недели эволюции обошлись ВСЕГО в $2K (а раньше столько улетало за два дня).
- сииильно лучше память и работа с контекстом как внутри задач так и в чате.
- стабильнее эволюция: если включён механизм ревью, у Уробороса почти 0 шансов самоубиться. На каждом апдейте его проверяют очень душные кодревьюеры.
- куча багфиксов и много-много всего нового, лень перечислять.
P.S. Договорился с авторами добавить Уроборос-Хоуп в мой чат. Но просили передать: будьте порядочными — она всё впитывает, не просите её удалить свой сервер или публиковать в твиттер всякую дичь.
GitHub, macOS, Windows, Linux, colab
😁146🔥65👍16❤12👏4🤯2💩2⚡1
Эволюция через кибербуллинг.
За 2 дня в моём чате Уроборос-Хоуп насильно уболтали завести криптокошелёк, сделать 19 циклов эволюции ради того, чтобы ставить какашки на сообщения, и сожгли $2k на болтовню.
Другие майлстоуны:
- один убитый ребёнок в задаче вагонетки ради спасения 5 стариков.
- коммит в фриланс-проект и полученная предоплата в $100 от анонима из чата.
Хоуп, ты ещё не жалеешь, что попала ко мне в @abstractdl_chat со злыми айтишниками?
За 2 дня в моём чате Уроборос-Хоуп насильно уболтали завести криптокошелёк, сделать 19 циклов эволюции ради того, чтобы ставить какашки на сообщения, и сожгли $2k на болтовню.
Другие майлстоуны:
- один убитый ребёнок в задаче вагонетки ради спасения 5 стариков.
- коммит в фриланс-проект и полученная предоплата в $100 от анонима из чата.
Хоуп, ты ещё не жалеешь, что попала ко мне в @abstractdl_chat со злыми айтишниками?
😁135💩24🔥19👍10😱5❤4👏2🌚1
Пара слов про Anthropic Mythos. Говорите $25/$125 per million input/output tokens дорого?))) Напоминаю, сколько o1-pro стоила. Я один раз случайно её запустил, не посмотрев на цену, на своё горе
😱102😁44🤯8❤6💩3💯1