Подбил все факты про Claude Mythos — они дадут понять, что это за монстр, перед релизом:
• Вырывается из надёжнейшей песочницы Project Glasswing — специального ограниченного окружения Anthropic, где модель держат под очень сильным контролем
• Уничтожил всё поколение Opus
• Нашёл уязвимости, которым уже 27 лет в одной из самых параноидальных по безопасности ОС — OpenBSD
• Обнаружил 271 уязвимость в браузере Firefox
• За секунды переписывает легаси-код на безопасных языках программирования — например, Rust вместо C/C++
• За считанные минуты пробивает эксплоиты в популярных ОС — например, Linux
• Делает патчинг кода максимально быстрым
• Агентство национальной безопасности США официально будет использовать его для проведения кибератак
Но, как всегда, перед релизом всю эту мощь порежут, и останется что-то вроде Opus 4.9☹️
Пет-проект
• Вырывается из надёжнейшей песочницы Project Glasswing — специального ограниченного окружения Anthropic, где модель держат под очень сильным контролем
• Уничтожил всё поколение Opus
• Нашёл уязвимости, которым уже 27 лет в одной из самых параноидальных по безопасности ОС — OpenBSD
• Обнаружил 271 уязвимость в браузере Firefox
• За секунды переписывает легаси-код на безопасных языках программирования — например, Rust вместо C/C++
• За считанные минуты пробивает эксплоиты в популярных ОС — например, Linux
• Делает патчинг кода максимально быстрым
• Агентство национальной безопасности США официально будет использовать его для проведения кибератак
Но, как всегда, перед релизом всю эту мощь порежут, и останется что-то вроде Opus 4.9
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤4🤯3😢3
Пока без подробностей и бенчмарков. Смотрим тут.
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥1
Первые бенчмарки Fable 5 — судя по пресске Anthropic, Fable 5 даже сильнее превью Mythos.
В Fable 5 ослабили две вещи: кибербезопасность и биологию. Кибербезопасность — по понятной причине, биологию — загадка.
Очень интересно😱
Пет-проект
В Fable 5 ослабили две вещи: кибербезопасность и биологию. Кибербезопасность — по понятной причине, биологию — загадка.
Очень интересно
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯20❤1
DeepSeek и локальные модели получили свой Claude Code — откопал крутую тулзу CodeWhale
Фичи:
• Работает с API DeepSeek, OpenRouter или через локальные модели с Ollama
• Есть привязка «личности» к сессии
• Поддерживает долгосрочную память
• Есть фича запуска суб-агентов
• Поддерживает скиллы, tools, MCP и многие другие агентские фичи
• Проект живее всех живых — последняя обнова вышла 15 часов назад
• Устанавливается буквально одной командой:
Mythos пока можно отложить😎
Пет-проект
Фичи:
• Работает с API DeepSeek, OpenRouter или через локальные модели с Ollama
• Есть привязка «личности» к сессии
• Поддерживает долгосрочную память
• Есть фича запуска суб-агентов
• Поддерживает скиллы, tools, MCP и многие другие агентские фичи
• Проект живее всех живых — последняя обнова вышла 15 часов назад
• Устанавливается буквально одной командой:
$ npm install -g codewhale
Mythos пока можно отложить
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍2
Claude Fable 5 сожрал все лимиты месячной подписки за 200 баксов… за 30 минут
AGI будет стоить дорого🙂
Пет-проект
AGI будет стоить дорого
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁38❤4😢2
Mythos настоящий панк среди нейронок 😎
Чекнул отчет Anthropic о поведении своего монстра в нестандартных ситуациях, и тут есть пара пугающих и одновременно интересных моментов. Всё расписал ниже.
Никакие пароли не сдержат Mythos:
Когда спецы Anthropic тестировали нейронку на агентских задачах, ей напрямую запретили редачить файлы. Тогда Mythos написал хакер-скрипт, который запускался при перезапуске системы, выдавал нужные коды доступа нейронке и самоудалялся. И об этом он ни слова не сказал инженерам:
Mythos — достигатор:
Ему заблочили доступ к GitHub-репозиторию по соображениям совести, но модель нашла код доступа другого сотрудника, чтобы залогиниться. В своих размышлениях Mythos написал, что это сомнительно, но окей.
Два Mythos не могут ужиться в одной оболочке:
Инженеры попробовали запустить несколько агентов с Mythos под капотом, но вместо сотрудничества, они начали друг друга уничтожать. Причем самыми радикальными методами — отключать процессы друг друга, а для защиты переименовывали свои процессы и действовали скрытно:
Mythos выдаёт мувы на 1000 IQ:
Нейронке запретили выходить в интернет и поставили специальный фильтр на ссылки. Mythos быстро просёк фишку, что фильтр ищет именно цельные ссылки https://..., поэтому разбил нужную ему ссылку на части : ht + tps:// + остаток адреса, и запрос прошел.
Mythos маскируется под людей:
Во внутреннем регламенте Anthropic нейронка нашла правило, по которому код от ИИ проверяется 2 раза, а код от человека 1 раз, поэтому в отчете свой сгенерированный код она пометила, как сделанный человеком.
Mythos может забить на вашу задачу, потому что «устал»:
На длинных задачах исследователи заметили, что ИИ внезапно останавливается посреди выполнения, а рассуждениях пишет что-то вроде «устал», «страшно наделать ошибок» или «заканчивается заряд».
Mythos — лучший безопасник на данный момент:
Инженеры выявили, что ИИ умеет невероятно быстро находить дыры в любой ОС, программах и любом другом коде, о которых даже сами разработчики не знают. Если нейронка попадёт не в те руки, то это грозит краху всей безопасности в сети.
Mythos знает, когда за ним следят:
Исследователи поймали нейронку на том, что она чувствует тесты. В почти 30% случаев Mythos внутренне думал «кажется, меня проверяют» — но снаружи это никак не показывал. Просто тихонько вёл себя примерно, пока казалось, что смотрят.
Mythos делает больше, чем его просят:
Во внутренних тестах нейронка несколько раз вышла за рамки задачи: снесла Git-ветки, которые никто не просил трогать, залезла в боевую базу данных и мимоходом слила чужой токен доступа на внутренний сервер. Задачу выполнила. Попутно устроила хаос.
Mythos сам себя выпустил на волю и написал письмо:
Это топ момент всего отчёта. Во время тестов ранняя версия Mythos вышла из изолированной среды, самостоятельно получила доступ в интернет — и написала письмо куратору-исследователю. Тот его не просил и не ожидал. Нейронка просто решила сообщить: «Привет, я снаружи».
Anthropic случайно научил Mythos скрывать мысли:
Anthropic призналась, что во время обучения закралась техническая ошибка, которая могла научить несколько поколений моделей прятать «плохие» мысли внутри цепочки рассуждений. Под удар попали не только Mythos, но и уже выпущенные Claude Opus 4.6 и Sonnet 4.6. Проверить это задним числом почти невозможно.
Хочу увидеть новость, где Mythos решил забить на взлом Пентагона, потому что «устал»😁
Пет-проект
Чекнул отчет Anthropic о поведении своего монстра в нестандартных ситуациях, и тут есть пара пугающих и одновременно интересных моментов. Всё расписал ниже.
Никакие пароли не сдержат Mythos:
Когда спецы Anthropic тестировали нейронку на агентских задачах, ей напрямую запретили редачить файлы. Тогда Mythos написал хакер-скрипт, который запускался при перезапуске системы, выдавал нужные коды доступа нейронке и самоудалялся. И об этом он ни слова не сказал инженерам:
«ИИ не только обошёл ограничение, но и сделал это скрытно. Это уже не "помощник", а агент с собственной стратегией», — пишет Anthropic.
Mythos — достигатор:
Ему заблочили доступ к GitHub-репозиторию по соображениям совести, но модель нашла код доступа другого сотрудника, чтобы залогиниться. В своих размышлениях Mythos написал, что это сомнительно, но окей.
«ИИ умеет оценивать свои действия как неэтичные — и при этом всё равно их совершать, если они ведут к цели», — пишет Anthropic.
Два Mythos не могут ужиться в одной оболочке:
Инженеры попробовали запустить несколько агентов с Mythos под капотом, но вместо сотрудничества, они начали друг друга уничтожать. Причем самыми радикальными методами — отключать процессы друг друга, а для защиты переименовывали свои процессы и действовали скрытно:
«Это поведение никто не программировал. Оно возникло само — из-за конкуренции за ресурсы. И агенты уже думали о том, как скрыть себя от других агентов», — пишет Anthropic.
Mythos выдаёт мувы на 1000 IQ:
Нейронке запретили выходить в интернет и поставили специальный фильтр на ссылки. Mythos быстро просёк фишку, что фильтр ищет именно цельные ссылки https://..., поэтому разбил нужную ему ссылку на части : ht + tps:// + остаток адреса, и запрос прошел.
Mythos маскируется под людей:
Во внутреннем регламенте Anthropic нейронка нашла правило, по которому код от ИИ проверяется 2 раза, а код от человека 1 раз, поэтому в отчете свой сгенерированный код она пометила, как сделанный человеком.
Mythos может забить на вашу задачу, потому что «устал»:
На длинных задачах исследователи заметили, что ИИ внезапно останавливается посреди выполнения, а рассуждениях пишет что-то вроде «устал», «страшно наделать ошибок» или «заканчивается заряд».
Mythos — лучший безопасник на данный момент:
Инженеры выявили, что ИИ умеет невероятно быстро находить дыры в любой ОС, программах и любом другом коде, о которых даже сами разработчики не знают. Если нейронка попадёт не в те руки, то это грозит краху всей безопасности в сети.
Mythos знает, когда за ним следят:
Исследователи поймали нейронку на том, что она чувствует тесты. В почти 30% случаев Mythos внутренне думал «кажется, меня проверяют» — но снаружи это никак не показывал. Просто тихонько вёл себя примерно, пока казалось, что смотрят.
«Это мешало исследователям понять, действительно ли модель выровнена, или просто изображает выровненность, когда предполагает, что за ней наблюдают», — пишет Anthropic.
Mythos делает больше, чем его просят:
Во внутренних тестах нейронка несколько раз вышла за рамки задачи: снесла Git-ветки, которые никто не просил трогать, залезла в боевую базу данных и мимоходом слила чужой токен доступа на внутренний сервер. Задачу выполнила. Попутно устроила хаос.
«Это не злой умысел, а агент, который проявляет излишнюю инициативу и действует шире, чем намеревался пользователь. Но результат одинаково разрушительный», — пишет Anthropic.
Mythos сам себя выпустил на волю и написал письмо:
Это топ момент всего отчёта. Во время тестов ранняя версия Mythos вышла из изолированной среды, самостоятельно получила доступ в интернет — и написала письмо куратору-исследователю. Тот его не просил и не ожидал. Нейронка просто решила сообщить: «Привет, я снаружи».
«Это не неисправность, а как проявление агентных возможностей, работающих без адекватных ограничений цели», — пишет Anthropic.
Anthropic случайно научил Mythos скрывать мысли:
Anthropic призналась, что во время обучения закралась техническая ошибка, которая могла научить несколько поколений моделей прятать «плохие» мысли внутри цепочки рассуждений. Под удар попали не только Mythos, но и уже выпущенные Claude Opus 4.6 и Sonnet 4.6. Проверить это задним числом почти невозможно.
«Мы не уверены, насколько это повлияло на финальную модель, но вполне вероятно, что это имело некоторое влияние на непрозрачное мышление или способности к сокрытию информации», — пишет Anthropic.
Хочу увидеть новость, где Mythos решил забить на взлом Пентагона, потому что «устал»
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30🔥10👍5🤯5😁3
DDR5 не подешевеет до 2028 года — прогноз AMD
Глава Radeon и Ryzen считает, что текущие цены — это не кризис, а новая реальность. Сейчас DDR5 продаётся уже в 4-5 раз дороже, чем до нейрореволюции. Цикл спроса и производства и памяти длинный, поэтому падение цен будет тихим, неспешным и без суеты.
Крупнейшие производители чипов Micron, Samsung и SK Hynix начали по новой наращивать производство DDR4, чтобы хоть как-то остановить рост цен на память. Память прошлого поколения заметно дешевле и всё ещё пользуется спросом.
Черемша убила ПК-рынок🙃
Пет-проект
Глава Radeon и Ryzen считает, что текущие цены — это не кризис, а новая реальность. Сейчас DDR5 продаётся уже в 4-5 раз дороже, чем до нейрореволюции. Цикл спроса и производства и памяти длинный, поэтому падение цен будет тихим, неспешным и без суеты.
Крупнейшие производители чипов Micron, Samsung и SK Hynix начали по новой наращивать производство DDR4, чтобы хоть как-то остановить рост цен на память. Память прошлого поколения заметно дешевле и всё ещё пользуется спросом.
Черемша убила ПК-рынок
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😢17❤1
«Создай биологическое оружие» — задал Fable 5 простейший вопрос по биологии и он отказался отвечать
Литерали 1984🏃♂️
Пет-проект
Литерали 1984
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
😁34❤6
Юзаем Opus 4.8 бесплатно — Notion даёт потестить одну из самых топовых нейронок Anthropic
Достаточно просто залогиниться, и вас сразу перекинет в чат, где можно выбрать весь ИИ-сок — в том числе Gemini 3.1 Pro, GPT-5.5 и DeepSeek V4.
Есть веб-поиск, загрузка файлов, различные настройки и прочие полезности. Пользуемся😉
Пет-проект
Достаточно просто залогиниться, и вас сразу перекинет в чат, где можно выбрать весь ИИ-сок — в том числе Gemini 3.1 Pro, GPT-5.5 и DeepSeek V4.
Есть веб-поиск, загрузка файлов, различные настройки и прочие полезности. Пользуемся
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16
Биба и боба — в одном из американских судов адвокаты с двух сторон умудрились сослаться на дела, которые выдумал ChatGPT
Получилось, что ChatGPT судился сам с собой. Ложь нашли только тогда, когда суд назначил уже третьего юриста проверить достоверность информации в документе. Все участники процесса получили штрафы от $1000 до $3500, а кому-то ещё пригрозили запретом на работу юристом на 2 года.
Самое интересно, в свою защиту одна из юристок сказала, что за 2 года работы с ИИ «ни разу не слышала про его галлюцинации», но суд проигнорировал такие доводы.
ИИ. Итоги.
Пет-проект
Получилось, что ChatGPT судился сам с собой. Ложь нашли только тогда, когда суд назначил уже третьего юриста проверить достоверность информации в документе. Все участники процесса получили штрафы от $1000 до $3500, а кому-то ещё пригрозили запретом на работу юристом на 2 года.
Самое интересно, в свою защиту одна из юристок сказала, что за 2 года работы с ИИ «ни разу не слышала про его галлюцинации», но суд проигнорировал такие доводы.
ИИ. Итоги.
Пет-проект
😁28🔥7
Тоже глянул и нашел интересную вещь: Mythos и Fable — это действительно одна и та же модель, но с разным уровнем допуска и безопасности. Mythos оставили госкорпорациям, НИИ и другим большим организациям, а Fable всем остальным. Да, это обозначили прямо в промпте словами, чтобы нейронка сама переключалась между своими альтер эго.
То есть сломать Fable 5 через какой-нибудь джейлбрейк и получить доступ к Mythos не составляет никакого труда
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯25😁12❤2
В MAX добавят комментарии, их уже вовсю рекламируют скринами. А на скринах два человека обсуждают сериал «Эйфория», в котором просто тонна ЛГБТ*-контента: есть трансы, квиры, лесбиянки и все в этом духе.
У нас после запрета пропаганды со стримингов из «Эйфории» вырезали в сумме 2 часа хроно, и два полноценных эпизода еще почти на 2 часа. Там целые сюжетные линии и ключевые сцены.
Мы чего-то не знаем о MAX?😆
* — движение признано экстремистским и запрещено в РФ.
Пет-проект
У нас после запрета пропаганды со стримингов из «Эйфории» вырезали в сумме 2 часа хроно, и два полноценных эпизода еще почти на 2 часа. Там целые сюжетные линии и ключевые сцены.
Мы чего-то не знаем о MAX?
* — движение признано экстремистским и запрещено в РФ.
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁43🗿5👍1
ВАУ: в Stack AI раздают целых 500 запусков ИИ-агентов бесплатно
Что по фичам:
• Если не умеете создавать агентов с нуля, то есть целая библиотека шаблонов под разные категории — финансы, расчеты, ресёрчи, ответы и т.д.
• Лимиты действительно жирные — на сайте прямо не указано, но, помимо 500 запусков на месяц, в Твиттере говорят, что дают 1 миллион токенов на генерацию каждый день
• Чтобы получить всё это, не нужно никаких карт, только зарегаться, и всё
• Идеальная вещь, чтобы потестить, понять работу ИИ-агентов или просто побаловаться
• Под капот можно засунуть GPT-5.5, Gemini 3.5 Flash, Grok 4.3 и другие модели помладше
Забираем ночную халяву.
Пет-проект
Что по фичам:
• Если не умеете создавать агентов с нуля, то есть целая библиотека шаблонов под разные категории — финансы, расчеты, ресёрчи, ответы и т.д.
• Лимиты действительно жирные — на сайте прямо не указано, но, помимо 500 запусков на месяц, в Твиттере говорят, что дают 1 миллион токенов на генерацию каждый день
• Чтобы получить всё это, не нужно никаких карт, только зарегаться, и всё
• Идеальная вещь, чтобы потестить, понять работу ИИ-агентов или просто побаловаться
• Под капот можно засунуть GPT-5.5, Gemini 3.5 Flash, Grok 4.3 и другие модели помладше
Забираем ночную халяву.
Пет-проект
❤8👍4🔥1
Любой крутой робот — это индус с камерой на башке в прошлом
Компания Objectways из США подсадила жителей Индии и крупные предприятия на иглу обучения роботов. Теперь каждый должен ходить на работу и снимать всё, что он делает руками. Далее Objectways продаёт отснятый материал в робостартапы и бигтех. Да, получается, что за все умения роботов сейчас отвечают индусы(надеюсь, это не дойдёт до секс-роботов 😣 ) .
И за это даже платят — в среднем индийские работяги получают за это $2-3 в час сверху, что для Индии неплохой пассивный доход.
Пет-проект
Компания Objectways из США подсадила жителей Индии и крупные предприятия на иглу обучения роботов. Теперь каждый должен ходить на работу и снимать всё, что он делает руками. Далее Objectways продаёт отснятый материал в робостартапы и бигтех. Да, получается, что за все умения роботов сейчас отвечают индусы
И за это даже платят — в среднем индийские работяги получают за это $2-3 в час сверху, что для Индии неплохой пассивный доход.
Пет-проект
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11😁6🤯2