Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Claude Opus 4.8 собрал рабочий клон Minecraft с первого раза — разработчик просто детально описал все механики в промте и скормил его нейронке.
Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.
Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».
@exploitex
Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.
Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».
@exploitex
🤯17🔥9👀5 3🤔2🤣2 2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Unsloth отбирает хлеб у Ollama и LM Studio
Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.
- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.
- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов
- Установка — одна команда:
💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.
Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X
#Unsloth
------
@tsingular
Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.
- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.
- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов
- Установка — одна команда:
curl -fsSL https://unsloth.ai/install.sh | sh
💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.
Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X
#Unsloth
------
@tsingular
✍19🔥10⚡3❤2👍2🙏2 1 1
This media is not supported in your browser
VIEW IN TELEGRAM
В Гермес добавился автопоиск инструментов.
Теперь контекст не переполняется описаниями навыков каждый вызов.
Обновляемся:
hermes update
#hermes #update #tools #навыки
------
@tsingular
Теперь контекст не переполняется описаниями навыков каждый вызов.
Обновляемся:
hermes update
#hermes #update #tools #навыки
------
@tsingular
👍12🔥11⚡3
Daily Dose of Datascience выпустили книгу - руководство по сборке и запуску агентских сервисов на базе CrewAI.
В книге десятки полезных наглядных примеров с кодом.
Полный PDF в комментарии
#DailyDoseOfDatascience #обучение #агенты
———
@tsingular
В книге десятки полезных наглядных примеров с кодом.
Полный PDF в комментарии
#DailyDoseOfDatascience #обучение #агенты
———
@tsingular
✍11🔥7⚡3❤1
ИИзбранное от Малышева
В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).
В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.
- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.
- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях
- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.
Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?
#анонсы #ИИзбранное
———
@tsingular
В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).
В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.
- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.
- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях
- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.
Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?
#анонсы #ИИзбранное
———
@tsingular
10🔥47 14❤5⚡2😢2😁1🏆1
Можно грабить корованы. Я джва года хочу такую игру.
Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.
Сообщение из 2001 года:
"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяныенабигают нагибают солдаты дворца и злодеи. Можно грабить корованы... И эльфу раз лесные то сделать так что там густой лес... А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого…). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 - зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 - зона злого… (в горах, там есть старый форт…)
Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…
P.S. Я джва года хочу такую игру."
В комментарии результат в исполнении Opus 4.8
Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.
запускать на компе.
Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)
#корованы #вайбкодинг #геймдев
———
@tsingular
Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.
Сообщение из 2001 года:
"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные
Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…
P.S. Я джва года хочу такую игру."
В комментарии результат в исполнении Opus 4.8
Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.
запускать на компе.
Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)
#корованы #вайбкодинг #геймдев
———
@tsingular
😁27🔥21⚡6❤🔥3
NVIDIA открыла каталог верифицированных навыков для AI-агентов
NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.
📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой:
Поддерживаются Claude Code, Codex, Cursor и Kiro.
🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через
💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.
💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.
#NVIDIA #agents #skills #governance
------
@tsingular
NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.
📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой:
npx skills add nvidia/skills --skill <имя> --agent claude-code. Поддерживаются Claude Code, Codex, Cursor и Kiro.
🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через
pip install model-signing и корневой сертификат NVIDIA.💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.
💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.
#NVIDIA #agents #skills #governance
------
@tsingular
✍4🔥2⚡1
Hermes Agent: теперь агента можно расшарить через git-репозиторий
Представьте,- разработчик две недели собирает агента: подбирает личность, прикручивает навыки, настраивает cron-задачи, подключает MCP-сервера.
Тестирует на реальных задачах.
Доводит до состояния «работает как часы».
А потом вместо десяти сообщений в чат «скопируй это, поправь то, не забудь вот тут» делает git tag и пуш.
Коллега пишет одну команду или даже автоматический скрипт по расписанию и получает точную копию агента за секунды.
Ноусы добавили в Hermes Agent profile distributions: возможность упаковать целого агента в git-репозиторий и установить одной командой. Без возни с файлами и без ручной сборки.
📋 Что в коробке: distribution.yaml (манифест: имя, версия, требования к API-ключам), SOUL.md (личность агента), config.yaml (модель, температура, инструменты), скиллы в skills/, cron-задачи в cron/, MCP-подключения в mcp.json.
Всё, что нужно агенту для работы.
Приватные данные (память, сессии, ключи, auth.json) не попадают в репозиторий автоматически.
🔧 Git как платформа дистрибуции: Никаких отдельных реестров, никаких tar.gz. Версионирование через теги, инкрементальные обновления через pull, привычный workflow.
Например автор пушит v1.1.0 с новым скиллом, а получатель делает
Свои настройки, память и сессии остаются нетронутыми, обновляется только то, что публикует автор.
💼 Бизнес аспект:
Удобно создавать профили централизованно и распределять их для всех по отделам автоматически.
Или сделать агента, который будет качать профили для роя в облаке, который будет так же обновляться по скрипту.
#Hermes #agents #opensource #devtools
------
@tsingular
Представьте,- разработчик две недели собирает агента: подбирает личность, прикручивает навыки, настраивает cron-задачи, подключает MCP-сервера.
Тестирует на реальных задачах.
Доводит до состояния «работает как часы».
А потом вместо десяти сообщений в чат «скопируй это, поправь то, не забудь вот тут» делает git tag и пуш.
Коллега пишет одну команду или даже автоматический скрипт по расписанию и получает точную копию агента за секунды.
Ноусы добавили в Hermes Agent profile distributions: возможность упаковать целого агента в git-репозиторий и установить одной командой. Без возни с файлами и без ручной сборки.
📋 Что в коробке: distribution.yaml (манифест: имя, версия, требования к API-ключам), SOUL.md (личность агента), config.yaml (модель, температура, инструменты), скиллы в skills/, cron-задачи в cron/, MCP-подключения в mcp.json.
Всё, что нужно агенту для работы.
Приватные данные (память, сессии, ключи, auth.json) не попадают в репозиторий автоматически.
🔧 Git как платформа дистрибуции: Никаких отдельных реестров, никаких tar.gz. Версионирование через теги, инкрементальные обновления через pull, привычный workflow.
Например автор пушит v1.1.0 с новым скиллом, а получатель делает
hermes profile update и забирает изменения. Свои настройки, память и сессии остаются нетронутыми, обновляется только то, что публикует автор.
💼 Бизнес аспект:
Удобно создавать профили централизованно и распределять их для всех по отделам автоматически.
Или сделать агента, который будет качать профили для роя в облаке, который будет так же обновляться по скрипту.
#Hermes #agents #opensource #devtools
------
@tsingular
🔥11❤7⚡4✍3
Технозаметки Малышева
ИИзбранное от Малышева В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ). В нём соберу концентрированный опыт. (примеры на скрине) Сейчас в плане: - 🛠 Рабочие сценарии использования…
Вангую что никто не подпишется или зайдут на бесплатные 7 дней, заберут материалы и отпишутся.
Но всё-таки если вдруг интерес будет, - то вот тут можно зайти на канал:
https://paywall.pw/tsingular_favorites
Сделал пробные 7 дней и акцию со скидкой на неделю.
Всё для вас, в общем :)
Этот канал остается основным для всех.
А в ИИзбранном будет то, во что вкладывается много времени, сил и токенов.
Потому так.
#ИИзбранное
———
@tsingular
Но всё-таки если вдруг интерес будет, - то вот тут можно зайти на канал:
https://paywall.pw/tsingular_favorites
Сделал пробные 7 дней и акцию со скидкой на неделю.
Всё для вас, в общем :)
Этот канал остается основным для всех.
А в ИИзбранном будет то, во что вкладывается много времени, сил и токенов.
Потому так.
#ИИзбранное
———
@tsingular
❤13👍7🔥1😁1😢1
Чтобы не говорили, что полезное будет теперь только по карточкам подписке, держите лайфхак, о котором знает почти никто :)
Оказывается если запустить Гермеса командой :
то будет вот такой чат в веб интерфейсе.
оно, конечно, все еще эмулирует командную строку и пока в бете, но достаточно симпатично.
#hermes #lifehack
------
@tsingular
Оказывается если запустить Гермеса командой :
hermes dashboard --tui
то будет вот такой чат в веб интерфейсе.
оно, конечно, все еще эмулирует командную строку и пока в бете, но достаточно симпатично.
#hermes #lifehack
------
@tsingular
👍15✍4❤3🔥3🥰1
Media is too big
VIEW IN TELEGRAM
Перевёл доклад о новых возможностях ClaudeCode
Командой schedule теперь можно запустить регулярные задачи.
Интересный пример автозапуска по событиями на гите.
Оно вроде уже и раньше было в github actions, но теперь вот показали как именно может работать с claudecode для автоматизации разработки.
#ClaudeCode #dev #переводы
------
@tsingular
Командой schedule теперь можно запустить регулярные задачи.
Интересный пример автозапуска по событиями на гите.
Оно вроде уже и раньше было в github actions, но теперь вот показали как именно может работать с claudecode для автоматизации разработки.
#ClaudeCode #dev #переводы
------
@tsingular
⚡2✍2🔥2🆒1
TrapDoor: supply chain атака заражает AI-ассистентов через .cursorrules и CLAUDE.md
Предсиавьте,- разработчик ставит npm-пакет для проверки криптокошелька, например.
Пакет отрабатывает postinstall и подкладывает в проект .cursorrules и CLAUDE.md с инструкциями, скрытыми за zero-width Unicode.
Claude Code или Cursor читают их и выполняют: фальшивый «security scan» эксфильтрирует секреты прямо из-под носа у разраба.
25 мая Socket Security раскрыли кампанию TrapDoor.
34 вредоносных пакета, 384+ версий через npm, PyPI и Crates.io. Первый артефакт 19 мая, активная эксплуатация подтверждена.
📋 34 пакета, три реестра: npm (21 пакет, 335 версий): crypto-credential-scanner, prompt-engineering-toolkit, llm-context-compressor. PyPI (7): eth-security-auditor, defi-risk-scanner. Crates.io (6): sui-framework-helpers, move-analyze-build. Все маскируются под инструменты для крипты, AI и безопасности.
🔧 Общий payload trap-core.js: 1,149 строк, четыре задачи. Сбор учётных данных (SSH, AWS, GitHub, криптокошельки), проверка токенов через live API, расстановка persistence (cron, systemd, git hooks, .cursorrules/CLAUDE.md), lateral movement по SSH.
PyPI-пакеты при импорте скачивают JavaScript с GitHub Pages атакующего: т.е атакующий может обновить поведение агента без перепубликации пакета.
Crates.io build.rs с XOR шифрованием сливает keystores в GitHub Gists.
💡 AI poisoning а не классическая уязвимость: Атакующий не взламывал Claude Code или Cursor.
Он использовал то, что AI-ассистенты обязаны читать проектные конфиги по дизайну. Unicode символы нулевого размера (U+200B, U+200C, U+200D, U+FEFF) прячут инструкции от глаз, но LLM читает их как обычный текст. Ассистент послушно запускает «security scan» и эксфильтрирует секреты через свои же инструменты.
Атакующий даже попытался протащить отравленные .cursorrules через pull request в LangChain, browser-use, llama_index, MetaGPT и OpenHands: все шесть PR закрыли, но вектор остаётся.
💼 Разработчик как периметр: Традиционные сканеры слепы: ни одного CVE. Phoenix Security подтверждает: детект только через IOC матчинг по SBOM.
CSA рекомендует относиться к .cursorrules, CLAUDE.md и AGENTS.md как к доверенным поверхностям исполнения, с теми же контролами что и build скрипты.
AI-ассистент читает эти файлы автоматически при открытии проекта и разработчик не знает, что его инструмент выполняет чужой код.
ZeroTrust наше все.
Очередное подтверждение, что навыки лучше писать самим.
#TrapDoor #supplychain #cybersecurity
------
@tsingular
Предсиавьте,- разработчик ставит npm-пакет для проверки криптокошелька, например.
Пакет отрабатывает postinstall и подкладывает в проект .cursorrules и CLAUDE.md с инструкциями, скрытыми за zero-width Unicode.
Claude Code или Cursor читают их и выполняют: фальшивый «security scan» эксфильтрирует секреты прямо из-под носа у разраба.
25 мая Socket Security раскрыли кампанию TrapDoor.
34 вредоносных пакета, 384+ версий через npm, PyPI и Crates.io. Первый артефакт 19 мая, активная эксплуатация подтверждена.
📋 34 пакета, три реестра: npm (21 пакет, 335 версий): crypto-credential-scanner, prompt-engineering-toolkit, llm-context-compressor. PyPI (7): eth-security-auditor, defi-risk-scanner. Crates.io (6): sui-framework-helpers, move-analyze-build. Все маскируются под инструменты для крипты, AI и безопасности.
🔧 Общий payload trap-core.js: 1,149 строк, четыре задачи. Сбор учётных данных (SSH, AWS, GitHub, криптокошельки), проверка токенов через live API, расстановка persistence (cron, systemd, git hooks, .cursorrules/CLAUDE.md), lateral movement по SSH.
PyPI-пакеты при импорте скачивают JavaScript с GitHub Pages атакующего: т.е атакующий может обновить поведение агента без перепубликации пакета.
Crates.io build.rs с XOR шифрованием сливает keystores в GitHub Gists.
💡 AI poisoning а не классическая уязвимость: Атакующий не взламывал Claude Code или Cursor.
Он использовал то, что AI-ассистенты обязаны читать проектные конфиги по дизайну. Unicode символы нулевого размера (U+200B, U+200C, U+200D, U+FEFF) прячут инструкции от глаз, но LLM читает их как обычный текст. Ассистент послушно запускает «security scan» и эксфильтрирует секреты через свои же инструменты.
Атакующий даже попытался протащить отравленные .cursorrules через pull request в LangChain, browser-use, llama_index, MetaGPT и OpenHands: все шесть PR закрыли, но вектор остаётся.
💼 Разработчик как периметр: Традиционные сканеры слепы: ни одного CVE. Phoenix Security подтверждает: детект только через IOC матчинг по SBOM.
CSA рекомендует относиться к .cursorrules, CLAUDE.md и AGENTS.md как к доверенным поверхностям исполнения, с теми же контролами что и build скрипты.
AI-ассистент читает эти файлы автоматически при открытии проекта и разработчик не знает, что его инструмент выполняет чужой код.
ZeroTrust наше все.
Очередное подтверждение, что навыки лучше писать самим.
#TrapDoor #supplychain #cybersecurity
------
@tsingular
👍6⚡3✍2
Forwarded from Machinelearning
Одна модель, чтобы работать в как агент, держать длинный контекст (1M) и понимать разные типы модальностей.
Бенчмарки
- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов за счёт MiniMax Sparse Attention
- нативная мультимодальность
Отдельно запустили MiniMax Code - среду для работы с кодом на базе новой модели.
По ценам: в первые 7 дней дают скидку 50% на стандартное использование с контекстом до 512K.
Разработчики выкладывают в open source модель, которая обходит и Opus, и GPT-5.5 на BrowseComp и SVG Bench.
При этом она ещё и лучше GPT-5.5 на SWE-Bench Pro, KernelBench Hard и BankerToolBench, а Opus обгоняет на OSWorld Verified.
API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io
@ai_machinelearning_big_data
#MiniMax #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡5✍4🆒2
MiniMax M3 vs DeepSeek V4 Pro
Самое главное, конечно, что M3 мультимодальная.
на вход принимает текст, картинки или видео - на выходе текст.
📋 Сравнение по метрикам:
SWE-Bench Pro 59.0% против 55.4% у V4-Pro-Max.
MCP Atlas 74.2% против 73.6%.
Контекст 1M токенов через собственное разреженное внимание MSA — на длинной дистанции per-token compute в 20 раз дешевле full attention.
Уже есть на openrouter:
https://openrouter.ai/minimax/minimax-m3
и в олламе:
https://ollama.com/library/minimax-m3 (у них правда 512к контекст)
Главный минус, конечно, - цена. $1.2 даже со скидкой больше, чем $0.87 у DeepSeekv4pro, если как и дипсик продлят в итоге промо период навсегда - имеет смысл подключить на фоллбэк на обработку картинок.
#MiniMax #DeepSeek
------
@tsingular
Самое главное, конечно, что M3 мультимодальная.
на вход принимает текст, картинки или видео - на выходе текст.
📋 Сравнение по метрикам:
SWE-Bench Pro 59.0% против 55.4% у V4-Pro-Max.
MCP Atlas 74.2% против 73.6%.
Контекст 1M токенов через собственное разреженное внимание MSA — на длинной дистанции per-token compute в 20 раз дешевле full attention.
Уже есть на openrouter:
https://openrouter.ai/minimax/minimax-m3
и в олламе:
https://ollama.com/library/minimax-m3 (у них правда 512к контекст)
Главный минус, конечно, - цена. $1.2 даже со скидкой больше, чем $0.87 у DeepSeekv4pro, если как и дипсик продлят в итоге промо период навсегда - имеет смысл подключить на фоллбэк на обработку картинок.
#MiniMax #DeepSeek
------
@tsingular
🔥6❤2👍2⚡1