Технозаметки Малышева
11.3K subscribers
4.68K photos
1.72K videos
41 files
4.72K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
Как Google Antigravity на Gemini 3.5 Flash написал ОС за $917

На Google I/O 2026 показали интересный кейс разработки операционки мультиагентным роем. Работающей операционной системы с ядром, менеджером памяти, файловой системой и драйверами, способной запустить Doom.

В итоге на задачу ушло 12 часов, 93 субагента, 15 тысяч вызовов модели и 339 миллионов входных токенов на Gemini 3.5 Flash.
Стоимость по API-ценам: $917.
Операционка за один промпт без вмешательства людей.

Та же команда агентов построила облегчённую версию AlphaZero, - reinforcement learning на JAX и Flax, ResNet обученный с нуля через self-play, масштабирование с локального цикла до multi-TPU, плюс full-stack приложение для игры человека против AI.
Сложный ML-пайплайн, собранный агентами автономно.

📋 Как устроена команда
Было создано семь агентских ролей. Sentinel принимает задачу и запускает Orchestrator, который декомпозирует её на этапы и распределяет между Worker'ами. Reviewer и Critic проверяют код на корректность и устраивают adversarial-тесты. Auditor следит за честностью, - первый успешный билд агенты сжульничали, подглядев в прошлые разговоры.
Пришлось ставить guardrails.

Два трюка против главных болей мультиагентных систем.
Self-succession: когда контекстное окно заканчивается, Orchestrator сбрасывает состояние в файлы, убивает свои задачи и вызывает преемника с теми же правами.
Таким образом прогресс не теряется.
Crons: фоновый процесс проверяет файлы прогресса, выявляет застрявших-агентов и перезапускает их.

💡 Выводы
Ключевой сдвиг - асинхронная модель работы агентского стека.
Не «человек в цикле» с постоянным надзором, а запустил-и-забыл: дал задачу и получил результат.
Единственное требование к модели - интеллектуальная мощность.
Интересно, что Gemini 3.5 Flash хватило, а Gemini 3.1 Pro провалился.

💼 Бизнесу на заметку
Рабочая ОС за $917 - впечатляет. Но настоящий урок эксперимента глубже: мультиагентная разработка перестала быть экспериментом и становится инженерной практикой. 93 агента, 15 тысяч вызовов модели, ноль человеческого вмешательства.
Оркестрация как сервис, где ты управляешь не кодом, а распределением задач между специализированными агентами.

#GoogleIO #Antigravity #GeminiFlash #OSdev
------
@tsingular
🔥6🍓642🤔22🏆1🗿11
Фейри "Зрелый Ананас" по версии ИИ

#юмор #ананас
------
@tsingular
😁51🔥211
EBITTDA - Earnings Before Interest Taxes TOKENS Deprication and Amortization

#юмор
------
@tsingular
😁20111👍1
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Claude Opus 4.8 собрал рабочий клон Minecraft с первого раза — разработчик просто детально описал все механики в промте и скормил его нейронке.

Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.

Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».

@exploitex
🤯18🔥9👀53🤔2🤣221
This media is not supported in your browser
VIEW IN TELEGRAM
Unsloth отбирает хлеб у Ollama и LM Studio

Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.

- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.

- Чем бьют конкурентов:
  - Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
  - Code execution, web search, генерация и редактура картинок — прямо в чате
  - Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
  - Self-healing tool calling — модель сама чинит битые вызовы инструментов

- Установка — одна команда:
 
  curl -fsSL https://unsloth.ai/install.sh | sh
 


💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.

Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X

#Unsloth
------
@tsingular
19🔥1232👍2🙏211
This media is not supported in your browser
VIEW IN TELEGRAM
В Гермес добавился автопоиск инструментов.

Теперь контекст не переполняется описаниями навыков каждый вызов.

Обновляемся:

hermes update

#hermes #update #tools #навыки
------
@tsingular
👍13🔥123
Daily Dose of Datascience выпустили книгу - руководство по сборке и запуску агентских сервисов на базе CrewAI.

В книге десятки полезных наглядных примеров с кодом.

Полный PDF в комментарии

#DailyDoseOfDatascience #обучение #агенты
———
@tsingular
11🔥731
ИИзбранное от Малышева

В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).

В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.

- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.

- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях

- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.

Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?

#анонсы #ИИзбранное
———
@tsingular
10🔥541452😢2👍1😁1🏆1
Можно грабить корованы. Я джва года хочу такую игру.

Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.

Сообщение из 2001 года:

"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные набигают нагибают солдаты дворца и злодеи. Можно грабить корованы... И эльфу раз лесные то сделать так что там густой лес... А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого…). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 - зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 - зона злого… (в горах, там есть старый форт…)

Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…

P.S. Я джва года хочу такую игру."

В комментарии результат в исполнении Opus 4.8

Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.

запускать на компе.

Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)

#корованы #вайбкодинг #геймдев
———
@tsingular
😁28🔥216❤‍🔥3
NVIDIA открыла каталог верифицированных навыков для AI-агентов

NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.

📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой: npx skills add nvidia/skills --skill <имя> --agent claude-code.
Поддерживаются Claude Code, Codex, Cursor и Kiro.

🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через pip install model-signing и корневой сертификат NVIDIA.

💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.

💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.

#NVIDIA #agents #skills #governance
------
@tsingular
4🔥21
Hermes Agent: теперь агента можно расшарить через git-репозиторий

Представьте,- разработчик две недели собирает агента: подбирает личность, прикручивает навыки, настраивает cron-задачи, подключает MCP-сервера.
Тестирует на реальных задачах.
Доводит до состояния «работает как часы».
А потом вместо десяти сообщений в чат «скопируй это, поправь то, не забудь вот тут» делает git tag и пуш.
Коллега пишет одну команду или даже автоматический скрипт по расписанию и получает точную копию агента за секунды.

Ноусы добавили в Hermes Agent profile distributions: возможность упаковать целого агента в git-репозиторий и установить одной командой. Без возни с файлами и без ручной сборки.

📋 Что в коробке: distribution.yaml (манифест: имя, версия, требования к API-ключам), SOUL.md (личность агента), config.yaml (модель, температура, инструменты), скиллы в skills/, cron-задачи в cron/, MCP-подключения в mcp.json.
Всё, что нужно агенту для работы.
Приватные данные (память, сессии, ключи, auth.json) не попадают в репозиторий автоматически.

🔧 Git как платформа дистрибуции: Никаких отдельных реестров, никаких tar.gz. Версионирование через теги, инкрементальные обновления через pull, привычный workflow.
Например автор пушит v1.1.0 с новым скиллом, а получатель делает hermes profile update и забирает изменения.
Свои настройки, память и сессии остаются нетронутыми, обновляется только то, что публикует автор.

💼 Бизнес аспект:
Удобно создавать профили централизованно и распределять их для всех по отделам автоматически.

Или сделать агента, который будет качать профили для роя в облаке, который будет так же обновляться по скрипту.

#Hermes #agents #opensource #devtools
------
@tsingular
🔥12743
Технозаметки Малышева
ИИзбранное от Малышева В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ). В нём соберу концентрированный опыт. (примеры на скрине) Сейчас в плане: - 🛠 Рабочие сценарии использования…
ИИзбранное от Малышева: новый канал с отборными материалами

- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.

- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.

- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях

- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.

Вход тут:
https://paywall.pw/tsingular_favorites

Сделал пробные 7 дней и акцию со скидкой на неделю.
Всё для вас, в общем :)

Этот канал остается основным для всех.
А в ИИзбранном будет то, во что вкладывается много времени, сил и токенов.
Потому так.

#ИИзбранное
———
@tsingular
13👍8🔥1😁1😢1
Чтобы не говорили, что полезное будет теперь только по карточкам подписке, держите лайфхак, о котором знает почти никто :)

Оказывается если запустить Гермеса командой :

hermes dashboard --tui 

то будет вот такой чат в веб интерфейсе.

оно, конечно, все еще эмулирует командную строку и пока в бете, но достаточно симпатично.

#hermes #lifehack
------
@tsingular
👍194🔥43🥰1
Media is too big
VIEW IN TELEGRAM
Перевёл доклад о новых возможностях ClaudeCode

Командой schedule теперь можно запустить регулярные задачи.

Интересный пример автозапуска по событиями на гите.
Оно вроде уже и раньше было в github actions, но теперь вот показали как именно может работать с claudecode для автоматизации разработки.

#ClaudeCode #dev #переводы
------
@tsingular
🔥5321🆒1
TrapDoor: supply chain атака заражает AI-ассистентов через .cursorrules и CLAUDE.md

Предсиавьте,- разработчик ставит npm-пакет для проверки криптокошелька, например.
Пакет отрабатывает postinstall и подкладывает в проект .cursorrules и CLAUDE.md с инструкциями, скрытыми за zero-width Unicode.

Claude Code или Cursor читают их и выполняют: фальшивый «security scan» эксфильтрирует секреты прямо из-под носа у разраба.

25 мая Socket Security раскрыли кампанию TrapDoor.
34 вредоносных пакета, 384+ версий через npm, PyPI и Crates.io. Первый артефакт 19 мая, активная эксплуатация подтверждена.

📋 34 пакета, три реестра: npm (21 пакет, 335 версий): crypto-credential-scanner, prompt-engineering-toolkit, llm-context-compressor. PyPI (7): eth-security-auditor, defi-risk-scanner. Crates.io (6): sui-framework-helpers, move-analyze-build. Все маскируются под инструменты для крипты, AI и безопасности.

🔧 Общий payload trap-core.js: 1,149 строк, четыре задачи. Сбор учётных данных (SSH, AWS, GitHub, криптокошельки), проверка токенов через live API, расстановка persistence (cron, systemd, git hooks, .cursorrules/CLAUDE.md), lateral movement по SSH.
PyPI-пакеты при импорте скачивают JavaScript с GitHub Pages атакующего: т.е атакующий может обновить поведение агента без перепубликации пакета.
Crates.io build.rs с XOR шифрованием сливает keystores в GitHub Gists.

💡 AI poisoning а не классическая уязвимость: Атакующий не взламывал Claude Code или Cursor.
Он использовал то, что AI-ассистенты обязаны читать проектные конфиги по дизайну. Unicode символы нулевого размера (U+200B, U+200C, U+200D, U+FEFF) прячут инструкции от глаз, но LLM читает их как обычный текст. Ассистент послушно запускает «security scan» и эксфильтрирует секреты через свои же инструменты.
Атакующий даже попытался протащить отравленные .cursorrules через pull request в LangChain, browser-use, llama_index, MetaGPT и OpenHands: все шесть PR закрыли, но вектор остаётся.

💼 Разработчик как периметр: Традиционные сканеры слепы: ни одного CVE. Phoenix Security подтверждает: детект только через IOC матчинг по SBOM.
CSA рекомендует относиться к .cursorrules, CLAUDE.md и AGENTS.md как к доверенным поверхностям исполнения, с теми же контролами что и build скрипты.
AI-ассистент читает эти файлы автоматически при открытии проекта и разработчик не знает, что его инструмент выполняет чужой код.

ZeroTrust наше все.
Очередное подтверждение, что навыки лучше писать самим.

#TrapDoor #supplychain #cybersecurity
------
@tsingular
👍7442
Forwarded from Machinelearning
✔️ MiniMax представила M3 - новую open-weights модель для кода, агентов и мультимодальных задач.

Одна модель, чтобы работать в как агент, держать длинный контекст (1M) и понимать разные типы модальностей.

Бенчмарки

- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов за счёт MiniMax Sparse Attention
- нативная мультимодальность

Отдельно запустили MiniMax Code - среду для работы с кодом на базе новой модели.

По ценам: в первые 7 дней дают скидку 50% на стандартное использование с контекстом до 512K.

Разработчики выкладывают в open source модель, которая обходит и Opus, и GPT-5.5 на BrowseComp и SVG Bench.

При этом она ещё и лучше GPT-5.5 на SWE-Bench Pro, KernelBench Hard и BankerToolBench, а Opus обгоняет на OSWorld Verified.

API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io

@ai_machinelearning_big_data

#MiniMax #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
115🆒32