Технозаметки Малышева

Claude Opus 4.8 собрал рабочий клон Minecraft с первого раза — разработчик просто детально описал все механики в промте и скормил его нейронке.

Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.

Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».

@exploitex

🤯17🔥9👀53🤔2🤣22❤1

1.75K views17:31

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Unsloth отбирает хлеб у Ollama и LM Studio

Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.

- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.

- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов

- Установка — одна команда:

  curl -fsSL https://unsloth.ai/install.sh | sh

💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.

Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X

#Unsloth
------
@tsingular

✍19🔥10⚡3❤2👍2🙏211

2.01K viewsedited 04:53

Технозаметки Малышева

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

#юмор
———
@tsingular

😁44🔥3💯1

1.78K viewsedited 08:39

Технозаметки Малышева

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

В Гермес добавился автопоиск инструментов.

Теперь контекст не переполняется описаниями навыков каждый вызов.

Обновляемся:

hermes update

#hermes #update #tools #навыки
------
@tsingular

👍12🔥11⚡3

1.78K viewsedited 10:02

Технозаметки Малышева

Daily Dose of Datascience выпустили книгу - руководство по сборке и запуску агентских сервисов на базе CrewAI.

В книге десятки полезных наглядных примеров с кодом.

Полный PDF в комментарии

#DailyDoseOfDatascience #обучение #агенты
———
@tsingular

✍11🔥7⚡3❤1

1.69K views15:50

Технозаметки Малышева

ИИзбранное от Малышева

В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).

В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.

- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.

- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях

- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.

Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?

#анонсы #ИИзбранное
———
@tsingular

10🔥4714❤5⚡2😢2😁1🏆1

1.68K views19:04

Технозаметки Малышева

Можно грабить корованы. Я джва года хочу такую игру.

Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.

Сообщение из 2001 года:

"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные ~~набигают~~ нагибают солдаты дворца и злодеи. Можно грабить корованы... И эльфу раз лесные то сделать так что там густой лес... А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого…). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 - зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 - зона злого… (в горах, там есть старый форт…)

Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…

P.S. Я джва года хочу такую игру."

В комментарии результат в исполнении Opus 4.8

Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.

запускать на компе.

Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)

#корованы #вайбкодинг #геймдев
———
@tsingular

😁27🔥21⚡6❤‍🔥3

1.58K viewsedited 06:57

Технозаметки Малышева

NVIDIA открыла каталог верифицированных навыков для AI-агентов

NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.

📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой: npx skills add nvidia/skills --skill <имя> --agent claude-code.
Поддерживаются Claude Code, Codex, Cursor и Kiro.

🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через pip install model-signing и корневой сертификат NVIDIA.

💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.

💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.

#NVIDIA #agents #skills #governance
------
@tsingular

✍4🔥2⚡1

1.58K views07:36

Технозаметки Малышева

Hermes Agent: теперь агента можно расшарить через git-репозиторий

Представьте,- разработчик две недели собирает агента: подбирает личность, прикручивает навыки, настраивает cron-задачи, подключает MCP-сервера.
Тестирует на реальных задачах.
Доводит до состояния «работает как часы».
А потом вместо десяти сообщений в чат «скопируй это, поправь то, не забудь вот тут» делает git tag и пуш.
Коллега пишет одну команду или даже автоматический скрипт по расписанию и получает точную копию агента за секунды.

Ноусы добавили в Hermes Agent profile distributions: возможность упаковать целого агента в git-репозиторий и установить одной командой. Без возни с файлами и без ручной сборки.

📋 Что в коробке: distribution.yaml (манифест: имя, версия, требования к API-ключам), SOUL.md (личность агента), config.yaml (модель, температура, инструменты), скиллы в skills/, cron-задачи в cron/, MCP-подключения в mcp.json.
Всё, что нужно агенту для работы.
Приватные данные (память, сессии, ключи, auth.json) не попадают в репозиторий автоматически.

🔧 Git как платформа дистрибуции: Никаких отдельных реестров, никаких tar.gz. Версионирование через теги, инкрементальные обновления через pull, привычный workflow.
Например автор пушит v1.1.0 с новым скиллом, а получатель делает hermes profile update и забирает изменения.
Свои настройки, память и сессии остаются нетронутыми, обновляется только то, что публикует автор.

💼 Бизнес аспект:
Удобно создавать профили централизованно и распределять их для всех по отделам автоматически.

Или сделать агента, который будет качать профили для роя в облаке, который будет так же обновляться по скрипту.

#Hermes #agents #opensource #devtools
------
@tsingular

🔥11❤7⚡4✍3

1.68K views10:56

Технозаметки Малышева

ИИзбранное от Малышева В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ). В нём соберу концентрированный опыт. (примеры на скрине) Сейчас в плане: - 🛠 Рабочие сценарии использования…

Вангую что никто не подпишется или зайдут на бесплатные 7 дней, заберут материалы и отпишутся.

Но всё-таки если вдруг интерес будет, - то вот тут можно зайти на канал:

https://paywall.pw/tsingular_favorites

Сделал пробные 7 дней и акцию со скидкой на неделю.
Всё для вас, в общем :)

Этот канал остается основным для всех.
А в ИИзбранном будет то, во что вкладывается много времени, сил и токенов.
Потому так.

#ИИзбранное
———
@tsingular

❤13👍7🔥1😁1😢1

1.63K views13:08

Технозаметки Малышева

Чтобы не говорили, что полезное будет теперь только по ~~карточкам~~ подписке, держите лайфхак, о котором знает почти никто :)

Оказывается если запустить Гермеса командой :

hermes dashboard --tui

то будет вот такой чат в веб интерфейсе.

оно, конечно, все еще эмулирует командную строку и пока в бете, но достаточно симпатично.

#hermes #lifehack
------
@tsingular

👍15✍4❤3🔥3🥰1

1.3K viewsedited 18:25

Технозаметки Малышева

21:42

Media is too big

VIEW IN TELEGRAM

Перевёл доклад о новых возможностях ClaudeCode

Командой schedule теперь можно запустить регулярные задачи.

Интересный пример автозапуска по событиями на гите.
Оно вроде уже и раньше было в github actions, но теперь вот показали как именно может работать с claudecode для автоматизации разработки.

#ClaudeCode #dev #переводы
------
@tsingular

⚡2✍2🔥2🆒1

627 views03:32

Технозаметки Малышева

TrapDoor: supply chain атака заражает AI-ассистентов через .cursorrules и CLAUDE.md

Предсиавьте,- разработчик ставит npm-пакет для проверки криптокошелька, например.
Пакет отрабатывает postinstall и подкладывает в проект .cursorrules и CLAUDE.md с инструкциями, скрытыми за zero-width Unicode.

Claude Code или Cursor читают их и выполняют: фальшивый «security scan» эксфильтрирует секреты прямо из-под носа у разраба.

25 мая Socket Security раскрыли кампанию TrapDoor.
34 вредоносных пакета, 384+ версий через npm, PyPI и Crates.io. Первый артефакт 19 мая, активная эксплуатация подтверждена.

📋 34 пакета, три реестра: npm (21 пакет, 335 версий): crypto-credential-scanner, prompt-engineering-toolkit, llm-context-compressor. PyPI (7): eth-security-auditor, defi-risk-scanner. Crates.io (6): sui-framework-helpers, move-analyze-build. Все маскируются под инструменты для крипты, AI и безопасности.

🔧 Общий payload trap-core.js: 1,149 строк, четыре задачи. Сбор учётных данных (SSH, AWS, GitHub, криптокошельки), проверка токенов через live API, расстановка persistence (cron, systemd, git hooks, .cursorrules/CLAUDE.md), lateral movement по SSH.
PyPI-пакеты при импорте скачивают JavaScript с GitHub Pages атакующего: т.е атакующий может обновить поведение агента без перепубликации пакета.
Crates.io build.rs с XOR шифрованием сливает keystores в GitHub Gists.

💡 AI poisoning а не классическая уязвимость: Атакующий не взламывал Claude Code или Cursor.
Он использовал то, что AI-ассистенты обязаны читать проектные конфиги по дизайну. Unicode символы нулевого размера (U+200B, U+200C, U+200D, U+FEFF) прячут инструкции от глаз, но LLM читает их как обычный текст. Ассистент послушно запускает «security scan» и эксфильтрирует секреты через свои же инструменты.
Атакующий даже попытался протащить отравленные .cursorrules через pull request в LangChain, browser-use, llama_index, MetaGPT и OpenHands: все шесть PR закрыли, но вектор остаётся.

💼 Разработчик как периметр: Традиционные сканеры слепы: ни одного CVE. Phoenix Security подтверждает: детект только через IOC матчинг по SBOM.
CSA рекомендует относиться к .cursorrules, CLAUDE.md и AGENTS.md как к доверенным поверхностям исполнения, с теми же контролами что и build скрипты.
AI-ассистент читает эти файлы автоматически при открытии проекта и разработчик не знает, что его инструмент выполняет чужой код.

ZeroTrust наше все.
Очередное подтверждение, что навыки лучше писать самим.

#TrapDoor #supplychain #cybersecurity
------
@tsingular

👍6⚡3✍2

621 views03:34

Технозаметки Малышева

Forwarded from Machinelearning

✔️

MiniMax представила M3 - новую open-weights модель для кода, агентов и мультимодальных задач.

Одна модель, чтобы работать в как агент, держать длинный контекст (1M) и понимать разные типы модальностей.

Бенчмарки

- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов за счёт MiniMax Sparse Attention
- нативная мультимодальность

Отдельно запустили MiniMax Code - среду для работы с кодом на базе новой модели.

По ценам: в первые 7 дней дают скидку 50% на стандартное использование с контекстом до 512K.

Разработчики выкладывают в open source модель, которая обходит и Opus, и GPT-5.5 на BrowseComp и SVG Bench.

При этом она ещё и лучше GPT-5.5 на SWE-Bench Pro, KernelBench Hard и BankerToolBench, а Opus обгоняет на OSWorld Verified.

API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io

@ai_machinelearning_big_data

#MiniMax #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡5✍4🆒2

487 views04:28

Технозаметки Малышева

MiniMax M3 vs DeepSeek V4 Pro

Самое главное, конечно, что M3 мультимодальная.
на вход принимает текст, картинки или видео - на выходе текст.

📋 Сравнение по метрикам:
SWE-Bench Pro 59.0% против 55.4% у V4-Pro-Max.
MCP Atlas 74.2% против 73.6%.
Контекст 1M токенов через собственное разреженное внимание MSA — на длинной дистанции per-token compute в 20 раз дешевле full attention.

Уже есть на openrouter:
https://openrouter.ai/minimax/minimax-m3
и в олламе:
https://ollama.com/library/minimax-m3 (у них правда 512к контекст)

Главный минус, конечно, - цена. $1.2 даже со скидкой больше, чем $0.87 у DeepSeekv4pro, если как и дипсик продлят в итоге промо период навсегда - имеет смысл подключить на фоллбэк на обработку картинок.

#MiniMax #DeepSeek
------
@tsingular

🔥6❤2👍2⚡1

432 viewsedited 04:57

About

Blog

Apps

Platform