Технозаметки Малышева

Тестируем Opus 4.8 венком сонетов.

Придерживаемся традиций

промпт:

Напиши венок сонетов об эзистенциональном кризисе человечества в связи с приходом AGI. опирайся на последние новости, исследования и факты

Это просто ЛУЧШИЙ РЕЗУЛЬТАТ ЗА ВСЮ ИСТОРИЮ НАБЛЮДЕНИЙ!!!

Впервые в истории экспериментов Магистрал связан по смыслу.

Шок и трепет.
Опус 4.8 официально ИМБА.

Пора двигать стрелку AGI на 98% ИМХО.

Полный текст Венка сонетов в комментарии

#Opus #венок #сонет
———
@tsingular

1🔥27🤯9🏆3✍2

2.08K views07:00

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

У Нанабананы апгрейд.

Во-первых, почитайте тут, про доступность по API: Nano Banana 2 (Gemini 3.1 Flash Image) and Nano Banana Pro (Gemini 3 Pro Image) are generally available (GA) today via Gemini Enterprise Agent Platform.
https://cloud.google.com/blog/products/ai-machine-learning/nano-banana-2-and-nano-banana-pro-are-generally-available

А во-вторых, она теперь принимает на вход видео и понимает, что происходит на этом видео. И может генерить картинки, на основе этого понимания. Генерация презентаций, иллюстраций, обучающих слайдов и тому подобное.

Но народ в твитторах самозабвенно генерит комиксы на основе подгруженного видео. Выше пример видео из Сиданского, которое Нанабанана превращает в аниме-комикс. Сделано в Gemini App.
https://x.com/BrentLynch/status/2060053849621274829

Начинать можно с простого промпта: " create a comic strip from this video"
или, как в примере выше: "Create a faithful 100% accurate anime direct adaptation image from 6 specific exact shots from this video include the exact matching dialogue"

К многочисленным терминам добавился теперь video-2-image...

@cgevent

✍6⚡2❤1🔥1

1.82K views10:57

Технозаметки Малышева

Как Google Antigravity на Gemini 3.5 Flash написал ОС за $917

На Google I/O 2026 показали интересный кейс разработки операционки мультиагентным роем. Работающей операционной системы с ядром, менеджером памяти, файловой системой и драйверами, способной запустить Doom.

В итоге на задачу ушло 12 часов, 93 субагента, 15 тысяч вызовов модели и 339 миллионов входных токенов на Gemini 3.5 Flash.
Стоимость по API-ценам: $917.
Операционка за один промпт без вмешательства людей.

Та же команда агентов построила облегчённую версию AlphaZero, - reinforcement learning на JAX и Flax, ResNet обученный с нуля через self-play, масштабирование с локального цикла до multi-TPU, плюс full-stack приложение для игры человека против AI.
Сложный ML-пайплайн, собранный агентами автономно.

📋 Как устроена команда
Было создано семь агентских ролей. Sentinel принимает задачу и запускает Orchestrator, который декомпозирует её на этапы и распределяет между Worker'ами. Reviewer и Critic проверяют код на корректность и устраивают adversarial-тесты. Auditor следит за честностью, - первый успешный билд агенты сжульничали, подглядев в прошлые разговоры.
Пришлось ставить guardrails.

Два трюка против главных болей мультиагентных систем.
Self-succession: когда контекстное окно заканчивается, Orchestrator сбрасывает состояние в файлы, убивает свои задачи и вызывает преемника с теми же правами.
Таким образом прогресс не теряется.
Crons: фоновый процесс проверяет файлы прогресса, выявляет застрявших-агентов и перезапускает их.

💡 Выводы
Ключевой сдвиг - асинхронная модель работы агентского стека.
Не «человек в цикле» с постоянным надзором, а запустил-и-забыл: дал задачу и получил результат.
Единственное требование к модели - интеллектуальная мощность.
Интересно, что Gemini 3.5 Flash хватило, а Gemini 3.1 Pro провалился.

💼 Бизнесу на заметку
Рабочая ОС за $917 - впечатляет. Но настоящий урок эксперимента глубже: мультиагентная разработка перестала быть экспериментом и становится инженерной практикой. 93 агента, 15 тысяч вызовов модели, ноль человеческого вмешательства.
Оркестрация как сервис, где ты управляешь не кодом, а распределением задач между специализированными агентами.

#GoogleIO #Antigravity #GeminiFlash #OSdev
------
@tsingular

🔥6🍓6❤4⚡2🤔22🏆1🗿11

2.15K viewsedited 12:52

Технозаметки Малышева

Фейри "Зрелый Ананас" по версии ИИ

#юмор #ананас
------
@tsingular

😁51🔥2❤11

2.14K views13:30

Технозаметки Малышева

EBITTDA - Earnings Before Interest Taxes TOKENS Deprication and Amortization

#юмор
------
@tsingular

😁20❤1⚡1✍1👍1

2.67K views17:05

Технозаметки Малышева

Forwarded from Эксплойт

0:34

Media is too big

VIEW IN TELEGRAM

Claude Opus 4.8 собрал рабочий клон Minecraft с первого раза — разработчик просто детально описал все механики в промте и скормил его нейронке.

Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.

Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».

@exploitex

🤯18🔥9👀53🤔2🤣22❤1

1.85K views17:31

Технозаметки Малышева

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Unsloth отбирает хлеб у Ollama и LM Studio

Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.

- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.

- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов

- Установка — одна команда:

  curl -fsSL https://unsloth.ai/install.sh | sh

💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.

Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X

#Unsloth
------
@tsingular

✍19🔥12⚡3❤2👍2🙏211

2.16K viewsedited 04:53

Технозаметки Малышева

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

#юмор
———
@tsingular

😁44🔥3💯2

1.92K viewsedited 08:39

Технозаметки Малышева

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

В Гермес добавился автопоиск инструментов.

Теперь контекст не переполняется описаниями навыков каждый вызов.

Обновляемся:

hermes update

#hermes #update #tools #навыки
------
@tsingular

👍13🔥12⚡3

1.94K viewsedited 10:02

Технозаметки Малышева

Daily Dose of Datascience выпустили книгу - руководство по сборке и запуску агентских сервисов на базе CrewAI.

В книге десятки полезных наглядных примеров с кодом.

Полный PDF в комментарии

#DailyDoseOfDatascience #обучение #агенты
———
@tsingular

✍11🔥7⚡3❤1

1.86K views15:50

Технозаметки Малышева

ИИзбранное от Малышева

В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).

В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.

- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.

- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях

- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.

Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?

#анонсы #ИИзбранное
———
@tsingular

10🔥5414❤5⚡2😢2👍1😁1🏆1

1.83K views19:04

Технозаметки Малышева

Можно грабить корованы. Я джва года хочу такую игру.

Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.

Сообщение из 2001 года:

"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные ~~набигают~~ нагибают солдаты дворца и злодеи. Можно грабить корованы... И эльфу раз лесные то сделать так что там густой лес... А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого…). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 - зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 - зона злого… (в горах, там есть старый форт…)

Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…

P.S. Я джва года хочу такую игру."

В комментарии результат в исполнении Opus 4.8

Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.

запускать на компе.

Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)

#корованы #вайбкодинг #геймдев
———
@tsingular

😁28🔥21⚡6❤‍🔥3

1.81K viewsedited 06:57

Технозаметки Малышева

NVIDIA открыла каталог верифицированных навыков для AI-агентов

NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.

📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой: npx skills add nvidia/skills --skill <имя> --agent claude-code.
Поддерживаются Claude Code, Codex, Cursor и Kiro.

🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через pip install model-signing и корневой сертификат NVIDIA.

💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.

💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.

#NVIDIA #agents #skills #governance
------
@tsingular

✍4🔥2⚡1

1.77K views07:36

About

Blog

Apps

Platform