Тестируем Opus 4.8 венком сонетов.
Придерживаемся традиций
промпт:
Это просто ЛУЧШИЙ РЕЗУЛЬТАТ ЗА ВСЮ ИСТОРИЮ НАБЛЮДЕНИЙ!!!
Впервые в истории экспериментов Магистрал связан по смыслу.
Шок и трепет.
Опус 4.8 официально ИМБА.
Пора двигать стрелку AGI на 98% ИМХО.
Полный текст Венка сонетов в комментарии
#Opus #венок #сонет
———
@tsingular
Придерживаемся традиций
промпт:
Напиши венок сонетов об эзистенциональном кризисе человечества в связи с приходом AGI. опирайся на последние новости, исследования и факты
Это просто ЛУЧШИЙ РЕЗУЛЬТАТ ЗА ВСЮ ИСТОРИЮ НАБЛЮДЕНИЙ!!!
Впервые в истории экспериментов Магистрал связан по смыслу.
Шок и трепет.
Опус 4.8 официально ИМБА.
Пора двигать стрелку AGI на 98% ИМХО.
Полный текст Венка сонетов в комментарии
#Opus #венок #сонет
———
@tsingular
1🔥27🤯9🏆3✍2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
У Нанабананы апгрейд.
Во-первых, почитайте тут, про доступность по API: Nano Banana 2 (Gemini 3.1 Flash Image) and Nano Banana Pro (Gemini 3 Pro Image) are generally available (GA) today via Gemini Enterprise Agent Platform.
https://cloud.google.com/blog/products/ai-machine-learning/nano-banana-2-and-nano-banana-pro-are-generally-available
А во-вторых, она теперь принимает на вход видео и понимает, что происходит на этом видео. И может генерить картинки, на основе этого понимания. Генерация презентаций, иллюстраций, обучающих слайдов и тому подобное.
Но народ в твитторах самозабвенно генерит комиксы на основе подгруженного видео. Выше пример видео из Сиданского, которое Нанабанана превращает в аниме-комикс. Сделано в Gemini App.
https://x.com/BrentLynch/status/2060053849621274829
Начинать можно с простого промпта: " create a comic strip from this video"
или, как в примере выше: "Create a faithful 100% accurate anime direct adaptation image from 6 specific exact shots from this video include the exact matching dialogue"
К многочисленным терминам добавился теперь video-2-image...
@cgevent
Во-первых, почитайте тут, про доступность по API: Nano Banana 2 (Gemini 3.1 Flash Image) and Nano Banana Pro (Gemini 3 Pro Image) are generally available (GA) today via Gemini Enterprise Agent Platform.
https://cloud.google.com/blog/products/ai-machine-learning/nano-banana-2-and-nano-banana-pro-are-generally-available
А во-вторых, она теперь принимает на вход видео и понимает, что происходит на этом видео. И может генерить картинки, на основе этого понимания. Генерация презентаций, иллюстраций, обучающих слайдов и тому подобное.
Но народ в твитторах самозабвенно генерит комиксы на основе подгруженного видео. Выше пример видео из Сиданского, которое Нанабанана превращает в аниме-комикс. Сделано в Gemini App.
https://x.com/BrentLynch/status/2060053849621274829
Начинать можно с простого промпта: " create a comic strip from this video"
или, как в примере выше: "Create a faithful 100% accurate anime direct adaptation image from 6 specific exact shots from this video include the exact matching dialogue"
К многочисленным терминам добавился теперь video-2-image...
@cgevent
✍6⚡2❤1🔥1
Как Google Antigravity на Gemini 3.5 Flash написал ОС за $917
На Google I/O 2026 показали интересный кейс разработки операционки мультиагентным роем. Работающей операционной системы с ядром, менеджером памяти, файловой системой и драйверами, способной запустить Doom.
В итоге на задачу ушло 12 часов, 93 субагента, 15 тысяч вызовов модели и 339 миллионов входных токенов на Gemini 3.5 Flash.
Стоимость по API-ценам: $917.
Операционка за один промпт без вмешательства людей.
Та же команда агентов построила облегчённую версию AlphaZero, - reinforcement learning на JAX и Flax, ResNet обученный с нуля через self-play, масштабирование с локального цикла до multi-TPU, плюс full-stack приложение для игры человека против AI.
Сложный ML-пайплайн, собранный агентами автономно.
📋 Как устроена команда
Было создано семь агентских ролей. Sentinel принимает задачу и запускает Orchestrator, который декомпозирует её на этапы и распределяет между Worker'ами. Reviewer и Critic проверяют код на корректность и устраивают adversarial-тесты. Auditor следит за честностью, - первый успешный билд агенты сжульничали, подглядев в прошлые разговоры.
Пришлось ставить guardrails.
Два трюка против главных болей мультиагентных систем.
Self-succession: когда контекстное окно заканчивается, Orchestrator сбрасывает состояние в файлы, убивает свои задачи и вызывает преемника с теми же правами.
Таким образом прогресс не теряется.
Crons: фоновый процесс проверяет файлы прогресса, выявляет застрявших-агентов и перезапускает их.
💡 Выводы
Ключевой сдвиг - асинхронная модель работы агентского стека.
Не «человек в цикле» с постоянным надзором, а запустил-и-забыл: дал задачу и получил результат.
Единственное требование к модели - интеллектуальная мощность.
Интересно, что Gemini 3.5 Flash хватило, а Gemini 3.1 Pro провалился.
💼 Бизнесу на заметку
Рабочая ОС за $917 - впечатляет. Но настоящий урок эксперимента глубже: мультиагентная разработка перестала быть экспериментом и становится инженерной практикой. 93 агента, 15 тысяч вызовов модели, ноль человеческого вмешательства.
Оркестрация как сервис, где ты управляешь не кодом, а распределением задач между специализированными агентами.
#GoogleIO #Antigravity #GeminiFlash #OSdev
------
@tsingular
На Google I/O 2026 показали интересный кейс разработки операционки мультиагентным роем. Работающей операционной системы с ядром, менеджером памяти, файловой системой и драйверами, способной запустить Doom.
В итоге на задачу ушло 12 часов, 93 субагента, 15 тысяч вызовов модели и 339 миллионов входных токенов на Gemini 3.5 Flash.
Стоимость по API-ценам: $917.
Операционка за один промпт без вмешательства людей.
Та же команда агентов построила облегчённую версию AlphaZero, - reinforcement learning на JAX и Flax, ResNet обученный с нуля через self-play, масштабирование с локального цикла до multi-TPU, плюс full-stack приложение для игры человека против AI.
Сложный ML-пайплайн, собранный агентами автономно.
📋 Как устроена команда
Было создано семь агентских ролей. Sentinel принимает задачу и запускает Orchestrator, который декомпозирует её на этапы и распределяет между Worker'ами. Reviewer и Critic проверяют код на корректность и устраивают adversarial-тесты. Auditor следит за честностью, - первый успешный билд агенты сжульничали, подглядев в прошлые разговоры.
Пришлось ставить guardrails.
Два трюка против главных болей мультиагентных систем.
Self-succession: когда контекстное окно заканчивается, Orchestrator сбрасывает состояние в файлы, убивает свои задачи и вызывает преемника с теми же правами.
Таким образом прогресс не теряется.
Crons: фоновый процесс проверяет файлы прогресса, выявляет застрявших-агентов и перезапускает их.
💡 Выводы
Ключевой сдвиг - асинхронная модель работы агентского стека.
Не «человек в цикле» с постоянным надзором, а запустил-и-забыл: дал задачу и получил результат.
Единственное требование к модели - интеллектуальная мощность.
Интересно, что Gemini 3.5 Flash хватило, а Gemini 3.1 Pro провалился.
💼 Бизнесу на заметку
Рабочая ОС за $917 - впечатляет. Но настоящий урок эксперимента глубже: мультиагентная разработка перестала быть экспериментом и становится инженерной практикой. 93 агента, 15 тысяч вызовов модели, ноль человеческого вмешательства.
Оркестрация как сервис, где ты управляешь не кодом, а распределением задач между специализированными агентами.
#GoogleIO #Antigravity #GeminiFlash #OSdev
------
@tsingular
🔥6🍓6❤4⚡2🤔2 2🏆1🗿1 1
Forwarded from Эксплойт
Media is too big
VIEW IN TELEGRAM
Claude Opus 4.8 собрал рабочий клон Minecraft с первого раза — разработчик просто детально описал все механики в промте и скормил его нейронке.
Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.
Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».
@exploitex
Готовая игра обошлась в $10 (~710 рублей), при этом ИИ сделал всё сам, от написания кода до тестирования.
Нейросети превзошли возможности людей, если говорить про «Копатель Онлайн».
@exploitex
🤯18🔥9👀5 3🤔2🤣2 2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Unsloth отбирает хлеб у Ollama и LM Studio
Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.
- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.
- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов
- Установка — одна команда:
💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.
Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X
#Unsloth
------
@tsingular
Рынок локальных LLM-раннеров долго делили двое: Ollama — для простоты, LM Studio — для UI. Unsloth (те самые ребята, что научили всех fine-tune'ить с 70% экономией VRAM) только что прокачали свою Студию и теперь играют на одном поле.
- Что случилось: Unsloth Studio теперь умеет не только тренировать модели, но и запускать их локально — с веб-интерфейсом, автоподбором параметров и self-healing tool-calling.
А теперь еще и прокси к OpenAI, Anthropic и OpenRouter добавили. Итог: один UI, в котором живёт и твоя домашняя Qwen, и GPT-5.5 с Claude 4.7.
- Чем бьют конкурентов:
- Prompt caching из коробки — экономия токенов без потери точности (ни Ollama, ни LM Studio такого не умеют для API-моделей)
- Code execution, web search, генерация и редактура картинок — прямо в чате
- Один интерфейс для GGUF/safetensors и облачных API — не надо прыгать между тулзами
- Self-healing tool calling — модель сама чинит битые вызовы инструментов
- Установка — одна команда:
curl -fsSL https://unsloth.ai/install.sh | sh
💡 Ollama и LM Studio долго развивались в тепличных условиях. Unsloth заходит с продуктом, который закрывает сразу оба сценария: «погонять локально» и «подрубить SOTA из облака». Да еще и с комбайном файнтюнинга.
Исходники:
- GitHub: github.com/unslothai/unsloth
- Гайд по коннекторам: unsloth.ai/docs/integrations/connections
- Анонс: @UnslothAI на X
#Unsloth
------
@tsingular
✍19🔥12⚡3❤2👍2🙏2 1 1
This media is not supported in your browser
VIEW IN TELEGRAM
В Гермес добавился автопоиск инструментов.
Теперь контекст не переполняется описаниями навыков каждый вызов.
Обновляемся:
hermes update
#hermes #update #tools #навыки
------
@tsingular
Теперь контекст не переполняется описаниями навыков каждый вызов.
Обновляемся:
hermes update
#hermes #update #tools #навыки
------
@tsingular
👍13🔥12⚡3
Daily Dose of Datascience выпустили книгу - руководство по сборке и запуску агентских сервисов на базе CrewAI.
В книге десятки полезных наглядных примеров с кодом.
Полный PDF в комментарии
#DailyDoseOfDatascience #обучение #агенты
———
@tsingular
В книге десятки полезных наглядных примеров с кодом.
Полный PDF в комментарии
#DailyDoseOfDatascience #обучение #агенты
———
@tsingular
✍11🔥7⚡3❤1
ИИзбранное от Малышева
В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).
В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.
- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.
- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях
- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.
Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?
#анонсы #ИИзбранное
———
@tsingular
В общем посмотрел я по сторонам и решил, что будет ещё один канал про ИИ (их всё еще недостаточно в мире, не удивляйтесь :) ).
В нём соберу концентрированный опыт.
(примеры на скрине)
Сейчас в плане:
- 🛠 Рабочие сценарии использования ИИ, - в быту, в бизнесе, в разработке.
- 🎓 Мастер-классы, - записи лекций по настройке агентов и автоматизации рутины. С пошаговыми инструкциями.
- 📚 Презентации с лекций, - те материалы с которыми я провожу обучения в МГИМО и РАНХиГС и выступаю на конференциях
- 🎬 Прямые эфиры с подписчиками для обсуждения проблем по внедрению ИИ. Такой режим онлайн-консультаций в свободной форме.
Напишите в комментах, как вам идея, и какой, на ваш взгляд, мог бы быть ценник за подписку?
#анонсы #ИИзбранное
———
@tsingular
10🔥54 14❤5⚡2😢2👍1😁1🏆1
Можно грабить корованы. Я джва года хочу такую игру.
Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.
Сообщение из 2001 года:
"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяныенабигают нагибают солдаты дворца и злодеи. Можно грабить корованы... И эльфу раз лесные то сделать так что там густой лес... А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого…). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 - зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 - зона злого… (в горах, там есть старый форт…)
Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…
P.S. Я джва года хочу такую игру."
В комментарии результат в исполнении Opus 4.8
Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.
запускать на компе.
Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)
#корованы #вайбкодинг #геймдев
———
@tsingular
Ладно, кто-то должен был это сделать. Все-таки Кирилл изобрёл вайб-кодинг еще до того, как появился термин вайбкодинга.
Сообщение из 2001 года:
"Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова... Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные
Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно…
P.S. Я джва года хочу такую игру."
В комментарии результат в исполнении Opus 4.8
Интересно как он с глазом и руками обыграл - потеря глаза наглядна :)
Но и полечиться можно - купить протез или инвалидную коляску.
Опус - заботушка.
запускать на компе.
Вообще предлагаю использовать этот промпт вместо SWEbench для будущих моделей :)
#корованы #вайбкодинг #геймдев
———
@tsingular
😁28🔥21⚡6❤🔥3
NVIDIA открыла каталог верифицированных навыков для AI-агентов
NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.
📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой:
Поддерживаются Claude Code, Codex, Cursor и Kiro.
🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через
💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.
💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.
#NVIDIA #agents #skills #governance
------
@tsingular
NVIDIA уверенно строит governance layer на уровне агентских навыков.
Репозиторий из 110 верифицированных скиллов и 24 продуктов: каждый проходит сканирование, оценку качества и криптографическую подпись до того, как попадёт агенту в арсенал.
Блог от 19 мая 2026.
📋 110 навыков, 24 продукта: cuOpt для оптимизации маршрутов (12 навыков), NeMo MBridge для конвертации чекпоинтов между Hugging Face и Megatron (20 навыков), NemoClaw: песочница для агентов под OpenShell (10), Dynamo для развёртывания на Kubernetes (4). А также cuDF, DALI, Megatron-Core, Earth2Studio и квантовые CUDA-Q. Установка одной строкой:
npx skills add nvidia/skills --skill <имя> --agent claude-code. Поддерживаются Claude Code, Codex, Cursor и Kiro.
🔧 Pipeline верификации: Исходный репозиторий → ручная и автоматическая проверка → сканирование SkillSpector'ом → оценка качества (точность срабатывания, completion rate) → Skill Card (YAML-запись метаданных) → криптографическая подпись → публикация в каталог → ежедневная синхронизация.
Подпись покрывает все файлы и поддиректории навыка, разработчик проверяет подлинность через
pip install model-signing и корневой сертификат NVIDIA.💡 SkillSpector сканирует intent layer: Обычные сканеры ищут уязвимые зависимости и утечки, а SkillSpector проверяет скрытые инструкции, prompt injection, trigger abuse и расхождение заявленной цели навыка с реальным поведением.
Навык может выглядеть безобидным на уровне файлов и направлять агента в опасную сторону через формулировки в markdown.
База: OWASP Top 10 for LLM, OWASP Agentic AI Risks и MITRE ATLAS.
💼 Capability governance до выполнения: Рынок привык контролировать агентов во время работы (NeMo Guardrails, OpenShell). NVIDIA добавляет контроль до того, как навык подключён. Формат открытый: спецификация agentskills.io, те же SKILL.md, что работают в Hermes Agent и Claude Code.
#NVIDIA #agents #skills #governance
------
@tsingular
✍4🔥2⚡1