This media is not supported in your browser
VIEW IN TELEGRAM
Вау, кодекс десктоп апп!
И дали бесплатно для всех планов и лимиты подняли платникам!
Теперь полноценная среда ("командный центр") для работы с AI-агентами.
- Нативная интеграция - приложение работает в связке с вашим терминалом и IDE, сохраняя весь контекст разработки.
- Skills - можно создавать прям в UI в кастомные навыки и воркфлоу для агента (например, стандартные процедуры по фиксу тестов или сбору логов, написание документации, анализ данных).
- Автоматизация - можно запускать в определенное время разные скиллы, типа подготовки к встрече, запуск тестов, анализ багов.
- Песочница - агент работает в изолированной среде. Вы сами решаете, к каким папкам или сетевым ресурсам у него есть доступ. И хотят делать интеграцию с облаком бесшовную, чтобы работало и при выключенном компьютере.
Пока доступно только на macOS, но скоро и windows.
https://openai.com/index/introducing-the-codex-app/
И дали бесплатно для всех планов и лимиты подняли платникам!
Теперь полноценная среда ("командный центр") для работы с AI-агентами.
- Нативная интеграция - приложение работает в связке с вашим терминалом и IDE, сохраняя весь контекст разработки.
- Skills - можно создавать прям в UI в кастомные навыки и воркфлоу для агента (например, стандартные процедуры по фиксу тестов или сбору логов, написание документации, анализ данных).
- Автоматизация - можно запускать в определенное время разные скиллы, типа подготовки к встрече, запуск тестов, анализ багов.
- Песочница - агент работает в изолированной среде. Вы сами решаете, к каким папкам или сетевым ресурсам у него есть доступ. И хотят делать интеграцию с облаком бесшовную, чтобы работало и при выключенном компьютере.
Пока доступно только на macOS, но скоро и windows.
https://openai.com/index/introducing-the-codex-app/
🔥19❤5👍3
Claude упал и как раз вышла новая модель для кодинга от Qwen - Qwen3 Coder Next :)
https://qwen.ai/blog?id=qwen3-coder-next
Модель размера 80B параметров, но активных 3B, так что быстрая, но все равно видюха нужна промышленная. Но для своего размера весьма неплохая. Тренировали много на синтетических данных в контролируемой среде, так что должна быть весьма хороша на понятных атомарных задачах.
https://qwen.ai/blog?id=qwen3-coder-next
Модель размера 80B параметров, но активных 3B, так что быстрая, но все равно видюха нужна промышленная. Но для своего размера весьма неплохая. Тренировали много на синтетических данных в контролируемой среде, так что должна быть весьма хороша на понятных атомарных задачах.
❤🔥7❤5👍5🔥2
Разработчикам под iOS подарок от Apple - встроила AI-агентов в Xcode
Вышла RC-версия Xcode 26.3 с поддержкой agentic coding.
- Claude Agent и OpenAI Codex работают напрямую из IDE
- Разбивают задачи на подзадачи автономно
- Лезут в документацию, файловую структуру, настройки проекта
- Проверяют код через Xcode Previews, прогоняют билды, исправляют ошибки
- Полный цикл разработки, а не просто автокомплит.
https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/
Вышла RC-версия Xcode 26.3 с поддержкой agentic coding.
- Claude Agent и OpenAI Codex работают напрямую из IDE
- Разбивают задачи на подзадачи автономно
- Лезут в документацию, файловую структуру, настройки проекта
- Проверяют код через Xcode Previews, прогоняют билды, исправляют ошибки
- Полный цикл разработки, а не просто автокомплит.
https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/
🔥11👍2❤1
Классный обзор, что происходит с миром saas (в там полный п в связи с вайбкодингом)
Акции SaaS-компаний падают на 30-40% с декабря. HubSpot, Atlassian, Jira - все вниз. Morgan Stanley уже пишет заметки "No Reasons to Own" про софтверные акции.
Почему? Клиенты поняли, что могут сами навайбкодить себе инструменты. И это создаёт экзистенциальную угрозу для B2B SaaS: как просить за renewal $50К в год, когда клиент чувствует, что может сам за выходные что-то собрать?
Проблема не в том, что клиенты реально могут сделать качественный продукт (автор правильно пишет - большинство не понимают, что идёт в архитектуру надёжных систем, и их самописные решения рано или поздно развалятся). Проблема в том, что они *чувствуют*, что могут. И этого достаточно для отмены подписки.
Как выживать (три стратегии):
1) Быть System of Record, а не просто сервисом.
Если вся компания работает на твоей платформе каждый день - ты интегрирован глубоко. Простые wrapper-продукты (типа дашбордов для визуализации) - легко заменяются вайб-кодингом.
2) Безопасность, аутентификация, надёжность
Это сложные части, которые клиенты пока не понимают. Но надо активно это коммуницировать, пока не поздно.
3) Адаптация под клиента, а не наоборот
Времена "меняйте свои процессы под наш софт" закончились. Побеждают ультра-кастомизируемые решения.
Самый интересный кейс:
Автор работал с SaaS для ремонтных операций. Проблема - UI слишком сложный для техников, использование было 35%. Решение - сделали whitelabel vibe-coding платформу поверх их SaaS. Customer success команда за несколько дней навайбкодила специфичные мобильные веб-аппы для техников.
Результат: usage вырос с 35% до 70%. Техники видят только создание work orders (что им нужно), а руководство вайб-кодит кастомные репорты. И всё это поверх основного SaaS, который остаётся System of Record.
В общем, AI не убивает B2B SaaS. Он убивает B2B SaaS, которые отказываются эволюционировать. Выживут не те, у кого лучшие фичи, а те, кто станет платформой - позволит клиентам строить *поверх* себя, а не *вместо* себя.
https://nmn.gl/blog/ai-killing-b2b-saas
Акции SaaS-компаний падают на 30-40% с декабря. HubSpot, Atlassian, Jira - все вниз. Morgan Stanley уже пишет заметки "No Reasons to Own" про софтверные акции.
Почему? Клиенты поняли, что могут сами навайбкодить себе инструменты. И это создаёт экзистенциальную угрозу для B2B SaaS: как просить за renewal $50К в год, когда клиент чувствует, что может сам за выходные что-то собрать?
Проблема не в том, что клиенты реально могут сделать качественный продукт (автор правильно пишет - большинство не понимают, что идёт в архитектуру надёжных систем, и их самописные решения рано или поздно развалятся). Проблема в том, что они *чувствуют*, что могут. И этого достаточно для отмены подписки.
Как выживать (три стратегии):
1) Быть System of Record, а не просто сервисом.
Если вся компания работает на твоей платформе каждый день - ты интегрирован глубоко. Простые wrapper-продукты (типа дашбордов для визуализации) - легко заменяются вайб-кодингом.
2) Безопасность, аутентификация, надёжность
Это сложные части, которые клиенты пока не понимают. Но надо активно это коммуницировать, пока не поздно.
3) Адаптация под клиента, а не наоборот
Времена "меняйте свои процессы под наш софт" закончились. Побеждают ультра-кастомизируемые решения.
Самый интересный кейс:
Автор работал с SaaS для ремонтных операций. Проблема - UI слишком сложный для техников, использование было 35%. Решение - сделали whitelabel vibe-coding платформу поверх их SaaS. Customer success команда за несколько дней навайбкодила специфичные мобильные веб-аппы для техников.
Результат: usage вырос с 35% до 70%. Техники видят только создание work orders (что им нужно), а руководство вайб-кодит кастомные репорты. И всё это поверх основного SaaS, который остаётся System of Record.
В общем, AI не убивает B2B SaaS. Он убивает B2B SaaS, которые отказываются эволюционировать. Выживут не те, у кого лучшие фичи, а те, кто станет платформой - позволит клиентам строить *поверх* себя, а не *вместо* себя.
https://nmn.gl/blog/ai-killing-b2b-saas
👍18💯7🔥6❤4🤝1
Mistral видимо окончательно забил на LLM и делает миништуки полезные на своем железе. Вот новый транскрибатор, в том числе с русским.
Две STT-модели: Voxtral Mini Transcribe V2 для batch и Voxtral Realtime для live. Realtime открыли под Apache 2.0.
Voxtral Mini Transcribe V2:
- WER ~4% на FLEURS
- $0.003/мин - дешевле всех при лучшей точности
- В 3 раза быстрее ElevenLabs Scribe v2, в 5 раз дешевле
- Бьет GPT-4o mini, Gemini 2.5 Flash, Assembly, Deepgram
Voxtral Realtime:
- Латентность от 200ms
- При 480ms задержке WER всего на 1-2% хуже batch
- $0.006/мин
- 4B параметров - можно на локалке запускать.
Ну и стандартный набор:
- Speaker diarization - кто, что и когда сказал
- Context biasing - до 100 терминов для правильного распознавания (имена, названия)
- Word-level timestamps - метка для каждого слова
- 13 языков включая русский
- До 3 часов аудио в запросе
- GDPR/HIPAA - можно on-premise
Надо тестить. $0.003/мин при лучшей точности - для наших кейсов в Abasis.AI это снижение затрат в разы.
Realtime с открытыми весами и 4B параметрами - можно деплоить локально для регулируемых отраслей.
https://mistral.ai/news/voxtral-transcribe-2
Две STT-модели: Voxtral Mini Transcribe V2 для batch и Voxtral Realtime для live. Realtime открыли под Apache 2.0.
Voxtral Mini Transcribe V2:
- WER ~4% на FLEURS
- $0.003/мин - дешевле всех при лучшей точности
- В 3 раза быстрее ElevenLabs Scribe v2, в 5 раз дешевле
- Бьет GPT-4o mini, Gemini 2.5 Flash, Assembly, Deepgram
Voxtral Realtime:
- Латентность от 200ms
- При 480ms задержке WER всего на 1-2% хуже batch
- $0.006/мин
- 4B параметров - можно на локалке запускать.
Ну и стандартный набор:
- Speaker diarization - кто, что и когда сказал
- Context biasing - до 100 терминов для правильного распознавания (имена, названия)
- Word-level timestamps - метка для каждого слова
- 13 языков включая русский
- До 3 часов аудио в запросе
- GDPR/HIPAA - можно on-premise
Надо тестить. $0.003/мин при лучшей точности - для наших кейсов в Abasis.AI это снижение затрат в разы.
Realtime с открытыми весами и 4B параметрами - можно деплоить локально для регулируемых отраслей.
https://mistral.ai/news/voxtral-transcribe-2
👍13❤2
Вау, это ж то, что решает проблемы в куче компаний, кто внедряет AI своими силами разрозненно!
OpenAI запустил Frontier – enterprise-платформу для управления AI-агентами. По сути, заявка на "операционную систему для enterprise".
Проблема, которую решают:
75% enterprise-работников говорят, что AI позволил им делать то, что раньше было невозможно. Но внедрение буксует – агенты работают в изолированных песочницах, данные разрозненные, каждая интеграция превращается в отдельный проект.
OpenAI взяли модель онбординга людей и применили к агентам. Получилось 4 компонента:
1. Business Context (семантический слой)
Объединяет data warehouses, CRM, тикетинг-системы, внутренние приложения в единый слой. Агенты понимают, как течёт информация, где принимаются решения, что важно для бизнеса.
2. Agent Execution (среда выполнения)
Открытая среда, где агенты могут:
- Работать с файлами
- Запускать код
- Использовать инструменты
- Планировать и выполнять сложные многошаговые задачи
Можно запускать локально (вау), в enterprise-облаке или на инфраструктуре OpenAI.
3. Memory & Learning
Агенты накапливают "память" – прошлые взаимодействия улучшают будущую работу. Встроенные evaluation и optimization loops показывают, что работает, а что нет.
4. Identity & Governance
Каждый агент получает:
- Собственную идентичность
- Явные permissions
- Guardrails для регулируемых сред (финансы, healthcare)
- Аудируемые действия
Ключевое отличие – открытость:
Frontier работает с агентами от любых вендоров: OpenAI, Google, Microsoft, Anthropic, собственные enterprise-агенты. Можно работать через ChatGPT, через Atlas workflows, или внутри существующих бизнес-приложений.
Реальные кейсы:
Крупный производитель полупроводников: оптимизация чипов сократилась с 6 недель до 1 дня
Глобальная инвестиционная компания: агенты по всему sales-процессу освободили 90% времени сейлзов для работы с клиентами
Энергетическая компания: +5% к выработке = +$1B дополнительной выручки
Финансовая компания: 90% времени вернули client-facing команде
Tech-компания: экономия 1,500 часов в месяц в product development
Enterprise Frontier Program:
OpenAI выделяет Forward Deployed Engineers, которые работают с командой клиента: проектируют архитектуру, операционализируют governance, запускают агентов в production. Цель — создать повторяемые паттерны, которые команда сможет развивать самостоятельно.
Клиенты:
Ранний доступ: HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
Пилоты: BBVA, Cisco, T-Mobile и "десятки" других
Прикольно, что если агент от лица всех сотрудников логинится в какую-нибудь систему, то per seat модели практически умерли.
Пока это все - через сейлзов и вейтлист, но хотят запустить на все компании.
Интересно, что OpenAI делает ставку на то, что ценность не в моделях, а в инфраструктуре управления агентами
Открытость к другим вендорам – прагматичный ход, учитывая что enterprise не будет делать all-in на одного провайдера.
https://openai.com/index/introducing-openai-frontier/
OpenAI запустил Frontier – enterprise-платформу для управления AI-агентами. По сути, заявка на "операционную систему для enterprise".
Проблема, которую решают:
75% enterprise-работников говорят, что AI позволил им делать то, что раньше было невозможно. Но внедрение буксует – агенты работают в изолированных песочницах, данные разрозненные, каждая интеграция превращается в отдельный проект.
OpenAI взяли модель онбординга людей и применили к агентам. Получилось 4 компонента:
1. Business Context (семантический слой)
Объединяет data warehouses, CRM, тикетинг-системы, внутренние приложения в единый слой. Агенты понимают, как течёт информация, где принимаются решения, что важно для бизнеса.
2. Agent Execution (среда выполнения)
Открытая среда, где агенты могут:
- Работать с файлами
- Запускать код
- Использовать инструменты
- Планировать и выполнять сложные многошаговые задачи
Можно запускать локально (вау), в enterprise-облаке или на инфраструктуре OpenAI.
3. Memory & Learning
Агенты накапливают "память" – прошлые взаимодействия улучшают будущую работу. Встроенные evaluation и optimization loops показывают, что работает, а что нет.
4. Identity & Governance
Каждый агент получает:
- Собственную идентичность
- Явные permissions
- Guardrails для регулируемых сред (финансы, healthcare)
- Аудируемые действия
Ключевое отличие – открытость:
Frontier работает с агентами от любых вендоров: OpenAI, Google, Microsoft, Anthropic, собственные enterprise-агенты. Можно работать через ChatGPT, через Atlas workflows, или внутри существующих бизнес-приложений.
Реальные кейсы:
Крупный производитель полупроводников: оптимизация чипов сократилась с 6 недель до 1 дня
Глобальная инвестиционная компания: агенты по всему sales-процессу освободили 90% времени сейлзов для работы с клиентами
Энергетическая компания: +5% к выработке = +$1B дополнительной выручки
Финансовая компания: 90% времени вернули client-facing команде
Tech-компания: экономия 1,500 часов в месяц в product development
Enterprise Frontier Program:
OpenAI выделяет Forward Deployed Engineers, которые работают с командой клиента: проектируют архитектуру, операционализируют governance, запускают агентов в production. Цель — создать повторяемые паттерны, которые команда сможет развивать самостоятельно.
Клиенты:
Ранний доступ: HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
Пилоты: BBVA, Cisco, T-Mobile и "десятки" других
Прикольно, что если агент от лица всех сотрудников логинится в какую-нибудь систему, то per seat модели практически умерли.
Пока это все - через сейлзов и вейтлист, но хотят запустить на все компании.
Интересно, что OpenAI делает ставку на то, что ценность не в моделях, а в инфраструктуре управления агентами
Открытость к другим вендорам – прагматичный ход, учитывая что enterprise не будет делать all-in на одного провайдера.
https://openai.com/index/introducing-openai-frontier/
🔥10❤3
Сlaude Opus 4.6! Апгрейд флагманской модели Claude Opus.
• Значительно сильнее в сложных профессиональных задачах – код, поиск, анализ больших текстов и reasoning. Работает над длинными контекстами лучше, чем предшественники.
• Добавили adaptive thinking – модель сама решает, когда углублённо думать.
• Появились новые параметры управления размышлением, более длинные выводы (до 128k токенов), контекст до 1M.
• Интеграции в инструментальные цепочки – Excel прокачан, PowerPoint в превью.
• Уровень безопасности не ниже, чем у Opus 4.5.
https://www.anthropic.com/news/claude-opus-4-6
• Значительно сильнее в сложных профессиональных задачах – код, поиск, анализ больших текстов и reasoning. Работает над длинными контекстами лучше, чем предшественники.
• Добавили adaptive thinking – модель сама решает, когда углублённо думать.
• Появились новые параметры управления размышлением, более длинные выводы (до 128k токенов), контекст до 1M.
• Интеграции в инструментальные цепочки – Excel прокачан, PowerPoint в превью.
• Уровень безопасности не ниже, чем у Opus 4.5.
https://www.anthropic.com/news/claude-opus-4-6
🔥19👍5❤2
А OpenAI решил не дать насладиться триумфом и через 10 минут побил все основные кодинговые метрики новым GPT-5.3 Codex, хах :)
https://openai.com/index/introducing-gpt-5-3-codex/
Быстрее на 25%, лучше понимает крупные планы, пишет все, что только можно, может работать долго и не терять контекст.
https://openai.com/index/introducing-gpt-5-3-codex/
Быстрее на 25%, лучше понимает крупные планы, пишет все, что только можно, может работать долго и не терять контекст.
😁15👍7👏3❤1
Claude зарелизил свои "команды разработки" - Claude Code: Agent Teams.
• Каждый агент — полноценная сессия Claude Code с своим контекстом.
• Они общаются не только с главным агентом, но и друг с другом.
• Есть общий список задач — он координирует работу команды.
• Подходит для сложных workflows, где надо делить работу на части, исследовать варианты, дебаты/ревью, сопоставлять результаты.
Как работает:
• Включается через флаг/переменную среды CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS.
• Говоришь Claude собрать команду с ролями/целями.
• Появляется lead-агент, который управляет задачами, и несколько teammates.
• Можно выбирать режимы отображения (в одном терминале или в split-панелях).
• Lead распределяет задачи, агенты самостоятельны, но координируются через общий список.
• Можно требовать согласования плана от агентов перед исполнением.
В итоге это мини-команда Claude, работающая как настоящая распределённая команда для твоего проекта. Как обычно убили сотню стартапов, которые подобные штуки разрабатывали.
https://code.claude.com/docs/en/agent-teams
• Каждый агент — полноценная сессия Claude Code с своим контекстом.
• Они общаются не только с главным агентом, но и друг с другом.
• Есть общий список задач — он координирует работу команды.
• Подходит для сложных workflows, где надо делить работу на части, исследовать варианты, дебаты/ревью, сопоставлять результаты.
Как работает:
• Включается через флаг/переменную среды CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS.
• Говоришь Claude собрать команду с ролями/целями.
• Появляется lead-агент, который управляет задачами, и несколько teammates.
• Можно выбирать режимы отображения (в одном терминале или в split-панелях).
• Lead распределяет задачи, агенты самостоятельны, но координируются через общий список.
• Можно требовать согласования плана от агентов перед исполнением.
В итоге это мини-команда Claude, работающая как настоящая распределённая команда для твоего проекта. Как обычно убили сотню стартапов, которые подобные штуки разрабатывали.
https://code.claude.com/docs/en/agent-teams
Claude Code Docs
Orchestrate teams of Claude Code sessions - Claude Code Docs
Coordinate multiple Claude Code instances working together as a team, with shared tasks, inter-agent messaging, and centralized management.
🔥24🤯9👍5❤2