AI Product | Igor Akimov
7.55K subscribers
1.12K photos
222 videos
56 files
1.19K links
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Вау, кодекс десктоп апп!
И дали бесплатно для всех планов и лимиты подняли платникам!

Теперь полноценная среда ("командный центр") для работы с AI-агентами.

- Нативная интеграция - приложение работает в связке с вашим терминалом и IDE, сохраняя весь контекст разработки.
- Skills - можно создавать прям в UI в кастомные навыки и воркфлоу для агента (например, стандартные процедуры по фиксу тестов или сбору логов, написание документации, анализ данных).
- Автоматизация - можно запускать в определенное время разные скиллы, типа подготовки к встрече, запуск тестов, анализ багов.
- Песочница - агент работает в изолированной среде. Вы сами решаете, к каким папкам или сетевым ресурсам у него есть доступ. И хотят делать интеграцию с облаком бесшовную, чтобы работало и при выключенном компьютере.

Пока доступно только на macOS, но скоро и windows.
https://openai.com/index/introducing-the-codex-app/
🔥195👍3
Claude упал и как раз вышла новая модель для кодинга от Qwen - Qwen3 Coder Next :)

https://qwen.ai/blog?id=qwen3-coder-next

Модель размера 80B параметров, но активных 3B, так что быстрая, но все равно видюха нужна промышленная. Но для своего размера весьма неплохая. Тренировали много на синтетических данных в контролируемой среде, так что должна быть весьма хороша на понятных атомарных задачах.
❤‍🔥75👍5🔥2
Разработчикам под iOS подарок от Apple - встроила AI-агентов в Xcode

Вышла RC-версия Xcode 26.3 с поддержкой agentic coding.
- Claude Agent и OpenAI Codex работают напрямую из IDE
- Разбивают задачи на подзадачи автономно
- Лезут в документацию, файловую структуру, настройки проекта
- Проверяют код через Xcode Previews, прогоняют билды, исправляют ошибки
- Полный цикл разработки, а не просто автокомплит.

https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/
🔥11👍21
Классный обзор, что происходит с миром saas (в там полный п в связи с вайбкодингом)

Акции SaaS-компаний падают на 30-40% с декабря. HubSpot, Atlassian, Jira - все вниз. Morgan Stanley уже пишет заметки "No Reasons to Own" про софтверные акции.

Почему? Клиенты поняли, что могут сами навайбкодить себе инструменты. И это создаёт экзистенциальную угрозу для B2B SaaS: как просить за renewal $50К в год, когда клиент чувствует, что может сам за выходные что-то собрать?

Проблема не в том, что клиенты реально могут сделать качественный продукт (автор правильно пишет - большинство не понимают, что идёт в архитектуру надёжных систем, и их самописные решения рано или поздно развалятся). Проблема в том, что они *чувствуют*, что могут. И этого достаточно для отмены подписки.

Как выживать (три стратегии):

1) Быть System of Record, а не просто сервисом.
Если вся компания работает на твоей платформе каждый день - ты интегрирован глубоко. Простые wrapper-продукты (типа дашбордов для визуализации) - легко заменяются вайб-кодингом.

2) Безопасность, аутентификация, надёжность
Это сложные части, которые клиенты пока не понимают. Но надо активно это коммуницировать, пока не поздно.

3) Адаптация под клиента, а не наоборот
Времена "меняйте свои процессы под наш софт" закончились. Побеждают ультра-кастомизируемые решения.

Самый интересный кейс:
Автор работал с SaaS для ремонтных операций. Проблема - UI слишком сложный для техников, использование было 35%. Решение - сделали whitelabel vibe-coding платформу поверх их SaaS. Customer success команда за несколько дней навайбкодила специфичные мобильные веб-аппы для техников.

Результат: usage вырос с 35% до 70%. Техники видят только создание work orders (что им нужно), а руководство вайб-кодит кастомные репорты. И всё это поверх основного SaaS, который остаётся System of Record.

В общем, AI не убивает B2B SaaS. Он убивает B2B SaaS, которые отказываются эволюционировать. Выживут не те, у кого лучшие фичи, а те, кто станет платформой - позволит клиентам строить *поверх* себя, а не *вместо* себя.

https://nmn.gl/blog/ai-killing-b2b-saas
👍18💯7🔥64🤝1
Mistral видимо окончательно забил на LLM и делает миништуки полезные на своем железе. Вот новый транскрибатор, в том числе с русским.

Две STT-модели: Voxtral Mini Transcribe V2 для batch и Voxtral Realtime для live. Realtime открыли под Apache 2.0.

Voxtral Mini Transcribe V2:
- WER ~4% на FLEURS
- $0.003/мин - дешевле всех при лучшей точности
- В 3 раза быстрее ElevenLabs Scribe v2, в 5 раз дешевле
- Бьет GPT-4o mini, Gemini 2.5 Flash, Assembly, Deepgram

Voxtral Realtime:
- Латентность от 200ms
- При 480ms задержке WER всего на 1-2% хуже batch
- $0.006/мин
- 4B параметров - можно на локалке запускать.

Ну и стандартный набор:
- Speaker diarization - кто, что и когда сказал
- Context biasing - до 100 терминов для правильного распознавания (имена, названия)
- Word-level timestamps - метка для каждого слова
- 13 языков включая русский
- До 3 часов аудио в запросе
- GDPR/HIPAA - можно on-premise

Надо тестить. $0.003/мин при лучшей точности - для наших кейсов в Abasis.AI это снижение затрат в разы.

Realtime с открытыми весами и 4B параметрами - можно деплоить локально для регулируемых отраслей.

https://mistral.ai/news/voxtral-transcribe-2
👍132
Вау, это ж то, что решает проблемы в куче компаний, кто внедряет AI своими силами разрозненно!

OpenAI запустил Frontier – enterprise-платформу для управления AI-агентами. По сути, заявка на "операционную систему для enterprise".

Проблема, которую решают:
75% enterprise-работников говорят, что AI позволил им делать то, что раньше было невозможно. Но внедрение буксует – агенты работают в изолированных песочницах, данные разрозненные, каждая интеграция превращается в отдельный проект.

OpenAI взяли модель онбординга людей и применили к агентам. Получилось 4 компонента:
1. Business Context (семантический слой)
Объединяет data warehouses, CRM, тикетинг-системы, внутренние приложения в единый слой. Агенты понимают, как течёт информация, где принимаются решения, что важно для бизнеса.

2. Agent Execution (среда выполнения)
Открытая среда, где агенты могут:
- Работать с файлами
- Запускать код
- Использовать инструменты
- Планировать и выполнять сложные многошаговые задачи
Можно запускать локально (вау), в enterprise-облаке или на инфраструктуре OpenAI.

3. Memory & Learning
Агенты накапливают "память" – прошлые взаимодействия улучшают будущую работу. Встроенные evaluation и optimization loops показывают, что работает, а что нет.

4. Identity & Governance
Каждый агент получает:
- Собственную идентичность
- Явные permissions
- Guardrails для регулируемых сред (финансы, healthcare)
- Аудируемые действия

Ключевое отличие – открытость:
Frontier работает с агентами от любых вендоров: OpenAI, Google, Microsoft, Anthropic, собственные enterprise-агенты. Можно работать через ChatGPT, через Atlas workflows, или внутри существующих бизнес-приложений.

Реальные кейсы:
Крупный производитель полупроводников: оптимизация чипов сократилась с 6 недель до 1 дня
Глобальная инвестиционная компания: агенты по всему sales-процессу освободили 90% времени сейлзов для работы с клиентами
Энергетическая компания: +5% к выработке = +$1B дополнительной выручки
Финансовая компания: 90% времени вернули client-facing команде
Tech-компания: экономия 1,500 часов в месяц в product development

Enterprise Frontier Program:
OpenAI выделяет Forward Deployed Engineers, которые работают с командой клиента: проектируют архитектуру, операционализируют governance, запускают агентов в production. Цель — создать повторяемые паттерны, которые команда сможет развивать самостоятельно.

Клиенты:
Ранний доступ: HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
Пилоты: BBVA, Cisco, T-Mobile и "десятки" других

Прикольно, что если агент от лица всех сотрудников логинится в какую-нибудь систему, то per seat модели практически умерли.

Пока это все - через сейлзов и вейтлист, но хотят запустить на все компании.

Интересно, что OpenAI делает ставку на то, что ценность не в моделях, а в инфраструктуре управления агентами
Открытость к другим вендорам – прагматичный ход, учитывая что enterprise не будет делать all-in на одного провайдера.

https://openai.com/index/introducing-openai-frontier/
🔥103
Эм, у меня появился Opus 4.6...
🔥19👀4🐳1
Сlaude Opus 4.6! Апгрейд флагманской модели Claude Opus.

• Значительно сильнее в сложных профессиональных задачах – код, поиск, анализ больших текстов и reasoning. Работает над длинными контекстами лучше, чем предшественники.

• Добавили adaptive thinking – модель сама решает, когда углублённо думать.

• Появились новые параметры управления размышлением, более длинные выводы (до 128k токенов), контекст до 1M.

• Интеграции в инструментальные цепочки – Excel прокачан, PowerPoint в превью.

• Уровень безопасности не ниже, чем у Opus 4.5.

https://www.anthropic.com/news/claude-opus-4-6
🔥19👍52
А OpenAI решил не дать насладиться триумфом и через 10 минут побил все основные кодинговые метрики новым GPT-5.3 Codex, хах :)
https://openai.com/index/introducing-gpt-5-3-codex/

Быстрее на 25%, лучше понимает крупные планы, пишет все, что только можно, может работать долго и не терять контекст.
😁15👍7👏31
Claude зарелизил свои "команды разработки" - Claude Code: Agent Teams.

• Каждый агент — полноценная сессия Claude Code с своим контекстом.
• Они общаются не только с главным агентом, но и друг с другом.
• Есть общий список задач — он координирует работу команды.
• Подходит для сложных workflows, где надо делить работу на части, исследовать варианты, дебаты/ревью, сопоставлять результаты.

Как работает:
• Включается через флаг/переменную среды CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS.
• Говоришь Claude собрать команду с ролями/целями.
• Появляется lead-агент, который управляет задачами, и несколько teammates.
• Можно выбирать режимы отображения (в одном терминале или в split-панелях).
• Lead распределяет задачи, агенты самостоятельны, но координируются через общий список.
• Можно требовать согласования плана от агентов перед исполнением.

В итоге это мини-команда Claude, работающая как настоящая распределённая команда для твоего проекта. Как обычно убили сотню стартапов, которые подобные штуки разрабатывали.
https://code.claude.com/docs/en/agent-teams
🔥24🤯9👍52