🤖 Основатель UiPath: Как агентный AI изменит автоматизацию бизнеса
Интервью на The Verge.
Дэниел Динес, основатель UiPath, после небольшого перерыва вернулся на пост CEO и делает большую ставку на агентный AI как будущее автоматизации.
В 2023 году Динес временно уступил руководство компанией, но вернулся менее чем через шесть месяцев после ухода Роба Энслина.
Революция в RPA через агентный AI
Ключевой момент: UiPath радикально смещает фокус с традиционной RPA (роботизированной автоматизации процессов) на агентный AI. Динес признает, что компания "повернула большую лодку" – более половины инженерных ресурсов переориентировано на создание агентных продуктов.
По словам Динеса, "агентный AI по сути – это AI плюс автоматизация, их слияние". UiPath позиционирует себя как идеальную платформу для этой интеграции, поскольку имеет многолетний опыт в автоматизации.
Детерминированное vs недетерминированное
Технически интересный момент в интервью:
Динес четко разграничивает, где нужны разные подходы:
- LLM не предназначены для выполнения детерминированных задач (например, умножения чисел)
- Транзакционные операции с побочными эффектами в корпоративных системах ДОЛЖНЫ быть детерминированными. "Нельзя иметь 95% вероятность успешной транзакции платежа. Должно быть 100%"
Решение UiPath: объединить лучшее из обоих миров. Роботы UiPath обеспечивают полностью детерминированный способ выполнения транзакций, а LLM от партнеров (OpenAI и Anthropic) дополняют это на участках процесса, которые раньше нельзя было автоматизировать.
Практическое применение: пример с путешествиями
Пример: агент для путешествий. AI-агент выполняет исследование доступных рейсов (недетерминированная задача), представляет варианты, но когда дело доходит до бронирования и оплаты – здесь нужна детерминированная система.
Потеряют ли люди работу?
Динес не считает, что агентный AI приведет к массовой безработице в ближайшее время. По его мнению, работа трансформируется: "Рабочие места будут смещаться в сторону принятия решений. Люди будут анализировать информацию, собранную агентами и автоматизацией, принимать решения, а действия будут выполняться корпоративными рабочими процессами".
Оркестрация процессов
UiPath фокусируется на рабочих процессах как ключевом компоненте. Их агенты - это не столько разговорные помощники, сколько процессные элементы, работающие в контексте корпоративных процессов. Как объясняет Динес: "Критически важная часть – это оркестрация".
Пример: агент для одобрения кредитов. Рабочий процесс запускается при получении заявки, направляет ее агенту для извлечения информации, затем может отправить человеку для базовой проверки, потом агенту для рекомендации по кредиту, который может вызвать инструменты (API или RPA-бот) для проверки кредитного рейтинга.
Что дальше для бизнеса?
Динес подтверждает тренд на коммуникацию с ботами через ключевые слова вместо полных предложений. Интересно, что сам он отмечает: "Если я говорю "пожалуйста", мне кажется, что LLM дают лучшие ответы".
В плане бизнеса стратегия UiPath смещается от "охоты на слонов" (крупные сделки) к подходу "посадка и расширение": начинать с малых подразделений, доказывать ценность и затем расширяться.
Вовремя разворачиваются. Иначе "новички" вроде n8n и langchain быстро отгрызут у них поляну.
По идее ресурса должно хватить.
#Agents #RPA #UiPath
———
@tsingular
Интервью на The Verge.
Дэниел Динес, основатель UiPath, после небольшого перерыва вернулся на пост CEO и делает большую ставку на агентный AI как будущее автоматизации.
В 2023 году Динес временно уступил руководство компанией, но вернулся менее чем через шесть месяцев после ухода Роба Энслина.
Революция в RPA через агентный AI
Ключевой момент: UiPath радикально смещает фокус с традиционной RPA (роботизированной автоматизации процессов) на агентный AI. Динес признает, что компания "повернула большую лодку" – более половины инженерных ресурсов переориентировано на создание агентных продуктов.
По словам Динеса, "агентный AI по сути – это AI плюс автоматизация, их слияние". UiPath позиционирует себя как идеальную платформу для этой интеграции, поскольку имеет многолетний опыт в автоматизации.
Детерминированное vs недетерминированное
Технически интересный момент в интервью:
Динес четко разграничивает, где нужны разные подходы:
- LLM не предназначены для выполнения детерминированных задач (например, умножения чисел)
- Транзакционные операции с побочными эффектами в корпоративных системах ДОЛЖНЫ быть детерминированными. "Нельзя иметь 95% вероятность успешной транзакции платежа. Должно быть 100%"
Решение UiPath: объединить лучшее из обоих миров. Роботы UiPath обеспечивают полностью детерминированный способ выполнения транзакций, а LLM от партнеров (OpenAI и Anthropic) дополняют это на участках процесса, которые раньше нельзя было автоматизировать.
Практическое применение: пример с путешествиями
Пример: агент для путешествий. AI-агент выполняет исследование доступных рейсов (недетерминированная задача), представляет варианты, но когда дело доходит до бронирования и оплаты – здесь нужна детерминированная система.
Потеряют ли люди работу?
Динес не считает, что агентный AI приведет к массовой безработице в ближайшее время. По его мнению, работа трансформируется: "Рабочие места будут смещаться в сторону принятия решений. Люди будут анализировать информацию, собранную агентами и автоматизацией, принимать решения, а действия будут выполняться корпоративными рабочими процессами".
Оркестрация процессов
UiPath фокусируется на рабочих процессах как ключевом компоненте. Их агенты - это не столько разговорные помощники, сколько процессные элементы, работающие в контексте корпоративных процессов. Как объясняет Динес: "Критически важная часть – это оркестрация".
Пример: агент для одобрения кредитов. Рабочий процесс запускается при получении заявки, направляет ее агенту для извлечения информации, затем может отправить человеку для базовой проверки, потом агенту для рекомендации по кредиту, который может вызвать инструменты (API или RPA-бот) для проверки кредитного рейтинга.
Что дальше для бизнеса?
Динес подтверждает тренд на коммуникацию с ботами через ключевые слова вместо полных предложений. Интересно, что сам он отмечает: "Если я говорю "пожалуйста", мне кажется, что LLM дают лучшие ответы".
В плане бизнеса стратегия UiPath смещается от "охоты на слонов" (крупные сделки) к подходу "посадка и расширение": начинать с малых подразделений, доказывать ценность и затем расширяться.
Вовремя разворачиваются. Иначе "новички" вроде n8n и langchain быстро отгрызут у них поляну.
По идее ресурса должно хватить.
#Agents #RPA #UiPath
———
@tsingular
👨💻5🔥3⚡1
Forwarded from Machinelearning
Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025.
Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике.
Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы.
Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI.
В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно.
- 2 статьи были отклонены.
- 1 статья прошла, получив баллы:
Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп.
— Придумывает научные идеи
— Пишет и запускает код для экспериментов
— Анализирует результаты, строит графики
— Сама пишет статью в научном формате
— И… сама себя рецензирует
@ai_machinelearning_big_data
#ai #ml #Sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9⚡3✍1🤔1
🔍 Gemini Deep Research - теперь в Gemini 2.5 Pro
Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.
Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.
Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)
Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений
Имейте в виду — функция доступна только подписчикам Gemini Advanced.
Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.
#Gemini #DeepResearch #агенты #Google
———
@tsingular
Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.
Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.
Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)
Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений
Имейте в виду — функция доступна только подписчикам Gemini Advanced.
Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.
#Gemini #DeepResearch #агенты #Google
———
@tsingular
👍5🔥4⚡2
AI agent for travel built on Amazon Nova Sonic
About Amazon
🔊 Amazon Nova Sonic: Революция в голосовом AI — понимает не только ЧТО, но и КАК вы говорите
Amazon запустил новую модель Nova Sonic — первый фундаментальный AI, который объединяет распознавание и генерацию речи в единой архитектуре, делая голосовое взаимодействие по-настоящему человечным.
Ключевые возможности:
• Единая модель (не разрозненные ASR+LLM+TTS)
• Понимание тона, интонации и темпа речи
• Адаптация ответа под эмоциональный контекст
• Естественные паузы и умение "не перебивать"
• Корректная обработка прерываний разговора
Техническая начинка:
• Двунаправленный streaming API через HTTP/2
• Контекстное окно в 32K токенов
• До 8 минут в одной сессии
• Function calling для интеграции внешних сервисов
• RAG для работы с корпоративными данными
• Поддержка американского и британского английского
Практическое применение:
• Автоматизация контакт-центров
• Виртуальные туристические консультанты
• Образовательные приложения
• Игры с голосовым интерфейсом
• AI-ассистенты для работы с корпоративными дашбордами
Модель уже доступна через Amazon Bedrock в регионе US East (N. Virginia).
Для Python-разработчиков выпущен экспериментальный SDK для работы с бидирекциональным стримингом.
AWS явно в лидерах ИИ разработок. Не перестают удивлять, хотя о них и меньше "кричат", чем про OpenAI или Google.
Послушайте пример в прикрепе к посту.
#Amazon #Nova #Voice #AWS #sound
———
@tsingular
Amazon запустил новую модель Nova Sonic — первый фундаментальный AI, который объединяет распознавание и генерацию речи в единой архитектуре, делая голосовое взаимодействие по-настоящему человечным.
Ключевые возможности:
• Единая модель (не разрозненные ASR+LLM+TTS)
• Понимание тона, интонации и темпа речи
• Адаптация ответа под эмоциональный контекст
• Естественные паузы и умение "не перебивать"
• Корректная обработка прерываний разговора
Техническая начинка:
• Двунаправленный streaming API через HTTP/2
• Контекстное окно в 32K токенов
• До 8 минут в одной сессии
• Function calling для интеграции внешних сервисов
• RAG для работы с корпоративными данными
• Поддержка американского и британского английского
Практическое применение:
• Автоматизация контакт-центров
• Виртуальные туристические консультанты
• Образовательные приложения
• Игры с голосовым интерфейсом
• AI-ассистенты для работы с корпоративными дашбордами
Модель уже доступна через Amazon Bedrock в регионе US East (N. Virginia).
Для Python-разработчиков выпущен экспериментальный SDK для работы с бидирекциональным стримингом.
AWS явно в лидерах ИИ разработок. Не перестают удивлять, хотя о них и меньше "кричат", чем про OpenAI или Google.
Послушайте пример в прикрепе к посту.
#Amazon #Nova #Voice #AWS #sound
———
@tsingular
👍6⚡4❤1
Forwarded from Лаборатория ИИ
ИИ сам прочитает статьи на arXiv и расскажет, что важно
Больше не надо тратить часы на изучение научных публикаций. Просто спрашиваете — и получаете готовый обзор по теме с самыми свежими статьями.
Что за arXiv?
Это крупнейшая открытая база научных публикаций по физике, математике, компьютерным наукам и ИИ. Все топовые учёные и лаборатории публикуются там задолго до того, как статьи попадут в журналы.
Что умеет Deep Research:
• Отвечает на вопросы вроде: «Какие последние прорывы в fine-tuning моделей RL?»
• Находит релевантные статьи на arXiv
• Делает краткий и понятный обзор
• Показывает, какие темы сейчас на хайпе в научном сообществе
Кому полезно:
• ИИ-разработчикам
• Студентам и исследователям
• Всем, кто хочет быстро разобраться в теме без тонны pdf’ов
Как это выглядит:
Вы пишете:
“What are the latest breakthroughs in generative AI for biology?”
ИИ выдает вам подборку с краткими описаниями и ссылками. Всё по делу.
Попробовать здесь: https://www.alphaxiv.org/assistant
➕ @ai_rostov
Больше не надо тратить часы на изучение научных публикаций. Просто спрашиваете — и получаете готовый обзор по теме с самыми свежими статьями.
Что за arXiv?
Это крупнейшая открытая база научных публикаций по физике, математике, компьютерным наукам и ИИ. Все топовые учёные и лаборатории публикуются там задолго до того, как статьи попадут в журналы.
Что умеет Deep Research:
• Отвечает на вопросы вроде: «Какие последние прорывы в fine-tuning моделей RL?»
• Находит релевантные статьи на arXiv
• Делает краткий и понятный обзор
• Показывает, какие темы сейчас на хайпе в научном сообществе
Кому полезно:
• ИИ-разработчикам
• Студентам и исследователям
• Всем, кто хочет быстро разобраться в теме без тонны pdf’ов
Как это выглядит:
Вы пишете:
“What are the latest breakthroughs in generative AI for biology?”
ИИ выдает вам подборку с краткими описаниями и ссылками. Всё по делу.
Попробовать здесь: https://www.alphaxiv.org/assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
1😍7🔥5
🔥 Alibaba Cloud открывает AI-возможности для международных заказчиков
Alibaba Cloud на своём Spring Launch 2025 только что представила серию новостей.
Самое важное — компания открывает международный доступ к своим передовым AI-моделям и инфраструктуре через зоны доступности в Сингапуре.
Ключевые новинки:
🧠 Продвинутые модели для серьезных задач
• Qwen-Max — масштабная MoE-модель (Mixture of Experts)
• QwQ-Plus — специализированная модель рассуждений для аналитических задач
• QVQ-Max — модель визуального рассуждения с высокой точностью
• Qwen2.5-Omni-7b — комплексная мультимодальная модель для работы с текстом, изображениями, аудио и видео
⚡️ Технические усовершенствования PAI (Platform for AI)
• Распределенный inference с многоузловой архитектурой — решение ограничений традиционной одноузловой архитектуры
• Функция prefill-decode disaggregation — увеличивает параллельные вычисления на 92% и TPS (токенов в секунду) на 91% при работе с Qwen2.5-72B
• Доступ к почти 300 передовым open-source моделям, включая собственные серии Qwen и Wan
🔄 Интеграция с базами данных
• Встроенные AI-возможности в реляционную БД PolarDB — устраняет необходимость переноса данных и снижает задержки
• Интеграция хранилища AnalyticDB в Model Studio как рекомендуемой векторной БД для RAG-решений
🛠 Новые SaaS-инструменты на базе AI
• AI Doc — умная обработка документов на базе LLM для извлечения информации и создания отчетов по бизнес-требованиям
• Smart Studio — платформа для создания контента (text-to-image, image-to-image, text-to-video) с ориентацией на маркетинг и творческие отрасли
Практическое применение:
• Для разработчиков AI-продуктов: возможность работать с распределенными моделями и быстрее обрабатывать сверхбольшие контексты
• Для бизнес-аналитиков: интеграция AI прямо в базы данных = работа с данными без экспорта/импорта
• Для маркетологов: создание визуального контента с помощью AI без специальных навыков
Это часть глобальной стратегии — в феврале 2025 Alibaba Group объявила об инвестициях в $53 млрд (380 млрд юаней) в развитие облачной и AI-инфраструктуры на следующие три года.
Ну что, господа облачники, как вам новый глобальный игрок на рынке?
Готовимся корректировать цены или мигрировать? :)
#Alibaba #Китай
———
@tsingular
Alibaba Cloud на своём Spring Launch 2025 только что представила серию новостей.
Самое важное — компания открывает международный доступ к своим передовым AI-моделям и инфраструктуре через зоны доступности в Сингапуре.
Ключевые новинки:
🧠 Продвинутые модели для серьезных задач
• Qwen-Max — масштабная MoE-модель (Mixture of Experts)
• QwQ-Plus — специализированная модель рассуждений для аналитических задач
• QVQ-Max — модель визуального рассуждения с высокой точностью
• Qwen2.5-Omni-7b — комплексная мультимодальная модель для работы с текстом, изображениями, аудио и видео
⚡️ Технические усовершенствования PAI (Platform for AI)
• Распределенный inference с многоузловой архитектурой — решение ограничений традиционной одноузловой архитектуры
• Функция prefill-decode disaggregation — увеличивает параллельные вычисления на 92% и TPS (токенов в секунду) на 91% при работе с Qwen2.5-72B
• Доступ к почти 300 передовым open-source моделям, включая собственные серии Qwen и Wan
🔄 Интеграция с базами данных
• Встроенные AI-возможности в реляционную БД PolarDB — устраняет необходимость переноса данных и снижает задержки
• Интеграция хранилища AnalyticDB в Model Studio как рекомендуемой векторной БД для RAG-решений
🛠 Новые SaaS-инструменты на базе AI
• AI Doc — умная обработка документов на базе LLM для извлечения информации и создания отчетов по бизнес-требованиям
• Smart Studio — платформа для создания контента (text-to-image, image-to-image, text-to-video) с ориентацией на маркетинг и творческие отрасли
Практическое применение:
• Для разработчиков AI-продуктов: возможность работать с распределенными моделями и быстрее обрабатывать сверхбольшие контексты
• Для бизнес-аналитиков: интеграция AI прямо в базы данных = работа с данными без экспорта/импорта
• Для маркетологов: создание визуального контента с помощью AI без специальных навыков
Это часть глобальной стратегии — в феврале 2025 Alibaba Group объявила об инвестициях в $53 млрд (380 млрд юаней) в развитие облачной и AI-инфраструктуры на следующие три года.
Ну что, господа облачники, как вам новый глобальный игрок на рынке?
Готовимся корректировать цены или мигрировать? :)
#Alibaba #Китай
———
@tsingular
🔥8⚡4❤1🎃1
Forwarded from эйай ньюз
Вышел DeepCoder 14B Preview
Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.
За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.
Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.
А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.
И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!
Веса
Код
Датасет
@ai_newz
Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.
За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.
Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.
А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.
И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!
Веса
Код
Датасет
@ai_newz
🔥8⚡3
Китайские товарищи выкатили новую открытую модель для генерации картинок, которая обходит вообще всех.
Однако для запуска ее полной версии нужна карта под 80 гигов.
Больше деталей и продуктов от разработчиков тут:
https://vivago.ai/
Так как такая, пока, есть не в каждом доме, народ уже нарезал версию nf4
https://huggingface.co/azaneko/HiDream-I1-Dev-nf4
можно запускать на 16гигах видео памяти.
#HiDream #нейрорендер #Китай
———
@tsingular
Однако для запуска ее полной версии нужна карта под 80 гигов.
Больше деталей и продуктов от разработчиков тут:
https://vivago.ai/
Так как такая, пока, есть не в каждом доме, народ уже нарезал версию nf4
https://huggingface.co/azaneko/HiDream-I1-Dev-nf4
можно запускать на 16гигах видео памяти.
#HiDream #нейрорендер #Китай
———
@tsingular
🔥9👍3
🚀 Новые релизы MCP-серверов от: ElevenLabs и GitHub
🔊 ElevenLabs MCP Server
ElevenLabs запустил официальный MCP-сервер, обеспечивающий бесшовную интеграцию с передовыми API для обработки аудио:
Ключевые возможности:
• Text-to-Speech с человекоподобным звучанием
• Клонирование голосов с исключительной точностью
• Аудиотранскрипция с высокой степенью распознавания
• Идентификация говорящих в многоголосых записях
• Создание звуковых ландшафтов для игр, VR и кино
Совместимость:
Поддерживает интеграцию с различными MCP-клиентами:
• Claude Desktop (с включенным Developer Mode)
• Cursor
• Windsurf
• OpenAI Agents
Доступность:
• Бесплатный тариф с 10,000 кредитов в месяц
• Масштабируемые платные планы
💻 GitHub MCP Server
GitHub выпустил официальный MCP-сервер для программистов, открывающий доступ к API GitHub непосредственно из AI:
Ключевые инструменты:
• Управление репозиториями — создание, форк, поиск
• Работа с issues — создание, комментирование, обновление
• Управление PR — создание, просмотр, мердж, обновление
• Работа с файлами — создание, обновление, просмотр содержимого
• Code Scanning — доступ к алертам безопасности кода
Практическое применение:
• Автоматизация рабочих процессов GitHub • Анализ данных из репозиториев
• Создание AI-инструментов для экосистемы GitHub
Простая установка:
• Поддержка Docker для быстрого развертывания
• Интеграция с VS Code через простую конфигурацию
• Поддержка Claude Desktop
Больше MCP богу ИИ. В каждом софте будет по-умолчанию.
#MCP #ElevenLabs #GitHub
———
@tsingular
🔊 ElevenLabs MCP Server
ElevenLabs запустил официальный MCP-сервер, обеспечивающий бесшовную интеграцию с передовыми API для обработки аудио:
Ключевые возможности:
• Text-to-Speech с человекоподобным звучанием
• Клонирование голосов с исключительной точностью
• Аудиотранскрипция с высокой степенью распознавания
• Идентификация говорящих в многоголосых записях
• Создание звуковых ландшафтов для игр, VR и кино
Совместимость:
Поддерживает интеграцию с различными MCP-клиентами:
• Claude Desktop (с включенным Developer Mode)
• Cursor
• Windsurf
• OpenAI Agents
Доступность:
• Бесплатный тариф с 10,000 кредитов в месяц
• Масштабируемые платные планы
💻 GitHub MCP Server
GitHub выпустил официальный MCP-сервер для программистов, открывающий доступ к API GitHub непосредственно из AI:
Ключевые инструменты:
• Управление репозиториями — создание, форк, поиск
• Работа с issues — создание, комментирование, обновление
• Управление PR — создание, просмотр, мердж, обновление
• Работа с файлами — создание, обновление, просмотр содержимого
• Code Scanning — доступ к алертам безопасности кода
Практическое применение:
• Автоматизация рабочих процессов GitHub • Анализ данных из репозиториев
• Создание AI-инструментов для экосистемы GitHub
Простая установка:
• Поддержка Docker для быстрого развертывания
• Интеграция с VS Code через простую конфигурацию
• Поддержка Claude Desktop
Больше MCP богу ИИ. В каждом софте будет по-умолчанию.
#MCP #ElevenLabs #GitHub
———
@tsingular
🔥7❤1
Forwarded from LLM под капотом
Google: Agent2Agent Protocol (A2A)
Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово.
Назвали его A2A (Agent2Agent). Это открытый стандарт для обмена информацией между ИИ-агентами, работающими в разных системах. Он использует технологии HTTP, SSE и JSON-RPC для упрощения интеграции в существующую инфраструктуру.
Основные моменты:
(1) Dynamic Capability Discovery - агенты обмениваются данными через JSON-Agent Card, что позволяет выбирать подходящего исполнителя задачи.
(2) Task-Centric Communication - протокол работает с задачами, у которых есть свой жизненный цикл. A2A поддерживает как быстрые операции, так и долгосрочные процессы с обратной связью и уведомлениями.
(3) Security (за что критиковали MCP) - продуманы средства аутентификации и авторизации для защиты данных.
(4) Мультимодальность - обмен информацией в виде текста, аудио или видео.
В теории, общее назначение A2A - упростить автоматизацию и интеграцию процессов в корпоративных системах. Однако на HN люди уже высказывались насчет сложности протокола и его влияния на контроль над данными. Мол, нагородили всякого, лишь бы рынок отжевать.
Мне кажется, с такой компанией оно может и взлететь. Но из-за сложности и непредсказуемости систем лететь будет так себе.
Почитать доки можно тут.
Ваш, @llm_under_hood 🤗
Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово.
Назвали его A2A (Agent2Agent). Это открытый стандарт для обмена информацией между ИИ-агентами, работающими в разных системах. Он использует технологии HTTP, SSE и JSON-RPC для упрощения интеграции в существующую инфраструктуру.
Основные моменты:
(1) Dynamic Capability Discovery - агенты обмениваются данными через JSON-Agent Card, что позволяет выбирать подходящего исполнителя задачи.
(2) Task-Centric Communication - протокол работает с задачами, у которых есть свой жизненный цикл. A2A поддерживает как быстрые операции, так и долгосрочные процессы с обратной связью и уведомлениями.
(3) Security (за что критиковали MCP) - продуманы средства аутентификации и авторизации для защиты данных.
(4) Мультимодальность - обмен информацией в виде текста, аудио или видео.
В теории, общее назначение A2A - упростить автоматизацию и интеграцию процессов в корпоративных системах. Однако на HN люди уже высказывались насчет сложности протокола и его влияния на контроль над данными. Мол, нагородили всякого, лишь бы рынок отжевать.
Мне кажется, с такой компанией оно может и взлететь. Но из-за сложности и непредсказуемости систем лететь будет так себе.
Почитать доки можно тут.
Ваш, @llm_under_hood 🤗
🆒4🔥1
Forwarded from Machinelearning
Deep Cogito выпустила семейство языковых моделей размером 3B, 8B, 14B, 32B и 70B параметров, которые уже доступны для загрузки.
По заявлению разработчиков, их модели превосходят аналогичные открытые решения от LLaMA, DeepSeek и Qwen в большинстве стандартных бенчмарков. Например, 70B-версия обходит новую 109B MoE-модель Llama 4, несмотря на меньший размер.
Все модели обучены с помощью метода Iterated Distillation and Amplification (IDA) — стратегии, которая сочетает итеративное самоулучшение и «сжатие» интеллекта для преодоления ограничений, накладываемых человеческим контролем.
Суть IDA проста: сначала модель «усиливает» свои способности, тратя больше вычислительных ресурсов на поиск решений через CoT, а затем «дистиллирует» эти улучшения в свои параметры. Такой цикл повторяется, создавая петлю обратной связи — каждая итерация делает модель умнее, а её мышление эффективнее. По словам команды, этот подход не только масштабируем, но и быстрее, чем RLHF.
Семейство поддерживает 2 режима работы: стандартный (прямой ответ) и «рефлексивный», где система сначала обдумывает запрос, как это реализовано в Claude 3.7. Они оптимизированы для программирования, вызова функций и агентских сценариев, но без акцента на CoT — разработчики считают, что короткие шаги эффективнее в реальных задачах.
Уже в ближайшие месяцы ожидаются версии на 109B, 400B и 671B параметров и вариации с MoE-архитектурой.
Модели доступны на Hugging Face, Ollama и через API Fireworks AI/Together AI.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Media is too big
VIEW IN TELEGRAM
Adobe активно развивает агентные AI-системы для всех своих продуктов
Adobe делает стратегическую ставку на агентный искусственный интеллект, внедряя эту технологию во все ключевые продукты — от Acrobat и Express до профессиональных инструментов Creative Cloud.
Техническая основа и стратегия
В Adobe подход к агентному ИИ прозрачен: лучшее использование искусственного интеллекта — дать людям больше контроля и освободить их время для работы, которую они любят, будь то творчество, анализ или совместная работа.
Компания последовательно расширяет возможности ИИ, начав с генеративных моделей Firefly и теперь переходя к более сложным агентным системам.
Технический фундамент для агентных систем Adobe — новая платформа Adobe Experience Platform Agent Orchestrator, которая позволяет объединять и координировать работу AI-агентов, как собственных от Adobe, так и от сторонних разработчиков.
Платформа обеспечивает:
- Семантическое понимание корпоративных данных
- Интеграцию с рабочими процессами маркетинга
- Встроенную систему управления данными и соответствие регуляторным требованиям
Продукты с агентными возможностями
Adobe активно интегрирует агентные технологии во все свои ключевые продукты:
1. Adobe Acrobat — исследовательские агенты для анализа документов, подготовки к встречам, академические помощники для студентов.
2. Adobe Express — агенты, действующие как творческие партнеры на всех этапах создания контента.
3. Photoshop — агенты для анализа изображений и автоматизации рутинных задач.
4. Premiere Pro — агенты, анализирующие содержимое видеоклипов и помогающие с монтажом.
Практическое применение
Представленные агенты решают реальные бизнес-задачи:
Site Optimization Agent — анализирует производительность сайта в реальном времени, выявляет проблемы и предлагает решения одним кликом.
Account Qualification Agent — помогает B2B-командам оценивать новые возможности и вовлекать ключевых лиц, принимающих решения.
Content Production Agent — генерирует контент на основе брифа, соблюдая фирменные стандарты и брендбук.
Audience Agent — анализирует данные о взаимодействии с аудиторией и оптимизирует сегментацию.
Интеграция с Microsoft и экосистемой
Adobe также объявила о расширении сотрудничества с Microsoft, включая интеграцию Adobe Marketing Agent в Microsoft 365 Copilot. Это позволит маркетологам использовать возможности Adobe прямо в привычном рабочем процессе через Microsoft Teams, PowerPoint и Word.
Что это означает для пользователей
По мнению Adobe, агентный ИИ станет мощным "умножителем сил" для творческих профессионалов.
Изучая обратную связь, адаптируясь к изменениям и проактивно предлагая идеи для более быстрой реализации, интеллектуальные агенты имеют огромный потенциал для ускорения творческой работы.
Для обычных пользователей агентный ИИ в продуктах Adobe означает:
- Более интуитивные интерфейсы
- Автоматизацию рутинных задач
- Персонализированные рекомендации и подсказки
- Ускорение рабочего процесса без необходимости изучать все аспекты сложных инструментов
Перспективы развития
Adobe позиционирует себя на переднем крае "третьей фазы" революции ИИ — после описательного и генеративного ИИ наступает эра агентного ИИ.
Этот этап характеризуется значительным повышением интерактивности и способностей к рассуждению у ИИ-моделей. Главное отличие — агенты могут не только давать рекомендации, но и самостоятельно выполнять действия в различных системах.
Интересно, как быстро творческие ИИ агенты превратят в творящих ИИ агентов (перейдут из цифрового мира в физический), исключив лишнее звено из цепочки производства.
#Adobe #Acrobat #Express #Photoshop #Premier
———
@tsingular
Adobe делает стратегическую ставку на агентный искусственный интеллект, внедряя эту технологию во все ключевые продукты — от Acrobat и Express до профессиональных инструментов Creative Cloud.
Техническая основа и стратегия
В Adobe подход к агентному ИИ прозрачен: лучшее использование искусственного интеллекта — дать людям больше контроля и освободить их время для работы, которую они любят, будь то творчество, анализ или совместная работа.
Компания последовательно расширяет возможности ИИ, начав с генеративных моделей Firefly и теперь переходя к более сложным агентным системам.
Технический фундамент для агентных систем Adobe — новая платформа Adobe Experience Platform Agent Orchestrator, которая позволяет объединять и координировать работу AI-агентов, как собственных от Adobe, так и от сторонних разработчиков.
Платформа обеспечивает:
- Семантическое понимание корпоративных данных
- Интеграцию с рабочими процессами маркетинга
- Встроенную систему управления данными и соответствие регуляторным требованиям
Продукты с агентными возможностями
Adobe активно интегрирует агентные технологии во все свои ключевые продукты:
1. Adobe Acrobat — исследовательские агенты для анализа документов, подготовки к встречам, академические помощники для студентов.
2. Adobe Express — агенты, действующие как творческие партнеры на всех этапах создания контента.
3. Photoshop — агенты для анализа изображений и автоматизации рутинных задач.
4. Premiere Pro — агенты, анализирующие содержимое видеоклипов и помогающие с монтажом.
Практическое применение
Представленные агенты решают реальные бизнес-задачи:
Site Optimization Agent — анализирует производительность сайта в реальном времени, выявляет проблемы и предлагает решения одним кликом.
Account Qualification Agent — помогает B2B-командам оценивать новые возможности и вовлекать ключевых лиц, принимающих решения.
Content Production Agent — генерирует контент на основе брифа, соблюдая фирменные стандарты и брендбук.
Audience Agent — анализирует данные о взаимодействии с аудиторией и оптимизирует сегментацию.
Интеграция с Microsoft и экосистемой
Adobe также объявила о расширении сотрудничества с Microsoft, включая интеграцию Adobe Marketing Agent в Microsoft 365 Copilot. Это позволит маркетологам использовать возможности Adobe прямо в привычном рабочем процессе через Microsoft Teams, PowerPoint и Word.
Что это означает для пользователей
По мнению Adobe, агентный ИИ станет мощным "умножителем сил" для творческих профессионалов.
Изучая обратную связь, адаптируясь к изменениям и проактивно предлагая идеи для более быстрой реализации, интеллектуальные агенты имеют огромный потенциал для ускорения творческой работы.
Для обычных пользователей агентный ИИ в продуктах Adobe означает:
- Более интуитивные интерфейсы
- Автоматизацию рутинных задач
- Персонализированные рекомендации и подсказки
- Ускорение рабочего процесса без необходимости изучать все аспекты сложных инструментов
Перспективы развития
Adobe позиционирует себя на переднем крае "третьей фазы" революции ИИ — после описательного и генеративного ИИ наступает эра агентного ИИ.
Этот этап характеризуется значительным повышением интерактивности и способностей к рассуждению у ИИ-моделей. Главное отличие — агенты могут не только давать рекомендации, но и самостоятельно выполнять действия в различных системах.
Интересно, как быстро творческие ИИ агенты превратят в творящих ИИ агентов (перейдут из цифрового мира в физический), исключив лишнее звено из цепочки производства.
#Adobe #Acrobat #Express #Photoshop #Premier
———
@tsingular
👍7⚡1🔥1👀1
🔥 Anthropic запускает Claude Max за $200: Битва за премиум-сегмент AI-рынка
Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.
Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.
📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.
Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.
📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)
Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате
Google (Gemini)
Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google
Anthropic (Claude)
Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены
Perplexity AI
Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд
💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).
Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.
Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.
Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.
#tariffwar #anthropic #claude
———
@tsingular
Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.
Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.
📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.
Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.
📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)
Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате
Google (Gemini)
Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google
Anthropic (Claude)
Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены
Perplexity AI
Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд
💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).
Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.
Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.
Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.
#tariffwar #anthropic #claude
———
@tsingular
✍6👍3⚡1