Forwarded from Machinelearning
Sakana AI впервые провела реальный эксперимент: три научные статьи, полностью сгенерированные ИИ (The AI Scientist-v2), были отправлены на слепое рецензирование на ICLR Workshop 2025.
Одна из них получила баллы выше среднего уровня принятия — лучше многих статей, написанных людьми. Это исторический момент в научной публикационной практике.
Статьи были на 100% созданы AI — от идеи до финального форматирования и списка литературы.
Человек не правил ни одного слова: только выбрал тему и три лучшие статьи из набора, сгенерированного AI.
В ICLR Workshop было отправлено 3 статьи из 43 (≈7%) — рецензенты знали, что среди них есть AI-работы, но не знали, какие именно.
- 2 статьи были отклонены.
- 1 статья прошла, получив баллы:
Средняя оценка статьи: 6.33 — это выше, чем у многих человеческих работ, принятых на воркшоп.
— Придумывает научные идеи
— Пишет и запускает код для экспериментов
— Анализирует результаты, строит графики
— Сама пишет статью в научном формате
— И… сама себя рецензирует
@ai_machinelearning_big_data
#ai #ml #Sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9⚡3✍1🤔1
🔍 Gemini Deep Research - теперь в Gemini 2.5 Pro
Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.
Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.
Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)
Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений
Имейте в виду — функция доступна только подписчикам Gemini Advanced.
Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.
#Gemini #DeepResearch #агенты #Google
———
@tsingular
Полезность тут не только в том, что режим Исследователя теперь работает с ведущей по "разуму" модели, но и в том, что у нее, напомню, 1М контекстное окно.
Технически это означает, что AI может одновременно удерживать и анализировать в "памяти" несколько десятков веб-страниц.
Т.е. потенциально из всех "исследователей" Gemini теперь лучше всех весь этот контекст переработает, не упустив важных деталей.
Техническая начинка:
• Многоступенчатый план исследования (который можно редактировать!)
• Самостоятельное уточнение поисковых запросов на основе найденной информации
• Автоматическое цитирование источников с реальными гиперссылками
• Возможность экспорта в Google Docs одним кликом
• Audio Overviews — конвертация отчёта в аудиоформат (пригодится в дороге)
Практическое применение:
• Стартапам: сбор данных о рынке и конкурентах без найма аналитика
• Продакт-менеджерам: исследование трендов для планирования фич на 2025
• Инвесторам: быстрый сбор информации по нишам/компаниям перед принятием решений
Имейте в виду — функция доступна только подписчикам Gemini Advanced.
Но если считать, сколько часов рабочего времени она экономит, подписка окупается за пару запусков.
#Gemini #DeepResearch #агенты #Google
———
@tsingular
👍5🔥4⚡2
AI agent for travel built on Amazon Nova Sonic
About Amazon
🔊 Amazon Nova Sonic: Революция в голосовом AI — понимает не только ЧТО, но и КАК вы говорите
Amazon запустил новую модель Nova Sonic — первый фундаментальный AI, который объединяет распознавание и генерацию речи в единой архитектуре, делая голосовое взаимодействие по-настоящему человечным.
Ключевые возможности:
• Единая модель (не разрозненные ASR+LLM+TTS)
• Понимание тона, интонации и темпа речи
• Адаптация ответа под эмоциональный контекст
• Естественные паузы и умение "не перебивать"
• Корректная обработка прерываний разговора
Техническая начинка:
• Двунаправленный streaming API через HTTP/2
• Контекстное окно в 32K токенов
• До 8 минут в одной сессии
• Function calling для интеграции внешних сервисов
• RAG для работы с корпоративными данными
• Поддержка американского и британского английского
Практическое применение:
• Автоматизация контакт-центров
• Виртуальные туристические консультанты
• Образовательные приложения
• Игры с голосовым интерфейсом
• AI-ассистенты для работы с корпоративными дашбордами
Модель уже доступна через Amazon Bedrock в регионе US East (N. Virginia).
Для Python-разработчиков выпущен экспериментальный SDK для работы с бидирекциональным стримингом.
AWS явно в лидерах ИИ разработок. Не перестают удивлять, хотя о них и меньше "кричат", чем про OpenAI или Google.
Послушайте пример в прикрепе к посту.
#Amazon #Nova #Voice #AWS #sound
———
@tsingular
Amazon запустил новую модель Nova Sonic — первый фундаментальный AI, который объединяет распознавание и генерацию речи в единой архитектуре, делая голосовое взаимодействие по-настоящему человечным.
Ключевые возможности:
• Единая модель (не разрозненные ASR+LLM+TTS)
• Понимание тона, интонации и темпа речи
• Адаптация ответа под эмоциональный контекст
• Естественные паузы и умение "не перебивать"
• Корректная обработка прерываний разговора
Техническая начинка:
• Двунаправленный streaming API через HTTP/2
• Контекстное окно в 32K токенов
• До 8 минут в одной сессии
• Function calling для интеграции внешних сервисов
• RAG для работы с корпоративными данными
• Поддержка американского и британского английского
Практическое применение:
• Автоматизация контакт-центров
• Виртуальные туристические консультанты
• Образовательные приложения
• Игры с голосовым интерфейсом
• AI-ассистенты для работы с корпоративными дашбордами
Модель уже доступна через Amazon Bedrock в регионе US East (N. Virginia).
Для Python-разработчиков выпущен экспериментальный SDK для работы с бидирекциональным стримингом.
AWS явно в лидерах ИИ разработок. Не перестают удивлять, хотя о них и меньше "кричат", чем про OpenAI или Google.
Послушайте пример в прикрепе к посту.
#Amazon #Nova #Voice #AWS #sound
———
@tsingular
👍6⚡4❤1
Forwarded from Лаборатория ИИ
ИИ сам прочитает статьи на arXiv и расскажет, что важно
Больше не надо тратить часы на изучение научных публикаций. Просто спрашиваете — и получаете готовый обзор по теме с самыми свежими статьями.
Что за arXiv?
Это крупнейшая открытая база научных публикаций по физике, математике, компьютерным наукам и ИИ. Все топовые учёные и лаборатории публикуются там задолго до того, как статьи попадут в журналы.
Что умеет Deep Research:
• Отвечает на вопросы вроде: «Какие последние прорывы в fine-tuning моделей RL?»
• Находит релевантные статьи на arXiv
• Делает краткий и понятный обзор
• Показывает, какие темы сейчас на хайпе в научном сообществе
Кому полезно:
• ИИ-разработчикам
• Студентам и исследователям
• Всем, кто хочет быстро разобраться в теме без тонны pdf’ов
Как это выглядит:
Вы пишете:
“What are the latest breakthroughs in generative AI for biology?”
ИИ выдает вам подборку с краткими описаниями и ссылками. Всё по делу.
Попробовать здесь: https://www.alphaxiv.org/assistant
➕ @ai_rostov
Больше не надо тратить часы на изучение научных публикаций. Просто спрашиваете — и получаете готовый обзор по теме с самыми свежими статьями.
Что за arXiv?
Это крупнейшая открытая база научных публикаций по физике, математике, компьютерным наукам и ИИ. Все топовые учёные и лаборатории публикуются там задолго до того, как статьи попадут в журналы.
Что умеет Deep Research:
• Отвечает на вопросы вроде: «Какие последние прорывы в fine-tuning моделей RL?»
• Находит релевантные статьи на arXiv
• Делает краткий и понятный обзор
• Показывает, какие темы сейчас на хайпе в научном сообществе
Кому полезно:
• ИИ-разработчикам
• Студентам и исследователям
• Всем, кто хочет быстро разобраться в теме без тонны pdf’ов
Как это выглядит:
Вы пишете:
“What are the latest breakthroughs in generative AI for biology?”
ИИ выдает вам подборку с краткими описаниями и ссылками. Всё по делу.
Попробовать здесь: https://www.alphaxiv.org/assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
1😍7🔥5
🔥 Alibaba Cloud открывает AI-возможности для международных заказчиков
Alibaba Cloud на своём Spring Launch 2025 только что представила серию новостей.
Самое важное — компания открывает международный доступ к своим передовым AI-моделям и инфраструктуре через зоны доступности в Сингапуре.
Ключевые новинки:
🧠 Продвинутые модели для серьезных задач
• Qwen-Max — масштабная MoE-модель (Mixture of Experts)
• QwQ-Plus — специализированная модель рассуждений для аналитических задач
• QVQ-Max — модель визуального рассуждения с высокой точностью
• Qwen2.5-Omni-7b — комплексная мультимодальная модель для работы с текстом, изображениями, аудио и видео
⚡️ Технические усовершенствования PAI (Platform for AI)
• Распределенный inference с многоузловой архитектурой — решение ограничений традиционной одноузловой архитектуры
• Функция prefill-decode disaggregation — увеличивает параллельные вычисления на 92% и TPS (токенов в секунду) на 91% при работе с Qwen2.5-72B
• Доступ к почти 300 передовым open-source моделям, включая собственные серии Qwen и Wan
🔄 Интеграция с базами данных
• Встроенные AI-возможности в реляционную БД PolarDB — устраняет необходимость переноса данных и снижает задержки
• Интеграция хранилища AnalyticDB в Model Studio как рекомендуемой векторной БД для RAG-решений
🛠 Новые SaaS-инструменты на базе AI
• AI Doc — умная обработка документов на базе LLM для извлечения информации и создания отчетов по бизнес-требованиям
• Smart Studio — платформа для создания контента (text-to-image, image-to-image, text-to-video) с ориентацией на маркетинг и творческие отрасли
Практическое применение:
• Для разработчиков AI-продуктов: возможность работать с распределенными моделями и быстрее обрабатывать сверхбольшие контексты
• Для бизнес-аналитиков: интеграция AI прямо в базы данных = работа с данными без экспорта/импорта
• Для маркетологов: создание визуального контента с помощью AI без специальных навыков
Это часть глобальной стратегии — в феврале 2025 Alibaba Group объявила об инвестициях в $53 млрд (380 млрд юаней) в развитие облачной и AI-инфраструктуры на следующие три года.
Ну что, господа облачники, как вам новый глобальный игрок на рынке?
Готовимся корректировать цены или мигрировать? :)
#Alibaba #Китай
———
@tsingular
Alibaba Cloud на своём Spring Launch 2025 только что представила серию новостей.
Самое важное — компания открывает международный доступ к своим передовым AI-моделям и инфраструктуре через зоны доступности в Сингапуре.
Ключевые новинки:
🧠 Продвинутые модели для серьезных задач
• Qwen-Max — масштабная MoE-модель (Mixture of Experts)
• QwQ-Plus — специализированная модель рассуждений для аналитических задач
• QVQ-Max — модель визуального рассуждения с высокой точностью
• Qwen2.5-Omni-7b — комплексная мультимодальная модель для работы с текстом, изображениями, аудио и видео
⚡️ Технические усовершенствования PAI (Platform for AI)
• Распределенный inference с многоузловой архитектурой — решение ограничений традиционной одноузловой архитектуры
• Функция prefill-decode disaggregation — увеличивает параллельные вычисления на 92% и TPS (токенов в секунду) на 91% при работе с Qwen2.5-72B
• Доступ к почти 300 передовым open-source моделям, включая собственные серии Qwen и Wan
🔄 Интеграция с базами данных
• Встроенные AI-возможности в реляционную БД PolarDB — устраняет необходимость переноса данных и снижает задержки
• Интеграция хранилища AnalyticDB в Model Studio как рекомендуемой векторной БД для RAG-решений
🛠 Новые SaaS-инструменты на базе AI
• AI Doc — умная обработка документов на базе LLM для извлечения информации и создания отчетов по бизнес-требованиям
• Smart Studio — платформа для создания контента (text-to-image, image-to-image, text-to-video) с ориентацией на маркетинг и творческие отрасли
Практическое применение:
• Для разработчиков AI-продуктов: возможность работать с распределенными моделями и быстрее обрабатывать сверхбольшие контексты
• Для бизнес-аналитиков: интеграция AI прямо в базы данных = работа с данными без экспорта/импорта
• Для маркетологов: создание визуального контента с помощью AI без специальных навыков
Это часть глобальной стратегии — в феврале 2025 Alibaba Group объявила об инвестициях в $53 млрд (380 млрд юаней) в развитие облачной и AI-инфраструктуры на следующие три года.
Ну что, господа облачники, как вам новый глобальный игрок на рынке?
Готовимся корректировать цены или мигрировать? :)
#Alibaba #Китай
———
@tsingular
🔥8⚡4❤1🎃1
Forwarded from эйай ньюз
Вышел DeepCoder 14B Preview
Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.
За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.
Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.
А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.
И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!
Веса
Код
Датасет
@ai_newz
Новый ризонер специально для кода, лидирующий в 14B весовой категории и догоняющий o3-mini и o1, когда они обе на low настройках. Неприятный звоночек — модель не сравнивают с QwQ 32B, основным конкурентом этой модели, а с моделями OpenAI сравнивают только на low настройках. Причём непонятно почему — результаты достойные, даже o3-mini (low) обойти это непросто.
За основу взят DeepSeek R1 Distill 14B, поверх которого запустили RL на 24к задач для кодинга. Это сильно бампануло качество кодинга по сравнению с бейзлайном, при этом случайно улучшив результаты на математике.
Сделали эту модель в колабе с Together AI, это один из клауд провайдеров заточенных специально на ИИ. Я уже писал пару лет назад об их датасете RedPajama, воспроизводящем датасет оригинальной Llama.
А вот самая лучшая часть — авторы опубликовали не только веса, но и код с датасетом. Всё это можно прямо сейчас скачать с 🤗 и гитхаба.
И мы все ближе к маленьким и умелым моделькам, которые можно запускать локально (а 14B можно запускать и на обычном железе) и которые могут заменить проприетарные модели. На этот раз в кодинге. Не устану повторять, что опен сорс – это круто!
Веса
Код
Датасет
@ai_newz
🔥8⚡3
Китайские товарищи выкатили новую открытую модель для генерации картинок, которая обходит вообще всех.
Однако для запуска ее полной версии нужна карта под 80 гигов.
Больше деталей и продуктов от разработчиков тут:
https://vivago.ai/
Так как такая, пока, есть не в каждом доме, народ уже нарезал версию nf4
https://huggingface.co/azaneko/HiDream-I1-Dev-nf4
можно запускать на 16гигах видео памяти.
#HiDream #нейрорендер #Китай
———
@tsingular
Однако для запуска ее полной версии нужна карта под 80 гигов.
Больше деталей и продуктов от разработчиков тут:
https://vivago.ai/
Так как такая, пока, есть не в каждом доме, народ уже нарезал версию nf4
https://huggingface.co/azaneko/HiDream-I1-Dev-nf4
можно запускать на 16гигах видео памяти.
#HiDream #нейрорендер #Китай
———
@tsingular
🔥9👍3
🚀 Новые релизы MCP-серверов от: ElevenLabs и GitHub
🔊 ElevenLabs MCP Server
ElevenLabs запустил официальный MCP-сервер, обеспечивающий бесшовную интеграцию с передовыми API для обработки аудио:
Ключевые возможности:
• Text-to-Speech с человекоподобным звучанием
• Клонирование голосов с исключительной точностью
• Аудиотранскрипция с высокой степенью распознавания
• Идентификация говорящих в многоголосых записях
• Создание звуковых ландшафтов для игр, VR и кино
Совместимость:
Поддерживает интеграцию с различными MCP-клиентами:
• Claude Desktop (с включенным Developer Mode)
• Cursor
• Windsurf
• OpenAI Agents
Доступность:
• Бесплатный тариф с 10,000 кредитов в месяц
• Масштабируемые платные планы
💻 GitHub MCP Server
GitHub выпустил официальный MCP-сервер для программистов, открывающий доступ к API GitHub непосредственно из AI:
Ключевые инструменты:
• Управление репозиториями — создание, форк, поиск
• Работа с issues — создание, комментирование, обновление
• Управление PR — создание, просмотр, мердж, обновление
• Работа с файлами — создание, обновление, просмотр содержимого
• Code Scanning — доступ к алертам безопасности кода
Практическое применение:
• Автоматизация рабочих процессов GitHub • Анализ данных из репозиториев
• Создание AI-инструментов для экосистемы GitHub
Простая установка:
• Поддержка Docker для быстрого развертывания
• Интеграция с VS Code через простую конфигурацию
• Поддержка Claude Desktop
Больше MCP богу ИИ. В каждом софте будет по-умолчанию.
#MCP #ElevenLabs #GitHub
———
@tsingular
🔊 ElevenLabs MCP Server
ElevenLabs запустил официальный MCP-сервер, обеспечивающий бесшовную интеграцию с передовыми API для обработки аудио:
Ключевые возможности:
• Text-to-Speech с человекоподобным звучанием
• Клонирование голосов с исключительной точностью
• Аудиотранскрипция с высокой степенью распознавания
• Идентификация говорящих в многоголосых записях
• Создание звуковых ландшафтов для игр, VR и кино
Совместимость:
Поддерживает интеграцию с различными MCP-клиентами:
• Claude Desktop (с включенным Developer Mode)
• Cursor
• Windsurf
• OpenAI Agents
Доступность:
• Бесплатный тариф с 10,000 кредитов в месяц
• Масштабируемые платные планы
💻 GitHub MCP Server
GitHub выпустил официальный MCP-сервер для программистов, открывающий доступ к API GitHub непосредственно из AI:
Ключевые инструменты:
• Управление репозиториями — создание, форк, поиск
• Работа с issues — создание, комментирование, обновление
• Управление PR — создание, просмотр, мердж, обновление
• Работа с файлами — создание, обновление, просмотр содержимого
• Code Scanning — доступ к алертам безопасности кода
Практическое применение:
• Автоматизация рабочих процессов GitHub • Анализ данных из репозиториев
• Создание AI-инструментов для экосистемы GitHub
Простая установка:
• Поддержка Docker для быстрого развертывания
• Интеграция с VS Code через простую конфигурацию
• Поддержка Claude Desktop
Больше MCP богу ИИ. В каждом софте будет по-умолчанию.
#MCP #ElevenLabs #GitHub
———
@tsingular
🔥7❤1
Forwarded from LLM под капотом
Google: Agent2Agent Protocol (A2A)
Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово.
Назвали его A2A (Agent2Agent). Это открытый стандарт для обмена информацией между ИИ-агентами, работающими в разных системах. Он использует технологии HTTP, SSE и JSON-RPC для упрощения интеграции в существующую инфраструктуру.
Основные моменты:
(1) Dynamic Capability Discovery - агенты обмениваются данными через JSON-Agent Card, что позволяет выбирать подходящего исполнителя задачи.
(2) Task-Centric Communication - протокол работает с задачами, у которых есть свой жизненный цикл. A2A поддерживает как быстрые операции, так и долгосрочные процессы с обратной связью и уведомлениями.
(3) Security (за что критиковали MCP) - продуманы средства аутентификации и авторизации для защиты данных.
(4) Мультимодальность - обмен информацией в виде текста, аудио или видео.
В теории, общее назначение A2A - упростить автоматизацию и интеграцию процессов в корпоративных системах. Однако на HN люди уже высказывались насчет сложности протокола и его влияния на контроль над данными. Мол, нагородили всякого, лишь бы рынок отжевать.
Мне кажется, с такой компанией оно может и взлететь. Но из-за сложности и непредсказуемости систем лететь будет так себе.
Почитать доки можно тут.
Ваш, @llm_under_hood 🤗
Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово.
Назвали его A2A (Agent2Agent). Это открытый стандарт для обмена информацией между ИИ-агентами, работающими в разных системах. Он использует технологии HTTP, SSE и JSON-RPC для упрощения интеграции в существующую инфраструктуру.
Основные моменты:
(1) Dynamic Capability Discovery - агенты обмениваются данными через JSON-Agent Card, что позволяет выбирать подходящего исполнителя задачи.
(2) Task-Centric Communication - протокол работает с задачами, у которых есть свой жизненный цикл. A2A поддерживает как быстрые операции, так и долгосрочные процессы с обратной связью и уведомлениями.
(3) Security (за что критиковали MCP) - продуманы средства аутентификации и авторизации для защиты данных.
(4) Мультимодальность - обмен информацией в виде текста, аудио или видео.
В теории, общее назначение A2A - упростить автоматизацию и интеграцию процессов в корпоративных системах. Однако на HN люди уже высказывались насчет сложности протокола и его влияния на контроль над данными. Мол, нагородили всякого, лишь бы рынок отжевать.
Мне кажется, с такой компанией оно может и взлететь. Но из-за сложности и непредсказуемости систем лететь будет так себе.
Почитать доки можно тут.
Ваш, @llm_under_hood 🤗
🆒4🔥1
Forwarded from Machinelearning
Deep Cogito выпустила семейство языковых моделей размером 3B, 8B, 14B, 32B и 70B параметров, которые уже доступны для загрузки.
По заявлению разработчиков, их модели превосходят аналогичные открытые решения от LLaMA, DeepSeek и Qwen в большинстве стандартных бенчмарков. Например, 70B-версия обходит новую 109B MoE-модель Llama 4, несмотря на меньший размер.
Все модели обучены с помощью метода Iterated Distillation and Amplification (IDA) — стратегии, которая сочетает итеративное самоулучшение и «сжатие» интеллекта для преодоления ограничений, накладываемых человеческим контролем.
Суть IDA проста: сначала модель «усиливает» свои способности, тратя больше вычислительных ресурсов на поиск решений через CoT, а затем «дистиллирует» эти улучшения в свои параметры. Такой цикл повторяется, создавая петлю обратной связи — каждая итерация делает модель умнее, а её мышление эффективнее. По словам команды, этот подход не только масштабируем, но и быстрее, чем RLHF.
Семейство поддерживает 2 режима работы: стандартный (прямой ответ) и «рефлексивный», где система сначала обдумывает запрос, как это реализовано в Claude 3.7. Они оптимизированы для программирования, вызова функций и агентских сценариев, но без акцента на CoT — разработчики считают, что короткие шаги эффективнее в реальных задачах.
Уже в ближайшие месяцы ожидаются версии на 109B, 400B и 671B параметров и вариации с MoE-архитектурой.
Модели доступны на Hugging Face, Ollama и через API Fireworks AI/Together AI.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Media is too big
VIEW IN TELEGRAM
Adobe активно развивает агентные AI-системы для всех своих продуктов
Adobe делает стратегическую ставку на агентный искусственный интеллект, внедряя эту технологию во все ключевые продукты — от Acrobat и Express до профессиональных инструментов Creative Cloud.
Техническая основа и стратегия
В Adobe подход к агентному ИИ прозрачен: лучшее использование искусственного интеллекта — дать людям больше контроля и освободить их время для работы, которую они любят, будь то творчество, анализ или совместная работа.
Компания последовательно расширяет возможности ИИ, начав с генеративных моделей Firefly и теперь переходя к более сложным агентным системам.
Технический фундамент для агентных систем Adobe — новая платформа Adobe Experience Platform Agent Orchestrator, которая позволяет объединять и координировать работу AI-агентов, как собственных от Adobe, так и от сторонних разработчиков.
Платформа обеспечивает:
- Семантическое понимание корпоративных данных
- Интеграцию с рабочими процессами маркетинга
- Встроенную систему управления данными и соответствие регуляторным требованиям
Продукты с агентными возможностями
Adobe активно интегрирует агентные технологии во все свои ключевые продукты:
1. Adobe Acrobat — исследовательские агенты для анализа документов, подготовки к встречам, академические помощники для студентов.
2. Adobe Express — агенты, действующие как творческие партнеры на всех этапах создания контента.
3. Photoshop — агенты для анализа изображений и автоматизации рутинных задач.
4. Premiere Pro — агенты, анализирующие содержимое видеоклипов и помогающие с монтажом.
Практическое применение
Представленные агенты решают реальные бизнес-задачи:
Site Optimization Agent — анализирует производительность сайта в реальном времени, выявляет проблемы и предлагает решения одним кликом.
Account Qualification Agent — помогает B2B-командам оценивать новые возможности и вовлекать ключевых лиц, принимающих решения.
Content Production Agent — генерирует контент на основе брифа, соблюдая фирменные стандарты и брендбук.
Audience Agent — анализирует данные о взаимодействии с аудиторией и оптимизирует сегментацию.
Интеграция с Microsoft и экосистемой
Adobe также объявила о расширении сотрудничества с Microsoft, включая интеграцию Adobe Marketing Agent в Microsoft 365 Copilot. Это позволит маркетологам использовать возможности Adobe прямо в привычном рабочем процессе через Microsoft Teams, PowerPoint и Word.
Что это означает для пользователей
По мнению Adobe, агентный ИИ станет мощным "умножителем сил" для творческих профессионалов.
Изучая обратную связь, адаптируясь к изменениям и проактивно предлагая идеи для более быстрой реализации, интеллектуальные агенты имеют огромный потенциал для ускорения творческой работы.
Для обычных пользователей агентный ИИ в продуктах Adobe означает:
- Более интуитивные интерфейсы
- Автоматизацию рутинных задач
- Персонализированные рекомендации и подсказки
- Ускорение рабочего процесса без необходимости изучать все аспекты сложных инструментов
Перспективы развития
Adobe позиционирует себя на переднем крае "третьей фазы" революции ИИ — после описательного и генеративного ИИ наступает эра агентного ИИ.
Этот этап характеризуется значительным повышением интерактивности и способностей к рассуждению у ИИ-моделей. Главное отличие — агенты могут не только давать рекомендации, но и самостоятельно выполнять действия в различных системах.
Интересно, как быстро творческие ИИ агенты превратят в творящих ИИ агентов (перейдут из цифрового мира в физический), исключив лишнее звено из цепочки производства.
#Adobe #Acrobat #Express #Photoshop #Premier
———
@tsingular
Adobe делает стратегическую ставку на агентный искусственный интеллект, внедряя эту технологию во все ключевые продукты — от Acrobat и Express до профессиональных инструментов Creative Cloud.
Техническая основа и стратегия
В Adobe подход к агентному ИИ прозрачен: лучшее использование искусственного интеллекта — дать людям больше контроля и освободить их время для работы, которую они любят, будь то творчество, анализ или совместная работа.
Компания последовательно расширяет возможности ИИ, начав с генеративных моделей Firefly и теперь переходя к более сложным агентным системам.
Технический фундамент для агентных систем Adobe — новая платформа Adobe Experience Platform Agent Orchestrator, которая позволяет объединять и координировать работу AI-агентов, как собственных от Adobe, так и от сторонних разработчиков.
Платформа обеспечивает:
- Семантическое понимание корпоративных данных
- Интеграцию с рабочими процессами маркетинга
- Встроенную систему управления данными и соответствие регуляторным требованиям
Продукты с агентными возможностями
Adobe активно интегрирует агентные технологии во все свои ключевые продукты:
1. Adobe Acrobat — исследовательские агенты для анализа документов, подготовки к встречам, академические помощники для студентов.
2. Adobe Express — агенты, действующие как творческие партнеры на всех этапах создания контента.
3. Photoshop — агенты для анализа изображений и автоматизации рутинных задач.
4. Premiere Pro — агенты, анализирующие содержимое видеоклипов и помогающие с монтажом.
Практическое применение
Представленные агенты решают реальные бизнес-задачи:
Site Optimization Agent — анализирует производительность сайта в реальном времени, выявляет проблемы и предлагает решения одним кликом.
Account Qualification Agent — помогает B2B-командам оценивать новые возможности и вовлекать ключевых лиц, принимающих решения.
Content Production Agent — генерирует контент на основе брифа, соблюдая фирменные стандарты и брендбук.
Audience Agent — анализирует данные о взаимодействии с аудиторией и оптимизирует сегментацию.
Интеграция с Microsoft и экосистемой
Adobe также объявила о расширении сотрудничества с Microsoft, включая интеграцию Adobe Marketing Agent в Microsoft 365 Copilot. Это позволит маркетологам использовать возможности Adobe прямо в привычном рабочем процессе через Microsoft Teams, PowerPoint и Word.
Что это означает для пользователей
По мнению Adobe, агентный ИИ станет мощным "умножителем сил" для творческих профессионалов.
Изучая обратную связь, адаптируясь к изменениям и проактивно предлагая идеи для более быстрой реализации, интеллектуальные агенты имеют огромный потенциал для ускорения творческой работы.
Для обычных пользователей агентный ИИ в продуктах Adobe означает:
- Более интуитивные интерфейсы
- Автоматизацию рутинных задач
- Персонализированные рекомендации и подсказки
- Ускорение рабочего процесса без необходимости изучать все аспекты сложных инструментов
Перспективы развития
Adobe позиционирует себя на переднем крае "третьей фазы" революции ИИ — после описательного и генеративного ИИ наступает эра агентного ИИ.
Этот этап характеризуется значительным повышением интерактивности и способностей к рассуждению у ИИ-моделей. Главное отличие — агенты могут не только давать рекомендации, но и самостоятельно выполнять действия в различных системах.
Интересно, как быстро творческие ИИ агенты превратят в творящих ИИ агентов (перейдут из цифрового мира в физический), исключив лишнее звено из цепочки производства.
#Adobe #Acrobat #Express #Photoshop #Premier
———
@tsingular
👍7⚡1🔥1👀1
🔥 Anthropic запускает Claude Max за $200: Битва за премиум-сегмент AI-рынка
Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.
Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.
📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.
Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.
📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)
Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате
Google (Gemini)
Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google
Anthropic (Claude)
Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены
Perplexity AI
Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд
💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).
Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.
Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.
Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.
#tariffwar #anthropic #claude
———
@tsingular
Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.
Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.
📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.
Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.
📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)
Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате
Google (Gemini)
Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google
Anthropic (Claude)
Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены
Perplexity AI
Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд
💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).
Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.
Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.
Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.
#tariffwar #anthropic #claude
———
@tsingular
✍6👍3⚡1
Cloud.ru запускает пространство для разработки и запуска ИИ моделей.
Evolution AI Factory
Задача - упростить порог входа.
Дополнительно будет Partner API - решения партнёров будут встроены в систему Cloud.ru.
Похоже на Azure Marketplace
Evolution stack - 394 компонента
+ 729 решений в Marketplace
#cloud.ru
———
@tsingular
Evolution AI Factory
Задача - упростить порог входа.
Дополнительно будет Partner API - решения партнёров будут встроены в систему Cloud.ru.
Похоже на Azure Marketplace
Evolution stack - 394 компонента
+ 729 решений в Marketplace
#cloud.ru
———
@tsingular
👍4🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Количество AI IDE, от Курсора и Виндсерфа до v0 и Клина, мне кажется, уже превысило 50.
И тут на базу выходит Гугл и выкатывает FireBase
https://studio.firebase.google.com/
Это, очень грубо говоря (не бейте сильно), аналог Курсора, только прямо в браузере.
Firebase Studio объединяет такие инструменты, как Project IDX, Genkit и Gemini в Firebase. По замыслу - это сквозная(end-to-end) платформа, для прототипирования, дизайна, вайб и невайб-кодинга, дебага, деплоя и отслеживания.
Посмотрим, куда они ее будут развивать, но некоторым стартапам не позавидуешь. Все меньше времени проходит от появления стартапа до выкатывания этой идеи на рынок от больших игроков.
С учетом того, что Gemini 2.5 сейчас, похоже, лучшая модель для сложного кода, а использование Firebase не требует установки моделей, ключей, связей и пр, это может стать инструментом для новых нормальных вайб-кодеров.
Я запустил, он мне быстро написал мой дежурный аттрактор Лоренца, сделал нарядный 3Д-вьюпорт. Любопытно, что если в процессе выполнения (у меня клик по слайдерам) возникает ошибка, то он предлагает пофиксить ее сам или послать меня править код ручками.
В общем есть игрушка на сегодня.
@cgevent
И тут на базу выходит Гугл и выкатывает FireBase
https://studio.firebase.google.com/
Это, очень грубо говоря (не бейте сильно), аналог Курсора, только прямо в браузере.
Firebase Studio объединяет такие инструменты, как Project IDX, Genkit и Gemini в Firebase. По замыслу - это сквозная(end-to-end) платформа, для прототипирования, дизайна, вайб и невайб-кодинга, дебага, деплоя и отслеживания.
Посмотрим, куда они ее будут развивать, но некоторым стартапам не позавидуешь. Все меньше времени проходит от появления стартапа до выкатывания этой идеи на рынок от больших игроков.
С учетом того, что Gemini 2.5 сейчас, похоже, лучшая модель для сложного кода, а использование Firebase не требует установки моделей, ключей, связей и пр, это может стать инструментом для новых нормальных вайб-кодеров.
Я запустил, он мне быстро написал мой дежурный аттрактор Лоренца, сделал нарядный 3Д-вьюпорт. Любопытно, что если в процессе выполнения (у меня клик по слайдерам) возникает ошибка, то он предлагает пофиксить ее сам или послать меня править код ручками.
В общем есть игрушка на сегодня.
@cgevent
👍12✍4