На сайте выложили продолжение курса по LangChain.
Для тех, кто знает Python и основы LangChain (цепочки), и хочет разобраться в агентах.
LangChain и сквозной проект агент-аналитик.
Каждый урок это теория, рабочий код, частые ошибки и практическое задание.
Содержание:
👉 Ссылка на курс
#langchain #ииагенты #курс
Для тех, кто знает Python и основы LangChain (цепочки), и хочет разобраться в агентах.
LangChain и сквозной проект агент-аналитик.
Каждый урок это теория, рабочий код, частые ошибки и практическое задание.
Содержание:
0 - Настройка окружения
1 - create_agent и цикл агента
2 - LangGraph и состояние агента
3 - MCP: инструменты через внешние серверы
4 - Context engineering
5 - Встроенный middleware
6 - Краткосрочная память
7 - Долгосрочная память
8 - Human-in-the-loop
9 - Guardrails
10 - Паттерны мультиагентных систем
11 - Субагенты и Handoffs
👉 Ссылка на курс
#langchain #ииагенты #курс
👍4
OpenAI frontier: угроза для saas-компаний?
OpenAI представила платформу "Frontier", которая может повлиять на рынок программного обеспечения как услуги (SaaS). Платформа позволяет создавать "агенты" – программы, способные самостоятельно выполнять задачи и интегрироваться с различными сервисами.
"Frontier" дает клиентам возможность создавать собственные решения, снижая необходимость во множестве SaaS-инструментов. Это может привести к консолидации рынка, где выживут только компании, предлагающие уникальную ценность и интеграцию с новой моделью.
Аналитики считают, что это фундаментальный сдвиг, требующий от SaaS-компаний адаптации и инноваций, а также может привести к снижению цен на решения.
OpenAI представила платформу "Frontier", которая может повлиять на рынок программного обеспечения как услуги (SaaS). Платформа позволяет создавать "агенты" – программы, способные самостоятельно выполнять задачи и интегрироваться с различными сервисами.
"Frontier" дает клиентам возможность создавать собственные решения, снижая необходимость во множестве SaaS-инструментов. Это может привести к консолидации рынка, где выживут только компании, предлагающие уникальную ценность и интеграцию с новой моделью.
Аналитики считают, что это фундаментальный сдвиг, требующий от SaaS-компаний адаптации и инноваций, а также может привести к снижению цен на решения.
🤔3
OpenAI разработала правила безопасности для подростков в виде промптов для модели gpt-oss-safeguard, которые разработчики используют для модерации возрастных рисков в системах искусственного интеллекта.
В ChatGPT представлен улучшенный визуальный шоппинг на базе протокола Agentic Commerce, позволяющего находить товары и сравнивать их, при этом интеграция с торговыми площадками зависит от участия конкретных мерчантов.
В ChatGPT представлен улучшенный визуальный шоппинг на базе протокола Agentic Commerce, позволяющего находить товары и сравнивать их, при этом интеграция с торговыми площадками зависит от участия конкретных мерчантов.
OpenAI приостановила публичный доступ к модели генерации видео Sora из-за опасений злоупотребления, включая создание дезинформации и дипфейков. Компания планирует тщательное тестирование и оценку системы перед повторным запуском, а также разработку мер по снижению рисков.
Решение принято после появления в сети примеров видео, созданных Sora, которые вызвали обеспокоенность. Видео демонстрировали способность модели создавать реалистичные сцены и лица, поднимая вопросы об использовании для создания поддельных новостей и манипулирования общественным мнением.
Решение принято после появления в сети примеров видео, созданных Sora, которые вызвали обеспокоенность. Видео демонстрировали способность модели создавать реалистичные сцены и лица, поднимая вопросы об использовании для создания поддельных новостей и манипулирования общественным мнением.
😱2
Tencent AI открыла исходный код Covo-Audio 7B параметровой end-to-end аудиоязыковой модели и конвейера вывода для разговоров и рассуждений в реальном времени.
В отличие от классических систем, которые последовательно пропускают аудио через три отдельных компонента (распознавание → языковая модель → синтез речи), Covo-Audio обрабатывает непрерывный аудиовход и генерирует аудиовыход в единой архитектуре за один проход. Это снижает накопление ошибок и задержку.
Модель прошла двухэтапное предобучение на 2 триллионах токенов, охватывающих речевые и текстовые данные на нескольких языках. На бенчмарках MMAU и MMSU Covo-Audio показала лучшие результаты среди моделей своего масштаба, сравнявшись с некоторыми 32B-системами.
Отдельно выпущен вариант Covo-Audio-Chat-FD с поддержкой full-duplex, то есть модель может одновременно слушать и говорить с низкой задержкой, что важно для голосовых помощников реального времени.
Веса модели и код для инференса опубликованы на GitHub и HuggingFace под лицензией CC BY 4.0.
В отличие от классических систем, которые последовательно пропускают аудио через три отдельных компонента (распознавание → языковая модель → синтез речи), Covo-Audio обрабатывает непрерывный аудиовход и генерирует аудиовыход в единой архитектуре за один проход. Это снижает накопление ошибок и задержку.
Модель прошла двухэтапное предобучение на 2 триллионах токенов, охватывающих речевые и текстовые данные на нескольких языках. На бенчмарках MMAU и MMSU Covo-Audio показала лучшие результаты среди моделей своего масштаба, сравнявшись с некоторыми 32B-системами.
Отдельно выпущен вариант Covo-Audio-Chat-FD с поддержкой full-duplex, то есть модель может одновременно слушать и говорить с низкой задержкой, что важно для голосовых помощников реального времени.
Веса модели и код для инференса опубликованы на GitHub и HuggingFace под лицензией CC BY 4.0.
🔥1
Google выпустила Gemini 3.1 Flash Live для AI-агентов
Google выпустила Gemini 3.1 Flash Live, audio-to-audio модель для работы с голосом, аудио и видео в реальном времени.
Она создана для использования в голосовых AI-агентах, где требуется низкая задержка и распознавание акустических нюансов.
Модель предназначена для обработки данных в реальном времени и доступна разработчикам через Gemini Live API в Google AI Studio и Vertex AI.
Google выпустила Gemini 3.1 Flash Live, audio-to-audio модель для работы с голосом, аудио и видео в реальном времени.
Она создана для использования в голосовых AI-агентах, где требуется низкая задержка и распознавание акустических нюансов.
Модель предназначена для обработки данных в реальном времени и доступна разработчикам через Gemini Live API в Google AI Studio и Vertex AI.
👍1
Теперь в Suno AI можно генерировать треки собственным голосом
Вышла новая модель 5.5.
Что улучшилось: вокал стал более живым и эмоциональным, звук чище, а треки более целостными и похожими на реальный продакшн.
Вышла новая модель 5.5.
Что улучшилось: вокал стал более живым и эмоциональным, звук чище, а треки более целостными и похожими на реальный продакшн.
👍1
Mistral AI представила Voxtral TTS
Voxtral TTS это модель потокового синтеза речи с открытыми весами, предназначенную для генерации голоса на нескольких языках с низкой задержкой.
Размер модели 4 миллиарда параметров. Voxtral TTS генерирует речь в потоковом режиме, поддерживая 9 языков: английский, французский, немецкий, испанский, голландский, португальский, итальянский, хинди и арабский.
Разработчики утверждают, что модель обеспечивает высокое качество генерации голоса и подходит для голосовых помощников, систем преобразования текста в речь и мультимедийных приложений.
Задержка составляет 70 мс для 10-секундного примера и 500 символов ввода, коэффициент RTF около 9.7x, при этом time-to-first-audio составляет ~100 мс.
Лицензия CC BY-NC 4.0 ограничивает коммерческое использование без отдельного соглашения.
Voxtral TTS это модель потокового синтеза речи с открытыми весами, предназначенную для генерации голоса на нескольких языках с низкой задержкой.
Размер модели 4 миллиарда параметров. Voxtral TTS генерирует речь в потоковом режиме, поддерживая 9 языков: английский, французский, немецкий, испанский, голландский, португальский, итальянский, хинди и арабский.
Разработчики утверждают, что модель обеспечивает высокое качество генерации голоса и подходит для голосовых помощников, систем преобразования текста в речь и мультимедийных приложений.
Задержка составляет 70 мс для 10-секундного примера и 500 символов ввода, коэффициент RTF около 9.7x, при этом time-to-first-audio составляет ~100 мс.
Лицензия CC BY-NC 4.0 ограничивает коммерческое использование без отдельного соглашения.
👍2
Представлена система A-Evolve, автоматизирующая настройку агентов искусственного интеллекта посредством мутации файлов в Agent Workspace и оценки результатов через внешний Mutation Engine.
Фреймворк упрощает создание и развертывание, сводя ручную оптимизацию к минимуму после начальной настройки.
A-Evolve автоматически изменяет конфигурацию агента, оценивает результаты и повторяет цикл из пяти этапов (Solve, Observe, Evolve, Gate, Reload) для достижения оптимального состояния, при этом механизм валидации откатывает регрессивные изменения через Git.
Разработчики из A-EVO-Lab, связанного с Amazon, утверждают, что A-Evolve может стать для агентических систем тем же, чем PyTorch является для нейронных сетей — модульной инфраструктурой для создания инновационных приложений, поддерживающей подходы BYOA, BYOE и BYO-Algo.
Фреймворк упрощает создание и развертывание, сводя ручную оптимизацию к минимуму после начальной настройки.
A-Evolve автоматически изменяет конфигурацию агента, оценивает результаты и повторяет цикл из пяти этапов (Solve, Observe, Evolve, Gate, Reload) для достижения оптимального состояния, при этом механизм валидации откатывает регрессивные изменения через Git.
Разработчики из A-EVO-Lab, связанного с Amazon, утверждают, что A-Evolve может стать для агентических систем тем же, чем PyTorch является для нейронных сетей — модульной инфраструктурой для создания инновационных приложений, поддерживающей подходы BYOA, BYOE и BYO-Algo.
🤯2
Команда agent-infra, связанная с ByteDance, выпустила AIO Sandbox
AIO Sandbox универсальная среда выполнения для AI-агентов, объединяющую браузер, терминал, файловую систему, MCP и VSCode Server в одном Docker контейнере.
Платформа позволяет создавать агентов для веб-скрапинга, автоматизации и анализа данных, обеспечивая безопасное изолированное выполнение кода на Python и Node.js.
Общая файловая система позволяет агентам обмениваться данными, а интеграция через Model Context Protocol стандартизирует доступ к инструментам.
Проект открыт под лицензией Apache 2.0. Предоставляет SDK для Python, TypeScript и Go.
AIO Sandbox универсальная среда выполнения для AI-агентов, объединяющую браузер, терминал, файловую систему, MCP и VSCode Server в одном Docker контейнере.
Платформа позволяет создавать агентов для веб-скрапинга, автоматизации и анализа данных, обеспечивая безопасное изолированное выполнение кода на Python и Node.js.
Общая файловая система позволяет агентам обмениваться данными, а интеграция через Model Context Protocol стандартизирует доступ к инструментам.
Проект открыт под лицензией Apache 2.0. Предоставляет SDK для Python, TypeScript и Go.
OpenAI привлекла 122 миллиарда долларов при оценке в 852 миллиарда долларов, работая над "супераппликацией". Amazon, Nvidia и SoftBank предоставили финансирование, а доход компании достиг 2 миллиардов долларов в месяц, в 4 раза превысив темпы роста Alphabet на аналогичной стадии. Enterprise-сегмент составляет более 40% доходов и прогнозируется к концу года сравняется с потребительским.
Anthropic случайно обнародовала исходный код Claude Code, включая 1900 файлов и 500 000+ строк кода, выявив невыпущенные функции и внутренние кодовые имена. Утечка получила широкое распространение в сети.
Исследование Университета Квиннипак показало рост использования AI на 14%, но снижение доверия и увеличение обеспокоенности по поводу рабочих мест до 70%. Настроения различаются в зависимости от дохода, а 74% респондентов считают, что правительство недостаточно регулирует AI.
Anthropic случайно обнародовала исходный код Claude Code, включая 1900 файлов и 500 000+ строк кода, выявив невыпущенные функции и внутренние кодовые имена. Утечка получила широкое распространение в сети.
Исследование Университета Квиннипак показало рост использования AI на 14%, но снижение доверия и увеличение обеспокоенности по поводу рабочих мест до 70%. Настроения различаются в зависимости от дохода, а 74% респондентов считают, что правительство недостаточно регулирует AI.
Gemma 4: новая мультимодальная модель от Google
Представлена Gemma 4 - новая мультимодальная модель от Google для понимания текста, изображений и видео. Малые версии (E2B, E4B) также работают с аудио. Модель демонстрирует улучшенное понимание сложных запросов, рассуждения и следование инструкциям по сравнению с предыдущими версиями Gemma.
Модель доступна в четырёх размерах: Effective 2B, Effective 4B, 31B Dense и 26B MoE с 3,8 млрд активных параметров (A4B). Это позволяет разработчикам выбирать оптимальный вариант под задачу.
Gemma 4 работает с transformers, llama.cpp, MLX, WebGPU, а также через Candle для Rust. Развёртывание доступно на Google Cloud, Kaggle и Hugging Face.
Google предоставляет полные веса модели и документацию под лицензией Apache 2.0.
Важное уточнение, Gemma 4 генерирует только текст, но может анализировать изображения, видео и аудио. Контекстное окно 128K токенов для малых моделей и до 256K для больших. Релиз состоялся 31 марта 2026 года.
Представлена Gemma 4 - новая мультимодальная модель от Google для понимания текста, изображений и видео. Малые версии (E2B, E4B) также работают с аудио. Модель демонстрирует улучшенное понимание сложных запросов, рассуждения и следование инструкциям по сравнению с предыдущими версиями Gemma.
Модель доступна в четырёх размерах: Effective 2B, Effective 4B, 31B Dense и 26B MoE с 3,8 млрд активных параметров (A4B). Это позволяет разработчикам выбирать оптимальный вариант под задачу.
Gemma 4 работает с transformers, llama.cpp, MLX, WebGPU, а также через Candle для Rust. Развёртывание доступно на Google Cloud, Kaggle и Hugging Face.
Google предоставляет полные веса модели и документацию под лицензией Apache 2.0.
Важное уточнение, Gemma 4 генерирует только текст, но может анализировать изображения, видео и аудио. Контекстное окно 128K токенов для малых моделей и до 256K для больших. Релиз состоялся 31 марта 2026 года.
👍4
Anthropic требует оплату за использование моделей в OpenClaw
Компания Anthropic с 4 апреля 2026 года прекратила поддержку использования подписок Claude Pro и Max через сторонние инструменты, включая OpenClaw.
Пользователи OpenClaw больше не могут использовать свои подписочные лимиты через API Anthropic и вынуждены перейти на API-биллинг с оплатой за токены или приобрести дополнительный платный аддон "Extra Usage".
Anthropic объявила об изменении за несколько часов до вступления политики в силу. Разработчики OpenClaw выразили недовольство коротким сроком уведомления и сложностью перехода на новую модель оплаты, которая стоит в 10-50 раз больше по сравнению с обычной подпиской.
По мнению разработчиков, Anthropic изменила политику использования API без заблаговременного предупреждения. Компания настаивает, что информация о ценах размещена на сайте и изменение необходимо для покрытия расходов на использование моделей через сторонние инструменты.
Компания Anthropic с 4 апреля 2026 года прекратила поддержку использования подписок Claude Pro и Max через сторонние инструменты, включая OpenClaw.
Пользователи OpenClaw больше не могут использовать свои подписочные лимиты через API Anthropic и вынуждены перейти на API-биллинг с оплатой за токены или приобрести дополнительный платный аддон "Extra Usage".
Anthropic объявила об изменении за несколько часов до вступления политики в силу. Разработчики OpenClaw выразили недовольство коротким сроком уведомления и сложностью перехода на новую модель оплаты, которая стоит в 10-50 раз больше по сравнению с обычной подпиской.
По мнению разработчиков, Anthropic изменила политику использования API без заблаговременного предупреждения. Компания настаивает, что информация о ценах размещена на сайте и изменение необходимо для покрытия расходов на использование моделей через сторонние инструменты.
😱1
👍3
Четырехдневная рабочая неделя и налоги на роботов
OpenAI представила доклад об экономических последствиях развития искусственного интеллекта. В нём обсуждаются возможности внедрения четырехдневной рабочей недели и налогов на автоматизацию.
Компания предполагает, что автоматизация может увеличить производительность, позволяя сократить рабочую неделю. Также рассматривается введение налога на автоматизированный труд для финансирования поддержки работников, потерявших работу.
В докладе отмечается потенциальное влияние ИИ на распределение богатства и необходимость разработки новых политик для справедливого распределения выгод от автоматизации. OpenAI подчеркивает важность проактивного подхода к решению возникающих проблем.
OpenAI представила доклад об экономических последствиях развития искусственного интеллекта. В нём обсуждаются возможности внедрения четырехдневной рабочей недели и налогов на автоматизацию.
Компания предполагает, что автоматизация может увеличить производительность, позволяя сократить рабочую неделю. Также рассматривается введение налога на автоматизированный труд для финансирования поддержки работников, потерявших работу.
В докладе отмечается потенциальное влияние ИИ на распределение богатства и необходимость разработки новых политик для справедливого распределения выгод от автоматизации. OpenAI подчеркивает важность проактивного подхода к решению возникающих проблем.
😱2
Вышла GLM-5.1 модель с открытыми весами от Zhipu AI
Архитектура не менялась 744B параметров (40B активных), MoE, контекст 204,8K токенов. Улучшения достигнуты за счёт пост-тренировки.
Совместима с существующими фреймворками: Ollama, OpenAI SDK и т.д. Веса доступны на Hugging Face и ModelScope под лицензией MIT.
Поддерживает длинные сессии до 8 часов автономной работы над одной задачей.
В агрегированных рейтингах GLM-5.1 не всегда занимает первые места, но на узких инженерных бенчмарках показывает результаты на уровне или выше проприетарных аналогов. Для практических задач программирования, рефакторинга, генерации, отладки это сейчас одно из наиболее доступных открытых решений.
Архитектура не менялась 744B параметров (40B активных), MoE, контекст 204,8K токенов. Улучшения достигнуты за счёт пост-тренировки.
Совместима с существующими фреймворками: Ollama, OpenAI SDK и т.д. Веса доступны на Hugging Face и ModelScope под лицензией MIT.
Поддерживает длинные сессии до 8 часов автономной работы над одной задачей.
В агрегированных рейтингах GLM-5.1 не всегда занимает первые места, но на узких инженерных бенчмарках показывает результаты на уровне или выше проприетарных аналогов. Для практических задач программирования, рефакторинга, генерации, отладки это сейчас одно из наиболее доступных открытых решений.
👍3
На сайте вышла статья об автоматизации работы с документами с помощью ИИ агента на компьютере.
Для примера взята задача, с которой сталкивается любой руководитель. Но применение агента шире.
👉 Ссылка на статью
Для примера взята задача, с которой сталкивается любой руководитель. Но применение агента шире.
👉 Ссылка на статью
👍3