Mistral AI представила Voxtral TTS
Voxtral TTS это модель потокового синтеза речи с открытыми весами, предназначенную для генерации голоса на нескольких языках с низкой задержкой.
Размер модели 4 миллиарда параметров. Voxtral TTS генерирует речь в потоковом режиме, поддерживая 9 языков: английский, французский, немецкий, испанский, голландский, португальский, итальянский, хинди и арабский.
Разработчики утверждают, что модель обеспечивает высокое качество генерации голоса и подходит для голосовых помощников, систем преобразования текста в речь и мультимедийных приложений.
Задержка составляет 70 мс для 10-секундного примера и 500 символов ввода, коэффициент RTF около 9.7x, при этом time-to-first-audio составляет ~100 мс.
Лицензия CC BY-NC 4.0 ограничивает коммерческое использование без отдельного соглашения.
Voxtral TTS это модель потокового синтеза речи с открытыми весами, предназначенную для генерации голоса на нескольких языках с низкой задержкой.
Размер модели 4 миллиарда параметров. Voxtral TTS генерирует речь в потоковом режиме, поддерживая 9 языков: английский, французский, немецкий, испанский, голландский, португальский, итальянский, хинди и арабский.
Разработчики утверждают, что модель обеспечивает высокое качество генерации голоса и подходит для голосовых помощников, систем преобразования текста в речь и мультимедийных приложений.
Задержка составляет 70 мс для 10-секундного примера и 500 символов ввода, коэффициент RTF около 9.7x, при этом time-to-first-audio составляет ~100 мс.
Лицензия CC BY-NC 4.0 ограничивает коммерческое использование без отдельного соглашения.
👍2
Представлена система A-Evolve, автоматизирующая настройку агентов искусственного интеллекта посредством мутации файлов в Agent Workspace и оценки результатов через внешний Mutation Engine.
Фреймворк упрощает создание и развертывание, сводя ручную оптимизацию к минимуму после начальной настройки.
A-Evolve автоматически изменяет конфигурацию агента, оценивает результаты и повторяет цикл из пяти этапов (Solve, Observe, Evolve, Gate, Reload) для достижения оптимального состояния, при этом механизм валидации откатывает регрессивные изменения через Git.
Разработчики из A-EVO-Lab, связанного с Amazon, утверждают, что A-Evolve может стать для агентических систем тем же, чем PyTorch является для нейронных сетей — модульной инфраструктурой для создания инновационных приложений, поддерживающей подходы BYOA, BYOE и BYO-Algo.
Фреймворк упрощает создание и развертывание, сводя ручную оптимизацию к минимуму после начальной настройки.
A-Evolve автоматически изменяет конфигурацию агента, оценивает результаты и повторяет цикл из пяти этапов (Solve, Observe, Evolve, Gate, Reload) для достижения оптимального состояния, при этом механизм валидации откатывает регрессивные изменения через Git.
Разработчики из A-EVO-Lab, связанного с Amazon, утверждают, что A-Evolve может стать для агентических систем тем же, чем PyTorch является для нейронных сетей — модульной инфраструктурой для создания инновационных приложений, поддерживающей подходы BYOA, BYOE и BYO-Algo.
🤯2
Команда agent-infra, связанная с ByteDance, выпустила AIO Sandbox
AIO Sandbox универсальная среда выполнения для AI-агентов, объединяющую браузер, терминал, файловую систему, MCP и VSCode Server в одном Docker контейнере.
Платформа позволяет создавать агентов для веб-скрапинга, автоматизации и анализа данных, обеспечивая безопасное изолированное выполнение кода на Python и Node.js.
Общая файловая система позволяет агентам обмениваться данными, а интеграция через Model Context Protocol стандартизирует доступ к инструментам.
Проект открыт под лицензией Apache 2.0. Предоставляет SDK для Python, TypeScript и Go.
AIO Sandbox универсальная среда выполнения для AI-агентов, объединяющую браузер, терминал, файловую систему, MCP и VSCode Server в одном Docker контейнере.
Платформа позволяет создавать агентов для веб-скрапинга, автоматизации и анализа данных, обеспечивая безопасное изолированное выполнение кода на Python и Node.js.
Общая файловая система позволяет агентам обмениваться данными, а интеграция через Model Context Protocol стандартизирует доступ к инструментам.
Проект открыт под лицензией Apache 2.0. Предоставляет SDK для Python, TypeScript и Go.
OpenAI привлекла 122 миллиарда долларов при оценке в 852 миллиарда долларов, работая над "супераппликацией". Amazon, Nvidia и SoftBank предоставили финансирование, а доход компании достиг 2 миллиардов долларов в месяц, в 4 раза превысив темпы роста Alphabet на аналогичной стадии. Enterprise-сегмент составляет более 40% доходов и прогнозируется к концу года сравняется с потребительским.
Anthropic случайно обнародовала исходный код Claude Code, включая 1900 файлов и 500 000+ строк кода, выявив невыпущенные функции и внутренние кодовые имена. Утечка получила широкое распространение в сети.
Исследование Университета Квиннипак показало рост использования AI на 14%, но снижение доверия и увеличение обеспокоенности по поводу рабочих мест до 70%. Настроения различаются в зависимости от дохода, а 74% респондентов считают, что правительство недостаточно регулирует AI.
Anthropic случайно обнародовала исходный код Claude Code, включая 1900 файлов и 500 000+ строк кода, выявив невыпущенные функции и внутренние кодовые имена. Утечка получила широкое распространение в сети.
Исследование Университета Квиннипак показало рост использования AI на 14%, но снижение доверия и увеличение обеспокоенности по поводу рабочих мест до 70%. Настроения различаются в зависимости от дохода, а 74% респондентов считают, что правительство недостаточно регулирует AI.
Gemma 4: новая мультимодальная модель от Google
Представлена Gemma 4 - новая мультимодальная модель от Google для понимания текста, изображений и видео. Малые версии (E2B, E4B) также работают с аудио. Модель демонстрирует улучшенное понимание сложных запросов, рассуждения и следование инструкциям по сравнению с предыдущими версиями Gemma.
Модель доступна в четырёх размерах: Effective 2B, Effective 4B, 31B Dense и 26B MoE с 3,8 млрд активных параметров (A4B). Это позволяет разработчикам выбирать оптимальный вариант под задачу.
Gemma 4 работает с transformers, llama.cpp, MLX, WebGPU, а также через Candle для Rust. Развёртывание доступно на Google Cloud, Kaggle и Hugging Face.
Google предоставляет полные веса модели и документацию под лицензией Apache 2.0.
Важное уточнение, Gemma 4 генерирует только текст, но может анализировать изображения, видео и аудио. Контекстное окно 128K токенов для малых моделей и до 256K для больших. Релиз состоялся 31 марта 2026 года.
Представлена Gemma 4 - новая мультимодальная модель от Google для понимания текста, изображений и видео. Малые версии (E2B, E4B) также работают с аудио. Модель демонстрирует улучшенное понимание сложных запросов, рассуждения и следование инструкциям по сравнению с предыдущими версиями Gemma.
Модель доступна в четырёх размерах: Effective 2B, Effective 4B, 31B Dense и 26B MoE с 3,8 млрд активных параметров (A4B). Это позволяет разработчикам выбирать оптимальный вариант под задачу.
Gemma 4 работает с transformers, llama.cpp, MLX, WebGPU, а также через Candle для Rust. Развёртывание доступно на Google Cloud, Kaggle и Hugging Face.
Google предоставляет полные веса модели и документацию под лицензией Apache 2.0.
Важное уточнение, Gemma 4 генерирует только текст, но может анализировать изображения, видео и аудио. Контекстное окно 128K токенов для малых моделей и до 256K для больших. Релиз состоялся 31 марта 2026 года.
👍4
Anthropic требует оплату за использование моделей в OpenClaw
Компания Anthropic с 4 апреля 2026 года прекратила поддержку использования подписок Claude Pro и Max через сторонние инструменты, включая OpenClaw.
Пользователи OpenClaw больше не могут использовать свои подписочные лимиты через API Anthropic и вынуждены перейти на API-биллинг с оплатой за токены или приобрести дополнительный платный аддон "Extra Usage".
Anthropic объявила об изменении за несколько часов до вступления политики в силу. Разработчики OpenClaw выразили недовольство коротким сроком уведомления и сложностью перехода на новую модель оплаты, которая стоит в 10-50 раз больше по сравнению с обычной подпиской.
По мнению разработчиков, Anthropic изменила политику использования API без заблаговременного предупреждения. Компания настаивает, что информация о ценах размещена на сайте и изменение необходимо для покрытия расходов на использование моделей через сторонние инструменты.
Компания Anthropic с 4 апреля 2026 года прекратила поддержку использования подписок Claude Pro и Max через сторонние инструменты, включая OpenClaw.
Пользователи OpenClaw больше не могут использовать свои подписочные лимиты через API Anthropic и вынуждены перейти на API-биллинг с оплатой за токены или приобрести дополнительный платный аддон "Extra Usage".
Anthropic объявила об изменении за несколько часов до вступления политики в силу. Разработчики OpenClaw выразили недовольство коротким сроком уведомления и сложностью перехода на новую модель оплаты, которая стоит в 10-50 раз больше по сравнению с обычной подпиской.
По мнению разработчиков, Anthropic изменила политику использования API без заблаговременного предупреждения. Компания настаивает, что информация о ценах размещена на сайте и изменение необходимо для покрытия расходов на использование моделей через сторонние инструменты.
😱1
👍3
Четырехдневная рабочая неделя и налоги на роботов
OpenAI представила доклад об экономических последствиях развития искусственного интеллекта. В нём обсуждаются возможности внедрения четырехдневной рабочей недели и налогов на автоматизацию.
Компания предполагает, что автоматизация может увеличить производительность, позволяя сократить рабочую неделю. Также рассматривается введение налога на автоматизированный труд для финансирования поддержки работников, потерявших работу.
В докладе отмечается потенциальное влияние ИИ на распределение богатства и необходимость разработки новых политик для справедливого распределения выгод от автоматизации. OpenAI подчеркивает важность проактивного подхода к решению возникающих проблем.
OpenAI представила доклад об экономических последствиях развития искусственного интеллекта. В нём обсуждаются возможности внедрения четырехдневной рабочей недели и налогов на автоматизацию.
Компания предполагает, что автоматизация может увеличить производительность, позволяя сократить рабочую неделю. Также рассматривается введение налога на автоматизированный труд для финансирования поддержки работников, потерявших работу.
В докладе отмечается потенциальное влияние ИИ на распределение богатства и необходимость разработки новых политик для справедливого распределения выгод от автоматизации. OpenAI подчеркивает важность проактивного подхода к решению возникающих проблем.
😱2
Вышла GLM-5.1 модель с открытыми весами от Zhipu AI
Архитектура не менялась 744B параметров (40B активных), MoE, контекст 204,8K токенов. Улучшения достигнуты за счёт пост-тренировки.
Совместима с существующими фреймворками: Ollama, OpenAI SDK и т.д. Веса доступны на Hugging Face и ModelScope под лицензией MIT.
Поддерживает длинные сессии до 8 часов автономной работы над одной задачей.
В агрегированных рейтингах GLM-5.1 не всегда занимает первые места, но на узких инженерных бенчмарках показывает результаты на уровне или выше проприетарных аналогов. Для практических задач программирования, рефакторинга, генерации, отладки это сейчас одно из наиболее доступных открытых решений.
Архитектура не менялась 744B параметров (40B активных), MoE, контекст 204,8K токенов. Улучшения достигнуты за счёт пост-тренировки.
Совместима с существующими фреймворками: Ollama, OpenAI SDK и т.д. Веса доступны на Hugging Face и ModelScope под лицензией MIT.
Поддерживает длинные сессии до 8 часов автономной работы над одной задачей.
В агрегированных рейтингах GLM-5.1 не всегда занимает первые места, но на узких инженерных бенчмарках показывает результаты на уровне или выше проприетарных аналогов. Для практических задач программирования, рефакторинга, генерации, отладки это сейчас одно из наиболее доступных открытых решений.
👍3
На сайте вышла статья об автоматизации работы с документами с помощью ИИ агента на компьютере.
Для примера взята задача, с которой сталкивается любой руководитель. Но применение агента шире.
👉 Ссылка на статью
Для примера взята задача, с которой сталкивается любой руководитель. Но применение агента шире.
👉 Ссылка на статью
👍3