OpenMOSS выпустили MOSS-TTS v1.5 - обновление своей открытой TTS-модели на 8B параметров.
Главная фича выглядит простой, но для реальных сценариев очень важная: теперь паузы можно задавать прямо внутри текста через
[pause 3.2s]. То есть моделью можно управлять не только на уровне «прочитай фразу», а точнее собирать ритм, драматургию и естественные остановки в речи.Что нового в v1.5:
- поддержка 31 языка вместо 20
- добавлены Cantonese, Hindi, Thai, Vietnamese, Tagalog, Swahili и другие
- более стабильное voice cloning без сильного разброса между повторными генерациями
- лучше работает сценарий, когда референс длинный, а целевой текст короткий
- улучшена просодия по пунктуации, особенно в длинных предложениях
- сохранены возможности v1.0: zero-shot cloning, long-form speech, Pinyin/IPA control и code-switching
GitHub:
https://github.com/OpenMOSS/MOSS-TTS
ModelScope:
https://modelscope.ai/models/OpenMOSS-Team/MOSS-TTS-v1.5
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
OpenBMB показали новый результат для MiniCPM5-1B и снова продвигают свою идею Densing Law: маленькие on-device модели постепенно догоняют то, что ещё недавно требовало огромных LLM.
Хронология выглядит так:
- февраль 2024: MiniCPM-2B добирается до уровня GPT-3
- сентябрь 2024: MiniCPM3-4B уже сравнивают с уровнем ChatGPT
- май 2026: MiniCPM5-1B получает AA 17.9 и обходит GPT-4o с 14.1 в этом тесте
Главный акцент - размер.
MiniCPM5-1B примерно в 200 раз меньше по числу параметров, но уже показывает результаты, которые ещё пару лет назад казались невозможными для локальных моделей.
Cами авторы честно признают, что на многих задачах 1B-модель всё ещё не сильнее GPT-4o. Это не «убийца больших моделей», а скорее сигнал направления.
Если Densing Law продолжит работать, следующий большой сдвиг может быть не в ещё более гигантских моделях, а в сильных локальных AI, которые запускаются прямо на телефоне, ноутбуке или edge-устройстве.
https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B
Хронология выглядит так:
- февраль 2024: MiniCPM-2B добирается до уровня GPT-3
- сентябрь 2024: MiniCPM3-4B уже сравнивают с уровнем ChatGPT
- май 2026: MiniCPM5-1B получает AA 17.9 и обходит GPT-4o с 14.1 в этом тесте
Главный акцент - размер.
MiniCPM5-1B примерно в 200 раз меньше по числу параметров, но уже показывает результаты, которые ещё пару лет назад казались невозможными для локальных моделей.
Cами авторы честно признают, что на многих задачах 1B-модель всё ещё не сильнее GPT-4o. Это не «убийца больших моделей», а скорее сигнал направления.
Если Densing Law продолжит работать, следующий большой сдвиг может быть не в ещё более гигантских моделях, а в сильных локальных AI, которые запускаются прямо на телефоне, ноутбуке или edge-устройстве.
https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B
👍3❤2
⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ
Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление.
➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу.
Какие направления доступны:
✅ AI и продуктовая аналитика
✅ Управление бизнес-моделью
✅ AI-помощники Phygital
🟢 Гибрид или офис, Москва
🟢 От 20 часов в неделю
🟢 Зарплата до 81 300 ₽ в месяц
Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship
Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление.
➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу.
Какие направления доступны:
Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
Forwarded from Machinelearning
Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
👍3❤2🔥2
AI-кино вышло на новый уровень: в Каннах показали 95-минутный фильм, полностью сгенерированный нейросетями.
Боевик Hell Grind, который собрали всего за две недели. Бюджет - около $500 000, и самое показательное, что примерно $400 000 из этой суммы ушло не на съёмки, актёров и декорации, а на AI compute.
Боевик Hell Grind, который собрали всего за две недели. Бюджет - около $500 000, и самое показательное, что примерно $400 000 из этой суммы ушло не на съёмки, актёров и декорации, а на AI compute.
💩5❤4🤮2👍1👎1🤔1🤯1
Это инструмент, с которым можно автоматизировать задачи, писать скрипты, собирать проекты, работать с данными, делать ботов и использовать ИИ как ускоритель разработки.
Но есть проблема: большинство новичков учат Python кусками. Немного синтаксиса, пару задачек, немного теории - и потом ступор: «а что с этим делать дальше?»
Этот курс сделан иначе. Здесь упор на реальную практику: вы не просто смотрите уроки, а постепенно учитесь писать код, разбирать ошибки, собирать рабочие решения и понимать, как Python применяется в нормальных задачах.
Что внутри:
- Python с нуля понятным языком
- практика вместо бесконечной сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современный подход к разработке с ИИ
- отдельный акцент на вайбкодинг
Вайбкодинг -это умение правильно ставить задачу, проверять код, понимать результат и ускорять работу без слепого копирования. В 2026 году это уже не бонус, а нормальный навык разработчика.
Сегодня скидка 60 процентов: https://stepik.org/course/288218/info
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2❤1👍1
Goldman Sachs: токены становятся новой болью AI-экономики
AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.
Обычный чат-бот отвечает один раз. Агент работает иначе:
- планирует задачу
- вызывает инструменты
- проверяет результат
- исправляет ошибки
- снова запускает цикл
Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели.
Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц.
Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена.
Главная битва - между продуктивностью агентов и токеновой расточительностью.
Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня.
https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars
AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.
Обычный чат-бот отвечает один раз. Агент работает иначе:
- планирует задачу
- вызывает инструменты
- проверяет результат
- исправляет ошибки
- снова запускает цикл
Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели.
Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц.
Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена.
Главная битва - между продуктивностью агентов и токеновой расточительностью.
Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня.
https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars
❤2👍1🥰1
Она позволяет командам взаимодействовать с агентами, которые выполняют задачи в изолированных средах Kubernetes, обеспечивая безопасность и гибкость.
🚀 Основные моменты:
- Slack-агенты для выполнения задач и получения ответов.
- Изолированные среды для безопасного выполнения команд.
- Поддержка пользовательских инструментов и плагинов.
- Долговременные рабочие процессы с возможностью восстановления.
- Хранение состояния для повторного подключения без потери данных.
📌 GitHub: https://github.com/paradigmxyz/centaur
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
🚀 Умный набор для AI-разработки
Vibecode Pro Max Kit превращает AI-агентов в полноценные инженерные команды, которые могут исследовать, планировать и разрабатывать код. Он обеспечивает автоматическую генерацию документации и управление контекстом, улучшая память AI на длительный срок.
🚀 Основные моменты:
- Спецификационно-ориентированная разработка для AI
- Автогенерация PRD и управление задачами
- Самообучающаяся база знаний
- Автономная работа на больших задачах
- Совместное использование планов и спецификаций
📌 GitHub: https://github.com/withkynam/vibecode-pro-max-kit
#typescript
Vibecode Pro Max Kit превращает AI-агентов в полноценные инженерные команды, которые могут исследовать, планировать и разрабатывать код. Он обеспечивает автоматическую генерацию документации и управление контекстом, улучшая память AI на длительный срок.
🚀 Основные моменты:
- Спецификационно-ориентированная разработка для AI
- Автогенерация PRD и управление задачами
- Самообучающаяся база знаний
- Автономная работа на больших задачах
- Совместное использование планов и спецификаций
📌 GitHub: https://github.com/withkynam/vibecode-pro-max-kit
#typescript
GitHub
GitHub - withkynam/vibecode-pro-max-kit: Your AI forgets. This remembers. Spec-driven coding harness for vibecoders, product owners…
Your AI forgets. This remembers. Spec-driven coding harness for vibecoders, product owners, CEOs and real builders — self-improving context memory, 12 agents, 32 skills. Kills context rot, ships fe...
❤2👍2
Nvidia выложила Nemotron 3 Ultra в открытых весах.
Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.
Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.
LatentMoE добавляет ёмкости без пропорционального роста вычислений.
Веса открыты - можно гонять локально и щупать самим.
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf
Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.
Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.
LatentMoE добавляет ёмкости без пропорционального роста вычислений.
Веса открыты - можно гонять локально и щупать самим.
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf