Big Data AI
18.6K subscribers
1.05K photos
150 videos
19 files
1.06K links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
✔️ MOSS-TTS v1.5: open-source озвучка стала заметно удобнее для продакшена

OpenMOSS выпустили MOSS-TTS v1.5 - обновление своей открытой TTS-модели на 8B параметров.

Главная фича выглядит простой, но для реальных сценариев очень важная: теперь паузы можно задавать прямо внутри текста через [pause 3.2s]. То есть моделью можно управлять не только на уровне «прочитай фразу», а точнее собирать ритм, драматургию и естественные остановки в речи.

Что нового в v1.5:

- поддержка 31 языка вместо 20
- добавлены Cantonese, Hindi, Thai, Vietnamese, Tagalog, Swahili и другие
- более стабильное voice cloning без сильного разброса между повторными генерациями
- лучше работает сценарий, когда референс длинный, а целевой текст короткий
- улучшена просодия по пунктуации, особенно в длинных предложениях
- сохранены возможности v1.0: zero-shot cloning, long-form speech, Pinyin/IPA control и code-switching

GitHub:
https://github.com/OpenMOSS/MOSS-TTS

ModelScope:
https://modelscope.ai/models/OpenMOSS-Team/MOSS-TTS-v1.5
Please open Telegram to view this post
VIEW IN TELEGRAM
1
OpenBMB показали новый результат для MiniCPM5-1B и снова продвигают свою идею Densing Law: маленькие on-device модели постепенно догоняют то, что ещё недавно требовало огромных LLM.

Хронология выглядит так:

- февраль 2024: MiniCPM-2B добирается до уровня GPT-3
- сентябрь 2024: MiniCPM3-4B уже сравнивают с уровнем ChatGPT
- май 2026: MiniCPM5-1B получает AA 17.9 и обходит GPT-4o с 14.1 в этом тесте

Главный акцент - размер.

MiniCPM5-1B примерно в 200 раз меньше по числу параметров, но уже показывает результаты, которые ещё пару лет назад казались невозможными для локальных моделей.

Cами авторы честно признают, что на многих задачах 1B-модель всё ещё не сильнее GPT-4o. Это не «убийца больших моделей», а скорее сигнал направления.

Если Densing Law продолжит работать, следующий большой сдвиг может быть не в ещё более гигантских моделях, а в сильных локальных AI, которые запускаются прямо на телефоне, ноутбуке или edge-устройстве.

https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B
👍32
⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ

Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление.

➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу.

Какие направления доступны:
AI и продуктовая аналитика
Управление бизнес-моделью
AI-помощники Phygital

🟢Гибрид или офис, Москва
🟢От 20 часов в неделю
🟢Зарплата до 81 300 ₽ в месяц

Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1
Forwarded from Machinelearning
Anthropic только что выпустила Claude Opus 4.8.

Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.

По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.

Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.

claude.com/blog/introducing-dynamic-workflows-in-claude-code
👍32🔥2
AI-кино вышло на новый уровень: в Каннах показали 95-минутный фильм, полностью сгенерированный нейросетями.

Боевик Hell Grind, который собрали всего за две недели. Бюджет - около $500 000, и самое показательное, что примерно $400 000 из этой суммы ушло не на съёмки, актёров и декорации, а на AI compute.
💩54🤮2👍1👎1🤔1🤯1
🖥 Python в 2026 - уже не просто «первый язык программирования».

Это инструмент, с которым можно автоматизировать задачи, писать скрипты, собирать проекты, работать с данными, делать ботов и использовать ИИ как ускоритель разработки.

Но есть проблема: большинство новичков учат Python кусками. Немного синтаксиса, пару задачек, немного теории - и потом ступор: «а что с этим делать дальше?»

Этот курс сделан иначе. Здесь упор на реальную практику: вы не просто смотрите уроки, а постепенно учитесь писать код, разбирать ошибки, собирать рабочие решения и понимать, как Python применяется в нормальных задачах.

Что внутри:

- Python с нуля понятным языком
- практика вместо бесконечной сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современный подход к разработке с ИИ
- отдельный акцент на вайбкодинг

Вайбкодинг -это умение правильно ставить задачу, проверять код, понимать результат и ускорять работу без слепого копирования. В 2026 году это уже не бонус, а нормальный навык разработчика.


Сегодня скидка 60 процентов:
https://stepik.org/course/288218/info
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍1
Goldman Sachs: токены становятся новой болью AI-экономики

AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость.

Обычный чат-бот отвечает один раз. Агент работает иначе:

- планирует задачу
- вызывает инструменты
- проверяет результат
- исправляет ошибки
- снова запускает цикл

Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели.

Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц.

Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена.

Главная битва - между продуктивностью агентов и токеновой расточительностью.

Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня.

https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech-cash-flow-as-usage-soars
2👍1🥰1
✔️ Centaur - это платформа для совместного использования AI-агентов, интегрированных в Slack.

Она позволяет командам взаимодействовать с агентами, которые выполняют задачи в изолированных средах Kubernetes, обеспечивая безопасность и гибкость.

🚀 Основные моменты:
- Slack-агенты для выполнения задач и получения ответов.
- Изолированные среды для безопасного выполнения команд.
- Поддержка пользовательских инструментов и плагинов.
- Долговременные рабочие процессы с возможностью восстановления.
- Хранение состояния для повторного подключения без потери данных.

📌 GitHub: https://github.com/paradigmxyz/centaur

#python
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🚀 Умный набор для AI-разработки

Vibecode Pro Max Kit превращает AI-агентов в полноценные инженерные команды, которые могут исследовать, планировать и разрабатывать код. Он обеспечивает автоматическую генерацию документации и управление контекстом, улучшая память AI на длительный срок.

🚀 Основные моменты:
- Спецификационно-ориентированная разработка для AI
- Автогенерация PRD и управление задачами
- Самообучающаяся база знаний
- Автономная работа на больших задачах
- Совместное использование планов и спецификаций

📌 GitHub: https://github.com/withkynam/vibecode-pro-max-kit

#typescript
2👍2
😁14💯3🎃1
Nvidia выложила Nemotron 3 Ultra в открытых весах.

Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.

Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.

LatentMoE добавляет ёмкости без пропорционального роста вычислений.

Веса открыты - можно гонять локально и щупать самим.

🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf