325K subscribers
4.68K photos
991 videos
17 files
5.11K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Media is too big
VIEW IN TELEGRAM
✔️ Американские сенаторы потребовали от ByteDance закрыть видеогенератор Seedance.

Сенаторы Конгресса США направили письмо CEO ByteDance с требованием немедленно остановить работу Seedance 2.0. По их словам, это наиболее очевидный случай нарушения авторских прав среди продуктов ByteDance: приложение генерирует видео с реальными людьми и персонажами без разрешения правообладателей.

В письме сенаторы привели примеры: ролики с Томом Крузом, Брэдом Питтом и персонажами сериала «Очень странные дела». ByteDance ответил стандартно: компания уважает интеллектуальную собственность и уже принимает меры для усиления защиты.

Ситуация отражает нарастающее давление Конгресса на ИИ-компании, особенно китайские. При этом законодательного регулирования отрасли в США до сих пор нет.
cnbc.com

✔️ Mistral AI запускает корпоративную платформу обучения ИИ-моделей полного цикла.

Новое решение, Forge, позволяет компаниям разрабатывать и улучшать модели на собственных закрытых данных. Платформа поддерживает весь ML-пайплайн от претрейна до SFT, DPO и тонкой настройки через RL. Инструментарий работает как с классическими плотными моделями, так и с архитектурой MoE, включая мультимодальный ввод.

Развернуть тренировочные сессии можно на мощностях Mistral или на локальных GPU-кластерах. В последнем случае компания платит только за лицензию на софт, а Mistral не имеет никакого доступа к обучающей выборке. В Forge также встроены конвейеры для сбора и генерации синтетических данных.

Платформа спроектирована по принципу «agent-first». Forge предоставляет программные интерфейсы, с помощью которых автономные ИИ-агенты (встроенный Mistral Vibe) могут самостоятельно планировать задачи, запускать обучающие эксперименты и подбирать оптимальные гиперпараметры без прямого участия инженеров.
mistral.ai

✔️ Google AI Studio обновил тарифы Gemini API и добавил лимиты расходов.

В Google AI Studio появились Project Spend Caps. Теперь можно задать жесткий месячный бюджет на Gemini API для каждого конкретного проекта. Поставили лимит - он работает, пока сами его не поменяете.

Систему тарифов тоже поменяли. Апгрейд до следующего уровня теперь происходит автоматом. Больше пользуетесь API, платите без задержек - получаете больше квот. Заодно Google снизил минимальные требования расходов для перехода на высокие уровни.

Из других обновлений: настройка биллинга теперь доступна прямо в Google AI Studio без переключения между вкладками, появились дашборды для мониторинга rate limits (RPM, TPM, RPD), суточной разбивки расходов по проектам и моделям, а также детальной статистики по токенам и ошибкам.
Google AI Studio в сети Х

✔️ Manus сделал десктопное приложение My Computer.

Вслед за Perlpexity, Manus анонсировал ИИ-агента, который работает напрямую с файлами и приложениями на ПК. Агент выполняет команды в терминале: сортирует файлы, переименовывает документы, запускает приложения, пишет код и умеет использовать локальный GPU для обучения моделей или инференса.

Manus интегрирован с Gmail и Google Calendar — это позволяет строить сценарии, где агент берёт файл с локального диска и сразу отправляет его по почте. Каждая команда требует подтверждения пользователя: можно разрешить выполнение один раз или добавить задачу в список доверенных. Приложение доступно для macOS и Windows.
manus.im

✔️ Rakuten релизнула японскую модель и сразу попала в скандал.

Компания опубликовала Rakuten AI 3.0 - языковую модель для японского языка. В пресс-релизе заявлено, что модель превосходит GPT-4 в ряде бенчмарков: знание японской культуры, истории и следование инструкциям. В основе - открытые модели сообщества и собственные данные Rakuten. Однако, пользователи в X нашли в конфигурационном файле на Hugging Face строку, явно указывающую на Deepseek. Помимо этого, в ответах на чувствительные вопросы модель демонстрирует скорее прокитайскую, чем прояпонскую позицию.

Это вызвало волну критики: действительно ли модель является японской разработкой, если в ее основе лежит DeepSeek. Rakuten пока не дала официальных пояснений.
rakuten.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍70🤔5021🤬20😁11🔥8😐8🎅1
Распознай, кто говорит, и выиграй 600 тысяч рублей! 💙

ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр»!


❗️Задача — разработать модель распознавания по голосу, устойчивую к искажениям аудиосигнала.

Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука:
🔹искажения, вносимые акустической средой;
🔹посторонние шумы;
🔹реверберация;
🔹большое расстояние до микрофона;
🔹искажения каналов связи.

Участвуй, и ты сможешь:
🟦получить шанс разделить призовой фонд в 600 000 рублей;
🟦разработать решения в области Audio/Speech ML;
🟦прокачать скиллы в Speaker Recognition и Deep Learning.

👆 Регистрируйтесь до 10 апреля включительно!

Подписывайтесь на телеграм-канал «Криптонит. Разработка, наука, шифрование» — там много всего интересного.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81👏21🤩16🤣126🎉5👨‍💻2🔥1😁1🌚1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Dispatch в Claude Cowork: управление Claude на ПК со смартфона.

Dispatch позволяет отправить задание на Mac или Windows в приложение Claude Cowork через мобильное приложение.

В мобильном приложении появляется лента обновлений в реальном времени: Claude сообщает о завершенных этапах и запрашивает подтверждение на критичные действия. Данные остаются на устройстве пользователя и не передаются на серверы Anthropic.

Типичные сценарии для Dispatch: собрать отчет из документов в папке, разобрать «Загрузки» по типам и датам, сконвертировать скриншоты чеков в таблицу Excel или сделать выжимку по нескольким статьям в одном документе.

Функция пока доступна подписчикам плана Claude Max. Для работы на компьютере должно быть установлено и запущено приложение Claude Desktop, привязанное к мобильному устройству через настройки. Расширение на план Pro анонсировано, сроки не уточняются.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13941🔥24👏5🤔54😁2🤗1
Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙

Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов».

60+ актуальных сессий, докладов, примеров, дискуссий по теме анализа данных/ науки о данных/ машинного обучения. Среди тем – ИИ-агенты, «обучение с подкреплением», компьютерное зрение, обработка естественного языка, открытый исходный код, воплощенный ИИ и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, ИИ+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте.

Конференция объединит лидеров команд по машинному обучению, специалистов по обработке данных, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы.

Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии.

Все мы любим конференции не только ради знаний, но и, конечно, ради живого общения и новых знакомств, а это важная часть Data Fusion!

Не пропустите, регистрируйтесь.

*Интеграция данных
Информация о рекламодателе
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47👏21🔥103👾2😁1🥱1😍1👀1
⚡️ Mistral выпустила Small 4.

Mistral Small 4 - это мультимодальный комбайн, который закрывает сразу три задачи: ризонинг, агентный кодинг и работу с изображениями. Раньше под каждую из них была отдельная модель: Magistral, Devstral и Pixtral. Теперь один чекпоинт,

🟡Архитектура

MoE с 128 экспертами, из которых на каждый токен активируются 4. Всего 119B параметров, активных - 6B на токен. Контекстное окно - 256 тыс. токенов.

По сравнению с Mistral Small 3 в новой версии задержка сократилась на 40%, пропускная способность выросла в 3 раза.

Ключевая фича - параметр reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели.

🟡Тесты

Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов.

На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K.

Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200.


Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio.


📌 Лицензирование: Apache 2.0 License.


🟡Статья
🟡Набор моделей


@ai_machinelearning_big_data

#AI #ML #LLM #MistralSmall4 #MistralAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍116👏23🤩1310🔥9👨‍💻5🤣4🥰3🎉3❤‍🔥1💯1
Media is too big
VIEW IN TELEGRAM
✔️ Nvidia выпустит инференс-чипы на базе архитектуры Groq для Китая.

Nvidia готовит к майскому релизу новую версию ИИ-ускорителей, построенных на технологиях стартапа Groq, которые компания лицензировала в прошлом году. Новинка предназначена исключительно для инференса.

На глобальном рынке Nvidia планирует использовать чипы Groq в связке с будущей архитектурой Vera Rubin. Поскольку экспорт этих флагманов в КНР запрещен, китайскую версию Groq адаптируют для интеграции со сторонними системами. При этом источники Reuters говорят, что аппаратная производительность новых процессоров не урезалась.

Параллельно Дженсен Хуанг объявил о возобновлении производства H200. Компания получила экспортные лицензии от администрации США и уже принимает заказы из Китая.
reuters.com

✔️ MiniMax выпустила самоэволюционирующую модель M2.7.

M2.7 - первая модель MiniMax, которая способна самостоятельно улучшать свои алгоритмы и рабочие процессы. За время разработки система прошла более 100 циклов автономной оптимизации, что повысило ее производительность на 30%.

Новинка позиционируется для сложных задач кодинга и построения многошаговых ИИ-агентов. В бенчмарке SWE-Pro модель показала уровень Claude 3.5 Sonnet, а ее рейтинг ELO на GDPval-AA достиг 1495. Помимо кодинга, M2.7 работает с офисными форматами: редактирует документы Word, Excel и PowerPoint, сохраняя исходную верстку даже после серии глубоких правок.

Модель поставляется в 2 вариантах: базовая версия и M2.7-highspeed со скоростью генерации до 100 токенов в секунду. Стоимость API - 30 центов за миллион входящих и 1,20 доллара за миллион исходящих токенов. M2.7 уже поддерживается в Cursor, Cline и Ollama, а также доступна в фирменном приложении MiniMax Agent.
minimax.io

✔️ Perplexity запустила Comet Enterprise.

ИИ-поисковик выпустил корпоративную версию своего браузера, ориентированную на безопасную автоматизацию рабочих процессов в компаниях.

С помощью Comet Enterprise сотрудники могут прямо из браузера делегировать рутину: анализировать контракты на предмет рисков, собирать контекст для встреч, делать вычисления на основе финансовых отчетов и автоматизировать поиск контактов в LinkedIn.

Безопасность усилена интеграцией с платформой CrowdStrike Falcon. Она на лету блокирует фишинг, вредоносное ПО и предотвращает утечки данных. Инструмент уже включен в корпоративную подписку Perplexity.
perplexity.ai

✔️ Google крупно обновила Stitch.

Google Labs представило новую версию платформы Stitch, генеративного инструмента для создания UI-макетов по текстовому описанию. Главной фишкой стал бесконечный ИИ-холст, принимающий на вход текст, код и картинки. На нем ИИ-агент анализирует историю проекта и может параллельно развивать сразу несколько визуальных концепций.

Теперь Stitch умеет превращать статические экраны в кликабельные прототипы, самостоятельно генерируя промежуточные шаги пользовательского пути при взаимодействии с элементами.

Платформа также получила поддержку MCP, прямую выгрузку в среды AI Studio и Antigravity и голосовое управление холстом в реальном времени.
blog.google

✔️ OpenAI хантит таланты через конкурс Parameter Golf.

Компания открыла публичное соревнование для исследователей с крайне жесткими техническими ограничениями. Участникам предстоит создать максимально эффективную языковую модель, при этом размер весов вместе с кодом для обучения не должен превышать 16 МБ. На сам процесс тренировки отводится строго до 10 минут на кластере из восьми видеокарт H100. Эффективность алгоритмов будет оцениваться на сете FineWeb.

Цель челленджа - поиск нестандартно мыслящих инженеров. Авторы лучших проектов получат приглашения на собеседование. Дополнительным стимулом станет призовой фонд в 1 млн. долларов, который распределят в виде грантов на аренду копьюта у провайдера Runpod.

На GitHub уже опубликованы базовые решения, проверочные скрипты и публичный лидерборд. Принять участие в конкурсе можно до 30 апреля.
openai.com

@ai_machinelearning_big_data

🎯Полезные Мл-ресурсы 🚀 Max

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10118🎉16👏9🔥7🤔1🤩1
🌟 Xiaomi релизнула 3 модели: LLM, омнимодальную и TTS.

🟡MiMo-V2-Pro

Флагман. Триллион параметров суммарно, 42 млрд. активных при инференсе, архитектура MoE с гибридным вниманием и контекстным окном в 1 миллион токенов. До официального анонса модель тестировалась на OpenRouter под именем Hunter Alpha.

🟢Artificial Analysis Intelligence Index - 49 баллов, это 8 место в мире и 2 среди китайских LLM.

🟢PinchBench - 84,0 (3 место, сразу за Claude Sonnet 4.6).

🟢ClawEval - 61,5, тоже 3 место, выше GPT-5.2.

Реальная агентская эффективность на GDPval-AA: Elo 1434 (лучший результат среди китайских моделей).

Цена API: $1 вход / $3 выход за млн. токенов при контексте 256K и $2 вход / $6 выход для контекста 256К-1М.

🟡 MiMo-V2-Omni

Принимает текст, изображения, видео и аудио через единую базу с отдельными энкодерами для каждой модальности. Параметры не раскрыты. Модель поддерживает непрерывную обработку аудио длиной свыше 10 часов в одном запросе.

🟢MM-BrowserComp - 52,0, на GPDVal AA - 1435, оба выше Gemini 3 Pro.

Цена: $0,40 вход / $2,00 выход.

На демонстрации модель прошла цикл онлайн-покупки автономно: нашла отзывы на Xiaohongshu, сравнила продавцов на JD.com, поторговалась с поддержкой, оформила заказ.

Второе демо: получила одно текстовое задание, сняла 15-секундный ролик из 4 сцен, синтезировала звук, исправила ошибку рендеринга шрифта, загрузила на TikTok и опубликовала.


🟡MiMo-V2-TTS

Модель обучена на сотнях миллионов часов аудио, и допилена через многомерный RL. Синтезирует речь с управлением эмоциями на уровне отдельных предложений, поёт с сохранением высоты и ритма, воспроизводит китайские диалекты: сычуаньский, хэнаньский, кантонский, тайваньский. Поддержка других языков не заявлена.

Форматные маркеры в тексте: пунктуацию, частицы и выделение сама переводит в просодику без дополнительной разметки.

Доступ на ограниченный период - бесплатно. Сроки предложения не указаны.

Кстати, команду MiMo возглавляет Ло Фули, один из ключевых авторов DeepSeek R1.


Все модели релиза доступны через API на platform.xiaomimimo.com и в MiMo Studio.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48👀2726🔥21👏8🤔2💋1
🔥 Денис из комьюнити @its_capitan запустил собственную детективную игру в одиночку: каждый персонаж — это реальный Telegram-аккаунт, AI отвечает за героев, улики (сайты, карты) — всё настоящее.

Что в итоге:
🔘 3 месяца на подготовку + 3 месяца на разработку
🔘 40+ покупок за полтора месяца
🔘 выручка — $1500+
🔘 чек — $40
🔘 стек: Python, Telegram API, OpenAI + Anthropic

Без команды и инвестиций, но с классной идеей и проработанным сценарием — проект уже зарабатывает деньги.

Таких запусков в канале десятки. Ребята честно рассказывают про успехи, провалы и продвижение. Без теорий — только фактические цифры и запуск в реальном времени.

➡️ @its_capitan

Подписывайтесь, если интересно, как делать маленькие IT-проекты с доходом и без иллюзий.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24😐23👍166👏6🤬2🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 Unsloth Studio: опенсорный no-code веб-интерфейс для LLM.

Unsloth Studio - это локальный комбайн, который объединяет подготовку данных, обучение, инференс и экспорт модели в одном месте.

Под капотом кастомные Triton-ядра с собственным backprop. По сравнению со стандартными CUDA-реализациями это дает 2х прирост скорости обучения и снижение потребления по VRAM на 70%.

Поддерживаются полный файн-тюнинг, претрейн, LoRA, QLoRA, 4-bit, 16-bit и FP8. Всего совместимо более 500 моделей, включая Llama 4, Qwen 3.5 и Gemma 3.

Для работы с данными есть визуальный нодовый редактор Data Recipes. Studio принимает PDF, DOCX, CSV и JSONL, генерирует синтетические датасеты и автоматически конвертирует данные в форматы ChatML или Alpaca.

Помимо стандартного SFT, Studio умеет в GRPO, которая не требует отдельной critic-модели и потребляет на 80% меньше VRAM, что делает обучение ризонинг-моделей реалистичным на локальном железе.

Модели на 8B и 70B параметров (например, Llama 3.1, Llama 3.3, DeepSeek-R1) можно файн-тюнить на одной RTX 4090 или 5090, а не на кластере, но есть и поддержка multi-GPU.


В режиме инференса Studio умеет: tool calling, выполнение кода прямо в чате, работу с изображениями, аудио, PDF и DOCX. Из коробки - веб-поиск и автонастройка параметров инференса.

Экспорт результатов - одной кнопкой в GGUF, vLLM или Ollama. Studio сама мерджит LoRA-адаптеры с базовой моделью.

Работает на Windows, Linux и macOS (на Mac пока только инференс, поддержка MLX-обучения анонсирована), есть Docker. AMD-пользователи могут обучать через Unsloth Core, поддержка в Studio обещана позже.


📌Лицензирование: AGPL-3.0.


🟡Документация
🖥Github


@ai_machinelearning_big_data

#AI #ML #LLM #Framework #Train #UnslothStudio
Please open Telegram to view this post
VIEW IN TELEGRAM
👌58🔥39👍25❤‍🔥21👏109💯6
Data Science и Data Engineering: какое направление выбрать в 2026 году?

🎧 1 апреля пройдет День открытых дверей онлайн-магистратуры НИЯУ МИФИ «Специалист по работе с данными и ИИ» в партнёрстве с Яндекс Практикумом.

На встрече обсудят:

💙 как рост ИИ трансформируют рынок труда
💙 4 трека для развития: ML, CV, NLP и Data Engineering
💙 какие задачи усложняются и где усиливается конкуренция

И расскажут, как за 2 года освоить фундаментальную базу, собрать портфолио из проектов и получить диплом магистра без отрыва от работы.

Подключайтесь онлайн 1 апреля в 19:00 мск.

🏃‍♀️ Записаться на ДОД
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🎉168🔥8🤔8😁3👏2🫡2
This media is not supported in your browser
VIEW IN TELEGRAM
🙂

Сегодня тот самый день - "давай сделаем до праздников"

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
😁105👏52🤣18👍1612🎉12😍9🤔1
Вот это комбо: ты, команда SberAds и шанс получить приглашение в Сбер за один день! ⚡️

28 марта Сбер устраивает One Day Offer* для Data Scientists**, готовых перевести эффективность SberAds, качество и релевантность показываемой рекламы на новый уровень.

Если ты хочешь работать над созданием и улучшением моделей для аукционов и свободно ориентируешься в Python, Go, S3, Spark — регистрируйся на One Day Offer*.

У тебя будет 8000+ коллег — масштабно, правда? Успей занять место в команде мечты!

* One Day Offer — предложение о работе за один день.
** Data Scientists — исследователи данных.
🔥22🤣20🎉12👏10🗿4🤬2💯21🤷‍♂1
Media is too big
VIEW IN TELEGRAM
⚡️ Unitree выпустила четвероногого робота As2

As2 предлагается в 3 версиях: AIR, PRO и EDU.

Вся линейка построена на одной механической базе: 18 кг, 12 степеней свободы, промышленные крестовые подшипники и моторы PMSM с низкой инерцией. Корпус - алюминиевый сплав с высокопрочным пластиком.

Базовая электроника тоже унифицирована: 8-ядерный CPU, Wi-Fi 6, Bluetooth 5.2, HD-камера, микрофон, динамик.

As2 AIR (бюджетный вариант)
Максимальный крутящий момент суставов 65 Нм, скорость до 3 м/с, грузоподъемность при ходьбе до 10 кг, подъем по склону до 30°. Батарея на 8000 мАч, без быстрой зарядки. Нет GPS, 4G, LiDAR и ISS 3.0. Это минимально рабочая конфигурация.

As2 PRO
Крутящий момент 75 Нм, скорость до 3,7 м/с, нагрузка до 13 кг, подъём 40°. Сюда добавили LiDAR, GPS, 4G, система ISS 3.0 для отслеживания сопровождаемого объекта, защита IP54. Батарея на 15 000 мАч с быстрой зарядкой обеспечивает до 4 часов хода налегке и до 13 км с нагрузкой 13 кг.

As2 EDU (платформа для разработчиков).
Характеристики ходовой части совпадают с PRO, но максимальный момент до 90 Нм, а нагрузка при ходьбе до 15 кг. Главное отличие: поддержка API, станция для автономной зарядки и опциональный вычислительный модуль NVIDIA Jetson Orin NX. Это единственная версия, которую можно программировать под собственные задачи.

Все 3 модели получают OTA-обновления через платформу UniStore и работают при температурах от −20 до +50 °C. Цен в открытых источниках пока нет.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2017🤩174🔥3👏2