Машинное обучение RU

Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis

Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.

https://github.com/open-jarvis/OpenJarvis

👍3❤2👎1

1.65K viewsedited 16:21

Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально.

У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление.

Если решите идти дальше, на основном курсе вас ждёт:

● обучение от основ до внедрения ML-моделей;
● 18+ проектов для портфолио;
● карьерная поддержка при выходе на рынок;
● дополнительный модуль по современным AI-инструментам.

🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10].

Попробовать бесплатно →

Erid: 2SDnjcVRJFU
Название: ООО "ЯНДЕКС"
ИНН: 7736207543

👍2

1.5K viewsedited 14:34

Машинное обучение RU

Forwarded from Machinelearning

✔️

На OpenRouter появилась Fugu Ultra

OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.

Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.

Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.

Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.

Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

1.2K views16:35

Машинное обучение RU

✔️

Японский разработчик выложил в open source drop-in замену NumPy, которая работает на GPU.

Она называется CuPy.

Меняете одну строку:

import numpy as np → import cupy as cp

И тот же код может работать до 100 раз быстрее на CUDA.

→ работает с существующим NumPy/SciPy-кодом
→ без переписывания логики
→ без нового синтаксиса
→ также поддерживает AMD ROCm

100% open source.

https://github.com/Hannibal046/Awesome-LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤20👍10🔥7👎3😁1

1.85K views12:01

Машинное обучение RU

Apple, как сообщается, лоббирует администрацию Трампа, чтобы ей разрешили покупать memory chips у CXMT - китайского производителя чипов, который находится в чёрном списке Pentagon Chinese Military Company.

FT пишет, что Apple обратилась в Министерство торговли США больше месяца назад, после того как рост цен на память вынудил компанию поднять цены на MacBook и iPad.

Этот шаг стёр $263 млрд рыночной стоимости Apple.

Юридически Apple не запрещено покупать чипы у CXMT.

Список Пентагона в основном создаёт репутационный риск, если только Министерство торговли позже не внесёт CXMT в Entity List.

CXMT - национальный DRAM-чемпион Китая.

Сейчас Apple зависит от Micron, Samsung и SK Hynix.

Apple заявляет, что цены на память стали «неустойчивыми».

https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1

❤4👍2🔥1

1.82K views15:09

Машинное обучение RU

Forwarded from Machinelearning

Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке.

Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

👍5🔥4❤3

994 views18:13

Машинное обучение RU

Как AI меняет промышленность и что интересного произошло в технологиях за последние полгода? Всё важное – в одном специальном эпизоде шоу «404 секунды»

Ведущий Антон Черноусов из Yandex Cloud и гость — Вячеслав Захаров из «Газпром нефти» — разобрали применение AI в разных областях жизни.

Уже сегодня голосовые помощники помогают детям с домашкой, аватары близких общаются с семьей после смерти, дизайнеры могут предложить не один, а 30 вариантов интерьера за одну встречу, а на главных кинофестивалях показывают созданные нейросетями фильмы. Ощутимое влияние искусственный интеллект оказывает и на бизнес, и на промышленность, и на всех нас.

Посмотреть шоу можно на YouTube и ВК
Послушать аудио-версию на Яндекс Музыке

👍3❤1🔥1😁1

1.21K views12:00

Машинное обучение RU

⚡️ Claude Sonnet 5 обходится дороже за задачу: примерно на 15% дороже Opus 4.8 и почти в 2 раза дороже Sonnet 4.6, хотя цена за токен у него ниже, чем у Opus.

Причина в том, что для выполнения похожей benchmark-задачи он использует больше токенов.

Проще говоря: Sonnet 5 сильнее «думает» и больше пишет, поэтому итоговый счёт выходит выше, даже если каждый токен дешевле.

Промо-цены пока меняют картину. До 31 августа 2026 Sonnet 5 стоит $2 за 1M input-токенов и $10 за 1M output-токенов.

С 1 сентября 2026 цена вернётся к $3 / $15.

https://x.com/ArtificialAnlys/status/2072062595482456431

❤4😁3👍2🔥2😢2

1.19K views23:51

Машинное обучение RU

Forwarded from GigaDev — разработка GigaChat

💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»

Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.

Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.

Почему это интересно?

Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.

В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.

Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.

Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.

Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.

Результаты:

🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.

➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B

➡️

GitVerse

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang

Motivation

Modifications

Accuracy Tests

Speed Tests and Profiling

Checklist

Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...

👍59🔥3👎2🥰2❤1🎉1

536 views12:31

Машинное обучение RU

Anthropic, по данным СМИ, ведёт ранние переговоры с Samsung о производстве собственного кастомного AI-чипа.

The Information пишет, что создатели Claude пока определяют, что именно должен делать этот процессор, насколько мощным он должен быть и как он будет встраиваться в серверы или кластеры.

Сейчас Anthropic уже использует AWS Trainium, Google TPU и Nvidia GPU, и эти решения останутся ключевыми.

Но собственный чип дал бы компании ещё один рычаг, пока стоимость запуска моделей, мощности дата-центров, поставки памяти и энергопотребление становятся стратегическими ограничениями.

Для Samsung это шанс получить клиентом AI-гаганта для своего 2-нм техпроцесса и advanced packaging.

https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip

👍3❤2🔥2

608 views15:35

Машинное обучение RU

🧠 Генеративный ИИ развивается настолько быстро, что за новыми моделями легко потерять из виду более важный вопрос: как вообще сегодня устроен рынок AI и куда движется индустрия?

16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».

Обсудят:
• какие технологические тренды сегодня определяют развитие AI;
• чем российский рынок отличается от мирового;
• как аналитики оценивают рынок ИИ и почему их прогнозы сильно расходятся;
• как компании внедряют GenAI и какие сценарии уже приносят бизнес-результат.

Среди спикеров — эксперты Yandex Cloud, Yandex AI Studio, «Яков и Партнёры» и инвестиционного сообщества.

🔗 Регистрация

❤2👍1🔥1🤬1

542 views16:03

Машинное обучение RU

AutoMem ускоряет long-horizon агентов в 2–4 раза

Новая работа предлагает обучать память агента как отдельный cognitive skill.

Идея в том, что агент должен не просто складывать всё в контекст, а учиться:

• что сохранять
• как кодировать информацию
• когда доставать нужные данные
• как менять структуру памяти после опыта

AutoMem использует два цикла: LLM пересобирает memory structure по прошлым траекториям, а затем улучшает её через удачные решения.

На Crafter, MiniHack и NetHack авторы показывают, что одна только оптимизация памяти уже даёт сильный прирост и местами приближает агентов к frontier-моделям.

Почему это важно: long-horizon задачи часто ломаются не из-за слабого reasoning, а из-за плохой памяти. Агент забывает контекст, хранит мусор или не может достать нужный факт вовремя.

AutoMem пытается решить именно этот bottleneck без полного переобучения под каждую задачу.

Потенциально полезно для игровых агентов, робототехники и автономных workflow.

arxiv.org/abs/2607.01224

🔥2

373 views18:33

About

Blog

Apps

Platform