Машинное обучение RU

✔️

DeepSeek раскатал Vision Mode в чат-боте

DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).

В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.

Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.

Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.

Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

910 views19:35

Машинное обучение RU

Forwarded from Machinelearning

✔️

Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.

Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥1

958 views19:55

Машинное обучение RU

NVIDIA выкатили кое-что большое для AI-агентов.

Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты.

Что внутри:

• cuOpt
• NeMo
• Dynamo
• RAG
• DeepStream
• medical AI
• physical AI
• и другие направления

Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA.

Работает из коробки с Claude Code, Codex, Cursor и Kiro.

Установка одной командой:

npx skills add nvidia/skills

Это уже не просто набор инструментов, а governance возможностей для AI-агентов.

Проверенные, подписанные и аудируемые инструкции, которым агент может доверять.

https://github.com/nvidia/skills

❤7👍6🔥1

2.21K views17:16

Машинное обучение RU

Codex начал отправлять SSD пользователей на пенсию раньше времени 😬

Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель.

Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник.

Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы.

А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex.

Фикса пока нет.

https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html

👍9❤4🔥4😱4👎1

2.21K views15:15

Машинное обучение RU

LLM уже находят реальные memory safety баги в Rust-коде.

И, что неожиданно, это работает очень хорошо.

Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах.

В итоге нашлись десятки реальных багов:

• use-after-free

• чтение за пределами буфера

• data races

• неправильные реализации Send / Sync

Все находки проверялись через miri, чтобы убрать ложные срабатывания.

Почему в Rust это работает лучше, чем в C?

• unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать

• miri может точно подтвердить, настоящий баг или нет

• не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C

Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности.

Стоит прочитать всем, кто думает про AI в security tooling.

https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc

https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3

#Rust #RustLang #MemorySafety #Security #LLM

👍7❤4🥰1

1.94K views14:35

Машинное обучение RU

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis

Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.

https://github.com/open-jarvis/OpenJarvis

👍3❤2👎1

1.65K viewsedited 16:21

Машинное обучение RU

Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально.

У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление.

Если решите идти дальше, на основном курсе вас ждёт:

● обучение от основ до внедрения ML-моделей;
● 18+ проектов для портфолио;
● карьерная поддержка при выходе на рынок;
● дополнительный модуль по современным AI-инструментам.

🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10].

Попробовать бесплатно →

Erid: 2SDnjcVRJFU
Название: ООО "ЯНДЕКС"
ИНН: 7736207543

👍2

1.48K viewsedited 14:34

Машинное обучение RU

Forwarded from Machinelearning

✔️

На OpenRouter появилась Fugu Ultra

OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.

Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.

Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.

Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.

Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🔥1

1.18K views16:35

Машинное обучение RU

✔️

Японский разработчик выложил в open source drop-in замену NumPy, которая работает на GPU.

Она называется CuPy.

Меняете одну строку:

import numpy as np → import cupy as cp

И тот же код может работать до 100 раз быстрее на CUDA.

→ работает с существующим NumPy/SciPy-кодом
→ без переписывания логики
→ без нового синтаксиса
→ также поддерживает AMD ROCm

100% open source.

https://github.com/Hannibal046/Awesome-LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤20👍10🔥7👎3😁1

1.82K views12:01

Машинное обучение RU

Apple, как сообщается, лоббирует администрацию Трампа, чтобы ей разрешили покупать memory chips у CXMT - китайского производителя чипов, который находится в чёрном списке Pentagon Chinese Military Company.

FT пишет, что Apple обратилась в Министерство торговли США больше месяца назад, после того как рост цен на память вынудил компанию поднять цены на MacBook и iPad.

Этот шаг стёр $263 млрд рыночной стоимости Apple.

Юридически Apple не запрещено покупать чипы у CXMT.

Список Пентагона в основном создаёт репутационный риск, если только Министерство торговли позже не внесёт CXMT в Entity List.

CXMT - национальный DRAM-чемпион Китая.

Сейчас Apple зависит от Micron, Samsung и SK Hynix.

Apple заявляет, что цены на память стали «неустойчивыми».

https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1

❤4👍2🔥1

1.78K views15:09

Машинное обучение RU

Forwarded from Machinelearning

Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке.

Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

👍5🔥4❤3

973 views18:13

Машинное обучение RU

Как AI меняет промышленность и что интересного произошло в технологиях за последние полгода? Всё важное – в одном специальном эпизоде шоу «404 секунды»

Ведущий Антон Черноусов из Yandex Cloud и гость — Вячеслав Захаров из «Газпром нефти» — разобрали применение AI в разных областях жизни.

Уже сегодня голосовые помощники помогают детям с домашкой, аватары близких общаются с семьей после смерти, дизайнеры могут предложить не один, а 30 вариантов интерьера за одну встречу, а на главных кинофестивалях показывают созданные нейросетями фильмы. Ощутимое влияние искусственный интеллект оказывает и на бизнес, и на промышленность, и на всех нас.

Посмотреть шоу можно на YouTube и ВК
Послушать аудио-версию на Яндекс Музыке

👍3❤1🔥1😁1

1.16K views12:00

Машинное обучение RU

⚡️ Claude Sonnet 5 обходится дороже за задачу: примерно на 15% дороже Opus 4.8 и почти в 2 раза дороже Sonnet 4.6, хотя цена за токен у него ниже, чем у Opus.

Причина в том, что для выполнения похожей benchmark-задачи он использует больше токенов.

Проще говоря: Sonnet 5 сильнее «думает» и больше пишет, поэтому итоговый счёт выходит выше, даже если каждый токен дешевле.

Промо-цены пока меняют картину. До 31 августа 2026 Sonnet 5 стоит $2 за 1M input-токенов и $10 за 1M output-токенов.

С 1 сентября 2026 цена вернётся к $3 / $15.

https://x.com/ArtificialAnlys/status/2072062595482456431

❤4😁3👍2🔥2😢2

1.1K views23:51

Машинное обучение RU

Forwarded from GigaDev — разработка GigaChat

💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»

Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.

Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.

Почему это интересно?

Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.

В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.

Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.

Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.

Цикл обучения включал:
🔘адаптацию AR-модели к диффузионной генерации;
🔘постепенное увеличение размера блока;
🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM;
🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации.

Результаты:

🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B.
🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%.
🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации.
🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM.
🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.

➡️Подробности — в статье на Habr.
➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B

➡️

GitVerse

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang

Motivation

Modifications

Accuracy Tests

Speed Tests and Profiling

Checklist

Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...

👍59🔥3👎2🥰2🎉1

429 views12:31

Машинное обучение RU

Anthropic, по данным СМИ, ведёт ранние переговоры с Samsung о производстве собственного кастомного AI-чипа.

The Information пишет, что создатели Claude пока определяют, что именно должен делать этот процессор, насколько мощным он должен быть и как он будет встраиваться в серверы или кластеры.

Сейчас Anthropic уже использует AWS Trainium, Google TPU и Nvidia GPU, и эти решения останутся ключевыми.

Но собственный чип дал бы компании ещё один рычаг, пока стоимость запуска моделей, мощности дата-центров, поставки памяти и энергопотребление становятся стратегическими ограничениями.

Для Samsung это шанс получить клиентом AI-гаганта для своего 2-нм техпроцесса и advanced packaging.

https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip

👍3❤2🔥2

350 views15:35

Машинное обучение RU

🧠 Генеративный ИИ развивается настолько быстро, что за новыми моделями легко потерять из виду более важный вопрос: как вообще сегодня устроен рынок AI и куда движется индустрия?

16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».

Обсудят:
• какие технологические тренды сегодня определяют развитие AI;
• чем российский рынок отличается от мирового;
• как аналитики оценивают рынок ИИ и почему их прогнозы сильно расходятся;
• как компании внедряют GenAI и какие сценарии уже приносят бизнес-результат.

Среди спикеров — эксперты Yandex Cloud, Yandex AI Studio, «Яков и Партнёры» и инвестиционного сообщества.

🔗 Регистрация

🤬1

206 views16:03

About

Blog

Apps

Platform