Forwarded from Machinelearning
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Forwarded from Machinelearning
DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML).
В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT.
Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
NVIDIA выкатили кое-что большое для AI-агентов.
Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты.
Что внутри:
• cuOpt
• NeMo
• Dynamo
• RAG
• DeepStream
• medical AI
• physical AI
• и другие направления
Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA.
Работает из коробки с Claude Code, Codex, Cursor и Kiro.
Установка одной командой:
Это уже не просто набор инструментов, а governance возможностей для AI-агентов.
Проверенные, подписанные и аудируемые инструкции, которым агент может доверять.
https://github.com/nvidia/skills
Компания открыла каталог из 110+ проверенных agent skills. Это переносимые наборы инструкций, которые учат AI-агентов правильно использовать библиотеки CUDA-X и платформенные инструменты.
Что внутри:
• cuOpt
• NeMo
• Dynamo
• RAG
• DeepStream
• medical AI
• physical AI
• и другие направления
Каждый skill подписан OMS-подписью. Её можно проверить через trust anchor NVIDIA.
Работает из коробки с Claude Code, Codex, Cursor и Kiro.
Установка одной командой:
npx skills add nvidia/skillsЭто уже не просто набор инструментов, а governance возможностей для AI-агентов.
Проверенные, подписанные и аудируемые инструкции, которым агент может доверять.
https://github.com/nvidia/skills
❤7👍6🔥1
Codex начал отправлять SSD пользователей на пенсию раньше времени 😬
Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель.
Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник.
Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы.
А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex.
Фикса пока нет.
https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html
Пользователи заметили баг: агент может записывать до 640 ТБ данных в год на накопитель.
Причина банальная, но болезненная: логгер слишком подробно сохраняет действия агента и постепенно превращает диск в расходник.
Для сравнения: обычный SSD на 1 ТБ часто рассчитан примерно на 600 ТБ записи за весь срок службы.
А один пользователь уже поймал 37 ТБ записи всего за 21 день работы Codex.
Фикса пока нет.
https://www.notebookcheck.net/OpenAI-Codex-has-a-bug-that-could-kill-your-SSD-in-under-a-year.1326191.0.html
👍9❤4🔥4😱4👎1
LLM уже находят реальные memory safety баги в Rust-коде.
И, что неожиданно, это работает очень хорошо.
Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах.
В итоге нашлись десятки реальных багов:
• use-after-free
• чтение за пределами буфера
• data races
• неправильные реализации Send / Sync
Все находки проверялись через miri, чтобы убрать ложные срабатывания.
Почему в Rust это работает лучше, чем в C?
• unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать
• miri может точно подтвердить, настоящий баг или нет
• не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C
Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности.
Стоит прочитать всем, кто думает про AI в security tooling.
https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc
https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3
#Rust #RustLang #MemorySafety #Security #LLM
И, что неожиданно, это работает очень хорошо.
Сергей Давыдов, руководитель Rust Secure Code Working Group, использовал GPT-5.5 и Claude Opus для аудита unsafe-блоков в популярных Rust-крейтах.
В итоге нашлись десятки реальных багов:
• use-after-free
• чтение за пределами буфера
• data races
• неправильные реализации Send / Sync
Все находки проверялись через miri, чтобы убрать ложные срабатывания.
Почему в Rust это работает лучше, чем в C?
• unsafe явно помечен и изолирован, поэтому LLM сразу понимает, где искать
• miri может точно подтвердить, настоящий баг или нет
• не нужно отслеживать data flow по всей кодовой базе, как часто бывает в C
Получается, дизайн Rust случайно сделал его почти идеальным языком для LLM-аудита безопасности.
Стоит прочитать всем, кто думает про AI в security tooling.
https://gist.github.com/Shnatsel/eb0a4be79a0657e4eb67c4f085f991bc
https://shnatsel.medium.com/the-unreasonable-effectiveness-of-llms-for-auditing-rust-code-d4df8bf0afd3
#Rust #RustLang #MemorySafety #Security #LLM
👍7❤4🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis
Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.
https://github.com/open-jarvis/OpenJarvis
Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.
https://github.com/open-jarvis/OpenJarvis
👍3❤2👎1
Хочется разобраться в машинном обучении, но страшно сразу покупать большой курс? Это нормально.
У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление.
Если решите идти дальше, на основном курсе вас ждёт:
● обучение от основ до внедрения ML-моделей;
● 18+ проектов для портфолио;
● карьерная поддержка при выходе на рынок;
● дополнительный модуль по современным AI-инструментам.
🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10].
Попробовать бесплатно →
Erid: 2SDnjcVRJFU
Название: ООО "ЯНДЕКС"
ИНН: 7736207543
У Яндекс Практикума есть бесплатная вводная часть курса «ML-инженер» — можно спокойно познакомиться с профессией, решить первые задачи по ML и понять, насколько вам вообще подходит это направление.
Если решите идти дальше, на основном курсе вас ждёт:
● обучение от основ до внедрения ML-моделей;
● 18+ проектов для портфолио;
● карьерная поддержка при выходе на рынок;
● дополнительный модуль по современным AI-инструментам.
🎁 А если продолжите обучение, для подписчиков канала действует скидка 10% по промокоду до 30 июня [TGPRACTICUM10].
Попробовать бесплатно →
Erid: 2SDnjcVRJFU
Название: ООО "ЯНДЕКС"
ИНН: 7736207543
👍2
Forwarded from Machinelearning
OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.
Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.
Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.
Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.
Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥1
Она называется CuPy.
Меняете одну строку:
import numpy as np → import cupy as cpИ тот же код может работать до 100 раз быстрее на CUDA.
→ работает с существующим NumPy/SciPy-кодом
→ без переписывания логики
→ без нового синтаксиса
→ также поддерживает AMD ROCm
100% open source.
https://github.com/Hannibal046/Awesome-LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍10🔥7👎3😁1
Apple, как сообщается, лоббирует администрацию Трампа, чтобы ей разрешили покупать memory chips у CXMT - китайского производителя чипов, который находится в чёрном списке Pentagon Chinese Military Company.
FT пишет, что Apple обратилась в Министерство торговли США больше месяца назад, после того как рост цен на память вынудил компанию поднять цены на MacBook и iPad.
Этот шаг стёр $263 млрд рыночной стоимости Apple.
Юридически Apple не запрещено покупать чипы у CXMT.
Список Пентагона в основном создаёт репутационный риск, если только Министерство торговли позже не внесёт CXMT в Entity List.
CXMT - национальный DRAM-чемпион Китая.
Сейчас Apple зависит от Micron, Samsung и SK Hynix.
Apple заявляет, что цены на память стали «неустойчивыми».
https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1
FT пишет, что Apple обратилась в Министерство торговли США больше месяца назад, после того как рост цен на память вынудил компанию поднять цены на MacBook и iPad.
Этот шаг стёр $263 млрд рыночной стоимости Apple.
Юридически Apple не запрещено покупать чипы у CXMT.
Список Пентагона в основном создаёт репутационный риск, если только Министерство торговли позже не внесёт CXMT в Entity List.
CXMT - национальный DRAM-чемпион Китая.
Сейчас Apple зависит от Micron, Samsung и SK Hynix.
Apple заявляет, что цены на память стали «неустойчивыми».
https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1
❤4👍2🔥1
Forwarded from Machinelearning
Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке.
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.
По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.
Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.
Цена для разработчиков до 31 августа 2026:
• $2 за 1 млн input tokens
• $10 за 1 млн output tokens
Потом стандартная цена:
• $3 за input
• $15 за output
Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.
По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.
https://www.anthropic.com/news/claude-sonnet-5
👍5🔥4❤3
Как AI меняет промышленность и что интересного произошло в технологиях за последние полгода? Всё важное – в одном специальном эпизоде шоу «404 секунды»
Ведущий Антон Черноусов из Yandex Cloud и гость — Вячеслав Захаров из «Газпром нефти» — разобрали применение AI в разных областях жизни.
Уже сегодня голосовые помощники помогают детям с домашкой, аватары близких общаются с семьей после смерти, дизайнеры могут предложить не один, а 30 вариантов интерьера за одну встречу, а на главных кинофестивалях показывают созданные нейросетями фильмы. Ощутимое влияние искусственный интеллект оказывает и на бизнес, и на промышленность, и на всех нас.
Посмотреть шоу можно на YouTube и ВК
Послушать аудио-версию на Яндекс Музыке
Ведущий Антон Черноусов из Yandex Cloud и гость — Вячеслав Захаров из «Газпром нефти» — разобрали применение AI в разных областях жизни.
Уже сегодня голосовые помощники помогают детям с домашкой, аватары близких общаются с семьей после смерти, дизайнеры могут предложить не один, а 30 вариантов интерьера за одну встречу, а на главных кинофестивалях показывают созданные нейросетями фильмы. Ощутимое влияние искусственный интеллект оказывает и на бизнес, и на промышленность, и на всех нас.
Посмотреть шоу можно на YouTube и ВК
Послушать аудио-версию на Яндекс Музыке
👍3❤1🔥1😁1
⚡️ Claude Sonnet 5 обходится дороже за задачу: примерно на 15% дороже Opus 4.8 и почти в 2 раза дороже Sonnet 4.6, хотя цена за токен у него ниже, чем у Opus.
Причина в том, что для выполнения похожей benchmark-задачи он использует больше токенов.
Проще говоря: Sonnet 5 сильнее «думает» и больше пишет, поэтому итоговый счёт выходит выше, даже если каждый токен дешевле.
Промо-цены пока меняют картину. До 31 августа 2026 Sonnet 5 стоит $2 за 1M input-токенов и $10 за 1M output-токенов.
С 1 сентября 2026 цена вернётся к $3 / $15.
https://x.com/ArtificialAnlys/status/2072062595482456431
Причина в том, что для выполнения похожей benchmark-задачи он использует больше токенов.
Проще говоря: Sonnet 5 сильнее «думает» и больше пишет, поэтому итоговый счёт выходит выше, даже если каждый токен дешевле.
Промо-цены пока меняют картину. До 31 августа 2026 Sonnet 5 стоит $2 за 1M input-токенов и $10 за 1M output-токенов.
С 1 сентября 2026 цена вернётся к $3 / $15.
https://x.com/ArtificialAnlys/status/2072062595482456431
❤4😁3👍2🔥2😢2
Forwarded from GigaDev — разработка GigaChat
«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»
Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base.
Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source.
Почему это интересно?
Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно.
В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов.
Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа.
Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации.
Цикл обучения включал:
Результаты:
💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
[DLLM] Add GFusion and EBSampling by perkyfever · Pull Request #29776 · sgl-project/sglang
Motivation
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
Modifications
Accuracy Tests
Speed Tests and Profiling
Checklist
Format your code according to the Format code with pre-commit.
Add unit tests according to the Run and add unit te...
👍59🔥3👎2🥰2🎉1
Anthropic, по данным СМИ, ведёт ранние переговоры с Samsung о производстве собственного кастомного AI-чипа.
The Information пишет, что создатели Claude пока определяют, что именно должен делать этот процессор, насколько мощным он должен быть и как он будет встраиваться в серверы или кластеры.
Сейчас Anthropic уже использует AWS Trainium, Google TPU и Nvidia GPU, и эти решения останутся ключевыми.
Но собственный чип дал бы компании ещё один рычаг, пока стоимость запуска моделей, мощности дата-центров, поставки памяти и энергопотребление становятся стратегическими ограничениями.
Для Samsung это шанс получить клиентом AI-гаганта для своего 2-нм техпроцесса и advanced packaging.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
The Information пишет, что создатели Claude пока определяют, что именно должен делать этот процессор, насколько мощным он должен быть и как он будет встраиваться в серверы или кластеры.
Сейчас Anthropic уже использует AWS Trainium, Google TPU и Nvidia GPU, и эти решения останутся ключевыми.
Но собственный чип дал бы компании ещё один рычаг, пока стоимость запуска моделей, мощности дата-центров, поставки памяти и энергопотребление становятся стратегическими ограничениями.
Для Samsung это шанс получить клиентом AI-гаганта для своего 2-нм техпроцесса и advanced packaging.
https://www.theinformation.com/articles/anthropic-talks-samsung-manufacture-custom-ai-chip
👍3❤2🔥2
🧠 Генеративный ИИ развивается настолько быстро, что за новыми моделями легко потерять из виду более важный вопрос: как вообще сегодня устроен рынок AI и куда движется индустрия?
16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».
Обсудят:
• какие технологические тренды сегодня определяют развитие AI;
• чем российский рынок отличается от мирового;
• как аналитики оценивают рынок ИИ и почему их прогнозы сильно расходятся;
• как компании внедряют GenAI и какие сценарии уже приносят бизнес-результат.
Среди спикеров — эксперты Yandex Cloud, Yandex AI Studio, «Яков и Партнёры» и инвестиционного сообщества.
🔗 Регистрация
16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».
Обсудят:
• какие технологические тренды сегодня определяют развитие AI;
• чем российский рынок отличается от мирового;
• как аналитики оценивают рынок ИИ и почему их прогнозы сильно расходятся;
• как компании внедряют GenAI и какие сценарии уже приносят бизнес-результат.
Среди спикеров — эксперты Yandex Cloud, Yandex AI Studio, «Яков и Партнёры» и инвестиционного сообщества.
🔗 Регистрация
🤬1