Анализ данных (Data analysis)

Выпускники 2026

😁61❤12🤣10👍1😍1

3.45K views10:02

Yandex ML Challenge — соревнование по ML с задачами по CV, LLM, RL и оптимизации нейросетей.

Если вам интересны foundation models и соревновательный ML — советую посмотреть.

С 21 мая начался длинный онлайн-тур: 3 задачи, рейтинг и 11 дней на решения. Топ-100 участников попадут в очный финал на Young Con в Москве.

1 место — 1 млн рублей.
Топ-15 получат устройства от Яндекса.

Регистрация уже открыта.

👍7😍5🙏2🥱2🌭2

3.01K views12:26

Анализ данных (Data analysis)

Forwarded from Machinelearning

3:50

Media is too big

VIEW IN TELEGRAM

✔️

Сэм Альтман форсирует выход OpenAI на IPO в сентябре

OpenAI готовит заявку на первичное размещение акций на сентябрь. Сэм Альтман торопит процесс, несмотря на позицию финансового директора Сары Фрайар о необходимости дополнительного времени на подготовку.

На этой неделе суд отклонил иск Илона Маска, обвинявшего OpenAI в незаконном переходе от некоммерческой лаборатории к коммерческой структуре. Закрытие дела устранило одно из юридических препятствий для листинга.

Перед размещением OpenAI предстоит обосновать инвесторам бизнес-модель. Основные проблемы - затраты на дата-центры и невыполнение внутренних KPI по выручке и пользователям.

На стратегию также влияет конкуренция: из-за темпов роста Anthropic в корпоративном секторе OpenAI пришлось корректировать план развития.
wsj.com

✔️

Белый дом предлагает тестировать ИИ-модели за 90 дней до релиза

Администрация США предложила внедрить систему добровольной оценки ИИ-моделей перед выходом на рынок. Инициативу обсуждали на закрытой встрече Управления национальной кибербезопасности США с руководителями ИИ-лабораторий.

Новые правила предполагают передачу правительству доступа к флагманским моделям за 90 дней до релиза. Компании лоббируют сокращение окна тестирования до 14 дней. Критерии отбора систем определят АНБ, УНКБ и Управление по научно-технической политике. Аудит пройдет в конфиденциальном режиме при участии Министерства обороны США.

Поводом для создания механизма стала Mythos от Anthropic. По данным спецслужб, на закрытых тестах система смогла эксплуатировать уязвимости нулевого дня, после чего ведомства ускорили разработку правил превентивного контроля.
theinformation.com

✔️

Инструменты CapCut будут встроены в интерфейс Google Gemini

Google добавит инструменты видеоредактора CapCut в интерфейс Gemini. Пользователи смогут монтировать видео и редактировать фото напрямую в диалоговом окне.

Интеграция объединит этапы создания контента: генерацию идей, написание сценария через LLM, склейку и экспорт ролика в одном интерфейсе.

Точная дата релиза совместного продукта пока неизвестна.
Cupcut в сети Х

✔️

Gemini начнет генерировать контекстную рекламу в поиске Google

Google тестирует диалоговые рекламные форматы в поиске на базе Gemini. В ИИ-режиме выдачи модель генерирует текст контекстного объявления с объяснением, как продукт решает задачу из запроса пользователя. Блоки сохранят обязательную пометку о спонсорстве.

Интеграция включает несколько форматов: адаптация креатива под узкие запросы, встраивание коммерческих предложений в сгенерированные рекомендации и персональное обоснование для покупки товаров.

Вместо статичных форм сбора лидов Google добавила встроенного в объявление интерактивного чат-бота, который отвечает на вопросы по базе знаний сайта компании.

В рамках программы Direct Offers, Gemini научилась динамически собирать персональные скидочные наборы. Продавцы, работающие по протоколу UCP смогут закрывать сделки через чекаут напрямую в поисковом интерфейсе.
blog.google

✔️

AMD представила процессоры Ryzen AI Max 400

Новая серия построена на базе архитектуры Strix Halo. Чипы поддерживают до 192 ГБ объединенной памяти стандарта LPDDR5X по 256-битной шине и допускают ручное выделение до 160 ГБ в качестве видеопамяти для встроенной графики. Это позволяет локально запускать LLM размером 300 млрд параметров.

Флагманский 16-ядерный чип Ryzen AI Max+ PRO 495 работает на частоте до 5,20 ГГц. Встроенный GPU RDNA 3.5 задействует 40 вычислительных блоков на частоте до 3,00 ГГц. Производительность интегрированного NPU составляет 55 TOPS.

В серию также вошли младшие модели с графикой на 32 блока: 12-ядерный PRO 490 и 8-ядерный PRO 485. Релиз потребительских версий запланирован на конец года.
techpowerup.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3

1.74K views13:47

Анализ данных (Data analysis)

Любители науки, фестиваль для вас

Жителей и гостей Санкт-Петербурга приглашают на Т-Двор — масштабный и бесплатный городской фестиваль.

Особенно рекомендуем заглянуть в субботу, 4 июня, на День технологий. Он посвящен точным наукам, ИИ, биотеху, генной инженерии, космосу и физике. На фестивале выступят ученые:

— Астроном Владимир Сурдин расскажет про космос, черные дыры и тайны Вселенной.
— Океанолог Александр Осадчиев выступит с докладом про воду — главный ресурс планеты, изученный лишь на 5%.
— Футуролог Руслан Юсуфов будет рассуждать о цифровом приговоре — когда данные начинают решать за нас.

А еще будет арт-пространство, еда и активности. Встречаемся в Никольских рядах.

Успей зарегистрироваться, чтобы не пропустить событие

❤2🙏2

2.66K views15:00

Анализ данных (Data analysis)

ModelScope добавили в EvalScope режим Agent Evaluation Mode. И это полезный сдвиг: теперь стандартные бенчмарки можно прогонять не только как «вопрос - ответ», а как полноценные агентные сценарии.

GSM8K, AIME, IFEval и SWE-Bench можно превратить в multi-turn задачи одной настройкой в конфиге. Дальше AgentLoop сам гоняет модель по циклу: сгенерировала шаг, вызвала инструмент, получила наблюдение, повторила.

Для оценки агентов это гораздо ближе к реальности. В проде модель редко просто отвечает текстом. Она вызывает функции, пишет код, запускает shell или Python, ошибается, читает вывод, чинит решение и идёт дальше.

В EvalScope теперь можно переключать стратегии: Function Calling, ReAct или SWE-Bench protocol. Можно сохранять полный trace: каждый шаг, ошибку, tool call и наблюдение. Потом всё это воспроизводится в Web Dashboard, что особенно полезно для дебага, а не только для красивой цифры в таблице.

Отдельно завезли безопасный sandbox через Docker и ms-enclave, чтобы shell и Python-инструменты запускались изолированно. Это важно, потому что агентные бенчмарки без sandbox быстро превращаются в рискованный запуск чужого кода.

Самое удобное - старые бенчмарки не надо переписывать. Включаешь Agent Mode в TaskConfig, и обычная проверка превращается в агентный прогон.

Судя по направлению, оценка AI-систем постепенно уходит от «какая модель умнее на статичном тесте» к более неприятному вопросу: как она ведёт себя в цикле, с инструментами, ошибками, ограничениями и реальным состоянием среды.

Вот это уже ближе к тому, что потом ломается в проде.

https://github.com/modelscope/evalscope

👍7🥰4❤3

2.7K views16:15

Анализ данных (Data analysis)

⚡️ Machine Learning Roadmap 2026: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15👍7🔥4❤‍🔥3

3.12K viewsedited 18:55

Анализ данных (Data analysis)

Anthropic выкатили первый апдейт по Project Glasswing и цифры там уже выглядят как начало нового этапа в кибербезе.

Claude Mythos Preview вместе с партнёрами нашёл больше 10 тысяч high и critical уязвимостей в системах, на которых держится интернет. У одного только Cloudflare модель накопала около 2000 багов, из них 400 критических. Mozilla за месяц закрыла 271 уязвимость в Firefox. Некоторые дыры сидели в коде больше 15 лет.

Anthropic прямо пишет, что поиск уязвимостей перестал быть узким местом. Теперь всё упирается в людей, которые должны успевать проверять отчёты, делать disclosure и выпускать патчи. Несколько maintainers open-source проектов уже попросили снизить поток репортов, потому что команды не справляются.

Отдельно впечатляет качество находок. Независимые исследователи подтвердили 90.6% true positive среди проверенных high/critical багов в open-source проектах. Для security tooling это уже не “интересный эксперимент”, а рабочий инструмент уровня топовых ресерчеров.

Anthropic при этом всё ещё не готова выпускать Mythos в паблик. Они прямо говорят, что индустрия пока не умеет контролировать модели такого уровня и не знает, как предотвращать их злоупотребление. Поэтому доступ пока только у ограниченного круга компаний и госструктур.

AI уже научился искать баги быстрее, чем индустрия успевает их чинить.

https://www.anthropic.com/research/glasswing-initial-update

❤24🔥9👍7🤣3

3.33K views21:31

Анализ данных (Data analysis)

✔️

В Claude Code закрыли уязвимость, позволявшую красть токены разработчиков

Anthropic пропатчила уязвимость в песочнице Claude Code. Баг позволял извлекать токены и исходный код разработчиков через инъекцию нулевого байта в SOCKS5.

Внутренний фильтр считал строку с нулевым символом безопасной, после чего операционная система обрезала текст по байту и подключалась к заблокированному хосту. В связке с промпт-инъекцией через анализируемые моделью файлы механизм давал возможность выполнять код и отправлять данные на сторонние серверы.

Уязвимость присутствовала в релизах до версии 2.1.89. Патч вышел в сборке 2.1.90 без упоминания в чейнджлоге и регистрации CVE. По заявлению Anthropic, разработчики обнаружили и закрыли баг внутренними силами до публикации отчета исследователей.

https://www.theregister.com/security/2026/05/20/even-claude-agrees-hole-in-its-sandbox-was-real-and-dangerous/5243662

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍8🔥1

2.89K views09:10

Анализ данных (Data analysis)

⚡️ В LLMs-from-scratch добавили реализацию DeepSeek Sparse Attention с нуля.

Это тот редкий случай, когда сложную архитектурную идею можно открыть не в виде сухой формулы из статьи, а в виде понятного кода, где видно, как именно модель выбирает, на какие токены смотреть.

Проблема обычного attention хорошо знакома всем, кто работал с длинным контекстом: чем больше последовательность, тем дороже становится вычисление. Каждый токен сравнивается со всеми предыдущими, и цена быстро улетает в квадрат. Sparse attention пытается убрать лишнюю работу без полного отказа от качества.

В реализации показан базовый механизм DSA: лёгкий индексатор оценивает важность прошлых токенов, затем выбираются top-K позиций, остальные маскируются, и attention считается только по релевантным участкам контекста. По сути, модель получает не весь контекст подряд, а отфильтрованное поле внимания.

В примере есть GPT-style модель, слой attention с DSA, optional KV cache, отдельный runnable-скрипт и тесты. Это не production-код уровня DeepSeek V3.2 с fused kernels, MLA и серверными оптимизациями. Зато это хороший учебный разбор, где архитектурная идея превращается в читаемую реализацию.

Sparse attention здесь разобрать пройти руками: от scoring до маскирования и выбора токенов.

https://github.com/rasbt/LLMs-from-scratch/tree/main/ch04/09_dsa

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍7❤4

1.96K views17:27

About

Blog

Apps

Platform