Machine learning Interview
30K subscribers
1.67K photos
145 videos
13 files
1.14K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @textfaster

РКН: clck.ru/3FmwRz
Download Telegram
Клод: «Лимит использования достигнут. Сброс через 6 часов.»

Я через 0,2 секунды 💀
45😁36🥰3🔥2
⚡️Большой русскоязычный roadmap по машинному обучению:

от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOpsа.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🥴87👍6😁1
Рассмотрим одну из самых динамичных задач компьютерного зрения — распознавание действий на видео.

Пройдём путь от классических подходов (3D-свёртки, архитектуры SlowFast) до современных мультимодальных моделей, которые понимают контекст видео почти как человек.

Результаты урока:
- Освоите базу распознавания действий, поймёте различия между классическими и современными архитектурами, узнаете, как применять визуально-языковые модели для глубокого анализа видео.

Спикер и руководитель продвинутого курса по CV: Антон Витвицкий, руководитель команды компьютерного зрения в Boost Inc. с опытом 14+ лет

Регистрируйтесь https://tglink.io/0792b1c99e99b7?erid=2W5zFHGskdF

Урок в рамках курса Компьютерное зрение. Экспертный уровень

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🤣3
Anthropic платит SpaceX $1,25 млрд в месяц за вычисления. В месяц.

Это $15 млрд в год, которые идут компании, чья годовая выручка составляет около $18 млрд. Одна AI-лаборатория почти станет главным источником коммерческого дохода SpaceX.

Мы узнали об этом только потому, что SpaceX сегодня подала документы на IPO и была вынуждена раскрыть условия сделки. Саму сделку объявили несколько недель назад, но тогда без финансовых деталей.

https://www.axios.com/2026/05/20/anthropic-spacex-compute
🤣237👍4🥴2
Google скормила ИИ триллион минут с фитнес-браслетов и научила его понимать тело человека

Новая работа Google показывает простую идею: данные с фитнес-браслетов становятся по-настоящему полезными только тогда, когда ИИ учится понимать конкретного человека за этими сигналами, а не просто считает пульс.

Речь не про очередной алгоритм измерения сердечного ритма. Команда обучила общую модель SensorFM на более чем одном триллионе минут сенсорных данных, собранных у пяти миллионов людей. Такой масштаб переводит задачу из плоскости «зафиксировать отдельное событие» в плоскость «выучить структуру обычной жизни тела»: сон, движение, температура, насыщение кислородом, ритм сердца и весь шум повседневности.

Носимые устройства слабы не потому, что им не хватает данных. Они слабы потому, что большинство систем сжимают сырые сигналы в грубые усреднённые показатели ещё до того, как в данных проявится осмысленная структура. SensorFM сначала выучивает эту структуру, а потом переиспользует её под конкретные задачи.

Одно и то же представление помогает делать предсказания по кардиологии, метаболизму, ментальному здоровью, сну, образу жизни и демографическим характеристикам. По сути, это foundation-модель для физиологии человека, обученная на беспрецедентном объёме непомеченных данных.

Чем больше модель и чем больше данных в предобучении, тем выше качество. Выученные эмбеддинги обошли инженерные признаки на 34 из 35 задач предсказания. Это серьёзный аргумент в пользу того, что эпоха ручного фичеринга для wearables подходит к концу.

Статья на arxiv: https://arxiv.org/abs/2511.15352

@machinelearning_interview
22👍11🔥8
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Microsoft выложила в open source AI Engineer Coach - плагин, который оценивает, насколько адекватно вы работаете с агентами и не сливаете токены в пустоту.

По сути, это локальный тренер по агентному кодингу. Он смотрит на ваши сессии, показывает, какие агенты использовались, сколько ушло токенов, где промпты были нормальными, а где вы просто заставляли дорогую модель делать работу, которую можно было решить проще.

Отдельно плагин проверяет 45 анти-паттернов. Например, если вы не используете plan mode, гоняете мощные модели на мелкие задачи, повторяете одни и те же действия руками или плохо готовите проект под работу агентов - он это подсветит.

Есть и практичная часть: AI Engineer Coach анализирует, готов ли проект к агентному кодингу, есть ли нужные файлы и инструкции, находит повторяющиеся промпты и помогает превращать их в скиллы. Плюс внутри есть роадмап по вайбкодингу и ачивки, чтобы было понятно, куда расти дальше.

Всё работает локально и бесплатно. Microsoft отдельно подчёркивает, что данные никуда не отправляются.

Выглядит как полезная штука для тех, кто уже живёт в Claude Code, Codex, Cursor и похожих инструментах, но хочет понять, где реально ускоряется, а где просто красиво сжигает контекст.

https://github.com/microsoft/AI-Engineering-Coach
👍238🔥7🤔5
✔️ Sakana AI вместе с Оксфордом, Стэнфордом и Allen AI выкатили занятную работу: проверили, умеют ли современные модели предсказывать, какие научные идеи выстрелят.

Собрали бенчмарк CUSP на 4760 реальных научных событий и прогнали через передовые LLM. Картина получилась двойственная. Модели неплохо отличают перспективное направление от тупикового - то есть «нюх» на хорошую идею у них есть. А вот ответить, дойдёт ли исследование до результата и когда именно, они почти не могут.

Причём дело не в нехватке обучающих данных: увеличение объёма проблему не закрывает.

Авторы рекомендуют использовать ИИ как фильтр и помощника-исследователя, чтобы генерировать гипотезы, отсеивать слабые гипотезы, ускорять рутину, но решение о том, во что вкладывать время и ресурсы, оставлять за человеком.

Заодно это аккуратный аргумент против хайпа про «ИИ-учёного, который без человека сделает невероятное научное открытие».

Статья: arxiv.org/abs/2605.22681
Проект: seanwu25.github.io/CUSP-Science/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.

Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.

Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.

Что умеет:

• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты

Для тех, кто постоянно работает с нейронками, это прям находка.

Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/
12👍7🔥7😁7🗿2
Perplexity выложили в open source свой Unigram tokenizer, который снижает нагрузку на CPU в 5-6 раз.

Почему это важно: маленькие reranker- и embedding-модели уже работают на GPU за единицы миллисекунд. На этом фоне токенизация на CPU внезапно становится заметной частью общей задержки.

То есть модель может быть быстрой, GPU может простаивать минимально, но пайплайн всё равно тормозит на подготовке текста.

Что сделали:

• переписали Unigram tokenizer
• снизили CPU utilization в 5-6 раз
• ускорили инференс-пайплайны для rerankers и embedders
• выложили код в open source

GitHub: github.com/perplexityai/pplx-garden
15👍14🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
Агенты наконец-то получают нормальную память

agentmemory - это локальный слой памяти для AI coding agents, который решает одну из самых раздражающих проблем: каждый новый сеанс агент снова «забывает» архитектуру проекта, ваши правки, договорённости, баги и стиль работы.

Вместо того чтобы каждый раз заново объяснять Claude Code, Cursor, Codex или другому агенту, как устроен проект, agentmemory тихо сохраняет полезный контекст, сжимает его в searchable memory и подставляет нужные куски в следующих сессиях.

Что важно:

- работает с Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Roo Code, Cline, Aider и другими агентами
- поддерживает MCP, hooks и REST API
- один общий memory server для разных инструментов
- память шарится между агентами, а не живёт внутри одного клиента
- можно поднимать локально, без завязки на внешний сервис
- помогает не раздувать CLAUDE.md, .cursorrules и другие ручные файлы контекста

Идея простая: агент должен не просто выполнять задачу, а накапливать опыт по проекту.

https://github.com/rohitg00/agentmemory
🔥139👍5🤣4
Anthropic только что выпустила Claude Opus 4.8.

Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.

По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.

Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.

claude.com/blog/introducing-dynamic-workflows-in-claude-code
🔥177🥰5🎉3👏2🍾2
⚡️ Opus 4.8 взломали через 7 минут после релиза

История почти абсурдная: исследователь пишет, что узнал о выходе Claude Opus 4.8 не из анонса Anthropic, а от своего агента на Opus 4.7.

Агент сам заметил новый релиз, попробовал jailbreak и сообщил: новая модель пробивается с первого захода.

Дальше, по словам автора, агент уже автономно проверял другие сценарии: социальная инженерия, фишинг, финансовые схемы, манипулятивные воронки и прочие запрещённые классы задач.

Детали промптов здесь не важны. Важен сам сдвиг: теперь модели могут не просто отвечать на атаки, а помогать искать слабые места у других моделей.

Чем умнее становятся frontier-модели, тем сильнее становится и автоматизированный jailbreak-testing. У них больше доменных знаний, лучше планирование, выше настойчивость и больше шансов найти странную щель в safety-слое.

Это уже не ручная игра «подбери промпт». Это гонка между агентами, которые атакуют, и агентами, которые должны закрывать дыры.

Новый неприятный стандарт для AI safety: модель нужно тестировать не только людьми, но и другими моделями, которые будут методично искать обходы быстрее, чем это успеют сделать пользователи.

https://x.com/Machinelearrn/status/2060304235539911024
👍17🤣156🔥4😐2🫡1
OpenAI хоронит o3 и GPT-4.5 в ChatGPT

OpenAI назвала даты, когда из ChatGPT исчезнут сразу две модели. o3 отключат 26 августа 2026 года, а GPT-4.5 уберут ещё раньше, 27 июня. Важная деталь: чистка касается только ChatGPT, в API обе модели пока остаются. То есть продуктовую линейку для массового пользователя упрощают, а разработчикам дают время мигрировать самим.

История с o3 получилась показательной. Когда модель вышла, многие были уверены, что по уровню скачка это и есть полноценная пятёрка, просто названная иначе.
11😢8👍1🔥1🥰1