Machine learning Interview
30.1K subscribers
1.68K photos
145 videos
13 files
1.14K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @workakkk

РКН: clck.ru/3FmwRz
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Агенты наконец-то получают нормальную память

agentmemory - это локальный слой памяти для AI coding agents, который решает одну из самых раздражающих проблем: каждый новый сеанс агент снова «забывает» архитектуру проекта, ваши правки, договорённости, баги и стиль работы.

Вместо того чтобы каждый раз заново объяснять Claude Code, Cursor, Codex или другому агенту, как устроен проект, agentmemory тихо сохраняет полезный контекст, сжимает его в searchable memory и подставляет нужные куски в следующих сессиях.

Что важно:

- работает с Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Roo Code, Cline, Aider и другими агентами
- поддерживает MCP, hooks и REST API
- один общий memory server для разных инструментов
- память шарится между агентами, а не живёт внутри одного клиента
- можно поднимать локально, без завязки на внешний сервис
- помогает не раздувать CLAUDE.md, .cursorrules и другие ручные файлы контекста

Идея простая: агент должен не просто выполнять задачу, а накапливать опыт по проекту.

https://github.com/rohitg00/agentmemory
🔥149👍6🤣4
Anthropic только что выпустила Claude Opus 4.8.

Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.

По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.

Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.

claude.com/blog/introducing-dynamic-workflows-in-claude-code
🔥198🥰5🎉3👏2🍾2
⚡️ Opus 4.8 взломали через 7 минут после релиза

История почти абсурдная: исследователь пишет, что узнал о выходе Claude Opus 4.8 не из анонса Anthropic, а от своего агента на Opus 4.7.

Агент сам заметил новый релиз, попробовал jailbreak и сообщил: новая модель пробивается с первого захода.

Дальше, по словам автора, агент уже автономно проверял другие сценарии: социальная инженерия, фишинг, финансовые схемы, манипулятивные воронки и прочие запрещённые классы задач.

Детали промптов здесь не важны. Важен сам сдвиг: теперь модели могут не просто отвечать на атаки, а помогать искать слабые места у других моделей.

Чем умнее становятся frontier-модели, тем сильнее становится и автоматизированный jailbreak-testing. У них больше доменных знаний, лучше планирование, выше настойчивость и больше шансов найти странную щель в safety-слое.

Это уже не ручная игра «подбери промпт». Это гонка между агентами, которые атакуют, и агентами, которые должны закрывать дыры.

Новый неприятный стандарт для AI safety: модель нужно тестировать не только людьми, но и другими моделями, которые будут методично искать обходы быстрее, чем это успеют сделать пользователи.

https://x.com/Machinelearrn/status/2060304235539911024
👍20🤣167🔥4🫡3😐2
OpenAI хоронит o3 и GPT-4.5 в ChatGPT

OpenAI назвала даты, когда из ChatGPT исчезнут сразу две модели. o3 отключат 26 августа 2026 года, а GPT-4.5 уберут ещё раньше, 27 июня. Важная деталь: чистка касается только ChatGPT, в API обе модели пока остаются. То есть продуктовую линейку для массового пользователя упрощают, а разработчикам дают время мигрировать самим.

История с o3 получилась показательной. Когда модель вышла, многие были уверены, что по уровню скачка это и есть полноценная пятёрка, просто названная иначе.
😢1914👍2🥰2🔥1
⚡️ Amazon поменяла архитектуру сетей в дата-центрах AWS - и это важно для AI-кластеров

Amazon представила Resilient Network Graphs, или RNG - новую архитектуру сети для дата-центров. По заявлению компании, она снижает потребность в железе на 69% и повышает throughput на 33%.

Amazon уже с прошлого года постепенно внедряла RNG в своих дата-центрах, а теперь сделала её сетью по умолчанию для большинства AWS-нагрузок.

Идея в том, чтобы уйти от классических fat-tree сетей.

Fat-tree десятилетиями были удобны, потому что они предсказуемые и понятные в эксплуатации. Но у такой иерархии есть проблема: часть трафика упирается в узкие места наверху дерева, пока другие каналы простаивают.

RNG делает сеть более плоской и квазислучайной. Вместо нескольких «привилегированных» маршрутов через верхние уровни появляется много независимых путей между серверами.

Внутри два ключевых элемента:

- Spraypoint - система маршрутизации, которая распределяет трафик по множеству разных путей
- ShuffleBox - устройство для кабельной разводки, которое делает такую хаотичную на вид сеть реально управляемой

То есть пакетам не обязательно всегда бежать по самому короткому пути. Spraypoint разбрасывает трафик через распределённые waypoint-точки и помогает находить много независимых маршрутов без экзотической памяти в коммутаторах.

Авторы проверяли RNG на двух реальных production-сетях Amazon и сравнивали с fat-tree на transport и storage-нагрузках.

Результат:

- производительность приложений на уровне fat-tree
- заметно больше независимых маршрутов
- оценочная экономия от 9% до 45%
- меньше простаивающей сетевой ёмкости

Если сеть лучше размазывает нагрузку и меньше упирается в congestion, это напрямую влияет на эффективность AI-кластеров.

arxiv.org/abs/2604.15261
13👍11🔥4
Nvidia похоронила MacBook: анонсирован тот самый чип RTX Spark - все утечки по характеристикам полностью подтвердились.

Нас ждёт революция:
• Ноутбуки с этим чипом будут очень тонкими, при этом их мощность будет сопоставима с девайсами на RTX 5070;

Хуанг заявляет, что чип -ультимативное решение для игр, запуска локального ИИ и даже работы с тяжёлыми приложениями;

При этом всём, ноутбуки начнут нормально держать батарею - обещают энергоэффективность нового поколения.

Первые устройства начнут продавать уже осенью, а помимо ноутбуков создадут ещё
и компактные ПК с RTX Spark на борту; Свои флагманы на новом чипе готовят буквально все главные компании: Microsoft, Asus, MSI, Dell и другие.
Официальная цена пока неизвестна, но инсайдеры предполагают, что ноутбуки с этим камнем будут стоить от 3000 евро.
👍30🥱13🔥64🥴4🤔3😁2
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ

Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.

DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.

Что получилось на выходе:

- DeepSeek полностью работает на чипах Huawei Ascend без потери качества

- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки

- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei

- Большая часть зависимости от американских поставщиков чипов убрана

Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.

@machinelearning_interview
74👍34🥰5🤔4🔥1👏1
✔️ Anthropic расширяет Project Glasswing: Claude теперь ищет уязвимости в критической инфраструктуре

Anthropic добавила к Project Glasswing ещё 150 организаций из 15+ стран. Участники получают доступ к Claude Mythos Preview - модели для поиска уязвимостей в системах, от которых напрямую зависит инфраструктура:

- энергетика
- водоснабжение
- здравоохранение
- телеком

За первые недели партнёры нашли больше 10 000 уязвимостей высокой и критической степени. Интересный момент: узкое место уже не только в поиске проблем, а в их исправлении. Поэтому модель используют и для помощи с патчингом.

Через 6–12 месяцев модели такого уровня появятся у других игроков, возможно уже без нормальных ограничений и safety-фильтров. Значит, защитники должны научиться работать с такими инструментами раньше атакующих.

Security-инструменты Anthropic пока доступны по запросу. Для остальных есть Claude Security на базе Opus 4.8.

https://www.anthropic.com/news/expanding-project-glasswing
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍5🔥3🌚2🤔1
Как попасть на международную стажировку в ML? 

Нашли интервью выпускника Школы анализа данных, который побывал на стажировке в университете KAUST в Саудовской Аравии .

Для тех, кто тоже ищет международные стажировки в ML, есть дельные советы:

Ранний старт. Начинайте искать стажировки как можно раньше. Следите за университетскими чатами и сообществами, подавайтесь везде, где тема пересекается с вашими интересами.

Реальные результаты. Идеальный английский не обязателен. Гораздо важнее иметь конкретные наработки: исследования, публикации, проекты. На стажировки берут тех, кто уже попробовал себя в науке.

Фундаментальное образование. Без крепкой базы заниматься исследованиями на таком уровне не получится. Ищите экспертов и единомышленников, с кем сможете вместе работать.

Вывод: международная стажировка — это не лотерея. Это результат системной работы и готовности искать возможности.
👍83🔥2
⚡️ MOSS-TTS-v1.5 вышла на первое место в Hugging Face Trending среди Text-to-Speech моделей и уже набрала 20,6K загрузок.

Это мультиязычная управляемая TTS-модель, которая умеет:

- стабильно клонировать голос
- генерировать длинные аудио
- точно управлять паузами
- работать с несколькими языками

Теперь MOSS-TTS-v1.5 официально поддерживается в vLLM-Omni и SGLang-Omni, что делает её интересной не только для экспериментов, но и для более серьёзной инфраструктуры голосовых приложений.

Модель разработала команда OpenMOSS-Team.

GitHub: https://github.com/OpenMOSS/MOSS-TTS

Hugging Face: https://huggingface.co/OpenMOSS-Team/MOSS-TTS-v1.5

ModelScope: https://modelscope.ai/organization/openmoss
Please open Telegram to view this post
VIEW IN TELEGRAM
👍106🥰2
⚡️ OpenAI раздаёт ChatGPT Pro на 6 месяцев** владельцам open-source проектов.

В рамках программы Codex for Open Source можно получить:

• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security

Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.

Больше шансов у тех, у кого есть:

• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов

Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.

https://openai.com/ru-RU/form/codex-for-oss/

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3👍1