Machine learning Interview
30.1K subscribers
1.68K photos
145 videos
13 files
1.14K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @workakkk

РКН: clck.ru/3FmwRz
Download Telegram
✔️ Sakana AI вместе с Оксфордом, Стэнфордом и Allen AI выкатили занятную работу: проверили, умеют ли современные модели предсказывать, какие научные идеи выстрелят.

Собрали бенчмарк CUSP на 4760 реальных научных событий и прогнали через передовые LLM. Картина получилась двойственная. Модели неплохо отличают перспективное направление от тупикового - то есть «нюх» на хорошую идею у них есть. А вот ответить, дойдёт ли исследование до результата и когда именно, они почти не могут.

Причём дело не в нехватке обучающих данных: увеличение объёма проблему не закрывает.

Авторы рекомендуют использовать ИИ как фильтр и помощника-исследователя, чтобы генерировать гипотезы, отсеивать слабые гипотезы, ускорять рутину, но решение о том, во что вкладывать время и ресурсы, оставлять за человеком.

Заодно это аккуратный аргумент против хайпа про «ИИ-учёного, который без человека сделает невероятное научное открытие».

Статья: arxiv.org/abs/2605.22681
Проект: seanwu25.github.io/CUSP-Science/

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍95🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.

Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.

Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.

Что умеет:

• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты

Для тех, кто постоянно работает с нейронками, это прям находка.

Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/
14👍8🔥7😁7🗿2
Perplexity выложили в open source свой Unigram tokenizer, который снижает нагрузку на CPU в 5-6 раз.

Почему это важно: маленькие reranker- и embedding-модели уже работают на GPU за единицы миллисекунд. На этом фоне токенизация на CPU внезапно становится заметной частью общей задержки.

То есть модель может быть быстрой, GPU может простаивать минимально, но пайплайн всё равно тормозит на подготовке текста.

Что сделали:

• переписали Unigram tokenizer
• снизили CPU utilization в 5-6 раз
• ускорили инференс-пайплайны для rerankers и embedders
• выложили код в open source

GitHub: github.com/perplexityai/pplx-garden
17👍14🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
Агенты наконец-то получают нормальную память

agentmemory - это локальный слой памяти для AI coding agents, который решает одну из самых раздражающих проблем: каждый новый сеанс агент снова «забывает» архитектуру проекта, ваши правки, договорённости, баги и стиль работы.

Вместо того чтобы каждый раз заново объяснять Claude Code, Cursor, Codex или другому агенту, как устроен проект, agentmemory тихо сохраняет полезный контекст, сжимает его в searchable memory и подставляет нужные куски в следующих сессиях.

Что важно:

- работает с Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Roo Code, Cline, Aider и другими агентами
- поддерживает MCP, hooks и REST API
- один общий memory server для разных инструментов
- память шарится между агентами, а не живёт внутри одного клиента
- можно поднимать локально, без завязки на внешний сервис
- помогает не раздувать CLAUDE.md, .cursorrules и другие ручные файлы контекста

Идея простая: агент должен не просто выполнять задачу, а накапливать опыт по проекту.

https://github.com/rohitg00/agentmemory
🔥149👍6🤣4
Anthropic только что выпустила Claude Opus 4.8.

Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.

По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.

Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.

claude.com/blog/introducing-dynamic-workflows-in-claude-code
🔥198🥰5🎉3👏2🍾2
⚡️ Opus 4.8 взломали через 7 минут после релиза

История почти абсурдная: исследователь пишет, что узнал о выходе Claude Opus 4.8 не из анонса Anthropic, а от своего агента на Opus 4.7.

Агент сам заметил новый релиз, попробовал jailbreak и сообщил: новая модель пробивается с первого захода.

Дальше, по словам автора, агент уже автономно проверял другие сценарии: социальная инженерия, фишинг, финансовые схемы, манипулятивные воронки и прочие запрещённые классы задач.

Детали промптов здесь не важны. Важен сам сдвиг: теперь модели могут не просто отвечать на атаки, а помогать искать слабые места у других моделей.

Чем умнее становятся frontier-модели, тем сильнее становится и автоматизированный jailbreak-testing. У них больше доменных знаний, лучше планирование, выше настойчивость и больше шансов найти странную щель в safety-слое.

Это уже не ручная игра «подбери промпт». Это гонка между агентами, которые атакуют, и агентами, которые должны закрывать дыры.

Новый неприятный стандарт для AI safety: модель нужно тестировать не только людьми, но и другими моделями, которые будут методично искать обходы быстрее, чем это успеют сделать пользователи.

https://x.com/Machinelearrn/status/2060304235539911024
👍20🤣167🔥4🫡3😐2
OpenAI хоронит o3 и GPT-4.5 в ChatGPT

OpenAI назвала даты, когда из ChatGPT исчезнут сразу две модели. o3 отключат 26 августа 2026 года, а GPT-4.5 уберут ещё раньше, 27 июня. Важная деталь: чистка касается только ChatGPT, в API обе модели пока остаются. То есть продуктовую линейку для массового пользователя упрощают, а разработчикам дают время мигрировать самим.

История с o3 получилась показательной. Когда модель вышла, многие были уверены, что по уровню скачка это и есть полноценная пятёрка, просто названная иначе.
😢1914👍2🥰2🔥1
⚡️ Amazon поменяла архитектуру сетей в дата-центрах AWS - и это важно для AI-кластеров

Amazon представила Resilient Network Graphs, или RNG - новую архитектуру сети для дата-центров. По заявлению компании, она снижает потребность в железе на 69% и повышает throughput на 33%.

Amazon уже с прошлого года постепенно внедряла RNG в своих дата-центрах, а теперь сделала её сетью по умолчанию для большинства AWS-нагрузок.

Идея в том, чтобы уйти от классических fat-tree сетей.

Fat-tree десятилетиями были удобны, потому что они предсказуемые и понятные в эксплуатации. Но у такой иерархии есть проблема: часть трафика упирается в узкие места наверху дерева, пока другие каналы простаивают.

RNG делает сеть более плоской и квазислучайной. Вместо нескольких «привилегированных» маршрутов через верхние уровни появляется много независимых путей между серверами.

Внутри два ключевых элемента:

- Spraypoint - система маршрутизации, которая распределяет трафик по множеству разных путей
- ShuffleBox - устройство для кабельной разводки, которое делает такую хаотичную на вид сеть реально управляемой

То есть пакетам не обязательно всегда бежать по самому короткому пути. Spraypoint разбрасывает трафик через распределённые waypoint-точки и помогает находить много независимых маршрутов без экзотической памяти в коммутаторах.

Авторы проверяли RNG на двух реальных production-сетях Amazon и сравнивали с fat-tree на transport и storage-нагрузках.

Результат:

- производительность приложений на уровне fat-tree
- заметно больше независимых маршрутов
- оценочная экономия от 9% до 45%
- меньше простаивающей сетевой ёмкости

Если сеть лучше размазывает нагрузку и меньше упирается в congestion, это напрямую влияет на эффективность AI-кластеров.

arxiv.org/abs/2604.15261
13👍11🔥4
Nvidia похоронила MacBook: анонсирован тот самый чип RTX Spark - все утечки по характеристикам полностью подтвердились.

Нас ждёт революция:
• Ноутбуки с этим чипом будут очень тонкими, при этом их мощность будет сопоставима с девайсами на RTX 5070;

Хуанг заявляет, что чип -ультимативное решение для игр, запуска локального ИИ и даже работы с тяжёлыми приложениями;

При этом всём, ноутбуки начнут нормально держать батарею - обещают энергоэффективность нового поколения.

Первые устройства начнут продавать уже осенью, а помимо ноутбуков создадут ещё
и компактные ПК с RTX Spark на борту; Свои флагманы на новом чипе готовят буквально все главные компании: Microsoft, Asus, MSI, Dell и другие.
Официальная цена пока неизвестна, но инсайдеры предполагают, что ноутбуки с этим камнем будут стоить от 3000 евро.
👍30🥱13🔥64🥴4🤔3😁2
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ

Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.

DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.

Что получилось на выходе:

- DeepSeek полностью работает на чипах Huawei Ascend без потери качества

- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки

- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei

- Большая часть зависимости от американских поставщиков чипов убрана

Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.

@machinelearning_interview
74👍34🥰5🤔4🔥1👏1
✔️ Anthropic расширяет Project Glasswing: Claude теперь ищет уязвимости в критической инфраструктуре

Anthropic добавила к Project Glasswing ещё 150 организаций из 15+ стран. Участники получают доступ к Claude Mythos Preview - модели для поиска уязвимостей в системах, от которых напрямую зависит инфраструктура:

- энергетика
- водоснабжение
- здравоохранение
- телеком

За первые недели партнёры нашли больше 10 000 уязвимостей высокой и критической степени. Интересный момент: узкое место уже не только в поиске проблем, а в их исправлении. Поэтому модель используют и для помощи с патчингом.

Через 6–12 месяцев модели такого уровня появятся у других игроков, возможно уже без нормальных ограничений и safety-фильтров. Значит, защитники должны научиться работать с такими инструментами раньше атакующих.

Security-инструменты Anthropic пока доступны по запросу. Для остальных есть Claude Security на базе Opus 4.8.

https://www.anthropic.com/news/expanding-project-glasswing
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍5🔥3🌚2🤔1
Как попасть на международную стажировку в ML? 

Нашли интервью выпускника Школы анализа данных, который побывал на стажировке в университете KAUST в Саудовской Аравии .

Для тех, кто тоже ищет международные стажировки в ML, есть дельные советы:

Ранний старт. Начинайте искать стажировки как можно раньше. Следите за университетскими чатами и сообществами, подавайтесь везде, где тема пересекается с вашими интересами.

Реальные результаты. Идеальный английский не обязателен. Гораздо важнее иметь конкретные наработки: исследования, публикации, проекты. На стажировки берут тех, кто уже попробовал себя в науке.

Фундаментальное образование. Без крепкой базы заниматься исследованиями на таком уровне не получится. Ищите экспертов и единомышленников, с кем сможете вместе работать.

Вывод: международная стажировка — это не лотерея. Это результат системной работы и готовности искать возможности.
👍83🔥2
⚡️ MOSS-TTS-v1.5 вышла на первое место в Hugging Face Trending среди Text-to-Speech моделей и уже набрала 20,6K загрузок.

Это мультиязычная управляемая TTS-модель, которая умеет:

- стабильно клонировать голос
- генерировать длинные аудио
- точно управлять паузами
- работать с несколькими языками

Теперь MOSS-TTS-v1.5 официально поддерживается в vLLM-Omni и SGLang-Omni, что делает её интересной не только для экспериментов, но и для более серьёзной инфраструктуры голосовых приложений.

Модель разработала команда OpenMOSS-Team.

GitHub: https://github.com/OpenMOSS/MOSS-TTS

Hugging Face: https://huggingface.co/OpenMOSS-Team/MOSS-TTS-v1.5

ModelScope: https://modelscope.ai/organization/openmoss
Please open Telegram to view this post
VIEW IN TELEGRAM
👍106🥰2
⚡️ OpenAI раздаёт ChatGPT Pro на 6 месяцев** владельцам open-source проектов.

В рамках программы Codex for Open Source можно получить:

• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security

Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.

Больше шансов у тех, у кого есть:

• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов

Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.

https://openai.com/ru-RU/form/codex-for-oss/

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3👍1