Machine learning Interview
30.1K subscribers
1.68K photos
146 videos
13 files
1.15K links
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!

Вопросы - @workakkk

РКН: clck.ru/3FmwRz
Download Telegram
OpenAI хоронит o3 и GPT-4.5 в ChatGPT

OpenAI назвала даты, когда из ChatGPT исчезнут сразу две модели. o3 отключат 26 августа 2026 года, а GPT-4.5 уберут ещё раньше, 27 июня. Важная деталь: чистка касается только ChatGPT, в API обе модели пока остаются. То есть продуктовую линейку для массового пользователя упрощают, а разработчикам дают время мигрировать самим.

История с o3 получилась показательной. Когда модель вышла, многие были уверены, что по уровню скачка это и есть полноценная пятёрка, просто названная иначе.
😢1914👍2🥰2🔥1
⚡️ Amazon поменяла архитектуру сетей в дата-центрах AWS - и это важно для AI-кластеров

Amazon представила Resilient Network Graphs, или RNG - новую архитектуру сети для дата-центров. По заявлению компании, она снижает потребность в железе на 69% и повышает throughput на 33%.

Amazon уже с прошлого года постепенно внедряла RNG в своих дата-центрах, а теперь сделала её сетью по умолчанию для большинства AWS-нагрузок.

Идея в том, чтобы уйти от классических fat-tree сетей.

Fat-tree десятилетиями были удобны, потому что они предсказуемые и понятные в эксплуатации. Но у такой иерархии есть проблема: часть трафика упирается в узкие места наверху дерева, пока другие каналы простаивают.

RNG делает сеть более плоской и квазислучайной. Вместо нескольких «привилегированных» маршрутов через верхние уровни появляется много независимых путей между серверами.

Внутри два ключевых элемента:

- Spraypoint - система маршрутизации, которая распределяет трафик по множеству разных путей
- ShuffleBox - устройство для кабельной разводки, которое делает такую хаотичную на вид сеть реально управляемой

То есть пакетам не обязательно всегда бежать по самому короткому пути. Spraypoint разбрасывает трафик через распределённые waypoint-точки и помогает находить много независимых маршрутов без экзотической памяти в коммутаторах.

Авторы проверяли RNG на двух реальных production-сетях Amazon и сравнивали с fat-tree на transport и storage-нагрузках.

Результат:

- производительность приложений на уровне fat-tree
- заметно больше независимых маршрутов
- оценочная экономия от 9% до 45%
- меньше простаивающей сетевой ёмкости

Если сеть лучше размазывает нагрузку и меньше упирается в congestion, это напрямую влияет на эффективность AI-кластеров.

arxiv.org/abs/2604.15261
13👍11🔥4
Nvidia похоронила MacBook: анонсирован тот самый чип RTX Spark - все утечки по характеристикам полностью подтвердились.

Нас ждёт революция:
• Ноутбуки с этим чипом будут очень тонкими, при этом их мощность будет сопоставима с девайсами на RTX 5070;

Хуанг заявляет, что чип -ультимативное решение для игр, запуска локального ИИ и даже работы с тяжёлыми приложениями;

При этом всём, ноутбуки начнут нормально держать батарею - обещают энергоэффективность нового поколения.

Первые устройства начнут продавать уже осенью, а помимо ноутбуков создадут ещё
и компактные ПК с RTX Spark на борту; Свои флагманы на новом чипе готовят буквально все главные компании: Microsoft, Asus, MSI, Dell и другие.
Официальная цена пока неизвестна, но инсайдеры предполагают, что ноутбуки с этим камнем будут стоить от 3000 евро.
👍31🥱13🔥64🥴4🤔3😁2
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ

Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.

DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.

Что получилось на выходе:

- DeepSeek полностью работает на чипах Huawei Ascend без потери качества

- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки

- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei

- Большая часть зависимости от американских поставщиков чипов убрана

Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.

@machinelearning_interview
75👍35🥰5🤔4🔥1👏1
✔️ Anthropic расширяет Project Glasswing: Claude теперь ищет уязвимости в критической инфраструктуре

Anthropic добавила к Project Glasswing ещё 150 организаций из 15+ стран. Участники получают доступ к Claude Mythos Preview - модели для поиска уязвимостей в системах, от которых напрямую зависит инфраструктура:

- энергетика
- водоснабжение
- здравоохранение
- телеком

За первые недели партнёры нашли больше 10 000 уязвимостей высокой и критической степени. Интересный момент: узкое место уже не только в поиске проблем, а в их исправлении. Поэтому модель используют и для помощи с патчингом.

Через 6–12 месяцев модели такого уровня появятся у других игроков, возможно уже без нормальных ограничений и safety-фильтров. Значит, защитники должны научиться работать с такими инструментами раньше атакующих.

Security-инструменты Anthropic пока доступны по запросу. Для остальных есть Claude Security на базе Opus 4.8.

https://www.anthropic.com/news/expanding-project-glasswing
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍5🔥3🌚2🤔1
Как попасть на международную стажировку в ML? 

Нашли интервью выпускника Школы анализа данных, который побывал на стажировке в университете KAUST в Саудовской Аравии .

Для тех, кто тоже ищет международные стажировки в ML, есть дельные советы:

Ранний старт. Начинайте искать стажировки как можно раньше. Следите за университетскими чатами и сообществами, подавайтесь везде, где тема пересекается с вашими интересами.

Реальные результаты. Идеальный английский не обязателен. Гораздо важнее иметь конкретные наработки: исследования, публикации, проекты. На стажировки берут тех, кто уже попробовал себя в науке.

Фундаментальное образование. Без крепкой базы заниматься исследованиями на таком уровне не получится. Ищите экспертов и единомышленников, с кем сможете вместе работать.

Вывод: международная стажировка — это не лотерея. Это результат системной работы и готовности искать возможности.
👍83🔥3
⚡️ MOSS-TTS-v1.5 вышла на первое место в Hugging Face Trending среди Text-to-Speech моделей и уже набрала 20,6K загрузок.

Это мультиязычная управляемая TTS-модель, которая умеет:

- стабильно клонировать голос
- генерировать длинные аудио
- точно управлять паузами
- работать с несколькими языками

Теперь MOSS-TTS-v1.5 официально поддерживается в vLLM-Omni и SGLang-Omni, что делает её интересной не только для экспериментов, но и для более серьёзной инфраструктуры голосовых приложений.

Модель разработала команда OpenMOSS-Team.

GitHub: https://github.com/OpenMOSS/MOSS-TTS

Hugging Face: https://huggingface.co/OpenMOSS-Team/MOSS-TTS-v1.5

ModelScope: https://modelscope.ai/organization/openmoss
Please open Telegram to view this post
VIEW IN TELEGRAM
👍158🥰4
⚡️ OpenAI раздаёт ChatGPT Pro на 6 месяцев** владельцам open-source проектов.

В рамках программы Codex for Open Source можно получить:

• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security

Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.

Больше шансов у тех, у кого есть:

• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов

Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.

https://openai.com/ru-RU/form/codex-for-oss/

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
17🔥7👍4
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Google выпустила Gemma 4 12B

DeepMind опубликовала веса мультимодальной модели Gemma 4 12B, которая обрабатывает текст, изображения и аудио без использования отдельных энкодеров.

Отказ от внешних модулей снизил вычислительную задержку и требования к памяти. Модель работает локально на устройствах с 16 ГБ ОЗУ, показывая в бенчмарках результаты на уровне моделей класса 26B.

Веса выложены на Hugging Face, поддержка модели добавлена в Ollama и LM Studio. Лицензия Apache 2.0, допускающая коммерческое применение.
blog.google

✔️ Ideogram релизнул четвертую версию T2i модели

Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.

На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.

Код и веса опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.

Доступен API стоимостью от $0.03 до $0.10 за генерацию в зависимости от качества. Модель есть на площадках ComfyUI, Replicate и Leonardo AI.

В будущих обновлениях обещают добавить работу со слоями и редактируемый текст.
ideogram.ai

✔️ Personal Computer от Perplexity стал доступен на Windows

Система напрямую взаимодействует с локальными файлами, системными утилитами и десктопными приложениями Microsoft (Word, Excel, PowerPoint, Outlook).

Архитектура разбивает запросы на подзадачи и распределяет их между пулом агентов. Personal Computer сортирует директории, переносит метрики из локальных таблиц в презентации и сверяет документы с веб-выдачей.

В интеграции с браузером Comet агент управляет интерфейсами сайтов: заполняет формы, бронирует слоты в календаре и работает с корпоративными платформами. Поддерживается синхронизация - запущенную на смартфоне задачу можно продолжить на ПК. Продукт доступен по листу ожидания для подписчиков Max и Enterprise Max.
perplexity.ai

✔️ Nous Research представила ИИ-агента Hermes Desktop

Hermes Desktop - превью-версия приложения под лицензией MIT для развертывания ИИ-агентов на Windows, macOS и Linux. Инструмент работает из терминала, электронной почты и мессенджеров.

Hermes планирует задачи на естественном языке и использует постоянную память для сохранения контекста проектов. Архитектура поддерживает делегирование: система запускает субагентов с отдельными терминалами для выполнения Python-скриптов, веб-поиска, генерации изображений и синтеза речи.

Для изоляции исполняемого кода доступны пять песочниц: локальная среда, Docker, SSH, Singularity и Modal. Обращения к LLM маршрутизируются через платформу Nous Portal, на которой есть более 300 моделей, в том числе по бесплатным тарифам.
nousresearch.com

✔️ MIT собрали набор для обучения моделей анализу графиков

Институт в коллаборации с IBM Research представил ChartNet - синтетический датасет из 1,5 млн диаграмм для обучения vision-моделей.

Авторы конвертировали существующие графики в исполняемый код, а затем программно модифицировали его для генерации новых примеров. 

Датасет
 включает 24 типа диаграмм на базе 6 библиотек визуализации. Каждый сэмпл содержит сгенерированное изображение, исходный код, таблицу данных и текстовое описание.

По заявлению разработчиков, дообучение на ChartNet позволило компактным моделям превзойти более крупные проприетарные системы в профильных бенчмарках по извлечению визуальной информации.
news.mit.edu

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🥰2
⚡️ Anthropic уже пишет о рекурсивном самоулучшении, как о процессе, который постепенно становится реальностью.

В свежем материале речь идёт об ИИ, который помогает проектировать и собирать следующую версию себя.

Длина задач, которые модель способна стабильно доводить до конца, удваивается примерно каждые четыре месяца. В марте 2024 года Opus 3 справлялся с задачами примерно на 5 минут. Через год Sonnet 3.7 уже держал около полутора часов. Ещё через год Opus 4.6 дошёл примерно до 12 часов. Внутренний препрев Anthropic показал минимум 16 часов, причём ограничением могла быть сама методика оценки.

К маю 2026 года Claude пишет больше 80% кода, который попадает в кодовую базу Anthropic. В одном кейсе модель выдала больше 800 фиксов и снизила целый класс API-ошибок в тысячу раз. По оценке инженера, человеку на такой объём работы понадобилось бы около четырёх лет.

В проекте по безопасности агенты закрыли 97% разрыва в производительности, тогда как два разраба за неделю закрыли 23%. В выборе следующего исследовательского шага модель уже показывает 64% попаданий против человеческого решения.

Решения людей пока держатся на: какие задачи выбирать, когда менять направление, когда признать тупик и не продолжать копать.

Авторы рассматривают три развилки. В первой рост упирается в плато, и этому варианту они дают меньше всего веса. Во второй эффективность продолжает накапливаться, люди задают направление, а небольшая команда делает объём работы, который раньше требовал тысяч специалистов. Этот сценарий выглядит для них наиболее вероятным. В третьей начинается полноценное рекурсивное самоулучшение, где темп всё сильнее определяется доступным компьютом. Именно по этому сценарию у Anthropic меньше всего уверенности в безопасности.

Люди пока сильнее в том, что не сводится к простому выполнению задачи: выбрать правильное направление, вовремя сменить подход, понять, что задача плохо поставлена, и остановиться, когда решение больше не окупает усилия.

Anthropic описывает три возможных сценария.

Первый - прогресс упирается в плато. Модели становятся лучше, но рост быстро замедляется. Авторы считают этот вариант наименее вероятным.

Второй - модели продолжают усиливать команды, но направление всё ещё задают люди. Небольшая группа специалистов с ИИ делает объём работы, который раньше требовал тысяч человек. Этот сценарий выглядит для Anthropic самым вероятным.

Третий - полноценное рекурсивное самоулучшение. ИИ всё активнее участвует в создании следующих поколений ИИ, а скорость прогресса начинает зависеть в первую очередь от доступных вычислений. По этому сценарию у Anthropic больше всего вопросов к безопасности.

https://www.anthropic.com/institute/recursive-self-improvement
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥117👍5🤔2