Data Secrets

Стартап Subquadratic анонсировал языковую модель SubQ с контекстным окном 12М токенов

Это не все: она также выдает невероятную скорость в 150 токенов/сек, обгоняет Claude Opus 4.6 на SWE-bench, и при этом ее стоимость составляет 5% от стоимости Opus (прочитайте это снова).

Секрет SubQ, как говорят создатели, в архитектуре. А точнее, в использовании нового вида механизма внимания – sub-quadratic sparse-attention. Идея в том, чтобы вычислять внимание только по разреженному набору наиболее важных связей, а не по всей матрице целиком.

Метод позволяет достичь линейной (!!!) вычислительной сложности относительно длины контекста и на длинных контекстных окнах достигает ускорения в 52 раза относительно FlashAttention.

Звучит как полный прорыв в экономике инференса. Но, как обычно, есть нюанс: пока все эти громкие заявления живут только на словах.

Проект находится в закрытой бете, техрепорта нет, доступов нет. Пока выложили только небольшой блог и разбор их механизма внимания.

Посмотрим, что из этого выйдет

😁14579🤯51❤19⚡10🤔10👍4🤩2👨‍💻1

16.1K views10:52

Data Secrets

Nvidia и один из крупнейших застройщиков США PulteGroup в сотрудничестве со стартапом Span будут устанавливать мини-датацентры на стены новых домов

Чего только не придумаешь, когда нужен компьют для ИИ. Кто-то предлагает строить датацентры в космосе, а вот в стартапе Span придумали концепцию распределенного дата‑центра, расбросанного по тысячам жилых домов.

В партнерстве с Nvidia и PulteGroup они прямо сейчас тестируют XFRA – небольшие вычислительные узлы, которые размещаются снаружи домов и состоят из ~ 16 GPU Blackwell. Умный электрощит Span следит, сколько энергии потребляет дом, и остаточную свободную мощность отдает XFRA на ИИ-нагрузки.

При этом владелец будет получать огромную скидку на тарифы электричества (и, вероятно, платить даже меньше, чем без XFRA) + дополнительный доход.

Фишка в том, что установить много таких ящичков – быстрее и дешевле, чем строить огромный датацентр (по расчетам Span, примерно в 5-6 раз). Так что идея неплохая, не считая рисков, стоимости обслуживания и, конечно, необходимости сложной инфры под все это дело.

К 2027 году Span с этим проектом планирует выйти на гигаваттный масштаб.

👍139👏28🔥18😁15❤11🤯8😎621

16.8K views13:11

Data Secrets

DeepSeek ведет переговоры о первом раунде внешнего финансирования

Компания планирует привлечь $3–4 млрд при оценке до $50 млрд, как сообщает Reuters.

Правда, большинство денег, скорее всего, все равно вложит государство. А точнее, Китайский национальный фонд искусственного интеллекта. Кроме того, принять участие в раунде может Tencent Holdings.

Напоминаем, что DeepSeek ранее отказывался от внешних инвестиций, но теперь, судя по всему, меняет стратегию.

❤71👍28🔥17😁8

14.7K views14:20

Data Secrets

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

Yandex ML Challenge — новое соревнование с задачами по ИИ и финалом на Young Con 2026

Кого ждем:
Студентов, выпускников и учеников 11-х классов — тех, кто любит решать соревнования по машинному обучению

Что нужно знать:
На длинном онлайн-туре вас ждут 3 задачи: CV (компьютерное зрение), LLM (большие языковые модели) и RL (обучение с подкреплением).
Регистрируйтесь сейчас и приступайте к задачам 21 мая в 16:00 мск

Таймлайн:
С 21 по 31 мая — длинный онлайн-тур, где определим топ-100 финалистов с самым высоким суммарным рейтингом

25 июня состоится очный финал на Young Con 2026: масштабном фестивале о технологиях и старте карьеры в IT

Победителю соревнования достанется приз в размере 1 млн рублей.
А топ-15 финалистов получат набор умных устройств от Яндекса.

Регистрация открыта

🗿34😁26👍9🤯3❤2🔥1

14.6K views15:02

Data Secrets

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Gemma-4 теперь умеет предсказывать токены не по одному, а партиями

Google только что выпустили Multi-Token Prediction (MTP) драфтеры. Это штука, которая позволяет Gemma-4 предсказывать сразу несколько токенов вперед.

Обычно LLM генерируют строго по одному токену за шаг, и это одна из главных проблем архитектуры трансформеров, потому что работает медленно.

Что сделали Google:

– Они взяли еще одну модель, крошечную, обучили ее на задаче multi-token prediction, и поставили на роль drafter. Называется так, потому что эта модель пишет черновики, то есть пытается угадать действия большой модели на несколько токенов вперед.

– Батч черновых токенов проверяет основная модель. Фишка в том, что на проверку нужен всего один проход (вместо нескольких, если бы модель генерировала все эти токены сама).

– Если в черновой последовательности попадается ошибка, то: (1) этот токен заменяется на тот, который большая модель считает верным; (2) проверка прерывается и дальше драфтер предсказывает новую партию с этого места.

Например, мы сгенерировали 5 черновых токенов. Три перых совпало, четвертый заменили. Всего сэкономили три прохода большой модели.

Итог: MTP ускоряет генерацию примерно в 3 раза вообще без потерь в качестве. Все драфтеры выложили, так что уже можно попробовать погенерить что-нибудь в таком режиме.

blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/

5👍190🔥73❤31🤔8🤯5😁3

18.4K views16:58

Data Secrets

Anthropic 🤝 SpaceX

Компании Дарио Амодеи и Илона Маска только что объявили о крупном партнерстве.

SpaceXAI предоставит Anthropic доступ ко всей вычислительной мощности дата-центра Colossus 1 в Мемфисе. Это примерно 300 мегаватт вычислительных мощностей или 220к GPU.

Это одна из крупнейших инфраструктурных договоренностей в секторе на данный момент.

В честь закрытия сделки Anthropic уже: удвоили 5-часовые лимиты для платных подписок; полностью убрали сокращение лимитов в пиковые часы (ура!); и повысили лимиты на Opus в API, включая RPM, TPM и квоты. Дальше обещают больше.

Сумма сделки не разглашается.

🔥251❤52👍28🤯9👏2😁2🕊1

15.1K views07:57

Data Secrets

Агенты Anthropic теперь будут самостоятельно улучшаться в свободное время

Компания запустила в рисерч превью функцию dreaming. Она активируется в простое между сессиями и позволяет агенту «самообучаться».

claude.com/blog/new-in-claude-managed-agents

Модель в фоновом режиме просматривает предыдущие взаимодействия, выявляет паттерны типа повторяющихся ошибок, общих предпочтений пользователей или типовых рабочих процессов. Затем на основе анализа агент обновляет свою память, добавляя туда эффективные паттерны и правила.

Можно выбрать автоматическое обновление или с ручным подтверждением. Теоретически, оптимизация должна быть ощутимая: это не только про качество работы агента как таковое, но и про компактную память и, следовательно, снижение потребления ресурсов.

Пока функция работает только в рамках Claude Managed Agents, запросить доступ можно здесь

Ждем, пока покатят на Claude Code

👍127🔥43❤25🕊3

16.2K views11:10

Data Secrets

Forwarded from Яндекс

🔴

Разработчики, держите дайджест Яндекса за апрель: что полезного почитать, посмотреть и куда сходить в ближайшее время.

Почитать

➕

Релиз userver 3.0 и переход на C++20 — зачем отказались от C++17 и что изменилось во фреймворке. Разбирает Антон Полухин из Техплатформы Городских сервисов Яндекса

➕

Как фронтенд работает с LLM? Объясняет Андрей Мелихов из Yandex Cloud на примере Yandex DataLens: как устроена интеграция, из каких компонентов она состоит и как команды делят зоны ответственности

➕

Как с помощью LLM автоматизировать поиск уязвимостей в коде — на примере TrustYFox. Своим опытом делится Андрей Фримучков, создатель инструмента

Посмотреть

➕

Дискуссия с Dream → Teamlead про AI в работе тимлида: какие задачи уже можно ускорить и упростить

➕

Доклад про RAG-системы с Saturday ML Party: как они устроены и когда стоит дообучать модели

➕

Подкаст аналитиков Яндекса — тоже про аналитиков: как устроена культура команд и как найти свою

Посетить

➕

16 мая — Backend Talks в Москве: лучшие практики высоконагруженных систем, хардовые доклады и нетворкинг. Специальный гость — учёный Владимир Сурдин

➕

23 мая — Я.Железо в Москве и онлайн: конференция про устройства, роботов и автономный транспорт — от железа до ML

➕

23 мая — Рекурсия по городу: CTF-квест по Москве с 30+ локациями. Какой маршрут выбрать и по какой стратегии двигаться — решать только вам

〰️ Сохраняйте, чтобы не потерять, и делитесь с коллегами

Please open Telegram to view this post

VIEW IN TELEGRAM

🗿35❤9🤯7👍6🍾4😁3

10.1K views13:31

Data Secrets

После объявления о партнерстве SpaceX и Anthropic в X пошла волна мемов. Вашему вниманию:

😁137🔥62❤13👍4🤯1🤝1

9.94K views14:33

About

Blog

Apps

Platform