Python Portal

Райан — лучший, делает божью работу

👉

Please open Telegram to view this post

😁15❤1

5.28K views12:07

MIT сделал ход, который ставит под сомнение ставки индустрии на рост контекстного окна.

Они решили проблему памяти не увеличением «окна», а сменой модели работы с данными.

Проблема.

У любой модели есть предел — контекстное окно. При его переполнении возникает деградация качества: факты теряются, связи между частями текста исчезают, ответы становятся хуже.

Это называют «деградацией контекста».

Что делали раньше.

RAG (генерация с извлечением):

- документ режется на чанки
- хранится во внешнем хранилище
- перед запросом извлекаются «релевантные» куски

Проблемы:

- извлечение делает предположение до чтения
- ошибки в выборе → модель не видит нужные данные
- связи между частями документа разрушаются

Подход MIT.

Документ не помещается в контекст вообще.

Он хранится вне модели, например как переменная.
Модели сообщается, что данные существуют и как к ним обращаться.

Дальше модель:

- пишет код для поиска
- использует регулярные выражения
- извлекает нужные фрагменты
- подгружает только релевантные части

Ключевой момент.

Обработка становится рекурсивной:

- модель находит релевантные участки
- запускает подзадачи (сабагенты) для их анализа
- агрегирует результат

Нет сжатия, нет потерь, нет переполнения контекста.

Результаты.

- обработка до ~10 млн токенов
- значительный прирост качества на задачах с длинным контекстом
- стоимость сопоставима с обычными запросами

Вывод.

Фокус смещается:

не «сколько текста держать в голове»,
а «как эффективно к нему обращаться».

Модель начинает работать как разработчик с доступом к данным:

поиск → извлечение → анализ → агрегация.

Ссылки:

- Статья: http://arxiv.org/abs/2512.24601
- Код: http://github.com/alexzhang13/rlm

👉

@PythonPortal

Please open Telegram to view this post