Please open Telegram to view this post
VIEW IN TELEGRAM
😁15❤1
MIT сделал ход, который ставит под сомнение ставки индустрии на рост контекстного окна.
Они решили проблему памяти не увеличением «окна», а сменой модели работы с данными.
Проблема.
У любой модели есть предел — контекстное окно. При его переполнении возникает деградация качества: факты теряются, связи между частями текста исчезают, ответы становятся хуже.
Это называют «деградацией контекста».
Что делали раньше.
RAG (генерация с извлечением):
- документ режется на чанки
- хранится во внешнем хранилище
- перед запросом извлекаются «релевантные» куски
Проблемы:
- извлечение делает предположение до чтения
- ошибки в выборе → модель не видит нужные данные
- связи между частями документа разрушаются
Подход MIT.
Документ не помещается в контекст вообще.
Он хранится вне модели, например как переменная.
Модели сообщается, что данные существуют и как к ним обращаться.
Дальше модель:
- пишет код для поиска
- использует регулярные выражения
- извлекает нужные фрагменты
- подгружает только релевантные части
Ключевой момент.
Обработка становится рекурсивной:
- модель находит релевантные участки
- запускает подзадачи (сабагенты) для их анализа
- агрегирует результат
Нет сжатия, нет потерь, нет переполнения контекста.
Результаты.
- обработка до ~10 млн токенов
- значительный прирост качества на задачах с длинным контекстом
- стоимость сопоставима с обычными запросами
Вывод.
Фокус смещается:
не «сколько текста держать в голове»,
а «как эффективно к нему обращаться».
Модель начинает работать как разработчик с доступом к данным:
поиск → извлечение → анализ → агрегация.
Ссылки:
- Статья: http://arxiv.org/abs/2512.24601
- Код: http://github.com/alexzhang13/rlm
👉 @PythonPortal
Они решили проблему памяти не увеличением «окна», а сменой модели работы с данными.
Проблема.
У любой модели есть предел — контекстное окно. При его переполнении возникает деградация качества: факты теряются, связи между частями текста исчезают, ответы становятся хуже.
Это называют «деградацией контекста».
Что делали раньше.
RAG (генерация с извлечением):
- документ режется на чанки
- хранится во внешнем хранилище
- перед запросом извлекаются «релевантные» куски
Проблемы:
- извлечение делает предположение до чтения
- ошибки в выборе → модель не видит нужные данные
- связи между частями документа разрушаются
Подход MIT.
Документ не помещается в контекст вообще.
Он хранится вне модели, например как переменная.
Модели сообщается, что данные существуют и как к ним обращаться.
Дальше модель:
- пишет код для поиска
- использует регулярные выражения
- извлекает нужные фрагменты
- подгружает только релевантные части
Ключевой момент.
Обработка становится рекурсивной:
- модель находит релевантные участки
- запускает подзадачи (сабагенты) для их анализа
- агрегирует результат
Нет сжатия, нет потерь, нет переполнения контекста.
Результаты.
- обработка до ~10 млн токенов
- значительный прирост качества на задачах с длинным контекстом
- стоимость сопоставима с обычными запросами
Вывод.
Фокус смещается:
не «сколько текста держать в голове»,
а «как эффективно к нему обращаться».
Модель начинает работать как разработчик с доступом к данным:
поиск → извлечение → анализ → агрегация.
Ссылки:
- Статья: http://arxiv.org/abs/2512.24601
- Код: http://github.com/alexzhang13/rlm
Please open Telegram to view this post
VIEW IN TELEGRAM
arXiv.org
Recursive Language Models
We study allowing large language models (LLMs) to process arbitrarily long prompts through the lens of inference-time scaling. We propose Recursive Language Models (RLMs), a general inference...
❤13🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
F = q(E + v \times B)
Наблюдать, как сила Лоренца из абстракции из учебника превращается в 30 000 об/мин в реальном времени — чистый дофамин.
В какой-то момент поток магнитного поля уже воспринимается как физическое размытие.
Большинство видит «крутящуюся игрушку», но по факту это векторное произведение скорости и магнитного поля, дающее силу, создающую момент на якоре. Это и есть практическое проявление уравнений Максвелла — не формулы, а реальная физика в работе.
Это демонстрация базового принципа работы коллекторных электродвигателей постоянного тока.
👉 @PythonPortal
Наблюдать, как сила Лоренца из абстракции из учебника превращается в 30 000 об/мин в реальном времени — чистый дофамин.
В какой-то момент поток магнитного поля уже воспринимается как физическое размытие.
Большинство видит «крутящуюся игрушку», но по факту это векторное произведение скорости и магнитного поля, дающее силу, создающую момент на якоре. Это и есть практическое проявление уравнений Максвелла — не формулы, а реальная физика в работе.
Это демонстрация базового принципа работы коллекторных электродвигателей постоянного тока.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32❤14👀6🤣2👍1
GitHub-репозитории, чтобы прокачать Python
Кидайте в закладки и делитесь с коллегами🌟
👉 @PythonPortal
- Веб-разработка с Django — https://github.com/django/django
- Инструментарий для Data Science — https://github.com/rasbt/python-machine-learning-book
- Алгоритмические задачи — https://github.com/TheAlgorithms/Python
- Рецепты машинного обучения — https://github.com/ageron/handson-ml2
- Лучшие практики тестирования — https://github.com/pytest-dev/pytest
- Скрипты для автоматизации — https://github.com/soimort/you-get
- Продвинутые концепции Python — https://github.com/faif/python-patterns
Кидайте в закладки и делитесь с коллегами
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15
Чёрт… хакеры это точно оценят.
Кто-то выложил в опенсорс универсальный тулкит для взлома, который объединяет все основные инструменты пентеста в одно CLI-меню.
Ставишь один раз — и сразу получаешь доступ к инструментам из всех категорий: анонимность, сбор информации, атаки на беспроводные сети, подбор паролей, сканирование веба, фреймворки эксплуатации, генерация полезной нагрузки и т.д.
Называется HackingTool.
→ Одно меню запускает Tor, Anonsurf, Macchanger и цепочки прокси за секунды
→ Включает Nmap, Dracnmap, RED HAWK и ReconSpider для полной разведки сети
→ Содержит SQLMap, XSStrike, WPScan и SecretFinder для эксплуатации веба
→ Есть John the Ripper, Hashbuster и BruteX для атак на пароли
51K звёзд. Работает на любом Linux-дистрибутиве.
Полностью опенсорс.
👉 @PythonPortal
Кто-то выложил в опенсорс универсальный тулкит для взлома, который объединяет все основные инструменты пентеста в одно CLI-меню.
Ставишь один раз — и сразу получаешь доступ к инструментам из всех категорий: анонимность, сбор информации, атаки на беспроводные сети, подбор паролей, сканирование веба, фреймворки эксплуатации, генерация полезной нагрузки и т.д.
Называется HackingTool.
→ Одно меню запускает Tor, Anonsurf, Macchanger и цепочки прокси за секунды
→ Включает Nmap, Dracnmap, RED HAWK и ReconSpider для полной разведки сети
→ Содержит SQLMap, XSStrike, WPScan и SecretFinder для эксплуатации веба
→ Есть John the Ripper, Hashbuster и BruteX для атак на пароли
51K звёзд. Работает на любом Linux-дистрибутиве.
Полностью опенсорс.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤22👍8
Forwarded from Айти мемы
Media is too big
VIEW IN TELEGRAM
Использую Claude Opus 4.7, чтобы отцентрировать
div😁35❤4🤣2
Если тебе нужны 3+ вложенных цикла — остановись и отрефактори.
Глубокую вложенность лучше избегать: такой код сложнее читать и поддерживать.
Цель всегда одна — читаемость и поддерживаемость.
Если ловишь себя на глубокой вложенности, остановись и подумай, можно ли сделать это понятнее. Использование библиотеки часто будет лучшей альтернативой.
👉 @PythonPortal
Глубокую вложенность лучше избегать: такой код сложнее читать и поддерживать.
Цель всегда одна — читаемость и поддерживаемость.
Если ловишь себя на глубокой вложенности, остановись и подумай, можно ли сделать это понятнее. Использование библиотеки часто будет лучшей альтернативой.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍6
Если видишь одну и ту же переменную по обе стороны
👉 @PythonPortal
and, обрати внимание на этот синтаксический сахар:x, y, z = 20, 15, 3
# Традиционный способ с 'and'
if x > y and y > z:
...
# Питоничный способ — цепное сравнение
if x > y > z:
...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🤔1
Не усложняй методы
Когда нужно проверить, начинается ли строка с одного из нескольких вариантов, не используй цикл — передай кортеж, и метод сам проверит совпадение с любым из значений в кортеже.
👉 @PythonPortal
startswith и endswith.Когда нужно проверить, начинается ли строка с одного из нескольких вариантов, не используй цикл — передай кортеж, и метод сам проверит совпадение с любым из значений в кортеже.
user_string = input()
starts = ('One', 'Two', 'Three')
# Переусложнённо
for s in starts:
if user_string.startswith(s):
# Сделать что-то и выйти
break
# Чистый вариант
if user_string.startswith(starts):
# Сделать что-то
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤3
Твой ПК скоро станет по-настоящему «умным».
Aiden — это полноценная ИИ-операционная система, которая работает на 100% локально на Windows или Linux:
- 1500+ компонуемых навыков
- 89+ автономных инструментов
- Управляет мышью, клавиатурой, экраном и приложениями (по сути как JARVIS)
- 6-слойная память + граф знаний
- Рой сабагентов, работающих параллельно
- Голос + каналы (Discord, Telegram, WhatsApp…)
Всё офлайн через Ollama.
Без аккаунтов.
Без телеметрии.
Без отправки данных в облако.
Это не чат-бот — это ассистент, который живёт внутри твоей машины.
Будущее персонального ИИ уже здесь, и оно с открытым исходным кодом.
👉 @PythonPortal
Aiden — это полноценная ИИ-операционная система, которая работает на 100% локально на Windows или Linux:
- 1500+ компонуемых навыков
- 89+ автономных инструментов
- Управляет мышью, клавиатурой, экраном и приложениями (по сути как JARVIS)
- 6-слойная память + граф знаний
- Рой сабагентов, работающих параллельно
- Голос + каналы (Discord, Telegram, WhatsApp…)
Всё офлайн через Ollama.
Без аккаунтов.
Без телеметрии.
Без отправки данных в облако.
Это не чат-бот — это ассистент, который живёт внутри твоей машины.
Будущее персонального ИИ уже здесь, и оно с открытым исходным кодом.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔19❤5
Please open Telegram to view this post
VIEW IN TELEGRAM
😁21
Хотите освоить анализ данных, но не знаете, с чего начать?
Центр непрерывного образования ФКН НИУ ВШЭ запускает онлайн-программу профессиональной переподготовки «Практический анализ данных» — полный цикл обучения от нуля до уровня практикующего аналитика.
Что вас ждет:
🟣 Python для автоматизации и анализа данных: от первых строк кода до Pandas и визуализации
🟣 SQL на продвинутом уровне: оконные функции, индексы, партиционирование, оптимизация запросов
🟣 Прикладная статистика и A/B-тестирование: проверка гипотез, планирование экспериментов, работа с малыми выборками
🟣 Основы машинного обучения: регрессия, классификация, кластеризация
🟣 Дашборды в Tableau и Yandex DataLens
🟣 Продуктовая аналитика: метрики, сегментация, приоритизация гипотез
🟣 Хранилища данных: архитектура DWH, Hadoop, Spark, ETL, Airflow
Преподаватели — практикующие специалисты из Wildberries, Вкусно — и точка и других компаний. По окончании вы получите диплом о профессиональной переподготовке НИУ ВШЭ.
📁 Старт: 12 мая.
Подробнее о программе📍
Центр непрерывного образования ФКН НИУ ВШЭ запускает онлайн-программу профессиональной переподготовки «Практический анализ данных» — полный цикл обучения от нуля до уровня практикующего аналитика.
Что вас ждет:
Преподаватели — практикующие специалисты из Wildberries, Вкусно — и точка и других компаний. По окончании вы получите диплом о профессиональной переподготовке НИУ ВШЭ.
Подробнее о программе
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4😢1
f-строки в Python:* Перед строкой ставится
f* Возвращается обычная строка
* Выражения в
{} вычисляются и подставляютсяx = 5
y = 7
f'{x} + {y} = {x+y}' # 5 + 7 = 12
x = [1, 2]
y = [3, 4]
f'{x} + {y} = {x+y}' # [1, 2] + [3, 4] = [1, 2, 3, 4]
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤4🤔1
Нужно округлить даты/время в Pandas:
*
*
*
Пример:
👉 @PythonPortal
*
dt.floor — вниз (к предыдущему интервалу)*
dt.ceil — вверх (к следующему интервалу)*
dt.round — к ближайшему интервалуПример:
s.dt.floor('3h') # предыдущий 3-часовой слот
s.dt.ceil('15m') # следующий 15-минутный слот
s.dt.round('1D') # ближайшие суткиPlease open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3❤2
Нужно обнулить время (до полуночи) в серии datetime в Pandas — используется
На выходе та же серия datetime, но у всех значений время
👉 @PythonPortal
dt.normalize:df['x'].dt.normalize()
На выходе та же серия datetime, но у всех значений время
00:00:00.Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Теперь можно искать по PDF на 500 страниц без чанкинга и без векторизации.
Андрей Карпати недавно озвучил идею:
что если база знаний работает как вики, а не как векторная база?
OpenKB — open-source CLI, построенный вокруг этой концепции.
Он компилирует сырые документы в структурированную связанную вики-систему с помощью LLM.
Знания накапливаются, а не пересобираются при каждом запросе.
В классическом RAG контекст каждый раз восстанавливается заново. Здесь модель опирается на уже построенную структуру.
Длинные PDF разбираются через PageIndex — древовидный индекс без векторов, который позволяет рассуждать по структуре документа.
Что получается на выходе:
> авто-суммаризация и страницы концептов
> кросс-ссылки между документами
> детект противоречий и пробелов
> режим наблюдения за изменениями
> markdown, совместимый с Obsidian
Поддерживаются PDF, Word, PowerPoint, Excel, HTML и изображения.
Таблицы и фигуры извлекаются нативно.
Один новый файл может автоматически обновить до 15 страниц в вики.
База знаний начинает сохранять то, что уже было выучено.
https://github.com/VectifyAI/OpenKB
👉 @PythonPortal
Андрей Карпати недавно озвучил идею:
что если база знаний работает как вики, а не как векторная база?
OpenKB — open-source CLI, построенный вокруг этой концепции.
Он компилирует сырые документы в структурированную связанную вики-систему с помощью LLM.
Знания накапливаются, а не пересобираются при каждом запросе.
В классическом RAG контекст каждый раз восстанавливается заново. Здесь модель опирается на уже построенную структуру.
Длинные PDF разбираются через PageIndex — древовидный индекс без векторов, который позволяет рассуждать по структуре документа.
Что получается на выходе:
> авто-суммаризация и страницы концептов
> кросс-ссылки между документами
> детект противоречий и пробелов
> режим наблюдения за изменениями
> markdown, совместимый с Obsidian
Поддерживаются PDF, Word, PowerPoint, Excel, HTML и изображения.
Таблицы и фигуры извлекаются нативно.
Один новый файл может автоматически обновить до 15 страниц в вики.
База знаний начинает сохранять то, что уже было выучено.
https://github.com/VectifyAI/OpenKB
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤8👍3🤔1🤝1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52❤6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Sentrux измеряет архитектуру кодовой базы в реальном времени.
Что делает:
→ Оценивает «здоровье» архитектуры (0–10000)
→ Отслеживает модульность, циклические зависимости, глубину, равномерность, избыточность
→ Работает за миллисекунды (Rust + tree-sitter, 52 языка)
→ Отдает фидбек, пока агенты пишут код
Как работает:
→ scan / rescan анализируют структуру
→ check_rules применяет ограничения
→ evolution отслеживает изменения во времени
→ Правила лежат в
Экспонируется как MCP-сервер:
→ Агенты получают живой структурный фидбек прямо в процессе сессии
Вместо:
code → review позже
Получаешь:
code → оценка → исправление (внутри цикла)
https://github.com/sentrux/sentrux
👉 @PythonPortal
Что делает:
→ Оценивает «здоровье» архитектуры (0–10000)
→ Отслеживает модульность, циклические зависимости, глубину, равномерность, избыточность
→ Работает за миллисекунды (Rust + tree-sitter, 52 языка)
→ Отдает фидбек, пока агенты пишут код
Как работает:
→ scan / rescan анализируют структуру
→ check_rules применяет ограничения
→ evolution отслеживает изменения во времени
→ Правила лежат в
.sentrux/rules.toml (связность, слои, циклы)Экспонируется как MCP-сервер:
→ Агенты получают живой структурный фидбек прямо в процессе сессии
Вместо:
code → review позже
Получаешь:
code → оценка → исправление (внутри цикла)
https://github.com/sentrux/sentrux
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🤔6👍1