This media is not supported in your browser
VIEW IN TELEGRAM
Агентный RAG для чайников
Если хочешь собрать рабочую RAG-систему, то большинство гайдов в интернете заканчиваются на самом базовом "retrieval + generation". Как только появляется многотуровый диалог или более сложная логика, качество ответов часто становится просто ужасным.
На GitHub нашел проект Агентный RAG для чайников. Не ведись на слово "для чайников" в названии: по сути это продакшен-уровневое решение agentic RAG, собранное на LangGraph.
Там добавлены память диалога и иерархическая индексация: сначала точный поиск по маленьким чанкам, потом подтягивание больших чанков как полноценного контекста. Это неплохо лечит проблему, когда модель выдирает фразы без нормального окружения.
Поддерживается параллельная работа нескольких агентов для разруливания сложных запросов. Если инструкция расплывчатая, система может сама переспросить, чтобы уточнить намерение, вместо того чтобы уверенно галлюцинировать.
Еще внутри есть Gradio-интерфейс: управление документами, сохранение диалогов, ручное вмешательство (human-in-the-loop) и прочее. Плюс дается полный гайд по конвертации PDF в Markdown, с инструментами и сравнением вариантов.
Есть быстрый деплой через Docker и подробные Notebook-уроки, так что локально поднять все довольно легко. Если хочешь апгрейднуть базовый RAG до уровня продакшена или ищешь кастомизируемую схему умного поиска, проект стоит попробовать.
📁 Language: #Python 32.1%
⭐️ Stars: 1.2k
➡️ Cсылка на GitHub
📱 @git_developer
Если хочешь собрать рабочую RAG-систему, то большинство гайдов в интернете заканчиваются на самом базовом "retrieval + generation". Как только появляется многотуровый диалог или более сложная логика, качество ответов часто становится просто ужасным.
На GitHub нашел проект Агентный RAG для чайников. Не ведись на слово "для чайников" в названии: по сути это продакшен-уровневое решение agentic RAG, собранное на LangGraph.
Там добавлены память диалога и иерархическая индексация: сначала точный поиск по маленьким чанкам, потом подтягивание больших чанков как полноценного контекста. Это неплохо лечит проблему, когда модель выдирает фразы без нормального окружения.
Поддерживается параллельная работа нескольких агентов для разруливания сложных запросов. Если инструкция расплывчатая, система может сама переспросить, чтобы уточнить намерение, вместо того чтобы уверенно галлюцинировать.
Еще внутри есть Gradio-интерфейс: управление документами, сохранение диалогов, ручное вмешательство (human-in-the-loop) и прочее. Плюс дается полный гайд по конвертации PDF в Markdown, с инструментами и сравнением вариантов.
Есть быстрый деплой через Docker и подробные Notebook-уроки, так что локально поднять все довольно легко. Если хочешь апгрейднуть базовый RAG до уровня продакшена или ищешь кастомизируемую схему умного поиска, проект стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1