GitHub Разработчика
17.4K subscribers
532 photos
345 videos
2 files
871 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
Readur

Управлять разными документами - боль: под каждый формат свой просмотрщик, а чтобы что-то найти, приходится перелопачивать файлы вручную.

Readur - open-source система управления документами с GitHub, которая собирает PDF, изображения и Office-файлы в одном месте и автоматически распознаёт текст. Достаточно перетащить файл — OCR сам извлечёт текст с поддержкой нескольких языков, после чего становится доступен полнотекстовый поиск.

Поддерживается подключение WebDAV, локальных папок и S3-хранилищ с автосинхронизацией, есть теги, категории, мониторинг каталогов, уведомления и даже встроенная Swagger API-документация. Разворачивается одной командой через Docker, работает из коробки - хороший вариант для личного использования или командного документооборота.

📁 Language: #Rust 67.4%

⭐️ Stars: 466

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
lsv

При работе с файлами в терминале обычно используют ls и cd, но они показывают только список. Чтобы посмотреть содержимое файла или быстро перейти по каталогам, приходится постоянно вводить команды, что не очень эффективно.

На GitHub нашёлся open-source инструмент lsv — трёхпанельный файловый браузер для терминала. Слева показывается родительский каталог, по центру текущий, справа идёт живой предпросмотр выбранного файла.

Управление полностью с клавиатуры. Конфигурация через Lua: темы, хоткеи, правила предпросмотра. Можно подключать внешние инструменты (например, bat, glow) для цветного рендеринга контента.

Поддерживаются файловые операции (создание, переименование, удаление), мультивыбор с копированием и вставкой, закладки для быстрого перехода по каталогам, командная панель и автодополнение.

Превью легко кастомизируется: glow для Markdown, viu для картинок, hexyl для бинарников и т.д. Конфиг гибкий.

Устанавливается через Cargo, работает на Windows, macOS и Linux, есть готовые шаблоны конфигурации из коробки.

📁 Language: #Rust 97.0%

⭐️ Stars: 71

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍62
cocoindex

При разработке RAG-приложений или сборке базы знаний самая больная часть обычно не выбор модели, а дата-пайплайн.

Нужно писать кучу Python-скриптов для очистки данных, чанкинга и векторизации. А как только меняется исходный датасет, приходится гонять полный пересчёт — долго и дорого.

Недавно на GitHub попался CocoIndex — опенсорсный высокопроизводительный фреймворк для трансформации данных, заточенный под AI-сценарии.

Примерно в 100 строках Python можно описать весь процесс: чтение файлов, разбиение на чанки и загрузку эмбеддингов в векторное хранилище.

Поддерживаются разные источники и приёмники данных: локальные файлы, Amazon S3, Google Drive, а также векторные БД вроде Postgres, Qdrant и LanceDB.

Кроме этого, внутри уже есть готовые компоненты для текстового чанкинга, генерации эмбеддингов, парсинга PDF, построения графов знаний и других типовых трансформаций.

В проекте много примеров — больше 20 реальных кейсов: семантический поиск, графы знаний, рекомендации товаров, поиск по изображениям и т.д. Можно брать и использовать как есть.

📁 Language: #Rust 77.4%

⭐️ Stars: 4.6k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1