GitHub Разработчика
16.7K subscribers
415 photos
302 videos
2 files
716 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
DrizzleTime/Foxel

Если ваши файлы разбросаны по разным местам — облачные диски, локальный жёсткий диск или NAS —> иногда сложно вспомнить, где именно что хранится.

Рекомендуется обратить внимание на Foxel - этот open-source инструмент для приватного облачного хранения позволяет унифицированно управлять файлами, разбросанными по разным хранилищам.

Особенно интересно, что поддерживается AI‑семантический поиск —> можно искать картинки и документы по содержимому с помощью естественного языка, а не только по имени файла.

📁 Language: #TypeScript 55.5%, #Python 41.5%

⭐️ Stars: 624

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Logics-Parsing

При обработке академических статей или исследовательских отчётов с помощью OCR, когда в документе есть сложные формулы, таблицы и графики, к качеству распознавания модели предъявляются особенно высокие требования.

Техническая команда Alibaba недавно выложила в опенсорс end-to-end модель для парсинга документов — Logics-Parsing, которая умеет напрямую конвертировать сложные документы в структурированный HTML.

Модель не только корректно распознаёт сложные научные формулы и химические структуры, но и автоматически отфильтровывает лишний контент вроде колонтитулов и футеров, фокусируясь на извлечении основной информации.

Поддерживаются разные типы входных данных: исследовательские отчёты, научные статьи, химическая документация, рукописные заметки и др.

В ряде бенчмарков модель показала результаты выше многих аналогов. Если у вас есть задачи по OCR сложных документов — стоит попробовать.

📁 Language: #Python 100.0%

⭐️ Stars: 369

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4