sq
- это CLI
утилита, которая предоставляет доступ в стиле jq
к структурированным источникам данных: базам данных SQL
или форматам документов, таким как CSV
или Excel
. sq
выводит данные во множество форматов, включая JSON
, Excel
, CSV
, HTML
, Markdown
и XML
, и может вставлять результаты запроса непосредственно в базу данных SQL
.sq
также может проверять источники для просмотра метаданных о структуре источника (таблицы, столбцы, размер). Вы можете использовать sq diff
для сравнения таблиц или целых баз данных. В sq
есть команды для обычных операций с базой данных, таких как копирование, усечение и удаление таблиц.https://github.com/neilotoole/sq
Web: https://sq.io/
#json #excel #csv #html #markdown #xml #sql
GitHub
GitHub - neilotoole/sq: sq data wrangler
sq data wrangler. Contribute to neilotoole/sq development by creating an account on GitHub.
👍22🔥8
MarkItDown
- утилита написанная на Python
для преобразования различных файлов в формат Markdown
для использования с LLM
и связанными с ними конвейерами анализа текста. В этом отношении она наиболее близка к
textract
, но с акцентом на сохранение важной структуры и содержимого документа в формате Markdown
(включая заголовки, списки, таблицы, ссылки и т. д.). Хотя вывод зачастую достаточно презентабелен и удобен для восприятия, он предназначен для использования инструментами анализа текста и может быть не лучшим вариантом для высококачественного преобразования документов для восприятия человеком.В настоящее время
MarkItDown
поддерживает конвертацию из:- PowerPoint
- Word
- Exel
- Изображения (метаданные
EXIF
и OCR
)- Аудио (метаданные
и транскрипция речи)- HTML
- Текстовые форматы (
CSV
, JSON
, XML
)- ZIP-файлы (перебирает содержимое)
- URL-адреса YouTube
- EPubs
- и многое другое!
https://github.com/microsoft/markitdown
опубликовано в @gitgate
#markdown #pdf #xls #doc #ppt #html #zip #epub #converter
🔥11👍6