Useful Tools | Linux | GitOps | DevOps
5.73K subscribers
145 photos
1 video
7 files
670 links
Полезные бесплатные opensource инструменты на все случаи жизни, а иногда и советы.

Понравился проект из поста - поддержи автора звездой!

Автор: @dmitry_malinin
Web: https://gitgate.d3.ru

Сотрудничество: @maxgrue
Обсуждение: @gittalk
Download Telegram
sq - это CLI утилита, которая предоставляет доступ в стиле jq к структурированным источникам данных: базам данных SQL или форматам документов, таким как CSV или Excel.

sq выводит данные во множество форматов, включая JSON, Excel, CSV, HTML, Markdown и XML, и может вставлять результаты запроса непосредственно в базу данных SQL.

sq также может проверять источники для просмотра метаданных о структуре источника (таблицы, столбцы, размер). Вы можете использовать sq diff для сравнения таблиц или целых баз данных. В sq есть команды для обычных операций с базой данных, таких как копирование, усечение и удаление таблиц.

https://github.com/neilotoole/sq
Web: https://sq.io/


#json #excel #csv #html #markdown #xml #sql
👍22🔥8
MarkItDown - утилита написанная на Python для преобразования различных файлов в формат Markdown для использования с LLM и связанными с ними конвейерами анализа текста.

В этом отношении она наиболее близка к textract, но с акцентом на сохранение важной структуры и содержимого документа в формате Markdown (включая заголовки, списки, таблицы, ссылки и т. д.). Хотя вывод зачастую достаточно презентабелен и удобен для восприятия, он предназначен для использования инструментами анализа текста и может быть не лучшим вариантом для высококачественного преобразования документов для восприятия человеком.

В настоящее время MarkItDown поддерживает конвертацию из:
- PDF
- PowerPoint
- Word
- Exel
- Изображения (метаданные EXIF и OCR)
- Аудио (метаданные и транскрипция речи)
- HTML
- Текстовые форматы (CSV, JSON, XML)
- ZIP-файлы (перебирает содержимое)
- URL-адреса YouTube
- EPubs
- и многое другое!

https://github.com/microsoft/markitdown

опубликовано в @gitgate

#markdown #pdf #xls #doc #ppt #html #zip #epub #converter
🔥11👍6