pdfplumber для извлечения текста с .pdf
Утилита, считывающая текст с документов на нескольких языках, включая русский:
Репозиторий
#OCR #библиотека
Утилита, считывающая текст с документов на нескольких языках, включая русский:
import pdfplumber
with pdfplumber.open("path/to/file.pdf") as pdf:
first_page = pdf.pages[0]
print(first_page.chars[0])
Репозиторий
#OCR #библиотека
👍11❤🔥3