This media is not supported in your browser
VIEW IN TELEGRAM
Узнал себя?
✄┈┈┈┈┈┈┈┈┈┈┈┈┈
Заметки программиста
«(!?»Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍6👀3
Библиотека для точного извлечения текста, таблиц и метаданных из PDF-документов с сохранением структуры и позиционирования элементов.
Детальный анализ PDF с возможностью вытаскивать таблицы как pandas DataFrame и визуализировать расположение текста на странице.
Установка библиотеки:
pip install pdfplumber
Пример использования:
import pdfplumber
with pdfplumber.open("file.pdf") as pdf:
first_page = pdf.pages[0]
table = first_page.extract_table()
print(table)
Поддержка сложных PDF с объединенными ячейками таблиц и точными координатами текста — в отличие от простых текстовых экстракторов.
✄┈┈┈┈┈┈┈┈┈┈┈┈┈
Заметки программиста
«(!?»Please open Telegram to view this post
VIEW IN TELEGRAM
👍5