Python PDF Handling Tutorial — интересная подборка скриптов для работы с PDF-файлами в Python:
Вы научитесь:
Пример извлечения текста:
from io import StringIO
from pdfminer.pdfinterp import PDFPageInterpreter, PDFResourceManager
from pdfminer.pdfpage import PDFPage
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
# PDFMiner Analyzers
rsrcmgr = PDFResourceManager()
sio = StringIO()
codec = "utf-8"
laparams = LAParams()
device = TextConverter(rsrcmgr, sio, codec=codec, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
# path to our input file
pdf_file = "sample.pdf"
# Extract text
pdfFile = open(pdf_file, "rb")
for page in PDFPage.get_pages(pdfFile):
interpreter.process_page(page)
pdfFile.close()
# Return text from StringIO
text = sio.getvalue()
print(text)
# Freeing Up
device.close()
sio.close()
Пример извлечения изображений:
import fitz
import io
from PIL import Image
# path to our input file
pdf_file = "sample.pdf"
# Input PDF file
pdf_file = fitz.open(pdf_file)
for page_no in range(len(pdf_file)):
curr_page = pdf_file[page_no]
images = curr_page.getImageList()
for image_no, image in enumerate(curr_page.getImageList()):
# get the XREF of the image
xref = image[0]
# extract the image bytes
curr_image = pdf_file.extractImage(xref)
img_bytes = curr_image["image"]
# get the image extension
img_extension = curr_image["ext"]
# load it to PIL
image = Image.open(io.BytesIO(img_bytes))
# save it to local disk
image.save(open(f"page{page_no+1}_img{image_no}.{img_extension}", "wb"))
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30❤9🔥8
Кодим и развиваемся без боли
Залетела мощная нейротулза: берёт любой проект с GitHub и превращает его в интерактивный гайд. Пошагово объясняет, как работает код, причём простыми словами — даже новичок разберётся.
Что умеет:
— Учит новым технологиям прямо на реальных проектах;
— Автоматически превращает код в понятную документацию;
— Разбирает сложные участки и даёт подробные объяснения;
— Отличный способ учиться не по теории, а по боевому коду.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥24❤4
WeasyPrint — библиотека, которая превращать HTML в красивые PDF-документы.
*
*
* 🎟 Билетов и любых документов прямо из кода
Особенности:
Установка:
pip install weasyprint
Отличный выбор, если вы хотите автоматизировать генерацию PDF в своих проектах — будь то веб-приложение, отчет из бота или документооборот
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥9❤6
TG_AutoPoster — Готовый бот-парсер для автоматической пересылки записей из групп ВКонтакте в ваш Telegram-канал, чат или личные сообщения.
Основные возможности:
config.yaml
, где вы указываете логин и пароль ВКонтакте или токен, а также данные для Telegram API.1. Установите TG_AutoPoster с помощью pip:
pip3 install -U TG-AutoPoster
2. Создайте файл
config.yaml
на основе config.yaml.example
и заполните необходимые параметры.3. Запустите бота командой:
python3 -m TG_AutoPoster
4. Активируйте бота в чате командой
/start
vk:
login: "your_vk_login"
pass: "your_vk_password"
token: "your_vk_token" # предпочтительно использовать токен
telegram:
api_id: 123456
api_hash: "your_api_hash"
bot_token: "your_bot_token"
proxy:
enabled: false
hostname: ""
port: 0
username: ""
password: ""
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥9❤5
Это не просто линтер, а брутальный инструмент аудита безопасности, созданный для того, чтобы находить уязвимости в твоём коде быстрее, чем это сделает реальный атакующий.
Что умеет:
eval()
до серьёзных криптокосяков.$ bandit your_script.py
#python #soft #github #security
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39❤14🔥9
EasyOCR — мощный и простой в использовании инструмент по распознаванию символов.
Пример использования на изображении
Установка:
pip install easyocr
⚙️ GitHub/Инструкция#python #soft #code #github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥14❤9
ART — минималистичная, но чертовски стильная библиотека для Python, с которой ты за секунду создашь красивый ASCII-логотип прямо в консоли.
ART — это быстро, просто и эффектно.
pip install art
#python #soft #code #github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍44🔥9❤5🤯1
Это не просто репозиторий, а целый пошаговый план, как прокачать себя в Python с нуля до уверенного разработчика c объяснениями и большим количеством примеров
Внутри:
Хочешь войти в IT, автоматизировать всё вокруг или наконец понять, как работает код — начни с первого дня. Остальные подтянутся.
#python #github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🔥17❤13
В репозитории — сотни реальных тестовых заданий от российских и зарубежных IT-компаний. Примеры на Python, фронт, DevOps, дизайн, аналитику и даже геймдев.
Идеально, чтобы:
#cheatsheet #doc #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥8❤6
Когда обычного текста мало, а нужно показать смысл, на помощь приходит Doc2Image — нейросервис, который читает документы и генерирует по ним визуальные подсказки для Midjourney, DALL·E и других генераторов.
Ты загружаешь документ — он сам вычленяет суть, превращает её в понятное описание и подсказывает, какое изображение можно создать.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥14❤8
config.toml
или переменные./forward
— для пересылки старых сообщений.1. Клонируешь репу
2. Настраиваешь
config.toml
(там всё понятно)3.
pip3 install -r requirements.txt
4.
python3 -m bot
или через Docker:docker build -t telegram-message-forwarder-bot .
docker run -d --name telegram-message-forwarder-bot telegram-message-forwarder-bot
– новостных и нишевых Telegram-каналов;
– кросспостинга в группы/чаты;
– админов, которые любят автоматизацию.
#soft #python #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23🔥12❤6
Но… бесплатно. И у тебя в ноутбуке. И через Python.
pip install openbb
Пример кода:
from openbb import obb
output = obb.equity.price.historical("AAPL")
df = output.to_dataframe()
Это больше, чем просто библиотека. Это твой личный финтех-терминал.
Сохраняем
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥21❤14
Wildberries — один из самых крупных маркетплейсов в СНГ. Ты сможешь вытащить оттуда всё, что скрыто за интерфейсом:
И даже:
Легко интегрируется в ваши боты, системы мониторинга или Excel-отчёты для продавцов.
Скачал → запустил → получил Excel со всеми нужными товарами.
#github #python #soft
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥21❤6
Знакомься с Pystray — библиотека, которая превращает твой скрипт в настоящее десктоп-приложение с иконкой рядом с часами.
pip install pystray
Используй Pystray, чтобы твои скрипты выглядели как настоящие нативные приложения.
И никаких окон. Только стиль и функциональность.
#python #soft #code #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57❤14🔥9
Предоставляет подробную документацию и примеры использования с Ollama, Docker, OpenAI, Groq, Azure и Gemini.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57🔥22❤12
Vidzilla — это Telegram-бот, который превращает любую ссылку в видеофайл.
Больше никаких сайтов с рекламой и ожидания — просто кинул ссылку, получил видео. Всё.
Поддержка самых популярных платформ:
*принаджелат Meta, признана экстремистской в РФ и запрещена.
*принаджелат Meta, признана экстремистской в РФ и запрещена.
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
❤33🔥15👍10🫡2
Forwarded from NetStalkers
Wapiti — один из самых мощных пентест-сканеров для веба.
Без лишней теории — просто запускаешь, и он тестирует твой сайт как хакер.
Ведёт себя как настоящий атакующий:
фаззит, сканирует формы, линкуется по сайту, шлёт payload’ы и ищет уязвимости.
Никакого доступа к коду — только black-box.
Что умеет:
Установка:
pip install wapiti3
Запуск:
wapiti -u https://target.com
Сохрани — пригодится
#pentest #redteam #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48🔥12❤6😱1
Идеальный чит для разработчика:
• Шпаргалки по Python, JS, Go, Rust, Java.
• Архитектура, ОС, редакторы, IDE, хоткеи.
• Лучшие фреймворки, библиотеки и паттерны.
• Гайды по фронту, бэку, DevOps и не только.
• Только выжимка — без воды, всё чётко по делу.
Сохрани, пока не удалили
#cheatsheet #python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍5❤3
Парсим Ozon
— /start, /status, /settings — бот принимает команды
— Настраиваешь, парсишь, смотришь результат в Excel
— Всё логируется, всё под контролем
— E-commerce аналитиков
— Поставщиков
— Реселлеров
— Исследователей маркетплейсов
— И просто фанатов автоматизации
git clone https://github.com/NurjahonErgashevMe/ozon-parser
cd ozon-parser
pip install -r requirements.txt
GUI интерфейс:
python main.py
Только Telegram бот:
python bot.py
Парсинг из командной строки:
python app.py
#python #github #soft
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍50🔥10❤4😱3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Забудь про боль с вытаскиванием текста из PDF, Word и PowerPoint. MegaParse сделает всё за тебя. И без потерь данных.
pip install megaparse
Поддерживаются Vision-модели: GPT-4o, Claude — идеально для обработки сканов, презентаций и изображений с текстом.
* Data science
* Финтеха
* Личного архива
* Автоматизации офиса
* Создания дата-сеток из презентаций и документов
from megaparse import MegaParse
parser = MegaParse()
data = parser.load("your_doc.pdf")
print(data)
#python #github #soft
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥18❤11