text-extract-api
— это инструмент, предназначенный для высокоточного преобразования изображений, PDF и офисных документов в текст в формате Markdown или структурированные JSON-документы.Построен на основе
FastAPI
и использует Celery
для асинхронной обработки задач, а Redis
— для кэширования результатов OCR.Основные возможности:
PyTorch
-базированные OCR и модели Ollama, которые настраиваются через docker-compose, обеспечивая конфиденциальность данных.Marker
, LLama3.2-vision
, Surya-OCR
и Tesseract
.Celery
для распределенной обработки задач.git clone https://github.com/CatchTheTornado/text-extract-api.git
cd text-extract-api
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Библиотека
PyWebIO
позволяет создавать веб-интерфейсы без необходимости писать HTML, CSS или JavaScript.Упрощает процесс разработки веб-приложений, предоставляя удобные функции для взаимодействия с пользователем.
Основные возможности библиотеки:
FastAPI
, Flask
, Django
pip install pywebio
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤🔥3👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Код для распаковки zip-архива на Python
Для распаковки архива в коде используется стандартный модуль
➡️ Справочник Программиста. Подписаться
Для распаковки архива в коде используется стандартный модуль
zipfile
.import zipfile
def unzip_file(zip_path, extract_path):
# Открытие zip-файла в режиме для чтения
with zipfile.ZipFile(zip_path, 'r') as zip_ref:
# Извлечение содержимого zip-архива
zip_ref.extractall(extract_path)
if __name__ == '__main__':
unzip_file('example.zip', '')
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤🔥2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Python Tutor
– это онлайн-инструмент для визуализации Python-кода.Помогает понять, как работает программа, отображая пошаговое выполнение кода и изменения в памяти.
Основные возможности:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4❤🔥2🤨1
Библиотека
MPLD3
связывает Matplotlib
с D3.js, позволяя конвертировать графики Matplotlib
в интерактивные веб-графики.Упрощает встраивание визуализаций в веб-приложения без необходимости писать код на JavaScript.
Основные возможности библиотеки:
Matplotlib
в HTML + JavaScript (D3.js)pip install mpld3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4🔥2
Код для удаления метаданных Excel-файла на Python
Для удаления метаданных из Excel-файла в коде используется библиотека
➡️ Установка библиотеки:
➡️ Справочник Программиста. Подписаться
Для удаления метаданных из Excel-файла в коде используется библиотека
openpyxl
.pip install openpyxl
import openpyxl
def remove_metadata(file_path, output_path):
# Загружаем Excel-файл
wb = openpyxl.load_workbook(file_path)
# Удаляем метаданные документа
wb.properties.creator = None # Удаляем информацию о создателе
wb.properties.lastModifiedBy = None # Удаляем информацию о последнем редактировавшем
wb.properties.title = None # Удаляем заголовок документа
wb.properties.subject = None # Удаляем тему документа
wb.properties.description = None # Удаляем описание документа
wb.properties.keywords = None # Удаляем ключевые слова
wb.properties.category = None # Удаляем категорию документа
wb.properties.contentStatus = None # Удаляем статус контента
# Удаляем определенные имена (если есть)
for name in list(wb.defined_names): # Перебираем именованные диапазоны
del wb.defined_names[name] # Удаляем каждое определенное имя
# Сохраняем файл без метаданных
wb.save(output_path) # Сохраняем изменения в новый файл
print(f"Метаданные удалены. Файл сохранен как {output_path}") # Выводим сообщение об успешном удалении
if __name__ == "__main__":
remove_metadata("input.xlsx", "output.xlsx")
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤🔥3
Библиотека
translators
— это удобный инструмент для работы с онлайн-переводчиками в Python.Позволяет использовать API популярных сервисов перевода без необходимости регистрироваться и получать ключи API.
Основные возможности библиотеки:
pip install translators
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Код для добавления изображений в PDF-документ на Python
Для добавления изображений в PDF-документ в коде используются библиотеки
➡️ Установка библиотеки Pillow:
➡️ Справочник Программиста. Подписаться
Для добавления изображений в PDF-документ в коде используются библиотеки
Pillow
и pathlib
.pip install Pillow
from pathlib import Path
from PIL import Image
def images_to_pdf(image_folder: str, output_pdf: str) -> None:
# Получаем список всех файлов в указанной папке, сортируем их
image_paths = Path(image_folder).glob("*.*")
# Открываем изображения, конвертируем их в формат RGB и фильтруем по разрешённым расширениям
images = [Image.open(img).convert("RGB") for img in image_paths if
img.suffix.lower() in {'.png', '.jpg', '.jpeg', '.bmp', '.gif'}]
if images:
# Сохраняем первый файл как PDF, добавляя остальные изображения в документ
images[0].save(output_pdf, save_all=True, append_images=images[1:])
print(f'PDF успешно сохранён: {output_pdf}')
else:
# Выводим сообщение, если изображений не найдено
print('Нет изображений для конвертации.')
if __name__ == '__main__':
images_to_pdf('папка_с_изображениями', 'результат.pdf')
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3❤🔥1
Библиотека
fastapi-plugins
предназначена для удобного управления ресурсами в FastAPI
, такими как кеш Redis
, базы данных, очереди задач и другие внешние сервисы.Упрощает работу с зависимостями, позволяя легко подключать, конфигурировать и переиспользовать подключенные сервисы.
Основные возможности библиотеки:
Redis
, SQLAlchemy
);FastAPI
;pip install fastapi-plugins
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥2👍2🔥2
ClearerVoice-Studio
— это открытый AI-инструмент для обработки речи.Основные возможности:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
В данной статье напишем код игры "Пятнашки" на Python с использованием библиотеки
Pygame
.Игра «Кости» на Python
Игра «Арканоид» на Python
Игра «Пинг-понг» на Python
Пишем игру «Виселица» на Python
Крестики-нолики на Python
Крестики-нолики с графическим интерфейсом на Python
Анаграммы на Python
Пишем игру «Змейка» на Python
Игра «Угадай число» на Python
Игра «Камень, ножницы, бумага» на Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤🔥4😎1
This media is not supported in your browser
VIEW IN TELEGRAM
TestZeus Hercules
— это первый в мире открытый тестировочный агент, предназначенный для автоматизации тестирования современных веб-приложений.Преобразует простые шаги, написанные на языке Gherkin, в полностью автоматизированные end-to-end тесты, не требующие навыков программирования. Адаптируется к различным платформам, таким как Salesforce, и подходит для интеграции в CI/CD пайплайны. Целью проекта является демократизация и революционизация автоматизации тестирования, делая передовые инструменты доступными для всех.
Основные особенности:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤🔥2🔥2
Библиотека
Plumbum
облегчает выполнение команд в shell, работу с локальными и удалёнными процессами, а также управление путями и файловой системой.Позволяет писать код, который легко переносится между разными операционными системами.
Основные возможности библиотеки:
pip install plumbum
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤🔥2👍1
Библиотека
polars
предназначена для работы с данными в формате DataFrame, разработанная для обеспечения быстрой и эффективной обработки данных.Она вдохновлена популярной библиотекой
pandas
, но предлагает еще более высокую производительность и возможности для работы с большими наборами данных, которые могут не поместиться в памяти.Основные особенности библиотеки:
NumPy
и PyArrow
.pip install polars
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥5👍3
В данном shorts напишем код для получения информации о видеокарте на Python.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4🔥3
Справочник Программиста
Код для получения информации о видеокарте на Python
Для получения информации о видеокарте в коде используется библиотека
➡️ Установка библиотек:
➡️ Справочник Программиста. Подписаться
Для получения информации о видеокарте в коде используется библиотека
GPUtil
, а для красивого вывода в виде таблицы - tabulate
.pip install GPUtil tabulate
import GPUtil
from tabulate import tabulate
gpus = GPUtil.getGPUs()
list_gpus = []
for gpu in gpus:
gpu_id = gpu.id
gpu_name = gpu.name
gpu_load = f"{gpu.load*100}%"
gpu_free_memory = f"{gpu.memoryFree}MB"
gpu_used_memory = f"{gpu.memoryUsed}MB"
gpu_total_memory = f"{gpu.memoryTotal}MB"
gpu_temperature = f"{gpu.temperature} C"
gpu_uuid = gpu.uuid
list_gpus.append((gpu_id,
gpu_name,
gpu_load,
gpu_free_memory,
gpu_used_memory,
gpu_total_memory,
gpu_temperature,
gpu_uuid))
print(tabulate(list_gpus,
headers=("ID",
"Название",
"Загрузка",
"Свободная память",
"Используемая память",
"Общая память",
"Температура",
"UUID")))
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤🔥2👍2