Решил написать свою нейросеть, но наткнулся на статью на JS, а мне ближе Python. Взял основу, переписал, разобрал сложные моменты и объяснил их подробнее. В статье — код, пояснения и ссылка на результат.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14
pdfplumber — это удобная библиотека для извлечения текста, таблиц и изображений из PDF-документов. Позволяет точно анализировать содержимое PDF, включая структурированные данные.
import pdfplumber
# Открываем PDF
with pdfplumber.open("example.pdf") as pdf:
page = pdf.pages[0]
text = page.extract_text()
print(text)
pip install pdfplumber
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤3
🗂 Работа с YAML в Python с помощью
YAML — удобный формат для хранения конфигураций и данных. В этом посте разберём, как работать с YAML-файлами в Python.
💬 Почему это полезно?
— YAML читается легче, чем JSON и XML.
— Часто используется в конфигурациях (Kubernetes, Ansible).
— Поддерживает комментарии и сложные структуры данных
⚙️ Простой пример
Сериализация (запись в YAML-файл):
Десериализация (чтение из YAML-файла):
➡️ Как это работает?
•
•
✔️ Установка:
🐍 Ghostly Python | #гайды
PyYAMLYAML — удобный формат для хранения конфигураций и данных. В этом посте разберём, как работать с YAML-файлами в Python.
— YAML читается легче, чем JSON и XML.
— Часто используется в конфигурациях (Kubernetes, Ansible).
— Поддерживает комментарии и сложные структуры данных
Сериализация (запись в YAML-файл):
import yaml
data = {"name": "Alice", "age": 25, "city": "London"}
with open("data.yaml", "w") as f:
yaml.dump(data, f, default_flow_style=False, allow_unicode=True)
Десериализация (чтение из YAML-файла):
with open("data.yaml", "r") as f:
loaded_data = yaml.safe_load(f)
print(loaded_data)•
yaml.dump(data, f) сохраняет объект в YAML-файл.•
yaml.safe_load(f) загружает данные обратно.pip install pyyaml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤1
Как заставить себя учиться, работать и прокачивать навыки без откладывания "на потом"?
В статье разберем, как создать виртуальную маркерную доску, которая всегда будет перед глазами и не даст расслабиться.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4😁1
tempfile — создание временных файлов и директорийПозволяет создавать временные файлы и папки, которые автоматически удаляются после использования. Полезно для кэша, тестирования и работы с временными данными.
import tempfile
with tempfile.NamedTemporaryFile(delete=True) as temp_file:
print("Временный файл:", temp_file.name)
temp_file.write(b"Временные данные")
temp_file.seek(0)
print(temp_file.read()) # Читаем содержимое
NamedTemporaryFile() создаёт временный файл, доступный во время работы скрипта.delete=True автоматически удаляет файл после выхода из контекста.TemporaryDirectory() для временных папокPlease open Telegram to view this post
VIEW IN TELEGRAM
👍12
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤1🔥1😁1
Здесь собраны пошаговые уроки, интерактивные примеры кода и практические упражнения, охватывающие основы Python, работу с файлами, обработку ошибок, ООП и многое другое.
Примечательно, что сайт предлагает встроенный онлайн-компилятор, позволяющий сразу тестировать код без установки Python.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
Разбираем, как написать свой DHCP-сервер на Python: перехватываем запросы, раздаём IP-шники и логируем весь процесс. Используем Scapy, SQLite и Logging, чтобы всё работало чётко.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤4
secrets — безопасная генерация случайных значенийПозволяет создавать криптографически стойкие случайные числа, строки и токены. Полезно для генерации паролей, API-ключей и безопасных идентификаторов.
import secrets
# Генерируем безопасный токен
token = secrets.token_hex(16)
print(token) # Например: 'a3f1b2c4d5e67890fabc1234567890de'
token_hex(n) генерирует случайную строку длиной n байтов.randbelow(n) создаёт случайное число в диапазоне [0, n).choice() выбирает случайный элемент из списка безопаснее, чем random.choice()Please open Telegram to view this post
VIEW IN TELEGRAM
👍10✍2🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁11
pytesseract — это мощная библиотека для оптического распознавания текста (OCR) на изображениях. Позволяет извлекать текст из картинок, сканов и PDF-документов.
import pytesseract
from PIL import Image
# Открываем изображение
image = Image.open("text_image.png")
# Извлекаем текст
text = pytesseract.image_to_string(image, lang="rus")
print(text)
pip install pytesseract
sudo apt install tesseract-ocr # Linux
brew install tesseract # macOS
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
Если в Airflow нет нужной библиотеки, но она нужна для SparkOperator, выход есть! Разбираемся, как создать виртуальное окружение, подключить его к SparkSubmit и заставить всё это работать.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Здесь собраны десятки тестов по разным темам Python: синтаксис, структуры данных, ООП, работа с файлами, многопоточное программирование и многое другое.
Примечательно, что после каждого ответа даётся объяснение, что делает тестирование полезным не только для проверки знаний, но и для обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
hashlib — хеширование данных в PythonПозволяет создавать криптографические хеши (SHA, MD5) для проверки целостности данных и хранения паролей.
import hashlib
# Создаём SHA-256 хеш
text = "password123"
hashed = hashlib.sha256(text.encode()).hexdigest()
print(hashed) # 6c6f...e3b5
sha256().hexdigest() создаёт 256-битный хеш строки.Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥3
Разбираемся, как грамотно вытаскивать данные с сайтов, не нарываясь на баны. Советы, лайфхаки и важные нюансы легального парсинга. Главное — не игнорировать robots.txt.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍3❤1
Все очень просто, если использовать библиотеку
SpeechRecognition. Это один из самых удобных способов распознавания речи в Python.pip install SpeechRecognition
import speech_recognition as sr
# Создаём объект для распознавания
recognizer = sr.Recognizer()
# Используем аудиофайл
with sr.AudioFile("audio.wav") as source:
audio_data = recognizer.record(source)
# Преобразуем речь в текст
text = recognizer.recognize_google(audio_data, language="ru-RU")
print(text)
1.
Recognizer() создаёт объект для обработки аудио.2.
record(source) записывает звук из файла.3.
recognize_google() использует Google API для распознавания речи.Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3
TextBlob — удобная библиотека для обработки естественного языка (NLP) в Python. Позволяет анализировать текст, исправлять ошибки, делать перевод и многое другое.
from textblob import TextBlob
text = TextBlob("Python is amasing!")
print(text.correct()) # Python is amazing!
print(text.sentiment) # Анализ тональности
pip install textblob
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10