Протоколы
Термины протокол итератора или протокол дескрипторов уже привычны и используются давно. Но теперь можно описывать протоколы в виде кода и проверять их соответствие на этапе статического анализа.
Протокол описывается как обычный класс, наследующийся от
Хоть это и не совсем интерфейсы, но все же классная штука. Еще важно что протоколы, как и все остальные фишки аннотаций типов, используются в основном со статически типизированным
Термины протокол итератора или протокол дескрипторов уже привычны и используются давно. Но теперь можно описывать протоколы в виде кода и проверять их соответствие на этапе статического анализа.
Протокол описывается как обычный класс, наследующийся от
Protocol. Он может иметь методы, в том числе с реализацией, а также поля. Реальные классы, реализующие протокол могут наследоваться от него, но это не обязательно, как показано в примере. Хоть это и не совсем интерфейсы, но все же классная штука. Еще важно что протоколы, как и все остальные фишки аннотаций типов, используются в основном со статически типизированным
mypy.Делаем ошибки более читаемыми
В Python есть удобный модуль
Для того, чтобы он заработал, достаточно импортировать его в ваш код.
Вывод ошибок в вашей программе будет выглядеть более читаемым. Более того, разные части вывода будут помечаться разным цветом вместо монотонного серого цвета.
Также модуль можно модифицировать, указав параметры в конфиге. Подробнее можете почитать в документации модуля.
В Python есть удобный модуль
pretty_errors, который делает стандартный вывод исключений и их traceback более удобным для чтения. Для того, чтобы он заработал, достаточно импортировать его в ваш код.
Вывод ошибок в вашей программе будет выглядеть более читаемым. Более того, разные части вывода будут помечаться разным цветом вместо монотонного серого цвета.
Также модуль можно модифицировать, указав параметры в конфиге. Подробнее можете почитать в документации модуля.
Константы пакета string
Встроенный модуль
Поговорим про константы этого модуля. Из интересного стоит выделить
Применение подобных констант может быть не очевидно с первого взгляда. Но подобные значения часто используются, например, в работе с алфавитом или в условном генераторе паролей.
К тому же часто бывает, что разработчики делают костыли и создают свои собственные константы в коде вместо того, чтобы импортировать уже готовые из модуля
Встроенный модуль
string предоставляет расширенный функционал для работы со строками.Поговорим про константы этого модуля. Из интересного стоит выделить
ascii_letters, punctuation, digits и whitespace — символы ascii, знаки пунктуации, цифры и пробельные символы. Применение подобных констант может быть не очевидно с первого взгляда. Но подобные значения часто используются, например, в работе с алфавитом или в условном генераторе паролей.
К тому же часто бывает, что разработчики делают костыли и создают свои собственные константы в коде вместо того, чтобы импортировать уже готовые из модуля
string.Удаление префиксов и суффиксов
По какой-то причине многие разработчики посчитали эту фичу в обновлении 3.9 не очень интересной и попросту забыли. И зря.
Некоторые на полном серьезе для таких целей до сих пор пытаются использовать забагованные .strip и .lsrtip. Большинство просто не до конца понимают, как работают эти два метода.
В Python 3.9 были добавлены методы для строк .removeprefix и .removesuffix, предназначенные специально для удаления префиксов и суффиксов в строках.
По какой-то причине многие разработчики посчитали эту фичу в обновлении 3.9 не очень интересной и попросту забыли. И зря.
Некоторые на полном серьезе для таких целей до сих пор пытаются использовать забагованные .strip и .lsrtip. Большинство просто не до конца понимают, как работают эти два метода.
В Python 3.9 были добавлены методы для строк .removeprefix и .removesuffix, предназначенные специально для удаления префиксов и суффиксов в строках.
Emoji
Пакет Emoji либо впечатляет, либо огорчает. Все зависит от самого «оценщика». :) Шутки шутками, но этот пакет очень помогает при анализе данных из соцсетей.
Почитать документацию и ознакомиться с другими примерами можно на странице пакета emoji.
Пакет Emoji либо впечатляет, либо огорчает. Все зависит от самого «оценщика». :) Шутки шутками, но этот пакет очень помогает при анализе данных из соцсетей.
Почитать документацию и ознакомиться с другими примерами можно на странице пакета emoji.
Beautiful soup
Когда вы вытаскиваете HTML с какого-то сайта, то сначала проводите его разбор и отсекаете все ненужное. Beautiful Soup — это Python-библиотека по сбору данных из HTML и XML-файлов. В ней представлены простые методы для навигации, поиска и парсинга. Это очень мощная библиотека, которая умеет обрабатывать все виды HTML, даже если он сломан. Уж поверьте моему опыту, HTML ломается довольно часто, поэтому такая функция окажется как нельзя кстати.
Beautiful Soup парсит все, что захотите. С его помощью вы, например, можете вытащить все ссылки или найти заголовок таблицы, выделенный жирным. На первой картинке приведен HTML, а на второй - несколько примеров работы с ним. Документация доступна по ссылке.
Когда вы вытаскиваете HTML с какого-то сайта, то сначала проводите его разбор и отсекаете все ненужное. Beautiful Soup — это Python-библиотека по сбору данных из HTML и XML-файлов. В ней представлены простые методы для навигации, поиска и парсинга. Это очень мощная библиотека, которая умеет обрабатывать все виды HTML, даже если он сломан. Уж поверьте моему опыту, HTML ломается довольно часто, поэтому такая функция окажется как нельзя кстати.
Beautiful Soup парсит все, что захотите. С его помощью вы, например, можете вытащить все ссылки или найти заголовок таблицы, выделенный жирным. На первой картинке приведен HTML, а на второй - несколько примеров работы с ним. Документация доступна по ссылке.
Аннотации типов: Union и Optional
При необходимости допустить использование не любых типов, а только некоторых, можно использовать аннотацию
Для объявления опциональных переменных используется
Кстати, аннотация
При необходимости допустить использование не любых типов, а только некоторых, можно использовать аннотацию
Union[T, ...] с указанием списка типов в квадратных скобках.Для объявления опциональных переменных используется
Optional[T]. Такая аннотация нужна для переменных, которые либо имеют значение определенного типа, либо равны None.Кстати, аннотация
Optional[T] эквивалентна Union[T, None].Создаем пакеты
Пакет в Python — это, грубо говоря, папка с другими папками и модулями. Помимо разделения частей проекта, пакеты нужны для формирования пространства имен, чтобы можно работать с пакетами и модулями через точку, как в примере на картинке.
При импорте вида
Также примечателен файл __init__.py, который раньше был обязателен для создания пакетов. С версии Python 3.3 эта необходимость пропала, но его функциональность на этом не заканчивается.
Пакет в Python — это, грубо говоря, папка с другими папками и модулями. Помимо разделения частей проекта, пакеты нужны для формирования пространства имен, чтобы можно работать с пакетами и модулями через точку, как в примере на картинке.
При импорте вида
from package import * будет подключены либо все модули и объекты модуля __init__.py, либо то, что находится в переменной __all__ в том же модуле __init__.py.Также примечателен файл __init__.py, который раньше был обязателен для создания пакетов. С версии Python 3.3 эта необходимость пропала, но его функциональность на этом не заканчивается.
Шуточный пакет pyjokes
Если в вашей крови течёт PEP, а дома вас ждёт домашняя змея в клетке, то и шутки вам нужны соответствующие. Вы всегда можете получить их с помощью модуля pyjokes. Устанавливается, как всегда, через pip.
Также есть отдельная категория с шутками Чака Норриса.
Если в вашей крови течёт PEP, а дома вас ждёт домашняя змея в клетке, то и шутки вам нужны соответствующие. Вы всегда можете получить их с помощью модуля pyjokes. Устанавливается, как всегда, через pip.
Также есть отдельная категория с шутками Чака Норриса.
Don't worry about tests, Chuck Norris's test cases cover your code too.art
Всё, что вам может понадобится для вывода красивых надписей или артов в терминал. Ставится с помощью команды
Всё, что вам может понадобится для вывода красивых надписей или артов в терминал. Ставится с помощью команды
pip install art. Полный список возможностей есть в документации.Завершение программы
Функция
По факту функция просто поднимает исключение
Использовать
Функция
exit создана для удобства работы в интерактивном режиме, но не рекомендуется использовать её внутри скриптов. По факту функция просто поднимает исключение
SystemExit, а при попытке вызова без скобок напишет подсказку о правильном способе выхода из интерпретатора.Использовать
sys.exit() стоит, так как этот метод есть в стандартном модуле и всегда там доступен. А ещё это довольно явный и понятный способ завершения программы.Отправляем электронные письма
SMTP (Simple Mail Transfer Protocol) — это протокол, позволяющий отправлять электронные письма. В стандартной библиотеке есть пакет
Для подключения к серверу будем использовать класс
Отправлять письма следует методом
Следует обратить внимание на то, что некоторые почтовые сервисы могут не разрешить так сразу подключаться к их серверам и производить операции. В этом случае пришлось немного повоевать с Gmail.
SMTP (Simple Mail Transfer Protocol) — это протокол, позволяющий отправлять электронные письма. В стандартной библиотеке есть пакет
smtplib, реализующий его поведение. Для подключения к серверу будем использовать класс
SMTP_SSL, включающий в себя и шифрование. В качестве аргументов передадим ему адрес сервера и порт. Авторизация происходит с помощью метода login, в который передаём логин и пароль. Отправлять письма следует методом
sendmail, который принимает адреса отправителя и получателя, а также сам текст. В конце программы следует закрывать соединение с помощью метода quit(). Следует обратить внимание на то, что некоторые почтовые сервисы могут не разрешить так сразу подключаться к их серверам и производить операции. В этом случае пришлось немного повоевать с Gmail.
Получаем текст с картинки
У Google есть система Tesseract, которая позволяет парсить текст с картинок с помощью оптического распознавания символов. В качестве обертки над их системой был создан пакет
Чтобы получить текст с картинки, надо вызвать метод
Для открытия картинок рекомендуется использовать
У Google есть система Tesseract, которая позволяет парсить текст с картинок с помощью оптического распознавания символов. В качестве обертки над их системой был создан пакет
pytesseract, который удобно и легко использовать. Чтобы получить текст с картинки, надо вызвать метод
image_to_string. Если вас интересует текст на русском, то следует указать аргумент lang как 'rus'. Для открытия картинок рекомендуется использовать
pillow, хоть и имеется возможность просто указать путь к файлу в виде строки.Временные файлы
В стандартной библиотеке Python имеется модуль
Функция
Созданный временный файл будет автоматически удален по закрытию файла или при выходе из контекстного менеджера, а другие процессы и приложения не смогут получить доступ к этому временному файлу.
В стандартной библиотеке Python имеется модуль
tempfile, содержащий классы и методы для работы со временными файлами и директориями. Такие файлы нужны для сохранения промежуточных результатов выполнения программы.Функция
TemporaryFile создает временный файл в системной директории и возвращает файлоподобный объект.Созданный временный файл будет автоматически удален по закрытию файла или при выходе из контекстного менеджера, а другие процессы и приложения не смогут получить доступ к этому временному файлу.
Универсальный парсер статей
Пакет
В качестве примера на картинке парсим статью https://proglib.io/sh/DhyuCFH5p3. Плюс пакета в том, что весь процесс парсинга автоматизирован и не надо вручную искать нужные теги и тянуть из них данные.
Точность парсера зависит в основном от того, как хорошо сверстана запрашиваемая страница, поэтому в некоторых случаях результат может отличаться от ожиданий.
Пакет
newspaper3k позволяет парсить статьи и извлекать из них заголовки, текст, дату публикации, имена авторов и много другой информации. Полный список возможностей в документации.В качестве примера на картинке парсим статью https://proglib.io/sh/DhyuCFH5p3. Плюс пакета в том, что весь процесс парсинга автоматизирован и не надо вручную искать нужные теги и тянуть из них данные.
Точность парсера зависит в основном от того, как хорошо сверстана запрашиваемая страница, поэтому в некоторых случаях результат может отличаться от ожиданий.
Объект Ellipsis
В Python есть крайне интересный объект, который обозначается как
Применяется зачастую при работе со срезами в Numpy, но и в обычном коде его тоже встретить можно. Например,
Если привести его к логическому типу данных, то увидим
В Python есть крайне интересный объект, который обозначается как
..., то есть многоточие. Он называется Ellipsis, и используется в основном как заготовка для чего-то ещё не реализованного.Применяется зачастую при работе со срезами в Numpy, но и в обычном коде его тоже встретить можно. Например,
... периодически встречается в теле функции в качестве заглушки.Если привести его к логическому типу данных, то увидим
True — это важный момент, потому что похожий на Ellipsis по своей сути None выдает False.Ищем ошибки с помощью assert
Инструкция
Если выполнить инструкцию
Однако не нужно пытаться обработать исключение
В примере на картинке проверяется, является ли переданный аргумент числовым типом данных. Если не является, то будет вызвано исключение и выведено указанное сообщение.
Инструкция
assert принимает логическое выражение и необязательное сообщение. Используется для проверки типов, значений аргумента и вывода функции, а ещё для отладки, поскольку останавливает программу в случае ошибки.Если выполнить инструкцию
assert с логическим выражением, результат которого равен True, то ничего не произойдет. Но в случае с False будет сгенерировано исключение AssertionError.Однако не нужно пытаться обработать исключение
AssertionError блоком try-except, так как assert тогда теряет свой смысл.В примере на картинке проверяется, является ли переданный аргумент числовым типом данных. Если не является, то будет вызвано исключение и выведено указанное сообщение.