Превращаем PDF в текст
Думаю, все периодические работают с PDF-документами. И зачастую это ручная и скучная работа. Но Python может автоматизировать даже такую рутинную задачу.
Модуль
Кстати, здесь ещё интересно то, что исходный код модуля написан на C++. Поэтому есть небольшая вероятность, что придётся повоевать с зависимостями.
Думаю, все периодические работают с PDF-документами. И зачастую это ручная и скучная работа. Но Python может автоматизировать даже такую рутинную задачу.
Модуль
pdftotext
создан именно для работы с документами в PDF формате. Устанавливается он через пакетный менеджер pip
, а использовать его проще простого. Все основные операции представлены на картинке выше. Кстати, здесь ещё интересно то, что исходный код модуля написан на C++. Поэтому есть небольшая вероятность, что придётся повоевать с зависимостями.
Библиотека mimesis
Часто для проверки работы алгоритмов нужно собрать достаточно данных, чтобы на них тестировать. Создание данных вручную занимает очень много времени, для избавления от этой рутины может помочь модуль mimesis, который умеет генерировать рандомные данные по нескольким критериям. Устанавливается он просто выполнив: pip install mimesis.
В примере выше мы генерируем адресные данные.
Часто для проверки работы алгоритмов нужно собрать достаточно данных, чтобы на них тестировать. Создание данных вручную занимает очень много времени, для избавления от этой рутины может помочь модуль mimesis, который умеет генерировать рандомные данные по нескольким критериям. Устанавливается он просто выполнив: pip install mimesis.
В примере выше мы генерируем адресные данные.
⁉️Как машинное обучение связано с AI?
Машинное обучение — это основа всего современного искусственного интеллекта, и вы можете понять, почему именно сегодня эти технологии актуальны как никогда. Присоединяйтесь к открытому вебинару 26 августа в 18:00 МСК!
Мы разберемся, как Machine Learning (ML) стал неотъемлемой частью развития AI и GenAI. Что стоит за этим технологическим бумом и как ML используется в реальных AI-моделях? Мы покажем, как использовать ML для создания мощных AI-моделей и какие знания стоит развивать сегодня.
➡️ Присоединяйтесь и получите скидку на курс «Machine Learning. Basic»: https://otus.pw/TiS5/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Машинное обучение — это основа всего современного искусственного интеллекта, и вы можете понять, почему именно сегодня эти технологии актуальны как никогда. Присоединяйтесь к открытому вебинару 26 августа в 18:00 МСК!
Мы разберемся, как Machine Learning (ML) стал неотъемлемой частью развития AI и GenAI. Что стоит за этим технологическим бумом и как ML используется в реальных AI-моделях? Мы покажем, как использовать ML для создания мощных AI-моделей и какие знания стоит развивать сегодня.
➡️ Присоединяйтесь и получите скидку на курс «Machine Learning. Basic»: https://otus.pw/TiS5/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Сокращение ссылок
Скорее всего, хоть раз, но вы сталкивались с сервисами по сокращению ссылок. Даже, если вы сами не создавали сокращенную ссылку, то хотя бы видели таковые в описаниях к различным роликам или на сайтах.
Создать такую ссылку можно всего за три строчки кода, при помощи использования библиотеки PyShorteners. Вам нужно установить библиотеку в проект, выполнить её подключение, а также создать объект на её основе.
Устfновка библиотеки - pip install pyshorteners.
Скорее всего, хоть раз, но вы сталкивались с сервисами по сокращению ссылок. Даже, если вы сами не создавали сокращенную ссылку, то хотя бы видели таковые в описаниях к различным роликам или на сайтах.
Создать такую ссылку можно всего за три строчки кода, при помощи использования библиотеки PyShorteners. Вам нужно установить библиотеку в проект, выполнить её подключение, а также создать объект на её основе.
Устfновка библиотеки - pip install pyshorteners.
Хотите писать гибкий, чистый и легко расширяемый код на Python? Разберитесь в одном из самых мощных инструментов языка - декораторах!
Приглашаем на открытый вебинар:
«Декораторы и фабрики декораторов в Python»
📅 25 августа в 20:00 (МСК)
Вебинар будет полезен:
- новичкам, которые хотят понять основы декорирования функций
- опытным разработчикам, которые хотят улучшить архитектуру своих приложений и писать более идиоматичный код
В результате вы научитесь применять декораторы и фабрики декораторов для повышения читаемости, повторного использования кода и удобства сопровождения проектов.
📲 Участие в вебинаре бесплатное. Регистрируйтесь: https://otus.pw/XTzO/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Приглашаем на открытый вебинар:
«Декораторы и фабрики декораторов в Python»
📅 25 августа в 20:00 (МСК)
Вебинар будет полезен:
- новичкам, которые хотят понять основы декорирования функций
- опытным разработчикам, которые хотят улучшить архитектуру своих приложений и писать более идиоматичный код
В результате вы научитесь применять декораторы и фабрики декораторов для повышения читаемости, повторного использования кода и удобства сопровождения проектов.
📲 Участие в вебинаре бесплатное. Регистрируйтесь: https://otus.pw/XTzO/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
#вопросы_с_собеседований
Напишите функцию, которая будет принимать список nums, содержащий числа в диапазоне от 1 до 100, и возвращать отсортированный список чисел, которые в списке nums встречались дважды.
Примеры:
duplicate_nums([1, 2, 3, 4, 3, 5, 6])
➞ [3]
duplicate_nums([81, 72, 43, 72, 81, 99, 99, 100, 12, 54])
➞ [72, 81, 99]
duplicate_nums([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
➞ None
Примечания:
— никакое число не будет встречаться в nums трижды и более раз,
— если никакое число в nums не встречалось дважды, функция должна вернуть None.
Напишите функцию, которая будет принимать список nums, содержащий числа в диапазоне от 1 до 100, и возвращать отсортированный список чисел, которые в списке nums встречались дважды.
Примеры:
duplicate_nums([1, 2, 3, 4, 3, 5, 6])
➞ [3]
duplicate_nums([81, 72, 43, 72, 81, 99, 99, 100, 12, 54])
➞ [72, 81, 99]
duplicate_nums([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
➞ None
Примечания:
— никакое число не будет встречаться в nums трижды и более раз,
— если никакое число в nums не встречалось дважды, функция должна вернуть None.
DiskCache
DiskCache — это высокопроизводительная библиотека кэширования, написанная на чистом Python и совместимая с Django. Она использует дисковое пространство и файлы для хранения данных, что делает ее быстрее, чем Redis и Memcached, особенно при работе с большими объемами данных.
https://pypi.org/project/diskcache/
#для_продвинутых
DiskCache — это высокопроизводительная библиотека кэширования, написанная на чистом Python и совместимая с Django. Она использует дисковое пространство и файлы для хранения данных, что делает ее быстрее, чем Redis и Memcached, особенно при работе с большими объемами данных.
https://pypi.org/project/diskcache/
#для_продвинутых
Wagtail
Wagtail — это система управления контентом (CMS) с открытым исходным кодом, построенная на базе Django. Она фокусируется на пользовательском опыте и предоставляет разработчикам и дизайнерам точный контроль над созданием контента.
#для_продвинутых
Wagtail — это система управления контентом (CMS) с открытым исходным кодом, построенная на базе Django. Она фокусируется на пользовательском опыте и предоставляет разработчикам и дизайнерам точный контроль над созданием контента.
#для_продвинутых