pdfplumber
pdfplumber - это библиотека Python для извлечения информации из PDF-документов. Она предоставляет простой в использовании интерфейс для извлечения текста, таблиц и изображений из PDF-файлов. Также вы можете извлекать таблицы из PDF в виде объектов pandas DataFrame, извлекать изображения из PDF и извлекать метаданные о PDF-документе.
В этом примере мы используем функцию pdfplumber.open() для открытия PDF-файла example.pdf.
Внутри оператора with мы перебираем все страницы PDF-файла с помощью цикла for. Для каждой страницы мы вызываем метод extract_text() для извлечения текстового содержимого. Извлеченный текст сохраняется в переменной text.
Выполнив этот код, вы сможете извлечь и распечатать текстовое содержимое каждой страницы PDF-файла.
Стоит отметить, что pdfplumber является мощным инструментом, но точность извлеченного текста сильно зависит от качества и форматирования самого PDF.
🔗 Python tricks
pdfplumber - это библиотека Python для извлечения информации из PDF-документов. Она предоставляет простой в использовании интерфейс для извлечения текста, таблиц и изображений из PDF-файлов. Также вы можете извлекать таблицы из PDF в виде объектов pandas DataFrame, извлекать изображения из PDF и извлекать метаданные о PDF-документе.
В этом примере мы используем функцию pdfplumber.open() для открытия PDF-файла example.pdf.
Внутри оператора with мы перебираем все страницы PDF-файла с помощью цикла for. Для каждой страницы мы вызываем метод extract_text() для извлечения текстового содержимого. Извлеченный текст сохраняется в переменной text.
Выполнив этот код, вы сможете извлечь и распечатать текстовое содержимое каждой страницы PDF-файла.
Стоит отметить, что pdfplumber является мощным инструментом, но точность извлеченного текста сильно зависит от качества и форматирования самого PDF.
🔗 Python tricks
Python Seaborn Matplotlib - Полный Курс для Начинающих
Если названия библиотек Matplotlib и Seaborn тебе ни о чем не говорят, не переживай и скорее погружайся в этот интенсив по отображению данных в Python.
Мы научимся строить различные виды графиков (Scatter Plot, Heatmap, Violin Plot, Boxplot, и т.д.), изучим их основные методы и области применения, а также ты узнаешь почему относить оранжевых и синих ежей начальству - плохая идея.
• Перейти к просмотру
🔗 Python tricks
Если названия библиотек Matplotlib и Seaborn тебе ни о чем не говорят, не переживай и скорее погружайся в этот интенсив по отображению данных в Python.
Мы научимся строить различные виды графиков (Scatter Plot, Heatmap, Violin Plot, Boxplot, и т.д.), изучим их основные методы и области применения, а также ты узнаешь почему относить оранжевых и синих ежей начальству - плохая идея.
• Перейти к просмотру
🔗 Python tricks
YouTube
Python Seaborn Matplotlib - Полный Курс для Начинающих
Промпт Инженеринг PRO (ChatGPT, Deepseek, Арт, Видео, Музыка)
https://stepik.org/a/193870/pay?promo=fea7f25a11408f61 Войти в IT: Вся Необходимая База. 3 Уровня Объяснения Материала
https://stepik.org/a/196646/pay?promo=6796137481ce3a53 Если не можешь напрямую…
https://stepik.org/a/193870/pay?promo=fea7f25a11408f61 Войти в IT: Вся Необходимая База. 3 Уровня Объяснения Материала
https://stepik.org/a/196646/pay?promo=6796137481ce3a53 Если не можешь напрямую…
Рекуррентная нейросеть: Прогноз символов
Продолжаем делиться циклом видео, где автор рассказывает про нейросети. В этот раз ты научишься строить рекуррентную нейросеть для прогнозирования символов последовательности. Ты узнаешь, как правильно кодировать и подавать на вход сети текстовую информацию в виде One-hot encoding (OHE) векторов.
• Перейти к просмотру
🔗 Python tricks
Продолжаем делиться циклом видео, где автор рассказывает про нейросети. В этот раз ты научишься строить рекуррентную нейросеть для прогнозирования символов последовательности. Ты узнаешь, как правильно кодировать и подавать на вход сети текстовую информацию в виде One-hot encoding (OHE) векторов.
• Перейти к просмотру
🔗 Python tricks
YouTube
Как рекуррентная нейронная сеть прогнозирует символы | #20 нейросети на Python
Строим рекуррентную нейросеть для прогнозирования символов последовательности. Узнаете, как правильно кодировать и подавать на вход сети текстовую информацию в виде One-hot encoding (OHE) векторов. Рассказывается про инструмент Tokenizer пакета Keras. Его…
Битва медведей: Pandas против Polars
В этой статье речь пойдет о сравнении двух гигантов аналитики данных в Python: Pandas и Polars. Автор подробно рассмотрит вопрос быстродействия этих двух решений в части работы с файлами больших объемов.
• Перейти к просмотру
🔗 Python tricks
В этой статье речь пойдет о сравнении двух гигантов аналитики данных в Python: Pandas и Polars. Автор подробно рассмотрит вопрос быстродействия этих двух решений в части работы с файлами больших объемов.
• Перейти к просмотру
🔗 Python tricks
Хабр
Битва медведей: Pandas против Polars
Привет! На связи Грегори Салиба из Spectr . Возможно, вы прочитали название статьи и подумали, что попали на программу «В мире животных». Но нет, речь пойдет о сравнении двух гигантов аналитики...
Усыпляем программу
Иногда возникает необходимость остановить выполнение программы, чтобы можно было выполнить несколько других операций, или просто из-за требуемой утилиты. В такой ситуации может пригодиться функция sleep(), которая обеспечивает точный и гибкий способ остановки потока кода на любой период времени.
В нашем примере время начала и время окончания будут напечатаны с задержкой в 6 секунд.
🔗 Python tricks
Иногда возникает необходимость остановить выполнение программы, чтобы можно было выполнить несколько других операций, или просто из-за требуемой утилиты. В такой ситуации может пригодиться функция sleep(), которая обеспечивает точный и гибкий способ остановки потока кода на любой период времени.
В нашем примере время начала и время окончания будут напечатаны с задержкой в 6 секунд.
🔗 Python tricks
Курс Python для HR
HR специалист занимается всеми вопросами, связанными с управлением человеческими ресурсами: подбирает новых сотрудников, помогает с адаптацией на новом месте, занимается мотивацией, проводит оценку персонала.
Данный курс создан для ознакомления HR специалистов с базовыми функциями языка программирования Python.
• Перейти к просмотру
🔗 Python tricks
HR специалист занимается всеми вопросами, связанными с управлением человеческими ресурсами: подбирает новых сотрудников, помогает с адаптацией на новом месте, занимается мотивацией, проводит оценку персонала.
Данный курс создан для ознакомления HR специалистов с базовыми функциями языка программирования Python.
• Перейти к просмотру
🔗 Python tricks
YouTube
Как установить Anaconda Python и Jupyter Notebook
https://www.anaconda.com/ - отсюда устанавливаем
Открытый он-лайн курс Python для HR
https://edwvb.blogspot.com/2020/12/otkrytyj-on-lajn-kurs-python-dlya-hr.html - все видео здесь
https://t.me/hranalitycs - следим за обновлениями курса
Открытый он-лайн курс Python для HR
https://edwvb.blogspot.com/2020/12/otkrytyj-on-lajn-kurs-python-dlya-hr.html - все видео здесь
https://t.me/hranalitycs - следим за обновлениями курса
Apache Airflow в связке с Kubernetes
Делимся статьей, где автор рассказывает про свой опыт в работе Apache Airflow в связке с Kubernetes. Ты соберешь собственный образ Docker с python-скриптом, настроишь автоматическую синхронизацию DAG’ов с удаленным репозиторием и их исполнение.
• Перейти к просмотру
🔗 Python tricks
Делимся статьей, где автор рассказывает про свой опыт в работе Apache Airflow в связке с Kubernetes. Ты соберешь собственный образ Docker с python-скриптом, настроишь автоматическую синхронизацию DAG’ов с удаленным репозиторием и их исполнение.
• Перейти к просмотру
🔗 Python tricks
Хабр
Apache Airflow в связке с Kubernetes
Привет! Меня зовут Алексей Карпов, я DevOps-инженер отдела ML разработки в OKKO. В этой статье я поделюсь опытом в работе Apache Airflow в связке с Kubernetes. Мы соберем собственный образ Docker с...
VSCode в браузере
Слабый пк? Лень скачивать IDE? Можете запустить его в браузере.
Он поддерживает почти все функции десктопного редактора, но ещё позволяет подключаться к git репозиторию и править там (если есть доступ).
Единственный недостаток — расширения. Они доступны, но с серьёзными ограничениями. Python работает, уже хорошо.
Попробовать
🔗 Python tricks
Слабый пк? Лень скачивать IDE? Можете запустить его в браузере.
Он поддерживает почти все функции десктопного редактора, но ещё позволяет подключаться к git репозиторию и править там (если есть доступ).
Единственный недостаток — расширения. Они доступны, но с серьёзными ограничениями. Python работает, уже хорошо.
Попробовать
🔗 Python tricks
Принципы хорошего кода
• KISS — старайтесь максимально упрощать код. Так, чтобы спустя пару месяцев, вы и ваши коллеги смогли всё понять.
• DRY — не повторяйтесь! Перестаньте копировать один и тот же код несколько раз! Потом его будет сложно менять. А ещё, по ночам, будет мучать вопрос: «Всё ли я поменял?»
• YAGNI — не делайте того, о чём вас не просят. В лучшем случае — потеряете деньги и время, в худшем — навредите проекту.
🔗 Python tricks
• KISS — старайтесь максимально упрощать код. Так, чтобы спустя пару месяцев, вы и ваши коллеги смогли всё понять.
• DRY — не повторяйтесь! Перестаньте копировать один и тот же код несколько раз! Потом его будет сложно менять. А ещё, по ночам, будет мучать вопрос: «Всё ли я поменял?»
• YAGNI — не делайте того, о чём вас не просят. В лучшем случае — потеряете деньги и время, в худшем — навредите проекту.
🔗 Python tricks
typer
Простая библиотека от разработчика FastAPI для создания CLI-приложений, то есть управляемых из терминала.
Библиотека позволит вам быстро создать команды для работы приложения из терминала и автоматически создаст help-меню.
🔗 Python tricks
Простая библиотека от разработчика FastAPI для создания CLI-приложений, то есть управляемых из терминала.
Библиотека позволит вам быстро создать команды для работы приложения из терминала и автоматически создаст help-меню.
🔗 Python tricks
Redis
Это in-memory база данных типа «ключ-значение». Она очень быстрая, т.к. данные хранятся в оперативной памяти.
Redis используется для кэширование, составления очереди задач, управления сеансами пользователей и для оперирования другими не столь важными данными.
Его не стоит использовать как основную БД, ведь при перезапуске компьютера все данные пропадут. Для работы с ней существует одноимённая библиотека.
🔗 Python tricks
Это in-memory база данных типа «ключ-значение». Она очень быстрая, т.к. данные хранятся в оперативной памяти.
Redis используется для кэширование, составления очереди задач, управления сеансами пользователей и для оперирования другими не столь важными данными.
Его не стоит использовать как основную БД, ведь при перезапуске компьютера все данные пропадут. Для работы с ней существует одноимённая библиотека.
🔗 Python tricks
sys.argv
В этой переменной хранятся параметры, переданные скрипту из командной строки. При вызове
Интересно:
Правда, использовать sys.argv в серьёзных проектах глупо, т.к. есть встроенный
🔗 Python tricks
В этой переменной хранятся параметры, переданные скрипту из командной строки. При вызове
python3 main.py 1 2 3
, sys.argv
будет иметь значение ['main.py', '1', '2', '3']
.Интересно:
sys.argv[0]
всегда будет названием вызываемого скрипта. Если это интерпретатор, то строка будет пустой.Правда, использовать sys.argv в серьёзных проектах глупо, т.к. есть встроенный
argparse
или typer
от разработчиков FastAPI.🔗 Python tricks
Режим разработчика
Этот режим включает дополнительные проверки, которые слишком требовательны, чтобы работать по умолчанию.
Например, Python проверяет, закрыл ли программист файл, обработал ли корутину (asyncio), перезаполнение буфера и т.д.
📌 Документация
🔗 Python tricks
Этот режим включает дополнительные проверки, которые слишком требовательны, чтобы работать по умолчанию.
Например, Python проверяет, закрыл ли программист файл, обработал ли корутину (asyncio), перезаполнение буфера и т.д.
📌 Документация
🔗 Python tricks
Простая визуализация данных
Фреймворк
В основном, используется для построения графиков, визуализации данных и т.д. Посмотреть пример можно введя:
🔗 Python tricks
Фреймворк
streamlit
позволяет быстро создать красивую страницу, даже если у вас нет навыков Frontend разработки.В основном, используется для построения графиков, визуализации данных и т.д. Посмотреть пример можно введя:
streamlit hello
.🔗 Python tricks
apscheduler
Библиотека для откладывания задач на потом и обработки их в фоне. Она намного лучше встроенного
🔗 Python tricks
Библиотека для откладывания задач на потом и обработки их в фоне. Она намного лучше встроенного
sched
, поскольку позволяет запускать асинхронные обработчики и хранить задачи в базе данных (Redis, MongoDB).🔗 Python tricks
Функция
#теория
🔗 Python tricks
filter()
filter(func, iter)
— принимает функцию, возвращающую True или False, и итерируемый объект. На основе ответа функции решает, оставлять объект или нет.filter()
больше относится к функциональному программированию, многие питонисты предпочитают использовать генераторные выражения, т.к. они more Pythonic.#теория
🔗 Python tricks
Основные коллекции: словарь
Связывает ключ и данные. Как в гардеробе, вы сдаёте вещь, получаете номер, по которому потом можете получить вещь обратно. Только в данном случае номер (ключ) выбираете и задаёте сами.
Ключ должен быть хешируемый объект: 1, 1.4, 'cool', (1, 2), True; и не может быть списком, множеством, словарём или любым другим изменяемым объектом. Все, у кого есть
Значения могут быть любыми.
#теория
🔗 Python tricks
Связывает ключ и данные. Как в гардеробе, вы сдаёте вещь, получаете номер, по которому потом можете получить вещь обратно. Только в данном случае номер (ключ) выбираете и задаёте сами.
Ключ должен быть хешируемый объект: 1, 1.4, 'cool', (1, 2), True; и не может быть списком, множеством, словарём или любым другим изменяемым объектом. Все, у кого есть
__hash__()
считаются хешируемыми.Значения могут быть любыми.
#теория
🔗 Python tricks
Media is too big
VIEW IN TELEGRAM
10 хитростей Python
Python славится простым, лаконичным и удобным синтаксисом. Но не многие знают, что в Python существует куча различных неочевидных фишек, которые могут сократить код, сделать его более простым и элегантным. И в этом ролике автор расскажет о 10 полезных фишках и хитростях языка Python, которые помогут сделать код ещё более крутым.
Смотреть это видео на youtube: youtu.be/K8mgXLycXIs
🔗 Python tricks
Python славится простым, лаконичным и удобным синтаксисом. Но не многие знают, что в Python существует куча различных неочевидных фишек, которые могут сократить код, сделать его более простым и элегантным. И в этом ролике автор расскажет о 10 полезных фишках и хитростях языка Python, которые помогут сделать код ещё более крутым.
Смотреть это видео на youtube: youtu.be/K8mgXLycXIs
🔗 Python tricks
This media is not supported in your browser
VIEW IN TELEGRAM
tqdm
Библиотека для отображения прогресса выполнения циклов. Она может строить так называемые progress bar'ы.
tqdm поддерживает множество настроек, таких как стиль вывода, частота обновления и т.д.
🔗 Python tricks
Библиотека для отображения прогресса выполнения циклов. Она может строить так называемые progress bar'ы.
tqdm поддерживает множество настроек, таких как стиль вывода, частота обновления и т.д.
🔗 Python tricks
uvicorn
Это быстрый ASGI-сервер (ASGI — интерфейс шлюза асинхронного сервера), разработанный для использования FastAPI, но не ограничиваясь этим.
Uvicorn поддерживает автоматическую генерацию OpenAPI-спецификаций и Swagger UI для веб-приложений, которые используют FastAPI.
Он также поддерживает различные опции конфигурации, такие как привязка к IP-адресу и порту, SSL/TLS-шифрование, логирование и т.д.
🔗 Python tricks
Это быстрый ASGI-сервер (ASGI — интерфейс шлюза асинхронного сервера), разработанный для использования FastAPI, но не ограничиваясь этим.
Uvicorn поддерживает автоматическую генерацию OpenAPI-спецификаций и Swagger UI для веб-приложений, которые используют FastAPI.
Он также поддерживает различные опции конфигурации, такие как привязка к IP-адресу и порту, SSL/TLS-шифрование, логирование и т.д.
🔗 Python tricks