Добро пожаловать в мир Python
3.12K subscribers
544 photos
19 videos
14 files
1.22K links
Подборка полезных материалов для Python программистов.

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Как мы научили заводчан строить красивые инженерные отчеты из Jupyter Notebook на Python.

Была у нас тут история, когда легкий перфекционизм помог привести в порядок конструкторскую документацию и регулярно экономить инженерам кучу дней на прохождение бюрократических процедур. В ее основе – создание системы управления расчетными данными и переход от трудночитаемых и трудноинтегрируемых отчетов Mathcad к гибкой связке Jupyter Notebook с Python и Teamcenter. Но основной рассказ будет про то, как преобразовывать и экспортировать математические формулы, таблицы и другие элементы из Jupyter в красивый и удобный вид.

Читать далее https://habr.com/ru/companies/lanit/articles/777514
Networkx - сетевой анализ в Python.

NetworkX — это пакет Python для создания, управления и изучения структуры, динамики и функций сложных сетей
https://networkx.org/
Пишем приложение на Python для подготовки к собеседованиям по Python.

На конец 2023 года язык программирования Python является самым популярным по индексу TIOBE. Что касается работы, то по количеству вакансий в мире язык Python занимает второе место (после JavaScript/TypeScript). Поэтому у соискателей на должность, где требуется Python, возникает потребность подготовки к собеседованиям.

В этой статье я расскажу о том, как используя Python, можно написать desktop-приложение для ОС Windows, которое поможет быстро, эффективно и абсолютно бесплатно подготовиться к собеседованиям по Python.

Читать далее https://habr.com/ru/articles/779624
Использование Polars в мире панд

Polars — это библиотека на основе фреймов данных, которая может быть быстрее, эффективнее использовать память и зачастую проще в использовании, чем Pandas. Кроме того, он гораздо новее и, соответственно, менее популярен. В ноябре 2023 года:

У Polars было около 2,6 миллионов загрузок с PyPI.
У Pandas было около 140 миллионов загрузок!
Из-за популярности Pandas и ее доступности на протяжении полутора десятилетий существует множество сторонних библиотек со встроенной поддержкой Pandas, а также других, которые специально расширяют Pandas. Многие библиотеки построения графиков и визуализации, например, принимают в качестве входных данных фреймы данных Pandas, а GeoPandas добавляет географические типы данных в фреймы данных Pandas. Если вы используете Polars, можете ли вы использовать эти библиотеки? И если да, то как? https://pythonspeed.com/articles/polars-pandas-interopability/
ezgif.com-webp-to-gif-converted.gif
15.9 MB
В постоянно развивающейся сфере разработки данных и автоматизации Python стал свидетелем появления нескольких оркестраторов рабочих процессов. В этой статье я расскажу о шести библиотеках Python и некоторых их основных функциях.

https://dev.to/taipy/the-pipeline-repos-showdown-python-edition-39i5
This media is not supported in your browser
VIEW IN TELEGRAM
Анализ посещаемости магазина для выявления наиболее часто посещаемых зон

ссылка на репо, если вы хотите создать что-то за выходные: https://github.com/roboflow/supervision
Forwarded from Big data world
Создание LLM с миллионом параметров с нуля с использованием Python
Пошаговое руководство по репликации архитектуры LLaMA

https://levelup.gitconnected.com/building-a-million-parameter-llm-from-scratch-using-python-f612398f06c2
Изучаем и парсим биржевую информацию Мосбиржи. Наш первый парсер на Python, разбор кода.

Как устроен ISS MOEX (информационно-статистический сервер Московской Биржи) и как можно парсить с него биржевые данные. Разбор кода программы. Это первое знакомство с MOEX, дальше будем изучать куда как более актуальный для алготрейдинга продукт мосбиржи - ALGOPACK. Однако перед этим общее знакомство с архитектурой iss moex должно быть. Стратегическая задача - использовать данные для алготрейдинга (работы торгового робота) напрямую с московской биржи.

Читать далее https://habr.com/ru/articles/781006
Мониторинг на Python: как сохранить метрики в мультипроцессном режиме.

Привет, Хабр! Меня зовут Никита, я backend-разработчик команды клиентских сервисов. В Selectel мы строим и поддерживаем IT-инфраструктуру для компаний, которые развивают свои цифровые продукты. В нашем департаменте около 20 приложений, большая часть из которых работает на Flask и Gunicorn. Чтобы отслеживать их производительность, мы мониторим параметры системы с помощью Prometheus.

С развитием бизнеса нагрузка на приложения возрастает, один из способов масштабировать его под большее количество запросов — запустить Gunicorn-сервер с несколькими worker-процессами в мультипроцессном режиме. Однако при таком подходе клиент Prometheus не выводит нужные нам метрики CPU и RAM. В статье расскажу, как мы решили эту проблему, сохранив метрики и организовав мониторинг в мультипроцессном режиме.

Читать дальше →https://habr.com/ru/companies/selectel/articles/781614
Проектирование и руководство: объектно-ориентированное программирование на Python
В этом видеокурсе вы узнаете о принципах SOLID — пяти общепризнанных стандартах для улучшения объектно-ориентированного проектирования на Python. Применяя эти принципы, вы можете создавать объектно-ориентированный код, который будет более удобным в сопровождении, расширяемом, масштабируемом и тестируемом. КУРС REAL PYTHON

Предварительный просмотр Python 3.12: более интуитивно понятные и последовательные F-строки В этом уроке вы познакомитесь с одной из будущих функций Python 3.12, которая представляет новую формализацию и реализацию синтаксиса f-строки. Новая реализация снимает некоторые ограничения и ограничения, влияющие на литералы f-строки в версиях Python ниже 3.12. REAL PYTHON

Изучение показателей кода в Python с помощью Radon Radon — это инструмент измерения показателей кода. Эта статья познакомит вас с этим и научит, как можно улучшить свой код на основе его измерений. МАЙК ДРИСКОЛ.
Это курс Гарвардского университета: «Введение в науку о данных с помощью Python». Вы можете пройти этот урок бесплатно. Если вам нужен сертификат, вы можете заплатить за него 299 долларов. Чтобы пройти этот курс, вы должны быть знакомы с Python. Курс предназначен для новичков.

https://pll.harvard.edu/course/introduction-data-science-python
Для Python предложен JIT-компилятор, использующий технику copy-and-patch

Брандт Букер (Brandt Bucher) из компании Microsoft, входящий в число core-разработчиков CPython и работающий в команде, занимающейся увеличением производительности интерпретатора CPython, опубликовал реализацию JIT-компилятора для Python, использующую технику Copy-and-Patch. Публикация JIT приурочена к Рождеству и анонс написан в стихах.

Предложенный JIT примечателен очень высокой скоростью генерации кода, простотой сопровождения и полной интеграцией с интерпретатором. Предложенный метод позволяет автоматически преобразовать интерпретатор, написанный на языке Си, в JIT-компилятор, без отдельного формирования логики генерации кода и без ручного создания ассемблерных представлений. При таком подходе исправление ошибки в интерпретаторе автоматически приведёт и к устранению той же проблемы в JIT, так как используется общий генератор кода.
🏆Как освоить 📊 конвейеры больших данных с помощью Taipy и PySpark 🐍

В этой статье будет использован простой пример, чтобы продемонстрировать, как мы можем интегрировать PySpark с Taipy , чтобы соединить ваши потребности в обработке больших данных с интеллектуальным выполнением заданий . https://dev.to/taipy/how-to-master-big-data-pipelines-with-taipy-and-pyspark-14oe
4 миллиарда операторов if — проверка того, является ли каждое 32-битное число четным или нечетным.

Просматривая недавно соцсети, я наткнулся на этот скриншот. Разумеется, его сопровождало множество злобных комментариев, критикующих попытку этого новичка в программировании решить классическую задачу computer science: операцию деления с остатком.

В современном мире, где ИИ постепенно заменяет программистов, отнимая у них работу и совершая переворот в том, как мы подходим к рассуждениям о коде, нам, возможно, следует быть более открытыми к мыслям людей, недавно пришедших в нашу отрасль? На самом деле, показанный выше код — идеальный пример компромисса между временем и задействованной памятью. Мы жертвуем временем и в то же время памятью и временем компьютера! Поистине чудесный алгоритм!

https://andreasjhkarlsson.github.io/jekyll/update/2023/12/27/4-billion-if-statements.html
[Перевод] Сколько ядер CPU можно использовать параллельно в Python?.

При выполнении параллельной программы, активно задействующей CPU, нам часто необходимо, чтобы пул потоков или процессов имел размер, сопоставимый с количеством ядер CPU на машине. Если потоков меньше, то вы будете использовать все преимущества ядер, если меньше, то программа начнёт работать медленнее, так как несколько потоков будет конкурировать за одно ядро. Ну, или такова ситуация в теории.

Как же проверить, сколько ядер есть у компьютера? И действительно ли это хороший совет?

Оказывается, на удивление сложно определить, сколько потоков выполнять:

- В стандартной библиотеке Python есть множество API для получения этой информации, но ни одного из них недостаточно.

- Хуже того, из-за таких функций CPU, как параллельность на уровне команд и одновременной многопоточности (Hyper-threading в CPU Intel), количество ядер, которое можно эффективно использовать, зависит от того кода, который напишете вы!

Давайте разберёмся, почему так сложно определить, сколько ядер CPU может использовать программа, а затем подумаем над потенциальным решением.

Читать далее https://habr.com/ru/articles/784014