PythonDigest
1.88K subscribers
23 photos
1 video
17.4K links
Сборник Python новостей: https://pythondigest.ru

Наш IT-тренажер: https://app.incidenta.tech/

Создано в @incidenta_tech
Download Telegram
cinderx: High-Performance Python Runtime Extensions
https://github.com/facebookincubator/cinderx
scrapy - 2.14.2
https://pypi.org/project/scrapy/2.14.2/

Гибкий фреймворк для написания web-пауков (парсеров). Скачать можно по ссылке: https://pypi.python.org/pypi/scrapy
Аугментации изображений: как улучшить качество моделей без новых данных
https://habr.com/ru/articles/1008560/

Аугментация данных — один из самых мощных инструментов улучшения качества моделей машинного обучения. В компьютерном зрении она почти всегда критична: без неё модели быстро переобучаются и плохо обобщаются.Но на практике её часто используют поверхностно: «добавим флип, поворот и color jitter».В этой статье разбираем аугментации глубжe
Система рекомендаций для изображений: пример на Python и CLIP
https://habr.com/ru/articles/1009024/

В этой статье я делюсь реальным кейсом построения системы рекомендаций для картин. Сначала мы реализовали простой поиск по тегам, а затем перешли к эмбеддингам изображений с помощью CLIP и хранению в Elasticsearch. Также я показываю, как строим персонализированные рекомендации на основе лайков и просмотров пользователя. Статья будет полезна тем, кто хочет понять, как создать рабочую систему рекомендаций на Python и постепенно улучшать её точность.
STAC — знакомство: Браузеры, API и управление доступом к пространственным данным (часть 3)
https://habr.com/ru/articles/1009110/

В первых двух статьях мы разобрали основы спецификации STAC (SpatioTemporal Asset Catalog), её объектную модель и философию, превращающую разрозненные архивы геоданных в единую, машиночитаемую «библиотеку». Мы увидели, как STAC описывает каталоги (catalog), коллекции (collection), элементы (item) и их ресурсы (assets), создавая универсальный язык для работы с геопространственной информацией.
Линейная алгебра для нейросетей: векторы на практике
https://habr.com/ru/articles/1001896/

Данная статья посвящена основе основ нейронауки — линейной алгебре. Если вы когда-либо планируйте изучать искусственные нейронные сети (и не только), то вам необходимо начать именно с этого. Причем не важно, собираетесь ли вы заниматься фундаментальными исследованиями (Data Science) или просто лепить модели в продакшн на конвейере (ML Engineering), вы обязаны знать их математику хотя бы поверхностно. Любые настройки, дообучение и применение даже готовой модели, требуют понимания основ. А по сему данное знание, как минимум, не будет избыточным.
🤡1
Локальный голосовой ввод: Whisper + Ollama на Python
https://habr.com/ru/articles/1009538/

Мне нужен был голосовой ввод. Не диктовка в Google Docs, не облачный API — а простая штука: зажал клавишу, сказал, отпустил, текст появился в активном окне. Локально, без отправки аудио куда-либо.Готовых решений, которые бы устроили, сходу не нашёл. Сделал свое. Может, кому будет полезно.
Okmain: you have an image but you want a colour
https://dgroshev.com/blog/okmain/
Comparing Python packages for A/B test analysis (with code examples)
https://e10v.me/python-packages-for-ab-test-analysis/
#python #pydigest
IT-новости про Python перед вами.

Часть материалов из выпуска Python Дайджест:

- Наблюдаемость LLM-агентов: Часть 1 и 2
- От OCR до ADE: как машины научились не просто читать, а понимать документы
- Умная теплица на Raspberry Pi 4. Часть 1
- Аугментации изображений: как улучшить качество моделей без новых данных
- DNS TXT как канал доставки конфигов: тихо, надёжно, неубиваемо?
- Как обнаружить заказной негатив с помощью скриптов
- Гит в Телеграм?
- opc-skills - Agent Skills for Solopreneurs
- cinderx: High-Performance Python Runtime Extensions

Заходите в гости - https://pythondigest.ru/issue/639/
opc-skills - Agent Skills for Solopreneurs
https://github.com/ReScienceLab/opc-skills
OpenSandbox - sandbox platform for AI applications
https://github.com/alibaba/OpenSandbox
Avoiding empty strings in non-nullable Django string-based model fields
https://peateasea.de/avoiding-empty-strings-in-non-nullable-django-string-based-model-fields/

Django silently converts None values in non-nullable string fields into empty strings, but a simple CheckConstraint can enforce truly required values and prevent empty data from slipping into your database.
🔥1
DNS TXT как канал доставки конфигов: тихо, надёжно, неубиваемо?
https://habr.com/ru/articles/1009628/

TXT-запись — это произвольная строка текста привязанная к домену. Придумали её для SPF (верификация почтовых серверов) и DKIM, потом стали использовать для подтверждения владения доменом в Google Search Console и Let's Encrypt. Технически это просто поле «здесь может лежать любой текст до 255 байт».
Как обнаружить заказной негатив с помощью скриптов
https://habr.com/ru/articles/1010014/

По данным Data Insight 30% отказов от покупок связано с заказным негативом. Раньше ботов вычисляли по шаблонным фразам, но сейчас спамеры массово генерируют жалобы через LLM. Модерация геосервисов пропускает такой контент. Формально отзывы уникальны и не нарушают правила площадок. 
Знакомьтесь, Барри Уорсо (цикл заметок о выдающихся питонистах)
https://habr.com/ru/articles/1010076/

Влюбился в Python в 1994-м, придумал PEP как систему управления изменениями в языке, спрятал пасхалку import this в стандартную библиотеку и годами прокладывал Python дорогу в Linux-дистрибутивы. Речь пойдёт о Барри Уорсо (Barry Warsaw) – первом неголландце в ядре Python. 
Сводка pythonz 08.03.2026 — 15.03.2026
https://pythonz.net/articles/636/

А теперь о том, что происходило в последнее время на других ресурсах.