Python Community – Telegram

Python Community

@python_community_ru

11.9K subscribers

1.4K photos

116 videos

15 files

919 links

Python Community RU - СНГ сообщество Python-разработчиков

Чат канала: @python_community_chat

Сотрудничество: @cyberJohnny и @Sergey_bzd

РКН реестр:
https://knd.gov.ru/license?id=67847dd98e552d6b54a511ed&registryType=bloggersPermission

Download Telegram

About

Blog

Apps

Platform

Python Community

11.9K subscribers

Python Community

🔒 OpenAI Privacy Filter: Защита Личных Данных

Модель для обнаружения и маскировки персонально идентифицируемой информации (PII) в текстах. Идеальна для высокопроизводительных рабочих процессов по очистке данных, обеспечивая быструю и контекстно осведомлённую обработку. Подходит для локального использования и настройки.

🚀 Основные моменты:
- Двусторонняя классификация токенов для PII.
- Легкая настройка под специфические данные.
- Поддержка длинных контекстов до 128,000 токенов.
- Низкие требования к ресурсам: работает на ноутбуках и в браузерах.
- Гибкость в управлении точностью и полнотой.

📌 GitHub: https://github.com/openai/privacy-filter

#python

@Python_Community_ru

GitHub - openai/privacy-filter: OpenAI Privacy Filter

OpenAI Privacy Filter. Contribute to openai/privacy-filter development by creating an account on GitHub.

721 views15:59

Python Community

Python 3.15 beta 1 вышела в релиз 🐍

Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.

Что интересного в 3.15:
- lazy imports через ключевое слово lazy
- встроенные frozendict и sentinel
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию

Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.

https://blog.python.org/2026/05/python-3150-beta-1/

@Python_Community_ru

734 views21:59

Python Community

‍⚡️ Глава Google Cloud выложил свой личный набор skills для AI-агентов

И это выглядит не как очередная папка с промптами, а как полноценный рабочий pipeline для разработки.

Внутри - 19 skills и 7 slash-команд, которые превращают агента в почти нормальную инженерную систему: от идеи и спецификации до тестов, ревью и релиза.

Логика разбита на 6 этапов:

- Define - помогает сформулировать идею, требования и спецификацию до начала кодинга
- Plan - дробит большую задачу на понятные шаги
- Build - ведёт пошаговую разработку с учётом контекста и нужных API
- Verify - прогоняет проверки через DevTools, ловит баги и помогает их чинить
- Review - смотрит качество кода, безопасность и производительность
- Ship - готовит проект к релизу и доводит до состояния «можно выкатывать»

Самое интересное - это не привязано к одному инструменту.

Сборку можно встроить в Claude Code, Cursor, Antigravity, OpenCode, Gemini CLI и другие агентные IDE / CLI.

По сути это готовый скелет для разработки с AI-агентом: меньше хаоса, меньше «сделай красиво», больше нормального процесса.

https://github.com/addyosmani/agent-skills

@Python_Community_ru

815 views15:55

Python Community

‍⚡️ Вредонос в PyPI превратил установку пакета в русскую рулетку

Microsoft расследует взлом популярного Python-пакета mistralai - официального клиента для работы с моделями Mistral AI.

По данным исследователей, злоумышленники внедрили вредонос прямо в библиотеку. Самое неприятное - код срабатывал уже при обычном import и пытался красть данные из окружения.
Но дальше история становится совсем абсурдной.

Вредонос проверял язык и регион системы, обходил русскоязычные окружения и включал геозависимую «лотерею» для остальных. Для некоторых стран поведение было особенно жёстким: с вероятностью 1 к 6 он мог запустить разрушительную команду удаления файлов.
В X после этого начали шутить, что лучший security-патч года - русский языковой пакет.

Шутки шутками, но кейс неприятный: это был не случайный левый пакет с тремя скачиваниями, а клиент для популярного AI-сервиса. То есть supply chain-атаки уже давно бьют не только по npm-мусору, а по нормальным инструментам, которые разработчики ставят почти на автомате.

Вывод простой: даже официальный пакет сегодня не гарантия безопасности.

Проверяйте версии, lock-файлы, хеши, changelog и окружение, где ставите зависимости. Особенно если это AI SDK, который по умолчанию получает доступ к токенам, ключам и рабочим данным.

https://x.com/lauriewired/status/2054231467744760131?s=46

@Python_Community_ru

🤔1

911 views09:53

Python Community

🌐 МHR-CFW: MasterHttpRelay + Cloudflare Worker

MHR-CFW — это инструмент для создания анонимного прокси-сервера, использующего Google и Cloudflare для маскировки реального трафика. Он позволяет обойти сетевые фильтры, скрывая целевые сайты за обычным трафиком Google.

🚀 Основные моменты:
- Прокси-сервер, использующий Google и Cloudflare для анонимности.
- Подходит для образовательных и исследовательских целей.
- Не требует установки дополнительных зависимостей, кроме Python.
- Предоставляется без гарантии и ответственности.

📌 GitHub: https://github.com/denuitt1/mhr-cfw

@Python_Community_ru

692 views15:44

Python Community

🚀 Удобная система сборки для нескольких языков с rigx

rigx — это экспериментальная система сборки для C, C++, Go, Rust, Zig, Nim и Python, которая упрощает процесс разработки, обеспечивая изоляцию и кэширование. Все зависимости управляются автоматически, а сборки выполняются в песочнице, что исключает проблемы с "работает на моем компьютере".

🚀 Основные моменты:
- Простая декларативная конфигурация через rigx.toml.
- Поддержка многопоточности и интеграционных тестов.
- Кэширование выходных данных для ускорения сборок.
- Совместимость с Nix для управления зависимостями.

📌 GitHub: https://github.com/unofficialtools/rigx

#python

@Python_Community_ru

767 views15:39

Python Community

This media is not supported in your browser

VIEW IN TELEGRAM

Python-скрипт, который автоматически «понимает» PDF-книги: AI Reads Books.

Достаточно предоставить PDF, запустить скрипт — и он будет анализировать содержимое по страницам, извлекать ключевые знания и генерировать структурированное резюме в формате Markdown.

GitHub: https://github.com/echohive42/AI-reads-books-page-by-page

@Python_Community_ru

744 views15:35

Python Community

‍✔️ Machine Learning Roadmap: нормальная карта входа в ML без сказок про «выучить нейросети за месяц»

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа.

Roadmap разбит на 7 треков:

- фундамент: Python, математика, статистика, инструменты
- классический ML: scikit-learn, табличные данные, метрики, валидация
- Deep Learning: PyTorch, CNN, RNN, training loop
- LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
- Generative AI: изображения, видео, аудио, мультимодальность
- MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving
- специализация: CV, NLP, RecSys, RL, Safety

Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается.

Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась.

По времени тоже без инфоцыганства:

- 0-3 месяца: Python, математика, классический ML
- 3-6 месяцев: Deep Learning и PyTorch
- 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
- 12+ месяцев: MLOps, прод, масштабирование, специализация

Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap/tree/main

@Python_Community_ru

798 views15:30

Python Community

🔒🌐 Awesome Privacy: Your Guide to Online Privacy Tools

Этот репозиторий собрал лучшие ресурсы и инструменты для обеспечения вашей конфиденциальности в интернете. Здесь вы найдете полезные ссылки на программы, сервисы и советы по защите личных данных.

🚀Основные моменты:
- Обширный список инструментов для защиты конфиденциальности
- Ресурсы по анонимности и безопасности в сети
- Регулярные обновления и новые добавления
- Полезные советы по улучшению личной безопасности

📌 GitHub:

#markdown

@Python_Community_ru

https://github.com/Lissy93/awesome-privacy

GitHub - lissy93/awesome-privacy: 🦄 A curated list of privacy & security-focused software and services

🦄 A curated list of privacy & security-focused software and services - lissy93/awesome-privacy

856 views21:25

Python Community

Вышел Codex CLI 0.133.0.

Goals теперь работают по умолчанию. У них появилось отдельное хранилище, прогресс трекается сквозь активные ходы, так что агент держит цель в фокусе между шагами и не забывает, куда шёл.

Заметно прокачали Permission profiles: API для списков, наследование настроек, поддержка managed requirements.toml, обновление прав в рантайме без перезапуска и усиленный сэндбокс под Windows.

Расширения получили доступ к событиям подагентов (старт, стоп), вызовам инструментов, метаданным хода и асинхронной обработке аппрувов. Можно строить нормальные обвязки вокруг Codex.

Плагины: discovery теперь учитывает маркетплейсы, показывает установленные версии, видимые корни и умеет работать с удалёнными коллекциями.

https://github.com/openai/codex/releases/tag/rust-v0.133.0

@Python_Community_ru

735 views21:18

Python Community

Kronos - open-source модель, которая читает финансовые свечи как язык

Это не обычная LLM, которую натянули на финансы. Kronos изначально обучали на K-line данных: open, high, low, close, volume и рыночных паттернах.

Что умеет:

- прогнозировать цену по свечам;
- оценивать будущую волатильность;
- работать zero-shot без дообучения;
- запускаться в разных размерах - от 4.1M до 499M параметров;
- делать прогнозы через несколько строк Python.

Модель обучали на данных с 45+ бирж, есть live demo для BTC/USDT, модели выложены на Hugging Face, код открыт под MIT.

Главная идея сильная: финансовые данные наконец начали обрабатывать не как обычный временной ряд, а как отдельный язык рынка.

GitHub: github.com/shiyu-coder/Kronos

@Python_Community_ru

703 views15:14

Python Community

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 PgQue – Устойчивые очереди в Postgres

PgQue предлагает универсальную архитектуру очередей для PostgreSQL, основанную на проверенной модели PgQ. Это решение без лишних зависимостей, работающее на любом управляемом Postgres, обеспечивая нулевое бремя и стабильную производительность под нагрузкой.

🚀 Основные моменты:
- Никаких внешних демонов или расширений
- Использует SQL и PL/pgSQL для установки
- Обеспечивает ACID-транзакции и долговечность
- Никакого накопления "мертвых" кортежей
- Подходит для высоконагруженных систем

📌 GitHub: https://github.com/NikolayS/pgque

#sql

@Python_Community_ru

632 views15:11

Python Community

🌟 Интуитивные голосовые интерфейсы с Moonshine Voice

Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.

🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.

📌 GitHub: https://github.com/moonshine-ai/moonshine

#python

@Python_Community_ru

527 views09:04

Python Community

🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн

Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов.

Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми.

Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении.

Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях.

Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры.

Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу.

Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи.

Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила.

Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии.

Формальная проверка отсекает галлюцинации.
Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит.

@Python_Community_ru

612 viewsedited 15:03

Python Community

641 views15:05

Python Community

✔️ Claude Code превращают в баг-хантинг машину

Claude-BugHunter - skill bundle для Claude Code, который добавляет готовую методологию для легального bug bounty, security audit и authorized red-team задач.

Это не один промпт в стиле «найди баги». Внутри целый набор рабочих навыков и команд:

- 51 skill и 15 slash-команд
- 574+ паттерна из раскрытых security-репортов
- 24 класса уязвимостей
- workflow для поиска, валидации, триажа и оформления findings
- шаблоны под enterprise-цепочки для M365, Okta, VMware и VPN-appliances
- scaffold папок под engagement: scope, notes, evidence, findings, reports
- интеграция с Burp через MCP

Проект: https://github.com/elementalsouls/Claude-BugHunter

@Python_Community_ru

667 views14:59

Python Community

🖥 Python умеет аккуратно читать вывод долгого процесса по мере выполнения

Вместо того чтобы ждать завершения команды, можно запустить её через subprocess.Popen и читать stdout построчно.

Так удобно следить за:

- долгими скриптами
- серверами
- сборками
- тестами
- CLI-утилитами
- фоновой обработкой данных

Пример на картинке запускает HTTP-сервер и сразу печатает его вывод:

subprocess.Popen(...) стартует процесс
stdout=subprocess.PIPE забирает поток вывода
iter(proc.stdout.readline, b'') читает строки, пока процесс жив

Полезный паттерн, когда нужно не просто запустить команду, а видеть, что с ней происходит прямо сейчас.

@Python_Community_ru

630 views20:53

Python Community

O(1) не значит «быстро»

Одна из самых частых ошибок в алгоритмах: считать, что O(1) всегда быстрее O(n).

На практике это не так.

O(1) означает только одно: время работы не растёт вместе с размером входных данных.

Но сама операция может быть дорогой.

Например, хеш-таблица формально даёт O(1) для поиска, но если данные не в кэше CPU, один cache miss может сделать её медленнее, чем простой линейный проход по маленькому массиву.

Именно поэтому в Go, Python и даже C-библиотеках для маленьких map/таблиц иногда используют обычный linear search.

Парадоксально, но:

O(n) при n = 16 и тёплом кэше может быть быстрее, чем O(1) с холодным cache miss.

Big O описывает асимптотический рост, а не реальную скорость на маленьких данных.

@Python_Community_ru

572 views14:48

Python Community

‍⚡️ Как Redis считает миллиарды уникальных значений, почти не тратя память

Есть алгоритм HyperLogLog. Он позволяет примерно понять, сколько уникальных элементов прошло через систему, используя около 12 KB памяти.

Идея простая: Redis не хранит сами элементы.

Он делает так:

- берёт элемент
- считает от него хеш
- часть хеша использует как номер ячейки
- в другой части смотрит, сколько нулей подряд встретилось
- если новое число больше старого - обновляет ячейку

Почему это работает?

Потому что длинная серия нулей в хеше встречается редко.

Например:

- 1 ноль подряд - довольно часто
- 5 нулей подряд - уже реже
- 10 нулей подряд - примерно шанс 1 к 1024
- 20 нулей подряд - совсем редкое событие

Если Redis увидел очень редкий паттерн, значит через него, скорее всего, прошло много разных элементов.

В Redis используется 16 384 маленьких счётчика. Каждый хранит максимальную «редкость», которую видел для своей группы элементов.

Потом Redis объединяет эти значения математикой и получает оценку уникальных элементов.

Не точное число, а очень близкую оценку.

Главный прикол HyperLogLog:

он может обработать хоть миллионы, хоть миллиарды значений, но память почти не растёт.

Именно поэтому Redis умеет считать уникальных пользователей, IP, запросы или события без огромных таблиц и списков.

@Python_Community_ru

570 views08:42

Python Community

This media is not supported in your browser

VIEW IN TELEGRAM

🖥 Python умеет читать бинарные файлы блоками очень элегантно - без ручного while True.

Вот такой приём через functools.partial:

`iter(partial(f.read, 64), b'')`

Что тут происходит:

partial(f.read, 64) превращает f.read(64) в функцию без аргументов.

iter(..., b'') вызывает её снова и снова, пока результат не станет b'', то есть пока файл не закончится.

В итоге получаем аккуратный цикл по блокам:

from functools import partial

with open("mydata.db", "rb") as f:
for block in iter(partial(f.read, 64), b""):
process_block(block)

@Python_Community_ru

👍2

479 views14:33