🔒 OpenAI Privacy Filter: Защита Личных Данных
Модель для обнаружения и маскировки персонально идентифицируемой информации (PII) в текстах. Идеальна для высокопроизводительных рабочих процессов по очистке данных, обеспечивая быструю и контекстно осведомлённую обработку. Подходит для локального использования и настройки.
🚀 Основные моменты:
- Двусторонняя классификация токенов для PII.
- Легкая настройка под специфические данные.
- Поддержка длинных контекстов до 128,000 токенов.
- Низкие требования к ресурсам: работает на ноутбуках и в браузерах.
- Гибкость в управлении точностью и полнотой.
📌 GitHub: https://github.com/openai/privacy-filter
#python
@Python_Community_ru
Модель для обнаружения и маскировки персонально идентифицируемой информации (PII) в текстах. Идеальна для высокопроизводительных рабочих процессов по очистке данных, обеспечивая быструю и контекстно осведомлённую обработку. Подходит для локального использования и настройки.
🚀 Основные моменты:
- Двусторонняя классификация токенов для PII.
- Легкая настройка под специфические данные.
- Поддержка длинных контекстов до 128,000 токенов.
- Низкие требования к ресурсам: работает на ноутбуках и в браузерах.
- Гибкость в управлении точностью и полнотой.
📌 GitHub: https://github.com/openai/privacy-filter
#python
@Python_Community_ru
GitHub
GitHub - openai/privacy-filter: OpenAI Privacy Filter
OpenAI Privacy Filter. Contribute to openai/privacy-filter development by creating an account on GitHub.
Python 3.15 beta 1 вышела в релиз 🐍
Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.
Что интересного в 3.15:
- lazy imports через ключевое слово lazy
- встроенные frozendict и sentinel
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию
Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.
https://blog.python.org/2026/05/python-3150-beta-1/
@Python_Community_ru
Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.
Что интересного в 3.15:
- lazy imports через ключевое слово lazy
- встроенные frozendict и sentinel
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию
Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.
https://blog.python.org/2026/05/python-3150-beta-1/
@Python_Community_ru
⚡️ Глава Google Cloud выложил свой личный набор skills для AI-агентов
И это выглядит не как очередная папка с промптами, а как полноценный рабочий pipeline для разработки.
Внутри - 19 skills и 7 slash-команд, которые превращают агента в почти нормальную инженерную систему: от идеи и спецификации до тестов, ревью и релиза.
Логика разбита на 6 этапов:
- Define - помогает сформулировать идею, требования и спецификацию до начала кодинга
- Plan - дробит большую задачу на понятные шаги
- Build - ведёт пошаговую разработку с учётом контекста и нужных API
- Verify - прогоняет проверки через DevTools, ловит баги и помогает их чинить
- Review - смотрит качество кода, безопасность и производительность
- Ship - готовит проект к релизу и доводит до состояния «можно выкатывать»
Самое интересное - это не привязано к одному инструменту.
Сборку можно встроить в Claude Code, Cursor, Antigravity, OpenCode, Gemini CLI и другие агентные IDE / CLI.
По сути это готовый скелет для разработки с AI-агентом: меньше хаоса, меньше «сделай красиво», больше нормального процесса.
https://github.com/addyosmani/agent-skills
@Python_Community_ru
И это выглядит не как очередная папка с промптами, а как полноценный рабочий pipeline для разработки.
Внутри - 19 skills и 7 slash-команд, которые превращают агента в почти нормальную инженерную систему: от идеи и спецификации до тестов, ревью и релиза.
Логика разбита на 6 этапов:
- Define - помогает сформулировать идею, требования и спецификацию до начала кодинга
- Plan - дробит большую задачу на понятные шаги
- Build - ведёт пошаговую разработку с учётом контекста и нужных API
- Verify - прогоняет проверки через DevTools, ловит баги и помогает их чинить
- Review - смотрит качество кода, безопасность и производительность
- Ship - готовит проект к релизу и доводит до состояния «можно выкатывать»
Самое интересное - это не привязано к одному инструменту.
Сборку можно встроить в Claude Code, Cursor, Antigravity, OpenCode, Gemini CLI и другие агентные IDE / CLI.
По сути это готовый скелет для разработки с AI-агентом: меньше хаоса, меньше «сделай красиво», больше нормального процесса.
https://github.com/addyosmani/agent-skills
@Python_Community_ru
⚡️ Вредонос в PyPI превратил установку пакета в русскую рулетку
Microsoft расследует взлом популярного Python-пакета mistralai - официального клиента для работы с моделями Mistral AI.
По данным исследователей, злоумышленники внедрили вредонос прямо в библиотеку. Самое неприятное - код срабатывал уже при обычном import и пытался красть данные из окружения.
Но дальше история становится совсем абсурдной.
Вредонос проверял язык и регион системы, обходил русскоязычные окружения и включал геозависимую «лотерею» для остальных. Для некоторых стран поведение было особенно жёстким: с вероятностью 1 к 6 он мог запустить разрушительную команду удаления файлов.
В X после этого начали шутить, что лучший security-патч года - русский языковой пакет.
Шутки шутками, но кейс неприятный: это был не случайный левый пакет с тремя скачиваниями, а клиент для популярного AI-сервиса. То есть supply chain-атаки уже давно бьют не только по npm-мусору, а по нормальным инструментам, которые разработчики ставят почти на автомате.
Вывод простой: даже официальный пакет сегодня не гарантия безопасности.
Проверяйте версии, lock-файлы, хеши, changelog и окружение, где ставите зависимости. Особенно если это AI SDK, который по умолчанию получает доступ к токенам, ключам и рабочим данным.
https://x.com/lauriewired/status/2054231467744760131?s=46
@Python_Community_ru
Microsoft расследует взлом популярного Python-пакета mistralai - официального клиента для работы с моделями Mistral AI.
По данным исследователей, злоумышленники внедрили вредонос прямо в библиотеку. Самое неприятное - код срабатывал уже при обычном import и пытался красть данные из окружения.
Но дальше история становится совсем абсурдной.
Вредонос проверял язык и регион системы, обходил русскоязычные окружения и включал геозависимую «лотерею» для остальных. Для некоторых стран поведение было особенно жёстким: с вероятностью 1 к 6 он мог запустить разрушительную команду удаления файлов.
В X после этого начали шутить, что лучший security-патч года - русский языковой пакет.
Шутки шутками, но кейс неприятный: это был не случайный левый пакет с тремя скачиваниями, а клиент для популярного AI-сервиса. То есть supply chain-атаки уже давно бьют не только по npm-мусору, а по нормальным инструментам, которые разработчики ставят почти на автомате.
Вывод простой: даже официальный пакет сегодня не гарантия безопасности.
Проверяйте версии, lock-файлы, хеши, changelog и окружение, где ставите зависимости. Особенно если это AI SDK, который по умолчанию получает доступ к токенам, ключам и рабочим данным.
https://x.com/lauriewired/status/2054231467744760131?s=46
@Python_Community_ru
🤔1
🌐 МHR-CFW: MasterHttpRelay + Cloudflare Worker
MHR-CFW — это инструмент для создания анонимного прокси-сервера, использующего Google и Cloudflare для маскировки реального трафика. Он позволяет обойти сетевые фильтры, скрывая целевые сайты за обычным трафиком Google.
🚀 Основные моменты:
- Прокси-сервер, использующий Google и Cloudflare для анонимности.
- Подходит для образовательных и исследовательских целей.
- Не требует установки дополнительных зависимостей, кроме Python.
- Предоставляется без гарантии и ответственности.
📌 GitHub: https://github.com/denuitt1/mhr-cfw
@Python_Community_ru
MHR-CFW — это инструмент для создания анонимного прокси-сервера, использующего Google и Cloudflare для маскировки реального трафика. Он позволяет обойти сетевые фильтры, скрывая целевые сайты за обычным трафиком Google.
🚀 Основные моменты:
- Прокси-сервер, использующий Google и Cloudflare для анонимности.
- Подходит для образовательных и исследовательских целей.
- Не требует установки дополнительных зависимостей, кроме Python.
- Предоставляется без гарантии и ответственности.
📌 GitHub: https://github.com/denuitt1/mhr-cfw
@Python_Community_ru
🚀 Удобная система сборки для нескольких языков с rigx
rigx — это экспериментальная система сборки для C, C++, Go, Rust, Zig, Nim и Python, которая упрощает процесс разработки, обеспечивая изоляцию и кэширование. Все зависимости управляются автоматически, а сборки выполняются в песочнице, что исключает проблемы с "работает на моем компьютере".
🚀 Основные моменты:
- Простая декларативная конфигурация через rigx.toml.
- Поддержка многопоточности и интеграционных тестов.
- Кэширование выходных данных для ускорения сборок.
- Совместимость с Nix для управления зависимостями.
📌 GitHub: https://github.com/unofficialtools/rigx
#python
@Python_Community_ru
rigx — это экспериментальная система сборки для C, C++, Go, Rust, Zig, Nim и Python, которая упрощает процесс разработки, обеспечивая изоляцию и кэширование. Все зависимости управляются автоматически, а сборки выполняются в песочнице, что исключает проблемы с "работает на моем компьютере".
🚀 Основные моменты:
- Простая декларативная конфигурация через rigx.toml.
- Поддержка многопоточности и интеграционных тестов.
- Кэширование выходных данных для ускорения сборок.
- Совместимость с Nix для управления зависимостями.
📌 GitHub: https://github.com/unofficialtools/rigx
#python
@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
Python-скрипт, который автоматически «понимает» PDF-книги: AI Reads Books.
Достаточно предоставить PDF, запустить скрипт — и он будет анализировать содержимое по страницам, извлекать ключевые знания и генерировать структурированное резюме в формате Markdown.
GitHub: https://github.com/echohive42/AI-reads-books-page-by-page
@Python_Community_ru
Достаточно предоставить PDF, запустить скрипт — и он будет анализировать содержимое по страницам, извлекать ключевые знания и генерировать структурированное резюме в формате Markdown.
GitHub: https://github.com/echohive42/AI-reads-books-page-by-page
@Python_Community_ru
✔️ Machine Learning Roadmap: нормальная карта входа в ML без сказок про «выучить нейросети за месяц»
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа.
Roadmap разбит на 7 треков:
- фундамент: Python, математика, статистика, инструменты
- классический ML: scikit-learn, табличные данные, метрики, валидация
- Deep Learning: PyTorch, CNN, RNN, training loop
- LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
- Generative AI: изображения, видео, аудио, мультимодальность
- MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving
- специализация: CV, NLP, RecSys, RL, Safety
Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается.
Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась.
По времени тоже без инфоцыганства:
- 0-3 месяца: Python, математика, классический ML
- 3-6 месяцев: Deep Learning и PyTorch
- 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
- 12+ месяцев: MLOps, прод, масштабирование, специализация
Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap/tree/main
@Python_Community_ru
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа.
Roadmap разбит на 7 треков:
- фундамент: Python, математика, статистика, инструменты
- классический ML: scikit-learn, табличные данные, метрики, валидация
- Deep Learning: PyTorch, CNN, RNN, training loop
- LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
- Generative AI: изображения, видео, аудио, мультимодальность
- MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving
- специализация: CV, NLP, RecSys, RL, Safety
Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается.
Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась.
По времени тоже без инфоцыганства:
- 0-3 месяца: Python, математика, классический ML
- 3-6 месяцев: Deep Learning и PyTorch
- 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
- 12+ месяцев: MLOps, прод, масштабирование, специализация
Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap/tree/main
@Python_Community_ru
🔒🌐 Awesome Privacy: Your Guide to Online Privacy Tools
Этот репозиторий собрал лучшие ресурсы и инструменты для обеспечения вашей конфиденциальности в интернете. Здесь вы найдете полезные ссылки на программы, сервисы и советы по защите личных данных.
🚀Основные моменты:
- Обширный список инструментов для защиты конфиденциальности
- Ресурсы по анонимности и безопасности в сети
- Регулярные обновления и новые добавления
- Полезные советы по улучшению личной безопасности
📌 GitHub:
#markdown
@Python_Community_ru
https://github.com/Lissy93/awesome-privacy
Этот репозиторий собрал лучшие ресурсы и инструменты для обеспечения вашей конфиденциальности в интернете. Здесь вы найдете полезные ссылки на программы, сервисы и советы по защите личных данных.
🚀Основные моменты:
- Обширный список инструментов для защиты конфиденциальности
- Ресурсы по анонимности и безопасности в сети
- Регулярные обновления и новые добавления
- Полезные советы по улучшению личной безопасности
📌 GitHub:
#markdown
@Python_Community_ru
https://github.com/Lissy93/awesome-privacy
GitHub
GitHub - lissy93/awesome-privacy: 🦄 A curated list of privacy & security-focused software and services
🦄 A curated list of privacy & security-focused software and services - lissy93/awesome-privacy
Вышел Codex CLI 0.133.0.
Goals теперь работают по умолчанию. У них появилось отдельное хранилище, прогресс трекается сквозь активные ходы, так что агент держит цель в фокусе между шагами и не забывает, куда шёл.
Заметно прокачали Permission profiles: API для списков, наследование настроек, поддержка managed requirements.toml, обновление прав в рантайме без перезапуска и усиленный сэндбокс под Windows.
Расширения получили доступ к событиям подагентов (старт, стоп), вызовам инструментов, метаданным хода и асинхронной обработке аппрувов. Можно строить нормальные обвязки вокруг Codex.
Плагины: discovery теперь учитывает маркетплейсы, показывает установленные версии, видимые корни и умеет работать с удалёнными коллекциями.
https://github.com/openai/codex/releases/tag/rust-v0.133.0
@Python_Community_ru
Goals теперь работают по умолчанию. У них появилось отдельное хранилище, прогресс трекается сквозь активные ходы, так что агент держит цель в фокусе между шагами и не забывает, куда шёл.
Заметно прокачали Permission profiles: API для списков, наследование настроек, поддержка managed requirements.toml, обновление прав в рантайме без перезапуска и усиленный сэндбокс под Windows.
Расширения получили доступ к событиям подагентов (старт, стоп), вызовам инструментов, метаданным хода и асинхронной обработке аппрувов. Можно строить нормальные обвязки вокруг Codex.
Плагины: discovery теперь учитывает маркетплейсы, показывает установленные версии, видимые корни и умеет работать с удалёнными коллекциями.
https://github.com/openai/codex/releases/tag/rust-v0.133.0
@Python_Community_ru
Kronos - open-source модель, которая читает финансовые свечи как язык
Это не обычная LLM, которую натянули на финансы. Kronos изначально обучали на K-line данных: open, high, low, close, volume и рыночных паттернах.
Что умеет:
- прогнозировать цену по свечам;
- оценивать будущую волатильность;
- работать zero-shot без дообучения;
- запускаться в разных размерах - от 4.1M до 499M параметров;
- делать прогнозы через несколько строк Python.
Модель обучали на данных с 45+ бирж, есть live demo для BTC/USDT, модели выложены на Hugging Face, код открыт под MIT.
Главная идея сильная: финансовые данные наконец начали обрабатывать не как обычный временной ряд, а как отдельный язык рынка.
GitHub: github.com/shiyu-coder/Kronos
@Python_Community_ru
Это не обычная LLM, которую натянули на финансы. Kronos изначально обучали на K-line данных: open, high, low, close, volume и рыночных паттернах.
Что умеет:
- прогнозировать цену по свечам;
- оценивать будущую волатильность;
- работать zero-shot без дообучения;
- запускаться в разных размерах - от 4.1M до 499M параметров;
- делать прогнозы через несколько строк Python.
Модель обучали на данных с 45+ бирж, есть live demo для BTC/USDT, модели выложены на Hugging Face, код открыт под MIT.
Главная идея сильная: финансовые данные наконец начали обрабатывать не как обычный временной ряд, а как отдельный язык рынка.
GitHub: github.com/shiyu-coder/Kronos
@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 PgQue – Устойчивые очереди в Postgres
PgQue предлагает универсальную архитектуру очередей для PostgreSQL, основанную на проверенной модели PgQ. Это решение без лишних зависимостей, работающее на любом управляемом Postgres, обеспечивая нулевое бремя и стабильную производительность под нагрузкой.
🚀 Основные моменты:
- Никаких внешних демонов или расширений
- Использует SQL и PL/pgSQL для установки
- Обеспечивает ACID-транзакции и долговечность
- Никакого накопления "мертвых" кортежей
- Подходит для высоконагруженных систем
📌 GitHub: https://github.com/NikolayS/pgque
#sql
@Python_Community_ru
PgQue предлагает универсальную архитектуру очередей для PostgreSQL, основанную на проверенной модели PgQ. Это решение без лишних зависимостей, работающее на любом управляемом Postgres, обеспечивая нулевое бремя и стабильную производительность под нагрузкой.
🚀 Основные моменты:
- Никаких внешних демонов или расширений
- Использует SQL и PL/pgSQL для установки
- Обеспечивает ACID-транзакции и долговечность
- Никакого накопления "мертвых" кортежей
- Подходит для высоконагруженных систем
📌 GitHub: https://github.com/NikolayS/pgque
#sql
@Python_Community_ru
🌟 Интуитивные голосовые интерфейсы с Moonshine Voice
Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.
🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.
📌 GitHub: https://github.com/moonshine-ai/moonshine
#python
@Python_Community_ru
Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.
🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.
📌 GitHub: https://github.com/moonshine-ai/moonshine
#python
@Python_Community_ru
🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн
Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов.
Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми.
Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении.
Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях.
Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры.
Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу.
Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи.
Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила.
Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии.
Формальная проверка отсекает галлюцинации.
Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит.
@Python_Community_ru
Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов.
Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми.
Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении.
Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях.
Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры.
Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу.
Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи.
Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила.
Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии.
Формальная проверка отсекает галлюцинации.
Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит.
@Python_Community_ru
✔️ Claude Code превращают в баг-хантинг машину
Claude-BugHunter - skill bundle для Claude Code, который добавляет готовую методологию для легального bug bounty, security audit и authorized red-team задач.
Это не один промпт в стиле «найди баги». Внутри целый набор рабочих навыков и команд:
- 51 skill и 15 slash-команд
- 574+ паттерна из раскрытых security-репортов
- 24 класса уязвимостей
- workflow для поиска, валидации, триажа и оформления findings
- шаблоны под enterprise-цепочки для M365, Okta, VMware и VPN-appliances
- scaffold папок под engagement: scope, notes, evidence, findings, reports
- интеграция с Burp через MCP
Проект: https://github.com/elementalsouls/Claude-BugHunter
@Python_Community_ru
Claude-BugHunter - skill bundle для Claude Code, который добавляет готовую методологию для легального bug bounty, security audit и authorized red-team задач.
Это не один промпт в стиле «найди баги». Внутри целый набор рабочих навыков и команд:
- 51 skill и 15 slash-команд
- 574+ паттерна из раскрытых security-репортов
- 24 класса уязвимостей
- workflow для поиска, валидации, триажа и оформления findings
- шаблоны под enterprise-цепочки для M365, Okta, VMware и VPN-appliances
- scaffold папок под engagement: scope, notes, evidence, findings, reports
- интеграция с Burp через MCP
Проект: https://github.com/elementalsouls/Claude-BugHunter
@Python_Community_ru
🖥 Python умеет аккуратно читать вывод долгого процесса по мере выполнения
Вместо того чтобы ждать завершения команды, можно запустить её через subprocess.Popen и читать stdout построчно.
Так удобно следить за:
- долгими скриптами
- серверами
- сборками
- тестами
- CLI-утилитами
- фоновой обработкой данных
Пример на картинке запускает HTTP-сервер и сразу печатает его вывод:
subprocess.Popen(...) стартует процесс
stdout=subprocess.PIPE забирает поток вывода
iter(proc.stdout.readline, b'') читает строки, пока процесс жив
Полезный паттерн, когда нужно не просто запустить команду, а видеть, что с ней происходит прямо сейчас.
@Python_Community_ru
Вместо того чтобы ждать завершения команды, можно запустить её через subprocess.Popen и читать stdout построчно.
Так удобно следить за:
- долгими скриптами
- серверами
- сборками
- тестами
- CLI-утилитами
- фоновой обработкой данных
Пример на картинке запускает HTTP-сервер и сразу печатает его вывод:
subprocess.Popen(...) стартует процесс
stdout=subprocess.PIPE забирает поток вывода
iter(proc.stdout.readline, b'') читает строки, пока процесс жив
Полезный паттерн, когда нужно не просто запустить команду, а видеть, что с ней происходит прямо сейчас.
@Python_Community_ru
O(1) не значит «быстро»
Одна из самых частых ошибок в алгоритмах: считать, что O(1) всегда быстрее O(n).
На практике это не так.
O(1) означает только одно: время работы не растёт вместе с размером входных данных.
Но сама операция может быть дорогой.
Например, хеш-таблица формально даёт O(1) для поиска, но если данные не в кэше CPU, один cache miss может сделать её медленнее, чем простой линейный проход по маленькому массиву.
Именно поэтому в Go, Python и даже C-библиотеках для маленьких map/таблиц иногда используют обычный linear search.
Парадоксально, но:
O(n) при n = 16 и тёплом кэше может быть быстрее, чем O(1) с холодным cache miss.
Big O описывает асимптотический рост, а не реальную скорость на маленьких данных.
@Python_Community_ru
Одна из самых частых ошибок в алгоритмах: считать, что O(1) всегда быстрее O(n).
На практике это не так.
O(1) означает только одно: время работы не растёт вместе с размером входных данных.
Но сама операция может быть дорогой.
Например, хеш-таблица формально даёт O(1) для поиска, но если данные не в кэше CPU, один cache miss может сделать её медленнее, чем простой линейный проход по маленькому массиву.
Именно поэтому в Go, Python и даже C-библиотеках для маленьких map/таблиц иногда используют обычный linear search.
Парадоксально, но:
O(n) при n = 16 и тёплом кэше может быть быстрее, чем O(1) с холодным cache miss.
Big O описывает асимптотический рост, а не реальную скорость на маленьких данных.
@Python_Community_ru
⚡️ Как Redis считает миллиарды уникальных значений, почти не тратя память
Есть алгоритм HyperLogLog. Он позволяет примерно понять, сколько уникальных элементов прошло через систему, используя около 12 KB памяти.
Идея простая: Redis не хранит сами элементы.
Он делает так:
- берёт элемент
- считает от него хеш
- часть хеша использует как номер ячейки
- в другой части смотрит, сколько нулей подряд встретилось
- если новое число больше старого - обновляет ячейку
Почему это работает?
Потому что длинная серия нулей в хеше встречается редко.
Например:
- 1 ноль подряд - довольно часто
- 5 нулей подряд - уже реже
- 10 нулей подряд - примерно шанс 1 к 1024
- 20 нулей подряд - совсем редкое событие
Если Redis увидел очень редкий паттерн, значит через него, скорее всего, прошло много разных элементов.
В Redis используется 16 384 маленьких счётчика. Каждый хранит максимальную «редкость», которую видел для своей группы элементов.
Потом Redis объединяет эти значения математикой и получает оценку уникальных элементов.
Не точное число, а очень близкую оценку.
Главный прикол HyperLogLog:
он может обработать хоть миллионы, хоть миллиарды значений, но память почти не растёт.
Именно поэтому Redis умеет считать уникальных пользователей, IP, запросы или события без огромных таблиц и списков.
@Python_Community_ru
Есть алгоритм HyperLogLog. Он позволяет примерно понять, сколько уникальных элементов прошло через систему, используя около 12 KB памяти.
Идея простая: Redis не хранит сами элементы.
Он делает так:
- берёт элемент
- считает от него хеш
- часть хеша использует как номер ячейки
- в другой части смотрит, сколько нулей подряд встретилось
- если новое число больше старого - обновляет ячейку
Почему это работает?
Потому что длинная серия нулей в хеше встречается редко.
Например:
- 1 ноль подряд - довольно часто
- 5 нулей подряд - уже реже
- 10 нулей подряд - примерно шанс 1 к 1024
- 20 нулей подряд - совсем редкое событие
Если Redis увидел очень редкий паттерн, значит через него, скорее всего, прошло много разных элементов.
В Redis используется 16 384 маленьких счётчика. Каждый хранит максимальную «редкость», которую видел для своей группы элементов.
Потом Redis объединяет эти значения математикой и получает оценку уникальных элементов.
Не точное число, а очень близкую оценку.
Главный прикол HyperLogLog:
он может обработать хоть миллионы, хоть миллиарды значений, но память почти не растёт.
Именно поэтому Redis умеет считать уникальных пользователей, IP, запросы или события без огромных таблиц и списков.
@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Python умеет читать бинарные файлы блоками очень элегантно - без ручного while True.
Вот такой приём через functools.partial:
`iter(partial(f.read, 64), b'')`
Что тут происходит:
partial(f.read, 64) превращает f.read(64) в функцию без аргументов.
iter(..., b'') вызывает её снова и снова, пока результат не станет b'', то есть пока файл не закончится.
В итоге получаем аккуратный цикл по блокам:
from functools import partial
with open("mydata.db", "rb") as f:
for block in iter(partial(f.read, 64), b""):
process_block(block)
@Python_Community_ru
Вот такой приём через functools.partial:
`iter(partial(f.read, 64), b'')`
Что тут происходит:
partial(f.read, 64) превращает f.read(64) в функцию без аргументов.
iter(..., b'') вызывает её снова и снова, пока результат не станет b'', то есть пока файл не закончится.
В итоге получаем аккуратный цикл по блокам:
from functools import partial
with open("mydata.db", "rb") as f:
for block in iter(partial(f.read, 64), b""):
process_block(block)
@Python_Community_ru
👍2