Python Community
11.9K subscribers
1.39K photos
114 videos
15 files
915 links
Python Community RU - СНГ сообщество Python-разработчиков

Чат канала: @python_community_chat

Сотрудничество: @cyberJohnny и @Sergey_bzd

РКН реестр:
https://knd.gov.ru/license?id=67847dd98e552d6b54a511ed&registryType=bloggersPermission
Download Telegram
Cua (https://github.com/trycua/cua) — это Docker для агентов, использующих компьютер — он позволяет агентам ИИ управлять полноценными операционными системами в виртуальных контейнерах и развертывать их локально или в облаке.

— Всего ~1,000 строк кода — легко читать, расширять и встраивать
— Поддержка OpenAI, Anthropic, Mistral и других LLM-провайдеров

https://github.com/trycua/cua

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Себастьян Рашка собрал в одном месте галерею архитектур современных языковых моделей.

Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok.

Для каждой модели есть:

• наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации

По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры.

https://sebastianraschka.com/llm-architecture-gallery/

@Python_Community_ru
🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Автономный помощник для подачи заявок на работу

ApplyPilot - это мощный инструмент для автоматизации процесса подачи заявок на работу. Он ищет вакансии на нескольких платформах, оценивает их с помощью ИИ, адаптирует ваше резюме и отправляет заявки без вашего участия. Просто настройте один раз и позвольте системе работать за вас.

🚀 Основные моменты:
- Полная автоматизация подачи заявок на работу
- Оценка вакансий по соответствию вашему резюме
- Генерация адаптированных резюме и сопроводительных писем
- Поддержка множества платформ для поиска вакансий
- Открытый исходный код и бесплатный доступ к API

📌 GitHub: https://github.com/Pickle-Pixel/ApplyPilot

@Python_Community_ru
🛰 Shadowbroker: Реальное геопространственное разведывательное решение

Shadowbroker — это платформа для анализа открытых источников, которая в реальном времени агрегирует данные о глобальных событиях, таких как авиаперелеты, морское движение, спутники и конфликты. Идеально подходит для аналитиков и исследователей, желающих получить целостный обзор мировых событий на едином интерфейсе.

🚀Основные моменты:
- Отслеживание частных и коммерческих авиарейсов
- Мониторинг морского трафика и военных кораблей
- Геолокация спутников и анализ их миссий
- Информация о глобальных конфликтах и событиях
- Доступ к CCTV и сигналам GPS в реальном времени

📌 GitHub: https://github.com/BigBodyCobain/Shadowbroker

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Open-source прорыв: PrismAudio

Вышла модель PrismAudio и она уже забирает SOTA в генерации аудио из видео (V2A)

Что важно:

- 518M модель, принята на ICLR 2026
- обходит все аналоги по качеству звука
- быстрее конкурентов: ~0.63s на инференс

Главная фишка:

модель думает не одним блоком, а разбивает задачу на 4 части:

- смысл (что происходит)
- время (когда звучит)
- эстетика (как звучит)
- пространство (где звучит)

И обучается через RL прямо внутри этого процесса

Результат:

- топ по всем метрикам (CLAP, MOS и др.)
- лучше MMAudio, ThinkSound и HunyuanVideo
- стабильно работает даже вне обучающего датасета

Плюс: выпустили новый бенчмарк AudioCanvas - 800+ сценариев со звуками

Model: https://modelscope.ai/models/iic/PrismAudio
Demo: https://modelscope.cn/studios/iic/PrismAudio
Paper: https://modelscope.ai/papers/2511.18833
GitHub: https://github.com/FunAudioLLM/ThinkSound/tree/prismaudio

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥2
Прости нас, Планктон

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
💻 Claude Computer - полезная шпаргалка

Как включить:

1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use

Примеры работы:

✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]

✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками

✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии

Claude Computer - мощный и простой в настройке исполнитель задач

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🌟🚀 LongCat-Next: Мультимодальная модель нового поколения

LongCat-Next — это мощная мультимодальная модель, объединяющая текст, визуальные и аудио данные в едином фрейме. Она демонстрирует выдающиеся результаты на различных задачах, превосходя традиционные подходы к представлению данных. Открытый исходный код модели способствует развитию исследований в этой области.

🚀Основные моменты:
- Объединяет текст, визуальные и аудио данные в одном фрейме.
- Использует новый подход DiNA для упрощения мультимодального моделирования.
- Внедряет иерархические дискретные токены для улучшенного представления.
- Обеспечивает высокую производительность в задачах понимания и генерации.

📌 GitHub: https://github.com/meituan-longcat/LongCat-Next

#python

@Python_Community_ru
🚨 PyPI снова взломали. Теперь под ударом пакет telnyx

Очередной удар по supply chain от TeamPCP. И это уже не единичный случай - это целая атака по экосистеме разработчиков.

Что произошло:
• Популярный Python-пакет telnyx на PyPI был скомпрометирован
• Вредоносный код внедрили прямо в официальные версии
• Payload срабатывает при обычном import — без действий пользователя

Что делает malware:
• крадёт SSH-ключи, токены, .env, криптокошельки
• шифрует и отправляет данные на сервер злоумышленников
• закрепляется в системе (persistency)
• может распространяться дальше по инфраструктуре

Это не просто вредоносный пакет - это полноценаая атака:

1. Сначала взломали Trivy (инструмент безопасности)
2. Через него украли токены CI/CD
3. Затем заразили npm (CanisterWorm)
4. Потом PyPI (LiteLLM, telnyx и др.)

👉 Один заражённый пакет = полный доступ к инфраструктуре


Теперь правило №1:
• фиксируй версии (pin dependencies)
• проверяй хэши
• не доверяй последним релизам вслепую

Это уже не баги.
Это война за supply chain.

https://www.aikido.dev/blog/telnyx-pypi-compromised-teampcp-canisterworm

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
Media is too big
VIEW IN TELEGRAM
📢 Mistral выпустили Voxtral TTS - open-weight голосовую модель, которая метит в уровень ElevenLabs, но без платных ограничений

Главное:

- всего ~3B параметров - работает даже на ноутбуке
- скорость ~6x быстрее реального времени
- ~90 мс до первого звука
- ~3GB RAM после квантования
- 9 языков + клонирование голоса по 5 секундам аудио (даже между языками)

Как работает:

- 3.4B - понимает текст и планирует речь
- 390M - отвечает за ритм, произношение, интонацию
- 300M - превращает всё в финальный аудио сигнал

Такое разделение ускоряет модель и делает её легче, чем один большой монолит

По тестам:

- 62.8% предпочли её ElevenLabs Flash (дефолтные голоса)
- 69.9% - на кастомных голосах

https://mistral.ai/news/voxtral-tts

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥2
🔥 dots.ocr-1.5 — OCR-модель на 3B параметров от Rednote-hilab.
SOTA для мультиязычного парсинга документов — поддерживает практически любую систему письма.

📊 Elo 1089 на olmOCR-Bench и 1157 на XDocParse — выше, чем у GLM-OCR и PaddleOCR-VL-1.5
📄 На OmniDocBench (text edit 0.031) обгоняет Qwen3-VL-235B (0.069) и Gemini 2.5 Pro (0.075)
🎨 Может генерировать SVG-код для графиков, диаграмм и химических формул
🌐 Поддерживает парсинг веб-страниц, распознавание текста в сценах и подсчёт объектов
Работает через vLLM и запускается на одной GPU

🤖 Модель: https://modelscope.cn/models/rednote-hilab/dots.ocr-1.5

🔗 GitHub: https://github.com/rednote-hilab/dots.ocr

🎠 Демо: https://dotsocr.xiaohongshu.com

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥1
⚡️ Alibaba DAMO Academy (лаборатория, которая создала Qwen) открыла исходный код AgentScope - Python-фреймворка для построения систем из нескольких AI-агентов.

Чем он отличается от остальных:
Вы описываете задачу - система строит архитектуру сама. Планировщик, исследователь, программист, критик - каждый агент получает свои инструменты, память и логику рассуждений.

Они работают в связке и возвращают готовый результат.

Что внутри из коробки:
• Визуальный конструктор агентов, проектируете систему до написания кода
• Поддержка MCP-инструментов - подключаете любые внешние сервисы напрямую
• Встроенная память - агенты помнят контекст, решения и историю между сессиями
• RAG-конвейер - подключаете свои документы и базы знаний
• Модули рассуждений - агенты планируют, рефлексируют и исправляют ошибки без участия человека

Это фреймворк, где агент - первичная единица мышления с самого начала проектирования.

Лицензия: Apache 2.0. Полностью бесплатно.

https://github.com/agentscope-ai/agentscope

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🚀 Открытый радиолокационный комплекс AERIS-10

AERIS-10 — это модульная, доступная радиолокационная система с фазированной антенной решеткой, работающая на частоте 10.5 ГГц. Проект ориентирован на исследователей и разработчиков дронов, предлагая возможность экспериментов с обработкой сигналов и отслеживанием целей.

🚀 Основные моменты:
- Полностью открытое аппаратное и программное обеспечение
- Две версии: AERIS-10N (3 км) и AERIS-10X (20 км)
- Электронное управление направлением луча ±45°
- Интуитивно понятный интерфейс на Python с интеграцией карт
- Модульная архитектура для легкой настройки

📌 GitHub:

#python

@Python_Community_ru

https://github.com/NawfalMotii79/PLFM_RADAR
👎2🔥2
✔️ AutoAgent: агенты теперь улучшают себя сами

Вышла мощная open source библиотека для автономной самооптимизации AI-агентов. Мета-агент сам подбирает промпты, инструменты и оркестрацию - и занял #1 на SpreadsheetBench (96.5%) и TerminalBench (55.1%).

В процессе оптимизации агент сам придумал несколько трюков, которые никто не закладывал. Spot checking – запуск отдельных задач для маленьких правок вместо полного прогона, что сэкономило кучу compute.

Принудительные верификационные циклы - агент встроил детерминированные self-check-и и валидаторы, выделив бюджет на основную задачу и бонусные шаги для проверки.

Написание тестов - агент начал сам писать юнит-тесты под каждую задачу.

Progressive disclosure – при переполнении контекста агент начал дампить длинные данные в файлы. Оркестрация субагентов – при необходимости агент создавал task-specific субагентов и передавал им управление.

GitHub: https://github.com/kevinrgu/autoagent

Подробнее: https://uproger.com/autoagent-agenty-teper-uluchshayut-sebya-sami/

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥 Самый полный набор для Claude Code - выложили в open-source

27 агентов, 64 навыка, 33 команды + встроенный AgentShield с 1 282 тестами безопасности
Закрывает всё: планирование, код-ревью, фиксы, TDD, оптимизация токенов и многое другое
Работает в Cursor, OpenCode, Codex CLI - один репозиторий заменяет недели настройки, полностью бесплатно

Repo: https://github.com/affaan-m/everything-claude-code

@Python_Community_ru
🔊 Собрали жирный пак инструментов для работы со звуком - без облаков и подписок.

Что внутри:

Клонирование голоса, изменение тона и обработка аудио
Хватает 2–3 секунд записи, чтобы воспроизвести голос
Поддержка десятков языков: русский, английский, китайский
Сохраняется оригинальный тембр
Всё работает локально - никакие данные никуда не улетают
Запускается даже на слабом железе
Есть гайды под Docker и запуск через bash

Забирай, пока не разнесли.

https://github.com/0xSojalSec/free-voice-clone

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
Опенсорс-аналог Claude Cowork, который работает локально и бесплатно

Разработчики выкатили Rowboat - open-source ИИ-коворкер, который позиционируют как замену Claude Cowork от Anthropic. Работает полностью локально, на вашей машине, с любой LLM на выбор.

Из интересного: поддержка голоса, расширяемость через MCP-тулы, совместимость с Obsidian-хранилищами, фоновые агенты с веб-поиском и автоматическое построение графа знаний по вашим заметкам и письмам.

Anthropic, кажется, начинают окружать со всех сторон. Пока они строят закрытую экосистему, комьюнити собирает аналоги на коленке и раздает бесплатно.

github.com/rowboatlabs/rowboat

@Python_Community_ru
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 ElevenLabs получил open source конкурента

Mistral выкатили Voxtral и это выглядит как серьёзный заход в TTS.

Модель всего на 4B параметров. При этом даёт около 70 мс задержки, что уже подходит для голосовых агентов в реальном времени.

Поддерживает клонирование голоса буквально с нескольких секунд аудио. Плюс работает на 9 языках и умеет переносить голос между ними.

По бенчмаркам заявляют 68.4% побед против ElevenLabs Flash v2.5.

Ключевой момент здесь не только в качестве. Веса открыты и доступны на Hugging Face.

Это значит, что TTS снова уходит из SaaS в инфраструктуру. Голос можно разворачивать локально, кастомизировать и встраивать без ограничений.

Для тех, кто делает voice agents, это сильный сдвиг. Контроль над голосом теперь можно держать у себя.

https://huggingface.co/mistralai/Voxtral-4B-TTS-2603

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru