Python Community
11.9K subscribers
1.39K photos
114 videos
15 files
915 links
Python Community RU - СНГ сообщество Python-разработчиков

Чат канала: @python_community_chat

Сотрудничество: @cyberJohnny и @Sergey_bzd

РКН реестр:
https://knd.gov.ru/license?id=67847dd98e552d6b54a511ed&registryType=bloggersPermission
Download Telegram
Media is too big
VIEW IN TELEGRAM
📢 Mistral выпустили Voxtral TTS - open-weight голосовую модель, которая метит в уровень ElevenLabs, но без платных ограничений

Главное:

- всего ~3B параметров - работает даже на ноутбуке
- скорость ~6x быстрее реального времени
- ~90 мс до первого звука
- ~3GB RAM после квантования
- 9 языков + клонирование голоса по 5 секундам аудио (даже между языками)

Как работает:

- 3.4B - понимает текст и планирует речь
- 390M - отвечает за ритм, произношение, интонацию
- 300M - превращает всё в финальный аудио сигнал

Такое разделение ускоряет модель и делает её легче, чем один большой монолит

По тестам:

- 62.8% предпочли её ElevenLabs Flash (дефолтные голоса)
- 69.9% - на кастомных голосах

https://mistral.ai/news/voxtral-tts

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥2
🔥 dots.ocr-1.5 — OCR-модель на 3B параметров от Rednote-hilab.
SOTA для мультиязычного парсинга документов — поддерживает практически любую систему письма.

📊 Elo 1089 на olmOCR-Bench и 1157 на XDocParse — выше, чем у GLM-OCR и PaddleOCR-VL-1.5
📄 На OmniDocBench (text edit 0.031) обгоняет Qwen3-VL-235B (0.069) и Gemini 2.5 Pro (0.075)
🎨 Может генерировать SVG-код для графиков, диаграмм и химических формул
🌐 Поддерживает парсинг веб-страниц, распознавание текста в сценах и подсчёт объектов
Работает через vLLM и запускается на одной GPU

🤖 Модель: https://modelscope.cn/models/rednote-hilab/dots.ocr-1.5

🔗 GitHub: https://github.com/rednote-hilab/dots.ocr

🎠 Демо: https://dotsocr.xiaohongshu.com

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥1
⚡️ Alibaba DAMO Academy (лаборатория, которая создала Qwen) открыла исходный код AgentScope - Python-фреймворка для построения систем из нескольких AI-агентов.

Чем он отличается от остальных:
Вы описываете задачу - система строит архитектуру сама. Планировщик, исследователь, программист, критик - каждый агент получает свои инструменты, память и логику рассуждений.

Они работают в связке и возвращают готовый результат.

Что внутри из коробки:
• Визуальный конструктор агентов, проектируете систему до написания кода
• Поддержка MCP-инструментов - подключаете любые внешние сервисы напрямую
• Встроенная память - агенты помнят контекст, решения и историю между сессиями
• RAG-конвейер - подключаете свои документы и базы знаний
• Модули рассуждений - агенты планируют, рефлексируют и исправляют ошибки без участия человека

Это фреймворк, где агент - первичная единица мышления с самого начала проектирования.

Лицензия: Apache 2.0. Полностью бесплатно.

https://github.com/agentscope-ai/agentscope

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🚀 Открытый радиолокационный комплекс AERIS-10

AERIS-10 — это модульная, доступная радиолокационная система с фазированной антенной решеткой, работающая на частоте 10.5 ГГц. Проект ориентирован на исследователей и разработчиков дронов, предлагая возможность экспериментов с обработкой сигналов и отслеживанием целей.

🚀 Основные моменты:
- Полностью открытое аппаратное и программное обеспечение
- Две версии: AERIS-10N (3 км) и AERIS-10X (20 км)
- Электронное управление направлением луча ±45°
- Интуитивно понятный интерфейс на Python с интеграцией карт
- Модульная архитектура для легкой настройки

📌 GitHub:

#python

@Python_Community_ru

https://github.com/NawfalMotii79/PLFM_RADAR
👎2🔥2
✔️ AutoAgent: агенты теперь улучшают себя сами

Вышла мощная open source библиотека для автономной самооптимизации AI-агентов. Мета-агент сам подбирает промпты, инструменты и оркестрацию - и занял #1 на SpreadsheetBench (96.5%) и TerminalBench (55.1%).

В процессе оптимизации агент сам придумал несколько трюков, которые никто не закладывал. Spot checking – запуск отдельных задач для маленьких правок вместо полного прогона, что сэкономило кучу compute.

Принудительные верификационные циклы - агент встроил детерминированные self-check-и и валидаторы, выделив бюджет на основную задачу и бонусные шаги для проверки.

Написание тестов - агент начал сам писать юнит-тесты под каждую задачу.

Progressive disclosure – при переполнении контекста агент начал дампить длинные данные в файлы. Оркестрация субагентов – при необходимости агент создавал task-specific субагентов и передавал им управление.

GitHub: https://github.com/kevinrgu/autoagent

Подробнее: https://uproger.com/autoagent-agenty-teper-uluchshayut-sebya-sami/

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥 Самый полный набор для Claude Code - выложили в open-source

27 агентов, 64 навыка, 33 команды + встроенный AgentShield с 1 282 тестами безопасности
Закрывает всё: планирование, код-ревью, фиксы, TDD, оптимизация токенов и многое другое
Работает в Cursor, OpenCode, Codex CLI - один репозиторий заменяет недели настройки, полностью бесплатно

Repo: https://github.com/affaan-m/everything-claude-code

@Python_Community_ru
🔊 Собрали жирный пак инструментов для работы со звуком - без облаков и подписок.

Что внутри:

Клонирование голоса, изменение тона и обработка аудио
Хватает 2–3 секунд записи, чтобы воспроизвести голос
Поддержка десятков языков: русский, английский, китайский
Сохраняется оригинальный тембр
Всё работает локально - никакие данные никуда не улетают
Запускается даже на слабом железе
Есть гайды под Docker и запуск через bash

Забирай, пока не разнесли.

https://github.com/0xSojalSec/free-voice-clone

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
Опенсорс-аналог Claude Cowork, который работает локально и бесплатно

Разработчики выкатили Rowboat - open-source ИИ-коворкер, который позиционируют как замену Claude Cowork от Anthropic. Работает полностью локально, на вашей машине, с любой LLM на выбор.

Из интересного: поддержка голоса, расширяемость через MCP-тулы, совместимость с Obsidian-хранилищами, фоновые агенты с веб-поиском и автоматическое построение графа знаний по вашим заметкам и письмам.

Anthropic, кажется, начинают окружать со всех сторон. Пока они строят закрытую экосистему, комьюнити собирает аналоги на коленке и раздает бесплатно.

github.com/rowboatlabs/rowboat

@Python_Community_ru
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 ElevenLabs получил open source конкурента

Mistral выкатили Voxtral и это выглядит как серьёзный заход в TTS.

Модель всего на 4B параметров. При этом даёт около 70 мс задержки, что уже подходит для голосовых агентов в реальном времени.

Поддерживает клонирование голоса буквально с нескольких секунд аудио. Плюс работает на 9 языках и умеет переносить голос между ними.

По бенчмаркам заявляют 68.4% побед против ElevenLabs Flash v2.5.

Ключевой момент здесь не только в качестве. Веса открыты и доступны на Hugging Face.

Это значит, что TTS снова уходит из SaaS в инфраструктуру. Голос можно разворачивать локально, кастомизировать и встраивать без ограничений.

Для тех, кто делает voice agents, это сильный сдвиг. Контроль над голосом теперь можно держать у себя.

https://huggingface.co/mistralai/Voxtral-4B-TTS-2603

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🚨 Без этого репо ты используешь Claude Code на 10%

Практически все, кто реально работает с Claude Code, уже сидят на claude-code-best-practice. Остальные просто не выжимают и половины возможностей.

Это не очередной список советов, а собранная база практики: 84 конкретных приёма, примеры внедрения и разбор того, как строят workflow топовые пользователи.

Внутри разложено всё, что обычно собираешь по кускам:

промптинг, планирование, CLAUDE.md, агенты, команды, skills, hooks, дебаг, утилиты
реальные примеры использования каждой ключевой фичи
сравнение подходов из крупных репозиториев и методологий
оркестрация через цепочку Command → Agent → Skill
советы Бориса Черны, собранные из тредов и интервью

Есть и практические вещи, которые реально меняют работу:

• использование subagents, чтобы разгружать контекст и ускорять задачи
• второй Claude как ревьюер перед выполнением плана
• контроль размера CLAUDE.md, чтобы модель не деградировала
• ручное управление контекстом через /compact
• переписывание решений «с нуля», когда уже понял задачу глубже

Отдельно - блок с открытыми вопросами, на которые до сих пор нет нормального ответа. Это уже уровень, где начинается настоящая инженерия вокруг Claude Code.

Репозиторий залетел в топ GitHub, почти 20K звёзд и активно растёт.

https://github.com/shanraisshan/claude-code-best-practice

@Python_Community_ru
👍1
🚀 OpenGauss: Умный оркестратор для Lean-работ

OpenGauss - это инструмент для управления рабочими процессами в Lean, позволяющий эффективно организовывать задачи, такие как доказательства и формализация. Он интегрирует несколько агентов и упрощает взаимодействие с Lean-экосистемой через удобный CLI.

🚀Основные моменты:
- Многоагентная архитектура для Lean-работ
- Поддержка различных рабочих процессов: prove, draft, autoprove
- Удобное управление проектами и сессиями
- Интеграция с Lean tooling и MCP/LSP

📌 GitHub: https://github.com/math-inc/OpenGauss

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Claude Code получил open-source инструмент, который снимает лимиты использования и не даёт ему останавливаться посреди задачи.

47 000+ звёзд, бесплатно, и уже называют чит-кодом для power-пользователей.

https://github.com/thedotmack/claude-mem

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🔊 В опенсорс вышел самый лёгкий и доступный генератор речи - MOSS-TTS-Nano работает локально на любом процессоре даже без видеокарты.
Ультралёгкий TTS, который можно гонять хоть на тостере - MOSS-TTS.

Это не «демка на поиграться», а нормальный инструмент: запускается на обычном 4-ядерном CPU, тянется даже на уровне Raspberry Pi и при этом выдаёт живую речь без ощутимой задержки.

Модель крошечная - около 100 млн параметров, но звук на уровне: до 48 кГц и вполне чистая озвучка.

Лучше всего справляется с английским, но русский тоже поддерживает.

Умеет не только короткие фразы. Спокойно читает длинные тексты и может клонировать голос, что открывает кучу сценариев - от ботов до локальных ассистентов.

Фактически это TTS, который не требует ни облака, ни GPU, ни сложной инфраструктуры. Запустил и используешь.

https://github.com/OpenMOSS/MOSS-TTS-Nano

Демо: https://huggingface.co/spaces/OpenMOSS-Team/MOSS-TTS-Nano

@Python_Community_ru
Продвинутый совет по Django:

Не тащи бизнес-логику в views и serializers. Выноси её в отдельный service layer.

Пока проект маленький, удобно писать всё прямо во view: получил request, дёрнул ORM, что-то посчитал, сохранил, отправил ответ.

Но как только появляются повторяющиеся сценарии, несколько точек входа, celery-задачи, admin, API и тесты, код начинает расползаться.

Хороший паттерн такой:
• view отвечает только за HTTP,
• serializer за валидацию,
• model за данные,
• а вся бизнес-логика живёт в services.

Пример:


# services/order_service.py

from django.db import transaction
from .models import Order, OrderItem

class OrderService:
@staticmethod
@transaction.atomic
def create_order(*, user, items_data):
order = Order.objects.create(user=user, status="new")

order_items = [
OrderItem(
order=order,
product_id=item["product_id"],
quantity=item["quantity"],
price=item["price"],
)
for item in items_data
]
OrderItem.objects.bulk_create(order_items)

return order

Во view тогда остаётся только это:


def create_order_view(request):
serializer = OrderCreateSerializer(data=request.data)
serializer.is_valid(raise_exception=True)

order = OrderService.create_order(
user=request.user,
items_data=serializer.validated_data["items"],
)

return Response({"order_id": order.id})


Что это даёт: код проще тестировать, логика не дублируется, её можно использовать в API, admin и background jobs, и становится меньше шансов сломать что-то при росте проекта.

Django-проект становится серьезнее в тот момент, когда ты перестаёшь писать всё во views.

🐍 Python полезные ресурсы ( )

@Python_Community_ru
Когда я прошу Клода провести проверку кода

@Python_Community_ru
🔥2
🚀 Автономные исследования на Apple Silicon

Порт Karpathy's autoresearch для Apple Silicon, использующий MLX. Проект реализует автономные исследовательские циклы с фиксированным временем и управлением через program.md. Основные файлы включают train.py для обучения и prepare.py для подготовки данных.

🚀 Основные моменты:
- Нативная поддержка Apple Silicon без PyTorch/CUDA
- Фиксированный 5-минутный бюджет на обучение
- Логирование результатов в results.tsv
- Простая структура для автономного эксперимента
- Оптимизация моделей для повышения эффективности

📌 GitHub: https://github.com/trevin-creator/autoresearch-mlx

#python

@Python_Community_ru