Python Community

⚡️ Языки программирования и их for-циклы

Ты когда-нибудь замечал, что почти все языки программирования выглядят по-разному, но внутри делают одно и то же?

Самый простой пример — обычный цикл. В Python он читается почти как английский. В C, Java и Go он выглядит как строгая формула. В Rust и Kotlin больше похож на математическую запись. А в Assembly это вообще набор инструкций для процессора.

Но смысл всегда один и тот же. Мы просто говорим компьютеру: повтори действие N раз.

• 🐍 Python - for i in range(n):
• ☕ Java - for(int i=0;i

@Python_Community_ru

1.01K views08:25

Python Community

‍🔥 Вышла модель Qwen-Image-Layered-Control-V2

Новая версия инструмента для извлечения слоёв из изображений с управлением через кисть. Модель построена поверх оригинальной Qwen-Image-Layered-Control и позволяет точнее выделять элементы на иллюстрациях и постерах.

Теперь можно управлять слоями прямо на изображении:

Красная кисть показывает какой слой нужно извлечь.
Зелёная кисть отмечает что нужно удалить.
Если области пересекаются, они отображаются жёлтым.

Также продолжает работать текстовое управление:
prompt — описывает, что нужно извлечь.
negative_prompt — что нужно исключить.

Кисти и текст можно свободно комбинировать, что даёт больше контроля при работе со слоями.

Рекомендуемые настройки: около 10 шагов инференса.
Если используется управление кистью, можно поставить cfg_scale=1, чтобы значительно ускорить генерацию.

Лучше всего модель работает с постерами и иллюстрациями, где объекты изначально разделены на слои. Для фотографий с тенями и сложным освещением она не предназначена.

Модель обучена на датасете PrismLayersPro и распространяется как LoRA, которая загружается поверх базовой версии V1.

🟢Model: https://modelscope.ai/models/DiffSynth-Studio/Qwen-Image-Layered-Control-V2
🟢Dataset: https://modelscope.cn/datasets/artplus/PrismLayersPro
🟢GitHub: https://github.com/modelscope/DiffSynth-Studio

@Python_Community_ru

1.2K views14:21

Python Community

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

👎2

1.11K views07:59

Python Community

@Python_Community_ru

899 viewsedited 13:52

Python Community

🐍 Почему ошибки валидации в Python иногда так сложно найти

Чем глубже вложена структура данных, тем сложнее понять, где именно произошла ошибка.

Если использовать обычные dataclass, вы чаще всего увидите только значение, которое не прошло проверку — но не путь к полю, где возникла проблема.

В сложных вложенных структурах это превращает отладку в настоящую боль.

Pydantic решает эту проблему.

Он показывает полный путь до поля, которое вызвало ошибку — от корневой модели до конкретного атрибута.

В результате сразу понятно, где искать проблему.

Пример:

from pydantic import BaseModel, Field

class Address(BaseModel):
zip_code: str = Field(pattern=r"^\d{5}$")

class Customer(BaseModel):
name: str
address: Address

customer = Customer(
name="Alice",
address={"zip_code": "9ABC1"}
)

Ошибка будет выглядеть так:

ValidationError: address.zip_code
String should match pattern '^\d{5}$'

То есть Pydantic сразу показывает:

address.zip_code

А не просто сообщает, что «где-то внутри данных ошибка».

Для сложных JSON, API-ответов и вложенных моделей это сильно упрощает дебаг.

#Python #Pydantic #Backend #DataValidation

@Python_Community_ru

844 viewsedited 07:49

Python Community

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

750 views07:49

Python Community

‍🖥 ByteDance только что выпустили в открытый доступ - OpenViking, и этот проект показывает, что именно не так с тем, как сегодня строят память для AI-агентов.

Вот где большинство агент-фреймворков ошибаются:

Память хранится в одном месте.
Ресурсы — в другом.
Навыки разбросаны по системе.

Когда агенту нужен контекст, обычно делают плоский векторный поиск и просто надеются на лучший результат.

Именно это и проблема. OpenViking решает её одной идеей:
рассматривать контекст агента как файловую систему.

Всё работает через единый протокол:

viking://

Память, ресурсы и навыки организованы как директории с уникальными URI.
Агент может ls, find и навигировать по контексту, как разработчик в терминале.

Главный прорыв — многоуровневая загрузка контекста:

- L0 — одно предложение для быстрого поиска
- L1 — обзор ~2000 токенов для принятия решений
- L2 — полные детали, загружаются только когда действительно нужны

Большинство агентов просто загружает всё в контекст и надеется на лучшее.

OpenViking загружает только нужные данные и только в нужный момент.

Результат:

- меньше расходов на токены
- выше точность
- быстрее работа агентов

Retrieval теперь тоже работает логичнее.

Вместо одного плоского семантического поиска:

1. сначала происходит позиционирование на уровне директорий
2. затем рекурсивный поиск внутри наиболее релевантных директорий

Можно буквально видеть траекторию поиска — это больше не чёрный ящик.

Есть и механизм самоэволюции агента.

В конце каждой сессии система автоматически:

- извлекает новые знания
- обновляет память агента
- обновляет память пользователя

То есть агент становится умнее с каждым использованием.

Проект уже имеет:

- 9K звёзд на GitHub
- 13 контрибьюторов

Разработан командой ByteDance Viking, которая строит инфраструктуру векторного поиска с 2019 года.

Проект полностью open-source под лицензией Apache 2.0.

https://github.com/volcengine/OpenViking

@Python_Community_ru

700 viewsedited 13:42

Python Community

🤖 Python библиотеки для AI-агентов — что изучать

Если вы хотите разрабатывать AI-агентов на Python, важно понимать порядок изучения библиотек.

Начните с LangChain, CrewAI или SmolAgents — они позволяют быстро собрать простых агентов, подключить инструменты и протестировать идеи.

Следующий уровень — LangGraph, LlamaIndex и Semantic Kernel. Эти инструменты уже используются для production-систем: RAG, orchestration и сложные workflow.

Самый сложный уровень — AutoGen, DSPy и A2A. Они нужны для автономных мультиагентных систем и оптимизации LLM-пайплайнов.

LangChain — простые агенты, инструменты и память
github.com/langchain-ai/langchain

CrewAI — мультиагентные системы с ролями
github.com/joaomdmoura/crewAI

SmolAgents — лёгкие агенты для быстрых экспериментов
github.com/huggingface/smolagents

LangGraph — orchestration и stateful workflow
github.com/langchain-ai/langgraph

LlamaIndex — RAG и knowledge-агенты
github.com/run-llama/llama_index

Semantic Kernel — AI workflow и плагины
github.com/microsoft/semantic-kernel

AutoGen — автономные мультиагентные системы
github.com/microsoft/autogen

DSPy — оптимизация LLM-пайплайнов
github.com/stanfordnlp/dspy

A2A — протокол взаимодействия между агентами
github.com/a2aproject/A2A

@Python_Community_ru

GitHub

GitHub - langchain-ai/langchain: The agent engineering platform.

The agent engineering platform. Contribute to langchain-ai/langchain development by creating an account on GitHub.

870 viewsedited 13:37

Python Community

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

829 views13:37

Python Community

Cua (https://github.com/trycua/cua) — это Docker для агентов, использующих компьютер — он позволяет агентам ИИ управлять полноценными операционными системами в виртуальных контейнерах и развертывать их локально или в облаке.

— Всего ~1,000 строк кода — легко читать, расширять и встраивать
— Поддержка OpenAI, Anthropic, Mistral и других LLM-провайдеров

https://github.com/trycua/cua

@Python_Community_ru

835 viewsedited 19:36

Python Community

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Себастьян Рашка собрал в одном месте галерею архитектур современных языковых моделей.

Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok.

Для каждой модели есть:

• наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации

По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры.

https://sebastianraschka.com/llm-architecture-gallery/

@Python_Community_ru

🤔1

895 viewsedited 13:33

Python Community

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Автономный помощник для подачи заявок на работу

ApplyPilot - это мощный инструмент для автоматизации процесса подачи заявок на работу. Он ищет вакансии на нескольких платформах, оценивает их с помощью ИИ, адаптирует ваше резюме и отправляет заявки без вашего участия. Просто настройте один раз и позвольте системе работать за вас.

🚀 Основные моменты:
- Полная автоматизация подачи заявок на работу
- Оценка вакансий по соответствию вашему резюме
- Генерация адаптированных резюме и сопроводительных писем
- Поддержка множества платформ для поиска вакансий
- Открытый исходный код и бесплатный доступ к API

📌 GitHub: https://github.com/Pickle-Pixel/ApplyPilot

@Python_Community_ru

927 viewsedited 13:25

Python Community

🛰 Shadowbroker: Реальное геопространственное разведывательное решение

Shadowbroker — это платформа для анализа открытых источников, которая в реальном времени агрегирует данные о глобальных событиях, таких как авиаперелеты, морское движение, спутники и конфликты. Идеально подходит для аналитиков и исследователей, желающих получить целостный обзор мировых событий на едином интерфейсе.

🚀Основные моменты:
- Отслеживание частных и коммерческих авиарейсов
- Мониторинг морского трафика и военных кораблей
- Геолокация спутников и анализ их миссий
- Информация о глобальных конфликтах и событиях
- Доступ к CCTV и сигналам GPS в реальном времени

📌 GitHub: https://github.com/BigBodyCobain/Shadowbroker

@Python_Community_ru

904 viewsedited 13:16

Python Community

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 Open-source прорыв: PrismAudio

Вышла модель PrismAudio и она уже забирает SOTA в генерации аудио из видео (V2A)

Что важно:

- 518M модель, принята на ICLR 2026
- обходит все аналоги по качеству звука
- быстрее конкурентов: ~0.63s на инференс

Главная фишка:

модель думает не одним блоком, а разбивает задачу на 4 части:

- смысл (что происходит)
- время (когда звучит)
- эстетика (как звучит)
- пространство (где звучит)

И обучается через RL прямо внутри этого процесса

Результат:

- топ по всем метрикам (CLAP, MOS и др.)
- лучше MMAudio, ThinkSound и HunyuanVideo
- стабильно работает даже вне обучающего датасета

Плюс: выпустили новый бенчмарк AudioCanvas - 800+ сценариев со звуками

Model: https://modelscope.ai/models/iic/PrismAudio
Demo: https://modelscope.cn/studios/iic/PrismAudio
Paper: https://modelscope.ai/papers/2511.18833
GitHub: https://github.com/FunAudioLLM/ThinkSound/tree/prismaudio

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

🔥2

833 views13:04

Python Community

Прости нас, Планктон

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

764 views13:00

Python Community

💻 Claude Computer - полезная шпаргалка

Как включить:

1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use

Примеры работы:

✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]

✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками

✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии

Claude Computer - мощный и простой в настройке исполнитель задач

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

720 views06:57

Python Community

🌟🚀 LongCat-Next: Мультимодальная модель нового поколения

LongCat-Next — это мощная мультимодальная модель, объединяющая текст, визуальные и аудио данные в едином фрейме. Она демонстрирует выдающиеся результаты на различных задачах, превосходя традиционные подходы к представлению данных. Открытый исходный код модели способствует развитию исследований в этой области.

🚀Основные моменты:
- Объединяет текст, визуальные и аудио данные в одном фрейме.
- Использует новый подход DiNA для упрощения мультимодального моделирования.
- Внедряет иерархические дискретные токены для улучшенного представления.
- Обеспечивает высокую производительность в задачах понимания и генерации.

📌 GitHub: https://github.com/meituan-longcat/LongCat-Next

#python

@Python_Community_ru

801 views18:55

Python Community

‍🚨 PyPI снова взломали. Теперь под ударом пакет telnyx

Очередной удар по supply chain от TeamPCP. И это уже не единичный случай - это целая атака по экосистеме разработчиков.

Что произошло:
• Популярный Python-пакет telnyx на PyPI был скомпрометирован
• Вредоносный код внедрили прямо в официальные версии
• Payload срабатывает при обычном import — без действий пользователя

Что делает malware:
• крадёт SSH-ключи, токены, .env, криптокошельки
• шифрует и отправляет данные на сервер злоумышленников
• закрепляется в системе (persistency)
• может распространяться дальше по инфраструктуре

Это не просто вредоносный пакет - это полноценаая атака:

1. Сначала взломали Trivy (инструмент безопасности)
2. Через него украли токены CI/CD
3. Затем заразили npm (CanisterWorm)
4. Потом PyPI (LiteLLM, telnyx и др.)

👉 Один заражённый пакет = полный доступ к инфраструктуре

Теперь правило №1:
• фиксируй версии (pin dependencies)
• проверяй хэши
• не доверяй последним релизам вслепую

Это уже не баги.
Это война за supply chain.

https://www.aikido.dev/blog/telnyx-pypi-compromised-teampcp-canisterworm

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

816 views12:51

📢 Mistral выпустили Voxtral TTS - open-weight голосовую модель, которая метит в уровень ElevenLabs, но без платных ограничений

Главное:

- всего ~3B параметров - работает даже на ноутбуке
- скорость ~6x быстрее реального времени
- ~90 мс до первого звука
- ~3GB RAM после квантования
- 9 языков + клонирование голоса по 5 секундам аудио (даже между языками)

Как работает:

- 3.4B - понимает текст и планирует речь
- 390M - отвечает за ритм, произношение, интонацию
- 300M - превращает всё в финальный аудио сигнал

Такое разделение ускоряет модель и делает её легче, чем один большой монолит

По тестам:

- 62.8% предпочли её ElevenLabs Flash (дефолтные голоса)
- 69.9% - на кастомных голосах

https://mistral.ai/news/voxtral-tts

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

🔥2

948 views12:47

Python Community

🔥 dots.ocr-1.5 — OCR-модель на 3B параметров от Rednote-hilab.
SOTA для мультиязычного парсинга документов — поддерживает практически любую систему письма.

📊 Elo 1089 на olmOCR-Bench и 1157 на XDocParse — выше, чем у GLM-OCR и PaddleOCR-VL-1.5
📄 На OmniDocBench (text edit 0.031) обгоняет Qwen3-VL-235B (0.069) и Gemini 2.5 Pro (0.075)
🎨 Может генерировать SVG-код для графиков, диаграмм и химических формул
🌐 Поддерживает парсинг веб-страниц, распознавание текста в сценах и подсчёт объектов
⚡ Работает через vLLM и запускается на одной GPU

🤖 Модель: https://modelscope.cn/models/rednote-hilab/dots.ocr-1.5

🔗 GitHub: https://github.com/rednote-hilab/dots.ocr

🎠 Демо: https://dotsocr.xiaohongshu.com

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru

🔥1

845 views12:38

About

Blog

Apps

Platform