This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Языки программирования и их for-циклы
Ты когда-нибудь замечал, что почти все языки программирования выглядят по-разному, но внутри делают одно и то же?
Самый простой пример — обычный цикл. В Python он читается почти как английский. В C, Java и Go он выглядит как строгая формула. В Rust и Kotlin больше похож на математическую запись. А в Assembly это вообще набор инструкций для процессора.
Но смысл всегда один и тот же. Мы просто говорим компьютеру: повтори действие N раз.
• 🐍 Python - for i in range(n):
• ☕ Java - for(int i=0;i
@Python_Community_ru
Ты когда-нибудь замечал, что почти все языки программирования выглядят по-разному, но внутри делают одно и то же?
Самый простой пример — обычный цикл. В Python он читается почти как английский. В C, Java и Go он выглядит как строгая формула. В Rust и Kotlin больше похож на математическую запись. А в Assembly это вообще набор инструкций для процессора.
Но смысл всегда один и тот же. Мы просто говорим компьютеру: повтори действие N раз.
• 🐍 Python - for i in range(n):
• ☕ Java - for(int i=0;i
@Python_Community_ru
🔥 Вышла модель Qwen-Image-Layered-Control-V2
Новая версия инструмента для извлечения слоёв из изображений с управлением через кисть. Модель построена поверх оригинальной Qwen-Image-Layered-Control и позволяет точнее выделять элементы на иллюстрациях и постерах.
Теперь можно управлять слоями прямо на изображении:
Красная кисть показывает какой слой нужно извлечь.
Зелёная кисть отмечает что нужно удалить.
Если области пересекаются, они отображаются жёлтым.
Также продолжает работать текстовое управление:
prompt — описывает, что нужно извлечь.
negative_prompt — что нужно исключить.
Кисти и текст можно свободно комбинировать, что даёт больше контроля при работе со слоями.
Рекомендуемые настройки: около 10 шагов инференса.
Если используется управление кистью, можно поставить cfg_scale=1, чтобы значительно ускорить генерацию.
Лучше всего модель работает с постерами и иллюстрациями, где объекты изначально разделены на слои. Для фотографий с тенями и сложным освещением она не предназначена.
Модель обучена на датасете PrismLayersPro и распространяется как LoRA, которая загружается поверх базовой версии V1.
🟢Model: https://modelscope.ai/models/DiffSynth-Studio/Qwen-Image-Layered-Control-V2
🟢Dataset: https://modelscope.cn/datasets/artplus/PrismLayersPro
🟢GitHub: https://github.com/modelscope/DiffSynth-Studio
@Python_Community_ru
Новая версия инструмента для извлечения слоёв из изображений с управлением через кисть. Модель построена поверх оригинальной Qwen-Image-Layered-Control и позволяет точнее выделять элементы на иллюстрациях и постерах.
Теперь можно управлять слоями прямо на изображении:
Красная кисть показывает какой слой нужно извлечь.
Зелёная кисть отмечает что нужно удалить.
Если области пересекаются, они отображаются жёлтым.
Также продолжает работать текстовое управление:
prompt — описывает, что нужно извлечь.
negative_prompt — что нужно исключить.
Кисти и текст можно свободно комбинировать, что даёт больше контроля при работе со слоями.
Рекомендуемые настройки: около 10 шагов инференса.
Если используется управление кистью, можно поставить cfg_scale=1, чтобы значительно ускорить генерацию.
Лучше всего модель работает с постерами и иллюстрациями, где объекты изначально разделены на слои. Для фотографий с тенями и сложным освещением она не предназначена.
Модель обучена на датасете PrismLayersPro и распространяется как LoRA, которая загружается поверх базовой версии V1.
🟢Model: https://modelscope.ai/models/DiffSynth-Studio/Qwen-Image-Layered-Control-V2
🟢Dataset: https://modelscope.cn/datasets/artplus/PrismLayersPro
🟢GitHub: https://github.com/modelscope/DiffSynth-Studio
@Python_Community_ru
🐍 Почему ошибки валидации в Python иногда так сложно найти
Чем глубже вложена структура данных, тем сложнее понять, где именно произошла ошибка.
Если использовать обычные dataclass, вы чаще всего увидите только значение, которое не прошло проверку — но не путь к полю, где возникла проблема.
В сложных вложенных структурах это превращает отладку в настоящую боль.
Pydantic решает эту проблему.
Он показывает полный путь до поля, которое вызвало ошибку — от корневой модели до конкретного атрибута.
В результате сразу понятно, где искать проблему.
Пример:
from pydantic import BaseModel, Field
class Address(BaseModel):
zip_code: str = Field(pattern=r"^\d{5}$")
class Customer(BaseModel):
name: str
address: Address
customer = Customer(
name="Alice",
address={"zip_code": "9ABC1"}
)
Ошибка будет выглядеть так:
ValidationError: address.zip_code
String should match pattern '^\d{5}$'
То есть Pydantic сразу показывает:
address.zip_code
А не просто сообщает, что «где-то внутри данных ошибка».
Для сложных JSON, API-ответов и вложенных моделей это сильно упрощает дебаг.
#Python #Pydantic #Backend #DataValidation
@Python_Community_ru
Чем глубже вложена структура данных, тем сложнее понять, где именно произошла ошибка.
Если использовать обычные dataclass, вы чаще всего увидите только значение, которое не прошло проверку — но не путь к полю, где возникла проблема.
В сложных вложенных структурах это превращает отладку в настоящую боль.
Pydantic решает эту проблему.
Он показывает полный путь до поля, которое вызвало ошибку — от корневой модели до конкретного атрибута.
В результате сразу понятно, где искать проблему.
Пример:
from pydantic import BaseModel, Field
class Address(BaseModel):
zip_code: str = Field(pattern=r"^\d{5}$")
class Customer(BaseModel):
name: str
address: Address
customer = Customer(
name="Alice",
address={"zip_code": "9ABC1"}
)
Ошибка будет выглядеть так:
ValidationError: address.zip_code
String should match pattern '^\d{5}$'
То есть Pydantic сразу показывает:
address.zip_code
А не просто сообщает, что «где-то внутри данных ошибка».
Для сложных JSON, API-ответов и вложенных моделей это сильно упрощает дебаг.
#Python #Pydantic #Backend #DataValidation
@Python_Community_ru
🖥 ByteDance только что выпустили в открытый доступ - OpenViking, и этот проект показывает, что именно не так с тем, как сегодня строят память для AI-агентов.
Вот где большинство агент-фреймворков ошибаются:
Память хранится в одном месте.
Ресурсы — в другом.
Навыки разбросаны по системе.
Когда агенту нужен контекст, обычно делают плоский векторный поиск и просто надеются на лучший результат.
Именно это и проблема. OpenViking решает её одной идеей:
рассматривать контекст агента как файловую систему.
Всё работает через единый протокол:
viking://
Память, ресурсы и навыки организованы как директории с уникальными URI.
Агент может ls, find и навигировать по контексту, как разработчик в терминале.
Главный прорыв — многоуровневая загрузка контекста:
- L0 — одно предложение для быстрого поиска
- L1 — обзор ~2000 токенов для принятия решений
- L2 — полные детали, загружаются только когда действительно нужны
Большинство агентов просто загружает всё в контекст и надеется на лучшее.
OpenViking загружает только нужные данные и только в нужный момент.
Результат:
- меньше расходов на токены
- выше точность
- быстрее работа агентов
Retrieval теперь тоже работает логичнее.
Вместо одного плоского семантического поиска:
1. сначала происходит позиционирование на уровне директорий
2. затем рекурсивный поиск внутри наиболее релевантных директорий
Можно буквально видеть траекторию поиска — это больше не чёрный ящик.
Есть и механизм самоэволюции агента.
В конце каждой сессии система автоматически:
- извлекает новые знания
- обновляет память агента
- обновляет память пользователя
То есть агент становится умнее с каждым использованием.
Проект уже имеет:
- 9K звёзд на GitHub
- 13 контрибьюторов
Разработан командой ByteDance Viking, которая строит инфраструктуру векторного поиска с 2019 года.
Проект полностью open-source под лицензией Apache 2.0.
https://github.com/volcengine/OpenViking
@Python_Community_ru
Вот где большинство агент-фреймворков ошибаются:
Память хранится в одном месте.
Ресурсы — в другом.
Навыки разбросаны по системе.
Когда агенту нужен контекст, обычно делают плоский векторный поиск и просто надеются на лучший результат.
Именно это и проблема. OpenViking решает её одной идеей:
рассматривать контекст агента как файловую систему.
Всё работает через единый протокол:
viking://
Память, ресурсы и навыки организованы как директории с уникальными URI.
Агент может ls, find и навигировать по контексту, как разработчик в терминале.
Главный прорыв — многоуровневая загрузка контекста:
- L0 — одно предложение для быстрого поиска
- L1 — обзор ~2000 токенов для принятия решений
- L2 — полные детали, загружаются только когда действительно нужны
Большинство агентов просто загружает всё в контекст и надеется на лучшее.
OpenViking загружает только нужные данные и только в нужный момент.
Результат:
- меньше расходов на токены
- выше точность
- быстрее работа агентов
Retrieval теперь тоже работает логичнее.
Вместо одного плоского семантического поиска:
1. сначала происходит позиционирование на уровне директорий
2. затем рекурсивный поиск внутри наиболее релевантных директорий
Можно буквально видеть траекторию поиска — это больше не чёрный ящик.
Есть и механизм самоэволюции агента.
В конце каждой сессии система автоматически:
- извлекает новые знания
- обновляет память агента
- обновляет память пользователя
То есть агент становится умнее с каждым использованием.
Проект уже имеет:
- 9K звёзд на GitHub
- 13 контрибьюторов
Разработан командой ByteDance Viking, которая строит инфраструктуру векторного поиска с 2019 года.
Проект полностью open-source под лицензией Apache 2.0.
https://github.com/volcengine/OpenViking
@Python_Community_ru
🤖 Python библиотеки для AI-агентов — что изучать
Если вы хотите разрабатывать AI-агентов на Python, важно понимать порядок изучения библиотек.
Начните с LangChain, CrewAI или SmolAgents — они позволяют быстро собрать простых агентов, подключить инструменты и протестировать идеи.
Следующий уровень — LangGraph, LlamaIndex и Semantic Kernel. Эти инструменты уже используются для production-систем: RAG, orchestration и сложные workflow.
Самый сложный уровень — AutoGen, DSPy и A2A. Они нужны для автономных мультиагентных систем и оптимизации LLM-пайплайнов.
LangChain — простые агенты, инструменты и память
github.com/langchain-ai/langchain
CrewAI — мультиагентные системы с ролями
github.com/joaomdmoura/crewAI
SmolAgents — лёгкие агенты для быстрых экспериментов
github.com/huggingface/smolagents
LangGraph — orchestration и stateful workflow
github.com/langchain-ai/langgraph
LlamaIndex — RAG и knowledge-агенты
github.com/run-llama/llama_index
Semantic Kernel — AI workflow и плагины
github.com/microsoft/semantic-kernel
AutoGen — автономные мультиагентные системы
github.com/microsoft/autogen
DSPy — оптимизация LLM-пайплайнов
github.com/stanfordnlp/dspy
A2A — протокол взаимодействия между агентами
github.com/a2aproject/A2A
@Python_Community_ru
Если вы хотите разрабатывать AI-агентов на Python, важно понимать порядок изучения библиотек.
Начните с LangChain, CrewAI или SmolAgents — они позволяют быстро собрать простых агентов, подключить инструменты и протестировать идеи.
Следующий уровень — LangGraph, LlamaIndex и Semantic Kernel. Эти инструменты уже используются для production-систем: RAG, orchestration и сложные workflow.
Самый сложный уровень — AutoGen, DSPy и A2A. Они нужны для автономных мультиагентных систем и оптимизации LLM-пайплайнов.
LangChain — простые агенты, инструменты и память
github.com/langchain-ai/langchain
CrewAI — мультиагентные системы с ролями
github.com/joaomdmoura/crewAI
SmolAgents — лёгкие агенты для быстрых экспериментов
github.com/huggingface/smolagents
LangGraph — orchestration и stateful workflow
github.com/langchain-ai/langgraph
LlamaIndex — RAG и knowledge-агенты
github.com/run-llama/llama_index
Semantic Kernel — AI workflow и плагины
github.com/microsoft/semantic-kernel
AutoGen — автономные мультиагентные системы
github.com/microsoft/autogen
DSPy — оптимизация LLM-пайплайнов
github.com/stanfordnlp/dspy
A2A — протокол взаимодействия между агентами
github.com/a2aproject/A2A
@Python_Community_ru
GitHub
GitHub - langchain-ai/langchain: The agent engineering platform.
The agent engineering platform. Contribute to langchain-ai/langchain development by creating an account on GitHub.
Cua (https://github.com/trycua/cua) — это Docker для агентов, использующих компьютер — он позволяет агентам ИИ управлять полноценными операционными системами в виртуальных контейнерах и развертывать их локально или в облаке.
— Всего ~1,000 строк кода — легко читать, расширять и встраивать
— Поддержка OpenAI, Anthropic, Mistral и других LLM-провайдеров
https://github.com/trycua/cua
@Python_Community_ru
— Всего ~1,000 строк кода — легко читать, расширять и встраивать
— Поддержка OpenAI, Anthropic, Mistral и других LLM-провайдеров
https://github.com/trycua/cua
@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Себастьян Рашка собрал в одном месте галерею архитектур современных языковых моделей.
Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok.
Для каждой модели есть:
• наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации
По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры.
https://sebastianraschka.com/llm-architecture-gallery/
@Python_Community_ru
Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok.
Для каждой модели есть:
• наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации
По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры.
https://sebastianraschka.com/llm-architecture-gallery/
@Python_Community_ru
🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Автономный помощник для подачи заявок на работу
ApplyPilot - это мощный инструмент для автоматизации процесса подачи заявок на работу. Он ищет вакансии на нескольких платформах, оценивает их с помощью ИИ, адаптирует ваше резюме и отправляет заявки без вашего участия. Просто настройте один раз и позвольте системе работать за вас.
🚀 Основные моменты:
- Полная автоматизация подачи заявок на работу
- Оценка вакансий по соответствию вашему резюме
- Генерация адаптированных резюме и сопроводительных писем
- Поддержка множества платформ для поиска вакансий
- Открытый исходный код и бесплатный доступ к API
📌 GitHub: https://github.com/Pickle-Pixel/ApplyPilot
@Python_Community_ru
ApplyPilot - это мощный инструмент для автоматизации процесса подачи заявок на работу. Он ищет вакансии на нескольких платформах, оценивает их с помощью ИИ, адаптирует ваше резюме и отправляет заявки без вашего участия. Просто настройте один раз и позвольте системе работать за вас.
🚀 Основные моменты:
- Полная автоматизация подачи заявок на работу
- Оценка вакансий по соответствию вашему резюме
- Генерация адаптированных резюме и сопроводительных писем
- Поддержка множества платформ для поиска вакансий
- Открытый исходный код и бесплатный доступ к API
📌 GitHub: https://github.com/Pickle-Pixel/ApplyPilot
@Python_Community_ru
🛰 Shadowbroker: Реальное геопространственное разведывательное решение
Shadowbroker — это платформа для анализа открытых источников, которая в реальном времени агрегирует данные о глобальных событиях, таких как авиаперелеты, морское движение, спутники и конфликты. Идеально подходит для аналитиков и исследователей, желающих получить целостный обзор мировых событий на едином интерфейсе.
🚀Основные моменты:
- Отслеживание частных и коммерческих авиарейсов
- Мониторинг морского трафика и военных кораблей
- Геолокация спутников и анализ их миссий
- Информация о глобальных конфликтах и событиях
- Доступ к CCTV и сигналам GPS в реальном времени
📌 GitHub: https://github.com/BigBodyCobain/Shadowbroker
@Python_Community_ru
Shadowbroker — это платформа для анализа открытых источников, которая в реальном времени агрегирует данные о глобальных событиях, таких как авиаперелеты, морское движение, спутники и конфликты. Идеально подходит для аналитиков и исследователей, желающих получить целостный обзор мировых событий на едином интерфейсе.
🚀Основные моменты:
- Отслеживание частных и коммерческих авиарейсов
- Мониторинг морского трафика и военных кораблей
- Геолокация спутников и анализ их миссий
- Информация о глобальных конфликтах и событиях
- Доступ к CCTV и сигналам GPS в реальном времени
📌 GitHub: https://github.com/BigBodyCobain/Shadowbroker
@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Open-source прорыв: PrismAudio
Вышла модель PrismAudio и она уже забирает SOTA в генерации аудио из видео (V2A)
Что важно:
- 518M модель, принята на ICLR 2026
- обходит все аналоги по качеству звука
- быстрее конкурентов: ~0.63s на инференс
Главная фишка:
модель думает не одним блоком, а разбивает задачу на 4 части:
- смысл (что происходит)
- время (когда звучит)
- эстетика (как звучит)
- пространство (где звучит)
И обучается через RL прямо внутри этого процесса
Результат:
- топ по всем метрикам (CLAP, MOS и др.)
- лучше MMAudio, ThinkSound и HunyuanVideo
- стабильно работает даже вне обучающего датасета
Плюс: выпустили новый бенчмарк AudioCanvas - 800+ сценариев со звуками
Model: https://modelscope.ai/models/iic/PrismAudio
Demo: https://modelscope.cn/studios/iic/PrismAudio
Paper: https://modelscope.ai/papers/2511.18833
GitHub: https://github.com/FunAudioLLM/ThinkSound/tree/prismaudio
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
Вышла модель PrismAudio и она уже забирает SOTA в генерации аудио из видео (V2A)
Что важно:
- 518M модель, принята на ICLR 2026
- обходит все аналоги по качеству звука
- быстрее конкурентов: ~0.63s на инференс
Главная фишка:
модель думает не одним блоком, а разбивает задачу на 4 части:
- смысл (что происходит)
- время (когда звучит)
- эстетика (как звучит)
- пространство (где звучит)
И обучается через RL прямо внутри этого процесса
Результат:
- топ по всем метрикам (CLAP, MOS и др.)
- лучше MMAudio, ThinkSound и HunyuanVideo
- стабильно работает даже вне обучающего датасета
Плюс: выпустили новый бенчмарк AudioCanvas - 800+ сценариев со звуками
Model: https://modelscope.ai/models/iic/PrismAudio
Demo: https://modelscope.cn/studios/iic/PrismAudio
Paper: https://modelscope.ai/papers/2511.18833
GitHub: https://github.com/FunAudioLLM/ThinkSound/tree/prismaudio
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
🔥2
💻 Claude Computer - полезная шпаргалка
Как включить:
1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use
Примеры работы:
✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]
✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками
✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии
Claude Computer - мощный и простой в настройке исполнитель задач
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
Как включить:
1. Платная подписка + десктопное приложение + приложение на телефоне
2. Соедини через Dispatch (слева)
3. В настройках включи Computer use
Примеры работы:
✦ Найти фрилансера
Промпт:
Открой мой Fiverr в Chrome.
Опубликуй задачу на [задача].
Напиши 10 лучшим специалистам.
Проверь входящие и доведи до сделки
до бюджета [бюджет]
✦ Найти вирусную рекламу
Промпт:
Открой Meta Ads Library
Найди свежие вирусные объявления по теме [тема] в [страна]
Собери Google Sheets с 50+ ссылками
✦ Массовый отклик на вакансии
Промпт:
Открой сайты с вакансиями
Проанализируй мой CV
И откликнись на подходящие вакансии
Claude Computer - мощный и простой в настройке исполнитель задач
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
🌟🚀 LongCat-Next: Мультимодальная модель нового поколения
LongCat-Next — это мощная мультимодальная модель, объединяющая текст, визуальные и аудио данные в едином фрейме. Она демонстрирует выдающиеся результаты на различных задачах, превосходя традиционные подходы к представлению данных. Открытый исходный код модели способствует развитию исследований в этой области.
🚀Основные моменты:
- Объединяет текст, визуальные и аудио данные в одном фрейме.
- Использует новый подход DiNA для упрощения мультимодального моделирования.
- Внедряет иерархические дискретные токены для улучшенного представления.
- Обеспечивает высокую производительность в задачах понимания и генерации.
📌 GitHub: https://github.com/meituan-longcat/LongCat-Next
#python
@Python_Community_ru
LongCat-Next — это мощная мультимодальная модель, объединяющая текст, визуальные и аудио данные в едином фрейме. Она демонстрирует выдающиеся результаты на различных задачах, превосходя традиционные подходы к представлению данных. Открытый исходный код модели способствует развитию исследований в этой области.
🚀Основные моменты:
- Объединяет текст, визуальные и аудио данные в одном фрейме.
- Использует новый подход DiNA для упрощения мультимодального моделирования.
- Внедряет иерархические дискретные токены для улучшенного представления.
- Обеспечивает высокую производительность в задачах понимания и генерации.
📌 GitHub: https://github.com/meituan-longcat/LongCat-Next
#python
@Python_Community_ru
🚨 PyPI снова взломали. Теперь под ударом пакет telnyx
Очередной удар по supply chain от TeamPCP. И это уже не единичный случай - это целая атака по экосистеме разработчиков.
Что произошло:
• Популярный Python-пакет telnyx на PyPI был скомпрометирован
• Вредоносный код внедрили прямо в официальные версии
• Payload срабатывает при обычном import — без действий пользователя
Что делает malware:
• крадёт SSH-ключи, токены, .env, криптокошельки
• шифрует и отправляет данные на сервер злоумышленников
• закрепляется в системе (persistency)
• может распространяться дальше по инфраструктуре
Это не просто вредоносный пакет - это полноценаая атака:
1. Сначала взломали Trivy (инструмент безопасности)
2. Через него украли токены CI/CD
3. Затем заразили npm (CanisterWorm)
4. Потом PyPI (LiteLLM, telnyx и др.)
👉 Один заражённый пакет = полный доступ к инфраструктуре
Теперь правило №1:
• фиксируй версии (pin dependencies)
• проверяй хэши
• не доверяй последним релизам вслепую
Это уже не баги.
Это война за supply chain.
https://www.aikido.dev/blog/telnyx-pypi-compromised-teampcp-canisterworm
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
Очередной удар по supply chain от TeamPCP. И это уже не единичный случай - это целая атака по экосистеме разработчиков.
Что произошло:
• Популярный Python-пакет telnyx на PyPI был скомпрометирован
• Вредоносный код внедрили прямо в официальные версии
• Payload срабатывает при обычном import — без действий пользователя
Что делает malware:
• крадёт SSH-ключи, токены, .env, криптокошельки
• шифрует и отправляет данные на сервер злоумышленников
• закрепляется в системе (persistency)
• может распространяться дальше по инфраструктуре
Это не просто вредоносный пакет - это полноценаая атака:
1. Сначала взломали Trivy (инструмент безопасности)
2. Через него украли токены CI/CD
3. Затем заразили npm (CanisterWorm)
4. Потом PyPI (LiteLLM, telnyx и др.)
👉 Один заражённый пакет = полный доступ к инфраструктуре
Теперь правило №1:
• фиксируй версии (pin dependencies)
• проверяй хэши
• не доверяй последним релизам вслепую
Это уже не баги.
Это война за supply chain.
https://www.aikido.dev/blog/telnyx-pypi-compromised-teampcp-canisterworm
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
Media is too big
VIEW IN TELEGRAM
📢 Mistral выпустили Voxtral TTS - open-weight голосовую модель, которая метит в уровень ElevenLabs, но без платных ограничений
Главное:
- всего ~3B параметров - работает даже на ноутбуке
- скорость ~6x быстрее реального времени
- ~90 мс до первого звука
- ~3GB RAM после квантования
- 9 языков + клонирование голоса по 5 секундам аудио (даже между языками)
Как работает:
- 3.4B - понимает текст и планирует речь
- 390M - отвечает за ритм, произношение, интонацию
- 300M - превращает всё в финальный аудио сигнал
Такое разделение ускоряет модель и делает её легче, чем один большой монолит
По тестам:
- 62.8% предпочли её ElevenLabs Flash (дефолтные голоса)
- 69.9% - на кастомных голосах
https://mistral.ai/news/voxtral-tts
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
Главное:
- всего ~3B параметров - работает даже на ноутбуке
- скорость ~6x быстрее реального времени
- ~90 мс до первого звука
- ~3GB RAM после квантования
- 9 языков + клонирование голоса по 5 секундам аудио (даже между языками)
Как работает:
- 3.4B - понимает текст и планирует речь
- 390M - отвечает за ритм, произношение, интонацию
- 300M - превращает всё в финальный аудио сигнал
Такое разделение ускоряет модель и делает её легче, чем один большой монолит
По тестам:
- 62.8% предпочли её ElevenLabs Flash (дефолтные голоса)
- 69.9% - на кастомных голосах
https://mistral.ai/news/voxtral-tts
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
🔥2
🔥 dots.ocr-1.5 — OCR-модель на 3B параметров от Rednote-hilab.
SOTA для мультиязычного парсинга документов — поддерживает практически любую систему письма.
📊 Elo 1089 на olmOCR-Bench и 1157 на XDocParse — выше, чем у GLM-OCR и PaddleOCR-VL-1.5
📄 На OmniDocBench (text edit 0.031) обгоняет Qwen3-VL-235B (0.069) и Gemini 2.5 Pro (0.075)
🎨 Может генерировать SVG-код для графиков, диаграмм и химических формул
🌐 Поддерживает парсинг веб-страниц, распознавание текста в сценах и подсчёт объектов
⚡ Работает через vLLM и запускается на одной GPU
🤖 Модель: https://modelscope.cn/models/rednote-hilab/dots.ocr-1.5
🔗 GitHub: https://github.com/rednote-hilab/dots.ocr
🎠 Демо: https://dotsocr.xiaohongshu.com
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
SOTA для мультиязычного парсинга документов — поддерживает практически любую систему письма.
📊 Elo 1089 на olmOCR-Bench и 1157 на XDocParse — выше, чем у GLM-OCR и PaddleOCR-VL-1.5
📄 На OmniDocBench (text edit 0.031) обгоняет Qwen3-VL-235B (0.069) и Gemini 2.5 Pro (0.075)
🎨 Может генерировать SVG-код для графиков, диаграмм и химических формул
🌐 Поддерживает парсинг веб-страниц, распознавание текста в сценах и подсчёт объектов
⚡ Работает через vLLM и запускается на одной GPU
🤖 Модель: https://modelscope.cn/models/rednote-hilab/dots.ocr-1.5
🔗 GitHub: https://github.com/rednote-hilab/dots.ocr
🎠 Демо: https://dotsocr.xiaohongshu.com
🐍 Python полезные ресурсы ( ) ()
@Python_Community_ru
🔥1