Chaplin
Chaplin — это инструмент распознавания речи по губам, который позволяет в реальном времени считывать движение губ и транскрибировать слова, произнесенные молча.
Он функционирует на локальном уровне и основан на модели, созданной с использованием набора данных Lip Reading Sentences 3 в проекте Auto-AVSR.
📁 Language: #Python (100.0%)
⭐️ Stars: 525
➡️ Cсылка на GitHub
📱 @git_developer
Chaplin — это инструмент распознавания речи по губам, который позволяет в реальном времени считывать движение губ и транскрибировать слова, произнесенные молча.
Он функционирует на локальном уровне и основан на модели, созданной с использованием набора данных Lip Reading Sentences 3 в проекте Auto-AVSR.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤4👍3🌭1
Omnara
Выполнять долгие задачи в Claude Code или Cursor, потом переключаться на другие дела, а через пару часов обнаруживать, что всё это время всё стояло из-за ошибки — огромная трата времени
Чтобы решить эту проблему, open-source проект Omnara умно отслеживает каждый шаг выполнения и отправляет обновления, которые можно смотреть в реальном времени
Можно получать пуш-уведомления на телефон, в любой момент проверять прогресс ключевых этапов задачи и даже отвечать прямо с телефона, если нужен совет для ИИ
Основные возможности
🔸 Мониторинг в реальном времени всего прогресса и шагов работы AI Agent
🔸 Пуш-уведомления на мобильный, мгновенное оповещение, когда ИИ требуется помощь
🔸 Поддержка удалённого запуска и управления задачами AI Agent с телефона
🔸 Единый интерфейс для централизованного просмотра статуса нескольких AI Agent
🔸 Двусторонний интерактивный Q&A — можно давать указания и фидбек ИИ в любой момент
🔸 Совместимость с MCP-протоколом, поддержка кастомных расширений
Сейчас поддерживает популярные инструменты разработки вроде Claude Code, Cursor и GitHub Copilot, а также имеет мобильный клиент для iOS
📁 Language: #Python 95.3%
⭐️ Stars: 1,1k
➡️ Cсылка на GitHub
📱 @git_developer
Выполнять долгие задачи в Claude Code или Cursor, потом переключаться на другие дела, а через пару часов обнаруживать, что всё это время всё стояло из-за ошибки — огромная трата времени
Чтобы решить эту проблему, open-source проект Omnara умно отслеживает каждый шаг выполнения и отправляет обновления, которые можно смотреть в реальном времени
Можно получать пуш-уведомления на телефон, в любой момент проверять прогресс ключевых этапов задачи и даже отвечать прямо с телефона, если нужен совет для ИИ
Основные возможности
Сейчас поддерживает популярные инструменты разработки вроде Claude Code, Cursor и GitHub Copilot, а также имеет мобильный клиент для iOS
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍5🏆4
YTSage
Обычно, чтобы скачать и сохранить видео или музыку с YouTube локально, я использую утилиту
Сегодня на GitHub наткнулся на YTSage — опенсорсный YouTube-даунлоадер с простым и удобным UI и мощным функционалом.
Поддерживает загрузку видео в любом качестве, извлечение аудио, скачивание субтитров, автоматическое пропускание рекламных вставок, а также обрезку видео по времени.
Основные фичи:
🔸 Загрузка видео в любом качестве и извлечение высококачественного аудио
🔸 Полная поддержка плейлистов с выборочной пакетной загрузкой
🔸 Многоязычные субтитры: скачивание, объединение и встраивание в видео
🔸 Интеграция с SponsorBlock для автоматического удаления рекламы и спонсорских сегментов
🔸 Видео-тримминг — скачивание определённого фрагмента по временным меткам
🔸 Поддержка cookie-авторизации для доступа к приватному или контенту для участников
Можно установить одной командой через
📁 Language: #Python
⭐️ Stars: 1.8k
➡️ Cсылка на GitHub
📱 @git_developer
Обычно, чтобы скачать и сохранить видео или музыку с YouTube локально, я использую утилиту
yt-dl
. Но это инструмент для работы в терминале, и для новичков он может быть не самым простым в освоении.Сегодня на GitHub наткнулся на YTSage — опенсорсный YouTube-даунлоадер с простым и удобным UI и мощным функционалом.
Поддерживает загрузку видео в любом качестве, извлечение аудио, скачивание субтитров, автоматическое пропускание рекламных вставок, а также обрезку видео по времени.
Основные фичи:
Можно установить одной командой через
pip
, а новичкам достаточно скачать готовый бинарник под свою ОСPlease open Telegram to view this post
VIEW IN TELEGRAM
❤12👍8🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
ScreenCoder
ScreenCoder — опенсорс-проект, который может напрямую преобразовать любой скриншот или дизайн-макет в чистый и читаемый фронтенд-код.
Поддерживает модели GPT-4o, Gemini-2.5-Pro и другие. Главная фишка — встроенная работа нескольких агентов одновременно, что даёт намного более точное воспроизведение, чем при использовании одной модели.
Основные возможности
🔸 Конвертация скриншотов или дизайн-макетов в HTML + CSS за один клик
🔸 Поддержка моделей Doubao, GPT, Qwen, Gemini и др.
🔸 Распознавание модулей + синтез стилей для более чистой структуры
🔸 Генерируемый код можно сразу деплоить и редактировать
🔸 Визуальная замена графических модулей
🔸 Определение UI-компонентов и восстановление их расположения
Чтобы начать, клонируйте репозиторий, установите зависимости, настройте API-ключ модели и запустите main.py для генерации страницы одним кликом.
📁 Language: #Python (73.1%)
⭐️ Stars: 1,5k
➡️ Cсылка на GitHub
📱 @git_developer
ScreenCoder — опенсорс-проект, который может напрямую преобразовать любой скриншот или дизайн-макет в чистый и читаемый фронтенд-код.
Поддерживает модели GPT-4o, Gemini-2.5-Pro и другие. Главная фишка — встроенная работа нескольких агентов одновременно, что даёт намного более точное воспроизведение, чем при использовании одной модели.
Основные возможности
Чтобы начать, клонируйте репозиторий, установите зависимости, настройте API-ключ модели и запустите main.py для генерации страницы одним кликом.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍9🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Smartcut
Smartcut — это инструмент с открытым исходным кодом для командной строки, предназначенный для эффективной обрезки видеофайлов в различных форматах и кодеках с минимальной перекодировкой в местах разрезов.
Это значит, что вы сможете обрезать даже длинные видеофайлы за считанные секунды!
Smartcut доступен в виде бинарных файлов для Windows и Linux, также предоставлены инструкции по установке и использованию для тех, кто предпочитает запускать его из исходного кода.
📁 Language: #Python 99.5%
⭐️ Stars: 166
➡️ Cсылка на GitHub
📱 @git_developer
Smartcut — это инструмент с открытым исходным кодом для командной строки, предназначенный для эффективной обрезки видеофайлов в различных форматах и кодеках с минимальной перекодировкой в местах разрезов.
Это значит, что вы сможете обрезать даже длинные видеофайлы за считанные секунды!
Smartcut доступен в виде бинарных файлов для Windows и Linux, также предоставлены инструкции по установке и использованию для тех, кто предпочитает запускать его из исходного кода.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍6🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAvatarChat
Сейчас при построении систем диалога с цифровыми аватарами, помимо сложной развертки, есть серьёзные требования к производительности и видеопамяти, а также большие проблемы с задержкой.
Сегодня на GitHub наткнулся на опенсорсный проект Open Avatar Chat, который как раз предлагает решение.
Можно запустить систему цифрового собеседника у себя на личном компьютере, и она будет отвечать в реальном времени со средней задержкой всего 2.2 секунды.
📁 Language: #Python 96.7%
⭐️ Stars: 2k
➡️ Cсылка на GitHub
📱 @git_developer
Сейчас при построении систем диалога с цифровыми аватарами, помимо сложной развертки, есть серьёзные требования к производительности и видеопамяти, а также большие проблемы с задержкой.
Сегодня на GitHub наткнулся на опенсорсный проект Open Avatar Chat, который как раз предлагает решение.
Можно запустить систему цифрового собеседника у себя на личном компьютере, и она будет отвечать в реальном времени со средней задержкой всего 2.2 секунды.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
GhostTrack
Обнаружил интересный проект на GitHub: GhostTrack.
Он позволяет выяснить, на каких платформах использовался телефонный номер или имя пользователя, исходя из введённых данных.
📁 Language: #Python 100.0%
⭐️ Stars: 3.1k
➡️ Cсылка на GitHub
📱 @git_developer
Обнаружил интересный проект на GitHub: GhostTrack.
Он позволяет выяснить, на каких платформах использовался телефонный номер или имя пользователя, исходя из введённых данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🔥4
WhisperLiveKit
На GitHub нашёлся инструмент для полностью локального развёртывания распознавания речи в реальном времени — WhisperLiveKit.
Поддерживает идентификацию говорящих, работает быстро и с низкой задержкой. Отлично подходит для субтитров на многопользовательских встречах и для лайв-транскрибации.
📁 Language: #Python 92.4%
⭐️ Stars: 696
➡️ Cсылка на GitHub
📱 @git_developer
На GitHub нашёлся инструмент для полностью локального развёртывания распознавания речи в реальном времени — WhisperLiveKit.
Поддерживает идентификацию говорящих, работает быстро и с низкой задержкой. Отлично подходит для субтитров на многопользовательских встречах и для лайв-транскрибации.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2
MCP Manager
MCP Manager — это десктопное приложение для управления серверами MCP с удобным графическим интерфейсом.
Оно предоставляет пользователям возможность настраивать, запускать и мониторить несколько серверов, требуя только Python и uv в качестве зависимостей.
С помощью MCP Manager пользователи могут легко добавлять новые серверные конфигурации, указав идентификаторы, имена, команды и аргументы.
Также доступна возможность изменения переменных окружения и рабочих директорий.
Все конфигурации хранятся в файле, который можно редактировать вручную или при помощи встроенного JSON-редактора, а также импортировать и экспортировать по мере необходимости.
📁 Language: #Python 94.5%
⭐️ Stars: 16
➡️ Cсылка на GitHub
📱 @git_developer
MCP Manager — это десктопное приложение для управления серверами MCP с удобным графическим интерфейсом.
Оно предоставляет пользователям возможность настраивать, запускать и мониторить несколько серверов, требуя только Python и uv в качестве зависимостей.
С помощью MCP Manager пользователи могут легко добавлять новые серверные конфигурации, указав идентификаторы, имена, команды и аргументы.
Также доступна возможность изменения переменных окружения и рабочих директорий.
Все конфигурации хранятся в файле, который можно редактировать вручную или при помощи встроенного JSON-редактора, а также импортировать и экспортировать по мере необходимости.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤5
This media is not supported in your browser
VIEW IN TELEGRAM
mcp-context-forge
MCP как важный протокол для подключения больших моделей к внешним инструментам и источникам данных сегодня часто используется в AI-проектах, где задействовано несколько MCP-инструментов.
Но они разбросаны по разным портам, и протоколы у них не унифицированы, из-за чего во время разработки неудобно переключаться между тестами.
Сегодня я увидел проект MCP Gateway с открытым исходным кодом от IBM, который отлично решает эту проблему, объединяя все MCP-сервисы в единую точку входа.
С его помощью можно централизованно управлять разбросанными инструментами, конвертировать протоколы (например, HTTP - WebSocket), а также пользоваться удобным веб-интерфейсом для тестирования и мониторинга разных инструментов.
📁 Language: #Python 82.2%
⭐️ Stars: 1.6k
➡️ Cсылка на GitHub
📱 @git_developer
MCP как важный протокол для подключения больших моделей к внешним инструментам и источникам данных сегодня часто используется в AI-проектах, где задействовано несколько MCP-инструментов.
Но они разбросаны по разным портам, и протоколы у них не унифицированы, из-за чего во время разработки неудобно переключаться между тестами.
Сегодня я увидел проект MCP Gateway с открытым исходным кодом от IBM, который отлично решает эту проблему, объединяя все MCP-сервисы в единую точку входа.
С его помощью можно централизованно управлять разбросанными инструментами, конвертировать протоколы (например, HTTP - WebSocket), а также пользоваться удобным веб-интерфейсом для тестирования и мониторинга разных инструментов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
VibeVoice
При создании подкастов или длинных аудиокниг стандартные бесплатные TTS-инструменты обычно умеют синтезировать только несколько минут речи. Диалоги с несколькими участниками звучат жёстко и неестественно, без реалистичности.
Недавно Microsoft выложила в опенсорс модель для синтеза речи VibeVoice. Она умеет напрямую генерировать естественные диалоги до 90 минут.
Модель работает не только с очень длинным текстом, но и поддерживает до 4 разных говорящих. Она может автоматически добавлять фоновые звуки и музыку в зависимости от контента.
📁 Language: #Python 100%
⭐️ Stars: 4.4k
➡️ Cсылка на GitHub
📱 @git_developer
При создании подкастов или длинных аудиокниг стандартные бесплатные TTS-инструменты обычно умеют синтезировать только несколько минут речи. Диалоги с несколькими участниками звучат жёстко и неестественно, без реалистичности.
Недавно Microsoft выложила в опенсорс модель для синтеза речи VibeVoice. Она умеет напрямую генерировать естественные диалоги до 90 минут.
Модель работает не только с очень длинным текстом, но и поддерживает до 4 разных говорящих. Она может автоматически добавлять фоновые звуки и музыку в зависимости от контента.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍3