agents
При разработке реального времени AI-голосового ассистента приходится по отдельности интегрировать сервисы распознавания речи, большие языковые модели (LLM), синтез речи, а также реализовывать сложную логику стриминга и взаимодействия — задача не из простых.
На GitHub появился VideoSDK AI Agents — open-source фреймворк, который упрощает создание голосовых AI-агентов.
Фреймворк написан на Python и уже включает модули для STT, LLM и TTS. Поддерживает такие модели, как OpenAI, Gemini и другие.
Ключевые возможности:
🔸 Реальное время аудио/видео-коммуникации — агент может участвовать в звонке или встрече с естественным голосовым взаимодействием
🔸 Интеграция с SIP-телефонией — можно подключать к существующим VoIP-системам
🔸 Поддержка нескольких AI-моделей — OpenAI, Gemini, AWS и др.
🔸 Виртуальный аватар (Simli) — визуальное сопровождение для UX
🔸 Каскадная архитектура pipeline'ов — гибкая сборка потоков STT/LLM/TTS
🔸 Управление диалогом — voice activity detection (VAD), управление очередностью фраз, логика ходов
Установка — через pip: достаточно поставить основной пакет и нужные плагины. Отличный старт для Python‑разработчиков, кто хочет быстро поднять своего AI-ассистента.
📁 Language: #Python (99.8%)
⭐️ Stars: 294
➡️ Cсылка на GitHub
📱 @git_developer
При разработке реального времени AI-голосового ассистента приходится по отдельности интегрировать сервисы распознавания речи, большие языковые модели (LLM), синтез речи, а также реализовывать сложную логику стриминга и взаимодействия — задача не из простых.
На GitHub появился VideoSDK AI Agents — open-source фреймворк, который упрощает создание голосовых AI-агентов.
Фреймворк написан на Python и уже включает модули для STT, LLM и TTS. Поддерживает такие модели, как OpenAI, Gemini и другие.
Ключевые возможности:
Установка — через pip: достаточно поставить основной пакет и нужные плагины. Отличный старт для Python‑разработчиков, кто хочет быстро поднять своего AI-ассистента.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
neuralagent
На GitHub появилась действительно автономная AI desktop-agent система — NeuralAgent, которая умеет выполнять задачи самостоятельно и освобождает пользователя от ручной работы за компьютером.
Она способна напрямую взаимодействовать с рабочим столом: печатать, кликать, открывать сайты, заполнять формы, отправлять почту — и даже выполнять сложные задачи в фоновом режиме.
Основные возможности:
🔸 Автоматизация действий на рабочем столе: управление мышью, клавиатурой и окнами
🔸 Фоновая автоматизация браузера: выполнение задач напрямую в веб-интерфейсах
🔸 Поддержка различных AI-моделей: OpenAI, Anthropic, Gemini и др.
🔸 Модульная архитектура агента: отдельные модули для планирования, классификации, генерации рекомендаций и др.
🔸 Мультимодальная обработка: понимание задач на основе текста и визуальной информации
🔸 Backend на FastAPI + desktop-приложение на Electron — обеспечивает плавный и отзывчивый интерфейс
Развертывание достаточно сложное, но проект включает подробную инструкцию по установке и работает на Windows, macOS и Linux.
Тем, кто заинтересован, рекомендуется попробовать развернуть и протестировать.
📁 Language: #Python (47.1%), #JavaScript (44.7%)
⭐️ Stars: 527
➡️ Cсылка на GitHub
📱 @git_developer
На GitHub появилась действительно автономная AI desktop-agent система — NeuralAgent, которая умеет выполнять задачи самостоятельно и освобождает пользователя от ручной работы за компьютером.
Она способна напрямую взаимодействовать с рабочим столом: печатать, кликать, открывать сайты, заполнять формы, отправлять почту — и даже выполнять сложные задачи в фоновом режиме.
Основные возможности:
Развертывание достаточно сложное, но проект включает подробную инструкцию по установке и работает на Windows, macOS и Linux.
Тем, кто заинтересован, рекомендуется попробовать развернуть и протестировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍5🌭1
pinme
Когда хочется развернуть персональный сайт или выложить портфолио, обычно приходится покупать сервер и настраивать окружение — а для новичков это довольно высокий порог входа.
В таких случаях пригодится PinMe — минималистичный, но мощный инструмент для децентрализованного деплоя, который позволяет опубликовать сайт или файлы всего одной командой.
Никакой возни с настройкой серверов — вы получаете уникальную, неизменяемую ссылку, с возможностью привязки ENS-домена, чтобы сайт выглядел профессионально.
Основной функционал:
🔸 Однострочный деплой: загрузка директории через CLI и автоматическая генерация публичной ссылки
🔸 Безопасный доступ: у каждой страницы уникальный CID, неизменяемый и поддающийся верификации
🔸 Интеграция с ENS: бесплатный сабдомен pinme.eth.limo или возможность привязать собственный ENS
🔸 Максимальная простота: без регистрации, всё работает через одну CLI-команду
🔸 Высокая скорость по всему миру: за счёт распределённой сети IPFS — без необходимости поднимать сервер
🔸 Полностью бесплатно: нет подписок, авторизации или затрат на хостинг
Проект сопровождается подробной инструкцией по установке и использованию. После установки через npm — можно сразу начать работу.
📁 Language: #HTML (46.9%), #TypeScript (44.3%)
⭐️ Stars: 329
➡️ Cсылка на GitHub
📱 @git_developer
Когда хочется развернуть персональный сайт или выложить портфолио, обычно приходится покупать сервер и настраивать окружение — а для новичков это довольно высокий порог входа.
В таких случаях пригодится PinMe — минималистичный, но мощный инструмент для децентрализованного деплоя, который позволяет опубликовать сайт или файлы всего одной командой.
Никакой возни с настройкой серверов — вы получаете уникальную, неизменяемую ссылку, с возможностью привязки ENS-домена, чтобы сайт выглядел профессионально.
Основной функционал:
Проект сопровождается подробной инструкцией по установке и использованию. После установки через npm — можно сразу начать работу.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3🌭2
OS Homedock
OS Homedock — это самостоятельная облачная операционная система, которая предлагает удобное и безопасное управление облаком, совместимую с Linux, Windows, macOS и Raspberry Pi.
Система фокусируется на конфиденциальности данных и предоставляет интеграцию через веб-интерфейс с использованием преднастроенных SSL-развертываний для надежной защиты информации.
Основные функции OS Homedock включают интуитивно понятный интерфейс для доступа к приложениям, быструю их установку через встроенный магазин, управление логами без командной строки и разнообразные опции резервного копирования.
📁 Language: #Vue (52.0%), #Python (29.5%), #TypeScript (15.9%)
⭐️ Stars: 206
➡️ Cсылка на GitHub
📱 @git_developer
OS Homedock — это самостоятельная облачная операционная система, которая предлагает удобное и безопасное управление облаком, совместимую с Linux, Windows, macOS и Raspberry Pi.
Система фокусируется на конфиденциальности данных и предоставляет интеграцию через веб-интерфейс с использованием преднастроенных SSL-развертываний для надежной защиты информации.
Основные функции OS Homedock включают интуитивно понятный интерфейс для доступа к приложениям, быструю их установку через встроенный магазин, управление логами без командной строки и разнообразные опции резервного копирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🌭2
ClockTemp
ClockTemp — это TUI часы, которые предоставляют возможность отображения времени, даты, температуры и другой информации.
Программа предлагает множество команд для настройки форматов времени, даты и температуры, а также клавиши для переключения режимов и управления таймером.
В будущем планируются дополнительные функции, включая календарь и напоминания.
📁 Language: #Python (91.1%)
⭐️ Stars: 39
➡️ Cсылка на GitHub
📱 @git_developer
ClockTemp — это TUI часы, которые предоставляют возможность отображения времени, даты, температуры и другой информации.
Программа предлагает множество команд для настройки форматов времени, даты и температуры, а также клавиши для переключения режимов и управления таймером.
В будущем планируются дополнительные функции, включая календарь и напоминания.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍4
evi-run
Готовая к использованию настраиваемая мультиагентная AI-система с интеграцией в Telegram.
Это мощный фреймворк с продвинутой архитектурой на OpenAI Agents SDK для создания AI-ботов в Telegram с enterprise-возможностями. Deploy за 5 минут через Docker и безграничная кастомизация!
Ключевые возможности:
🔸 Управление памятью
🔸 Работа с документами и изображениями
🔸 Генерация изображений
🔸 Интеллектуальный веб-поиск
🔸 Глубокое исследование
🔸 Аналитика и торговля на DEX
🔸 Кастомные агенты
🔸 Режимы: private (для себя), free (для сообщества), pay (для монетизации)
Подходит для создания AI-ассистентов, виртуальных персонажей, автоматизации саппорта, аналитика данных, торгового агента на DEX, кастомных мультиагентных систем.
📁 Language: #Python (85.9%)
⭐️ Stars: 17
➡️ Cсылка на GitHub
📱 @git_developer
Готовая к использованию настраиваемая мультиагентная AI-система с интеграцией в Telegram.
Это мощный фреймворк с продвинутой архитектурой на OpenAI Agents SDK для создания AI-ботов в Telegram с enterprise-возможностями. Deploy за 5 минут через Docker и безграничная кастомизация!
Ключевые возможности:
Подходит для создания AI-ассистентов, виртуальных персонажей, автоматизации саппорта, аналитика данных, торгового агента на DEX, кастомных мультиагентных систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😈5🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Serpl
Serpl – это интерфейс для терминала, предназначенный для эффективного поиска и замены слов по всему проекту.
Приложение предлагает несколько ключевых возможностей, включая поиск ключевых слов по проекту, опции сохранения регистра при замене, интерактивный предварительный просмотр результатов поиска, а также настраиваемые сочетания клавиш и режимы поиска для повышения эффективности рабочего процесса.
Кроме того, Serpl поддерживает интеграцию с Neovim через плагин, предоставляя переключаемый терминал в редакторе.
📁 Language: #Rust (99.9%)
⭐️ Stars: 729
➡️ Cсылка на GitHub
📱 @git_developer
Serpl – это интерфейс для терминала, предназначенный для эффективного поиска и замены слов по всему проекту.
Приложение предлагает несколько ключевых возможностей, включая поиск ключевых слов по проекту, опции сохранения регистра при замене, интерактивный предварительный просмотр результатов поиска, а также настраиваемые сочетания клавиш и режимы поиска для повышения эффективности рабочего процесса.
Кроме того, Serpl поддерживает интеграцию с Neovim через плагин, предоставляя переключаемый терминал в редакторе.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥2
mtab
mtab представляет собой простое и настраиваемое расширение для новой вкладки в веб-браузерах.
Оно позволяет пользователям персонализировать свою новую вкладку, выбирая обои, закладки, цвета, шрифты и поисковые системы.
Расширение также предлагает плавные анимации и горячие клавиши для улучшения пользовательского опыта.
Расширение доступно для браузеров на базе Chromium, таких как Chrome и Brave, а также для Firefox.
📁 Language: #CSS (68.3%), #TypeScript (23.4%), #HTML (7.9%)
⭐️ Stars: 497
➡️ Cсылка на GitHub
📱 @git_developer
mtab представляет собой простое и настраиваемое расширение для новой вкладки в веб-браузерах.
Оно позволяет пользователям персонализировать свою новую вкладку, выбирая обои, закладки, цвета, шрифты и поисковые системы.
Расширение также предлагает плавные анимации и горячие клавиши для улучшения пользовательского опыта.
Расширение доступно для браузеров на базе Chromium, таких как Chrome и Brave, а также для Firefox.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
LangExtract
Google выпустил open-source Python библиотеку для эффективного извлечения текста — LangExtract. Она позволяет большим моделям точно вытягивать структурированные данные из неструктурированного текста.
Поддерживает модели, включая Gemini, позволяет кастомизировать prompt для контроля структуры вывода, автоматически генерирует интерактивный визуальный интерфейс для быстрой проверки результатов извлечения.
Основные возможности:
🔸 Кастомизация prompt и примеров для точного извлечения информации
🔸 Структурированный вывод на основе небольшого количества примеров, подходит для любых доменов
🔸 Поддержка обработки длинных текстов с разбиением на блоки, многократное извлечение и параллельная обработка
🔸 Генерация интерактивного HTML для визуализации результатов одним взглядом
🔸 Поддержка разных LLM — от Google Gemini до локальной модели Ollama
🔸 Прямая работа с URL-документами, параллельная обработка для повышения производительности
Устанавливается через pip, требуется конфигурация API ключа модели. Подходит для разработчиков и аналитиков, которым нужно обрабатывать большие объёмы документов.
📁 Language: #Python (98.8%)
⭐️ Stars: 2.8k
➡️ Cсылка на GitHub
📱 @git_developer
Google выпустил open-source Python библиотеку для эффективного извлечения текста — LangExtract. Она позволяет большим моделям точно вытягивать структурированные данные из неструктурированного текста.
Поддерживает модели, включая Gemini, позволяет кастомизировать prompt для контроля структуры вывода, автоматически генерирует интерактивный визуальный интерфейс для быстрой проверки результатов извлечения.
Основные возможности:
Устанавливается через pip, требуется конфигурация API ключа модели. Подходит для разработчиков и аналитиков, которым нужно обрабатывать большие объёмы документов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3