GitHub Разработчика
16.5K subscribers
432 photos
312 videos
2 files
743 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Paper2Agent

Если код статьи на GitHub обычно вызывает головную боль при запуске, Paper2Agent решает это за тебя и превращает любой репозиторий в интерактивного AI-агента

Мульти-агентная система анализирует код, создаёт MCP-сервер и интегрирует его с Claude Code, чтобы методы статьи были доступны через диалог

Плюсы — автоматическая настройка среды, управление зависимостями, поддержка разных научных областей, предустановленные агенты для AlphaGenome, Scanpy, TISSUE

После установки Python 3.10+ и Claude Code одной командой можно превратить любой код статьи в AI-агента. Очень удобный инструмент для исследователей и разработчиков.

📁 Language: #Python 4.0%

⭐️ Stars: 417

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍6
DrizzleTime/Foxel

Если ваши файлы разбросаны по разным местам — облачные диски, локальный жёсткий диск или NAS —> иногда сложно вспомнить, где именно что хранится.

Рекомендуется обратить внимание на Foxel - этот open-source инструмент для приватного облачного хранения позволяет унифицированно управлять файлами, разбросанными по разным хранилищам.

Особенно интересно, что поддерживается AI‑семантический поиск —> можно искать картинки и документы по содержимому с помощью естественного языка, а не только по имени файла.

📁 Language: #TypeScript 55.5%, #Python 41.5%

⭐️ Stars: 624

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64
This media is not supported in your browser
VIEW IN TELEGRAM
Logics-Parsing

При обработке академических статей или исследовательских отчётов с помощью OCR, когда в документе есть сложные формулы, таблицы и графики, к качеству распознавания модели предъявляются особенно высокие требования.

Техническая команда Alibaba недавно выложила в опенсорс end-to-end модель для парсинга документов — Logics-Parsing, которая умеет напрямую конвертировать сложные документы в структурированный HTML.

Модель не только корректно распознаёт сложные научные формулы и химические структуры, но и автоматически отфильтровывает лишний контент вроде колонтитулов и футеров, фокусируясь на извлечении основной информации.

Поддерживаются разные типы входных данных: исследовательские отчёты, научные статьи, химическая документация, рукописные заметки и др.

В ряде бенчмарков модель показала результаты выше многих аналогов. Если у вас есть задачи по OCR сложных документов — стоит попробовать.

📁 Language: #Python 100.0%

⭐️ Stars: 369

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥1
anki-hyper-tts

Использовать Anki для заучивания слов действительно удобно, но вот его встроенный модуль озвучки оставляет желать лучшего — для тренировки произношения он не очень подходит.

Поэтому один разработчик сделал и выложил в open source мощный плагин anki-hyper-tts, который добавляет в Anki профессиональное качество синтеза речи.

Плагин поддерживает несколько TTS-сервисов с высоким качеством, благодаря чему можно добавить к карточкам естественное и плавное озвучивание на любом языке — обучение сразу становится более живым и интересным.

У плагина простой и удобный интерфейс, никаких сложных настроек — всё работает «из коробки». Поддерживается массовая обработка: можно в один клик озвучить сразу большое количество карточек.

Если вы учите иностранные языки через Anki, достаточно в меню «Получить дополнение» вставить код 111623432, чтобы установить плагин.

📁 Language: #Python 99.8%

⭐️ Stars: 188

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Code2Video

Команда Show Lab из Национального университета Сингапура представила open-source проект Code2Video - инструмент, который автоматически генерирует качественные образовательные видео из кода.

В основе решения — три AI-агента, которые работают совместно:

🔸Планировщик создаёт сториборд,
🔸Кодер пишет исполняемый код,
🔸Оценщик оптимизирует визуальное оформление и логику.

Code2Video использует движок Manim для визуализации, поддерживает автоматическую интеграцию иконок и графики, а также включает MMMC-бенчмарк с 117 обучающими темами.

Разработчики могут клонировать репозиторий, установить зависимости и указать API-ключ LLM — после чего инструмент готов к работе.

Проект обещает сделать создание учебных видео столь же простым, как написание кода.

📁 Language: #Python 98.7%

⭐️ Stars: 136

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🌭21👍1
Varia

Часто приходится использовать разные инструменты для загрузок: обычные файлы через браузер, торренты через отдельный клиент, а для видео вообще отдельный софт. Довольно неудобно.

К счастью, нашёл Varia — open source менеджер загрузок, который объединяет файлы, торренты и видеопотоки в одном интерфейсе.

Он поддерживает не только обычные файлы и BT-загрузки, но и умеет напрямую скачивать видео и аудио с популярных платформ. Есть даже расширения для браузеров, позволяющие в один клик отправлять загрузку в приложение.

Основные возможности:

🔸Единое управление всеми задачами загрузки: файлы, торренты, видеопотоки и т.д.
🔸Поддержка скачивания и конвертации аудио/видео с популярных видеосервисов.
🔸Расширения для Firefox и Chrome — отправляйте загрузки одним кликом.
🔸Основан на aria2 и yt-dlp, что гарантирует стабильность и совместимость.
🔸Поддержка автоматического выключения ПК после завершения загрузок и других удобных функций.

Доступны готовые установочные пакеты для Windows и Linux — можно попробовать прямо сейчас.

📁 Language: #Python 92.5%

⭐️ Stars: 993

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
NeuTTS Air

NeuTTS Air — сверхреалистичный AI-голос на локальной машине

Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.

Особенности:

🔸Голос почти как у человека;
🔸Клонирование голоса по 3 секундам аудио;
🔸Полностью локально — приватность под контролем;
🔸Лёгкая и быстрая генерация даже на средних устройствах;
🔸Встроенные водяные знаки для отслеживаемости аудио.

📁 Language: #Python 100.0%

⭐️ Stars: 2.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Use Preview

Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5

Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.

Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.

📁 Language: #Python 100.0%

⭐️ Stars: 931

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3
LeetGPU Challenges

LeetCode для GPU-разработчиков

Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.

Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.

📁 Language: #Python 72.1%

⭐️ Stars: 170

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
PaddleOCR

Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.

При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.

Почему это важно

В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или много­колоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.

Что умеет модель

Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.

Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.

Что можно извлекать

Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.

Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.

Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.

📁 Language: #Python 77.0%

⭐️ Stars: 57.5k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2
Ducky

Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.

Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.

Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.

📁 Language: #Python 99.0%

⭐️ Stars: 362

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍122