GitHub Разработчика
16.5K subscribers
464 photos
322 videos
2 files
783 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Paper2Agent

Если код статьи на GitHub обычно вызывает головную боль при запуске, Paper2Agent решает это за тебя и превращает любой репозиторий в интерактивного AI-агента

Мульти-агентная система анализирует код, создаёт MCP-сервер и интегрирует его с Claude Code, чтобы методы статьи были доступны через диалог

Плюсы — автоматическая настройка среды, управление зависимостями, поддержка разных научных областей, предустановленные агенты для AlphaGenome, Scanpy, TISSUE

После установки Python 3.10+ и Claude Code одной командой можно превратить любой код статьи в AI-агента. Очень удобный инструмент для исследователей и разработчиков.

📁 Language: #Python 4.0%

⭐️ Stars: 417

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍6
DrizzleTime/Foxel

Если ваши файлы разбросаны по разным местам — облачные диски, локальный жёсткий диск или NAS —> иногда сложно вспомнить, где именно что хранится.

Рекомендуется обратить внимание на Foxel - этот open-source инструмент для приватного облачного хранения позволяет унифицированно управлять файлами, разбросанными по разным хранилищам.

Особенно интересно, что поддерживается AI‑семантический поиск —> можно искать картинки и документы по содержимому с помощью естественного языка, а не только по имени файла.

📁 Language: #TypeScript 55.5%, #Python 41.5%

⭐️ Stars: 624

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64
This media is not supported in your browser
VIEW IN TELEGRAM
Logics-Parsing

При обработке академических статей или исследовательских отчётов с помощью OCR, когда в документе есть сложные формулы, таблицы и графики, к качеству распознавания модели предъявляются особенно высокие требования.

Техническая команда Alibaba недавно выложила в опенсорс end-to-end модель для парсинга документов — Logics-Parsing, которая умеет напрямую конвертировать сложные документы в структурированный HTML.

Модель не только корректно распознаёт сложные научные формулы и химические структуры, но и автоматически отфильтровывает лишний контент вроде колонтитулов и футеров, фокусируясь на извлечении основной информации.

Поддерживаются разные типы входных данных: исследовательские отчёты, научные статьи, химическая документация, рукописные заметки и др.

В ряде бенчмарков модель показала результаты выше многих аналогов. Если у вас есть задачи по OCR сложных документов — стоит попробовать.

📁 Language: #Python 100.0%

⭐️ Stars: 369

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥1
anki-hyper-tts

Использовать Anki для заучивания слов действительно удобно, но вот его встроенный модуль озвучки оставляет желать лучшего — для тренировки произношения он не очень подходит.

Поэтому один разработчик сделал и выложил в open source мощный плагин anki-hyper-tts, который добавляет в Anki профессиональное качество синтеза речи.

Плагин поддерживает несколько TTS-сервисов с высоким качеством, благодаря чему можно добавить к карточкам естественное и плавное озвучивание на любом языке — обучение сразу становится более живым и интересным.

У плагина простой и удобный интерфейс, никаких сложных настроек — всё работает «из коробки». Поддерживается массовая обработка: можно в один клик озвучить сразу большое количество карточек.

Если вы учите иностранные языки через Anki, достаточно в меню «Получить дополнение» вставить код 111623432, чтобы установить плагин.

📁 Language: #Python 99.8%

⭐️ Stars: 188

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Code2Video

Команда Show Lab из Национального университета Сингапура представила open-source проект Code2Video - инструмент, который автоматически генерирует качественные образовательные видео из кода.

В основе решения — три AI-агента, которые работают совместно:

🔸Планировщик создаёт сториборд,
🔸Кодер пишет исполняемый код,
🔸Оценщик оптимизирует визуальное оформление и логику.

Code2Video использует движок Manim для визуализации, поддерживает автоматическую интеграцию иконок и графики, а также включает MMMC-бенчмарк с 117 обучающими темами.

Разработчики могут клонировать репозиторий, установить зависимости и указать API-ключ LLM — после чего инструмент готов к работе.

Проект обещает сделать создание учебных видео столь же простым, как написание кода.

📁 Language: #Python 98.7%

⭐️ Stars: 136

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🌭21👍1
Varia

Часто приходится использовать разные инструменты для загрузок: обычные файлы через браузер, торренты через отдельный клиент, а для видео вообще отдельный софт. Довольно неудобно.

К счастью, нашёл Varia — open source менеджер загрузок, который объединяет файлы, торренты и видеопотоки в одном интерфейсе.

Он поддерживает не только обычные файлы и BT-загрузки, но и умеет напрямую скачивать видео и аудио с популярных платформ. Есть даже расширения для браузеров, позволяющие в один клик отправлять загрузку в приложение.

Основные возможности:

🔸Единое управление всеми задачами загрузки: файлы, торренты, видеопотоки и т.д.
🔸Поддержка скачивания и конвертации аудио/видео с популярных видеосервисов.
🔸Расширения для Firefox и Chrome — отправляйте загрузки одним кликом.
🔸Основан на aria2 и yt-dlp, что гарантирует стабильность и совместимость.
🔸Поддержка автоматического выключения ПК после завершения загрузок и других удобных функций.

Доступны готовые установочные пакеты для Windows и Linux — можно попробовать прямо сейчас.

📁 Language: #Python 92.5%

⭐️ Stars: 993

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
NeuTTS Air

NeuTTS Air — сверхреалистичный AI-голос на локальной машине

Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.

Особенности:

🔸Голос почти как у человека;
🔸Клонирование голоса по 3 секундам аудио;
🔸Полностью локально — приватность под контролем;
🔸Лёгкая и быстрая генерация даже на средних устройствах;
🔸Встроенные водяные знаки для отслеживаемости аудио.

📁 Language: #Python 100.0%

⭐️ Stars: 2.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Use Preview

Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5

Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.

Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.

📁 Language: #Python 100.0%

⭐️ Stars: 931

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3
LeetGPU Challenges

LeetCode для GPU-разработчиков

Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.

Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.

📁 Language: #Python 72.1%

⭐️ Stars: 170

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
PaddleOCR

Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.

При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.

Почему это важно

В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или много­колоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.

Что умеет модель

Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.

Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.

Что можно извлекать

Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.

Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.

Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.

📁 Language: #Python 77.0%

⭐️ Stars: 57.5k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3
Ducky

Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.

Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.

Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.

📁 Language: #Python 99.0%

⭐️ Stars: 362

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍145
GPU Hot

Когда приходится следить за несколькими GPU-серверами, подключаясь к каждой машине по SSH, постоянно переключаться между ними — то ещё удовольствие.

GPU Hot — опенсорс-утилита, которая решает эту проблему. С ней можно мониторить и управлять всеми GPU прямо из браузера, в едином интерфейсе.

Инструмент умеет не только в реальное время показывать состояние всех видеокарт на одной машине, но и работать в кластерном режиме, собирая данные со всего парка серверов. Вся информация выводится в виде наглядных графиков и таблиц.

📁 Language: #JavaScript 57.3%, #Python 28.5%

⭐️ Stars: 646

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
OSX-PROXMOX

Если ты собираешься взять себе Mac, но раньше не пользовался macOS и не уверен, подойдет ли она тебе,

можешь попробовать её через OSX-PROXMOX — это open-source инструмент, который позволяет запустить macOS на любом ПК с AMD или Intel.

Всё настраивается одной командой: автоматическая установка и конфигурация, поддержка систем от macOS High Sierra до последней Sequoia.

В комплекте идёт OpenCore 1.0.4 загрузчик — с улучшенной безопасностью и совместимостью. Можно даже поднять macOS на облачном сервере.

Есть подробный гайд по устранению проблем и проверке совместимости железа — достаточно установить Proxmox VE и запустить одну команду.

📁 Language: #Python 23.7%

⭐️ Stars: 5.4k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
💊7👍42
This media is not supported in your browser
VIEW IN TELEGRAM
Scrapling

Самое раздражающее в написании парсеров это обновления сайта. Как только страница меняется, старые селекторы ломаются, и приходится заново разбирать структуру и дебажить код.

Недавно я наткнулся на Scrapling это open source-библиотека адаптивного парсера, которая решает эту проблему. Она умеет автоматически переназначать элементы, если структура сайта изменилась.

Кроме того, Scrapling может отслеживать изменения в расположении элементов и имеет встроенные механизмы обхода антибот-защиты: маскировку TLS-отпечатков, обход Cloudflare и другие. Благодаря этому парсер работает стабильнее и надежнее.

После установки через pip нужно дополнительно выполнить scrapling install, чтобы скачать зависимости для браузера. Если занимаешься веб-скрейпингом — стоит глянуть.

📁 Language: #Python 97.8%

⭐️ Stars: 7.8k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍5🔥3
persepolis

Когда скачиваешь большие файлы или хочешь сохранить видео с сайтов вроде YouTube, стандартный загрузчик браузера часто тупит: медленно качает, обрывает соединение и заставляет всё начинать заново.

Попробуй Persepolis Download Manager — это опенсорсный загрузчик, который заметно ускоряет и упрощает работу с файлами.

Он поддерживает многопоточные загрузки (до 64 одновременных соединений), что не только ускоряет скачивание, но и даёт продвинутые инструменты для планирования задач и управления очередями.

📁 Language: #Python 99.7%

⭐️ Stars: 7k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥84👍1
This media is not supported in your browser
VIEW IN TELEGRAM
DeepAnalyze

Обычно анализ данных - от чистки и исследования до моделирования, визуализации и написания отчётов отнимает кучу времени. Особенно когда приходится возиться с кучей файлов разных форматов. Это тот ещё гемор.

К счастью, я наткнулся на опенсорсный проект DeepAnalyze, который позволяет ИИ полностью самостоятельно пройти весь цикл data science, реально без участия человека.

Он построен на DeepSeek-R1 и использует подход curriculum learning при обучении. Поддерживает весь пайплайн: подготовку данных, анализ, моделирование, визуализацию и генерацию отчётов.

Инструмент умеет работать с разными типами данных — базы данных, CSV, Excel, JSON, XML и в итоге генерирует профессиональные исследовательские отчёты.

📁 Language: #Python 94.9%

⭐️ Stars: 874

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍95
Media is too big
VIEW IN TELEGRAM
Math-To-Manim

Раньше, чтобы сделать интерактивные анимации для обучения математике или физике, приходилось использовать профинструменты вроде Manim + разбираться с рендерингом формул в LaTeX, движениями камеры и прочими тонкостями.

Теперь, с открытым инструментом Math-To-Manim, можно автоматически сгенерировать полноценную интерактивную анимацию по простому однофразовому описанию.

Инструмент сам анализирует концепции и постепенно выстраивает материал до нужной темы, автоматически создавая контент: подробные формулы LaTeX, раскадровку сцен и прочее — весь процесс полностью автоматизирован.

📁 Language: #Python 71.8%

⭐️ Stars: 1.2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆5👍4
agent-lightning

Когда делаешь агентные приложения и хочешь, чтобы они сами учились и прокачивались на реальных данных во время работы, всё упирается в сложную реализацию.

Microsoft недавно выкатили в опенсорс проект под названием Agent Lightning. Он сильно снижает порог входа и позволяет без боли добавить самооптимизацию агентам.

Нужно всего лишь добавить простые события для трекинга, и можно подключать разные алгоритмы: обучение с подкреплением, автооптимизацию промптов, supervised fine-tuning и прочее. Агент будет становиться умнее прямо в проде.

Плюс он дружит со всеми основными фреймворками для агентов: LangChain, AutoGen, CrewAI и даже обычные питоновские проекты поддерживает.

Архитектура легковесная, почти не лезет глубоко в исходники. Ставится через pip, а у ребят уже есть нормальные примеры и полная документация.

📁 Language: #Python 99.0%

⭐️ Stars: 3.4k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42
This media is not supported in your browser
VIEW IN TELEGRAM
MedRAX

После рентгена в больнице обычно приходится ещё торчать в очереди, пока результаты дойдут до врача и тот их посмотрит. Часто уходит больше часа, чистая морока.

Недавно я наткнулся на опенсорсный агент для анализа медизображений MedRAX на GitHub. Он как раз пытается поменять весь этот устаревший процесс.

В нём собраны разные специализированные инструменты для анализа снимков грудной клетки. Всё построено на LangChain и LangGraph, в роли основной модели работает GPT-4o.

Внутри семь крупных групп проф-инструментов: visual question answering, сегментация, поиск и локализация патологий, генерация отчётов, классификация заболеваний и не только. Агент умеет сам выбирать нужные модули и решать сложные задачи анализа снимков без дополнительного обучения.

Репозиторий клонируем, ставим зависимости, запускаем main.py — поднимается Gradio-интерфейс. Нужен OpenAI API key. Поддерживается локальный запуск и облако.

📁 Language: #Python 95.7%

⭐️ Stars: 845

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔5🔥4💊31
This media is not supported in your browser
VIEW IN TELEGRAM
gamewiki

При игре в сложные проекты часто приходится лезть в интернет за гайдами. Постоянные переключения между браузером и игрой убивают весь кайф.

На GitHub есть опенсорсный AI ассистент GameWiki. Он умеет прямо в игре показывать вики и ответы ИИ, так что нужная инфа появляется сразу под рукой.

Нажимаешь хоткей, выскакивает оверлей поверх игры. Не нужно сворачивать окно и рушить процесс. Можно просто спросить у ИИ и получить ответ на лету.

📁 Language: #Python 82.0%

⭐️ Stars: 126

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
😁42