GitHub Разработчика
17.4K subscribers
513 photos
340 videos
2 files
848 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
sam-3d-objects

Вчера Meta выложила в открытый доступ модель SAM 3D. Новость практически утонула на фоне хайпа вокруг Gemini 3 Pro, но ей точно стоит уделить внимание.

Когда человек видит какой-то предмет и хочет получить из него 3D модель, классические инструменты моделирования оказываются слишком сложными и требующими долгого обучения. А фотографировать объект со всех ракурсов — ещё тот гемор.

А вот SAM 3D Objects от Meta умеет собирать полноценную 3D модель по одной единственной фотографии. Причём сразу с формой, текстурами и пространственной позицией.

Модель уверенно работает в реальных условиях. Даже если объект частично закрыт, очень маленький или кадр забит деталями, она всё равно корректно реконструирует его. Плюс умеет восстанавливать несколько объектов одновременно и сохранять их взаимное расположение в сцене.

Кроме модели есть онлайн-демо и примеры в Jupyter. Результат можно экспортировать в формат 3D Gaussian Splatting, чтобы дальше спокойно работать с ним в пайплайне.

После установки зависимостей всё запускается прямо из коробки. Подходит для e-commerce, интерьерки, быстрого создания ассетов для игр или любых сценариев, где нужна быстрая генерация 3D по фото.

📁 Language: #Python 98.0%

⭐️ Stars: 2.3k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
MobiAgent

Посмотрел MobiAgent. Это опенсорс фреймворк на GitHub, и выглядит он реально круто. Он позволяет ИИ управлять телефоном почти как живой пользователь, выполняя довольно сложные сценарии.

У них есть готовое приложение, куда можно просто ввести команду, и оно само выполнит нужные действия. Есть поддержка запоминания пользовательских предпочтений, кастомизации пайплайнов выполнения и даже параллельной обработки задач.

Самое интересное, что внутри есть модуль извлечения опыта, который автоматически оптимизирует планирование на основе предыдущих задач. То есть агент со временем реально учится и адаптируется.

📁 Language: #Python 61.9%

⭐️ Stars: 486

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83
Compounding Engineering Plugin

Когда используешь ИИ для разработки, самая сложная часть обычно не в том, чтобы писать код, а в том, чтобы заставить ИИ строго соблюдать существующие инженерные стандарты команды, а не генерировать что попало каждый раз.

Недавно наткнулся на open-source проект Compounding Engineering Plugin. Он предлагает довольно жёсткий рабочий цикл Plan-Work-Review, который помогает делать так, чтобы каждая итерация разработки с участием ИИ улучшала качество кода, а не плодила техдолг.

Это не просто память или сохранение контекста. На этапе Plan плагин глубоко анализирует кодовую базу, выявляет паттерны и генерирует подробный issue. Дальше разработка происходит в изолированной среде (worktree), а затем результат проходит ревью сразу более чем у 10 специализированных агентов.

Самая интересная часть — механизм Review. Там есть такие агенты, как security-sentinel (безопасность) и performance-oracle (производительность). Они ведут себя как опытные инженеры и буквально устраивают полноценную проверку кода.

Если хочется, чтобы Claude Code был не просто генератором кода, а дисциплинированным виртуальным коллегой, который не только пишет, но и умеет сам себя проверять — этот плагин однозначно стоит изучить.

📁 Language: #Python 60.1%

⭐️ Stars: 2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74🔥3
argos-translate

Если пользоваться Google, DeepL или онлайн-переводчиками на базе ИИ, всегда есть риск утечки чувствительных данных, а офлайн такие сервисы вообще недоступны.

Недавно наткнулся на офлайн-переводчик с открытым исходным кодом на Python: Argos Translate. Все данные обрабатываются локально, никуда не отправляются.

Поддерживает перевод между 40+ языками — китайский, английский, японский, французский, немецкий, испанский и другие. Если прямой модели нет, автоматически делает перевод через промежуточный язык, например испанский → английский → французский.

Работает как Python-библиотека, CLI-утилита и GUI-приложение. Есть поддержка GPU, умеет переводить HTML и разные документ-форматы, а также предоставляет онлайн-демку.

Если нужен офлайн-перевод или хочется поднять свой приватный переводчик ради защиты данных — проект точно стоит посмотреть.

📁 Language: #Python 94.7%

⭐️ Stars: 5.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥5
Paper2All

После того как заканчиваешь писать научную работу, самый болезненный этап обычно — промо. Нужно делать проектный сайт, рисовать постер, монтировать видео, писать посты для соцсетей — и всё это иногда утомляет сильнее самой статьи.

Случайно наткнулся на Paper2All — открытый инструмент для академической продуктивности, который по одному загруженному PDF автоматически генерирует полный набор промо-материалов.

Он создаёт интерактивный сайт, научный постер, промо-видео, текст для соцсетей и прочее. Можно задать свои размеры постера, а для видео выбрать, нужен ли цифровой диктор.

Инструмент даже умеет генерировать посты под конкретные площадки вроде Twitter или Xiaohongshu, подстраивая стиль под платформу.

Достаточно развернуть у себя локально — есть подробная инструкция. Поддерживаются API моделей OpenAI, OpenRouter и другие.

Если у тебя вышла научная статья и нужно быстро собрать промо-пакет, чтобы повысить охват и видимость — эта штука серьёзно экономит время.

📁 Language: #Python 80.2%

⭐️ Stars: 275

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥5
Media is too big
VIEW IN TELEGRAM
MLE-agent

Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.

На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.

Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.

Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.

Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.

Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.

📁 Language: #Python 96.0%

⭐️ Stars: 1.4k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥3👍2
qxresearch-event-1

При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.

Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.

Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.

Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.

Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.

📁 Language: #Python 100%

⭐️ Stars: 2.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍85🔥4
python-markdownify

Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.

В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.

Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.

Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.

Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.

При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.

Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.

📁 Language: #Python 100%

⭐️ Stars: 1.9k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103
Media is too big
VIEW IN TELEGRAM
OpenContracts

Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.

На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.

Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.

Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.

Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.

Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.

📁 Language: #TypeScript 52.3%, #Python 46.9%

⭐️ Stars: 985

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍7🔥2
inksight

Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.

Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.

Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.

Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:

на уровне слов,

и на уровне всей страницы.

На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.

Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.

📁 Language: #Python 13.2%

⭐️ Stars: 759

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍7🔥3
shapash

Обучить модель машинного обучения — это только первый шаг. Самая болезненная часть начинается, когда нужно объяснить начальству или бизнес-команде, почему модель выдала именно такой прогноз. В случае с «черными ящиками» обычно просто нечего сказать.

Недавно я нашел на GitHub библиотеку Shapash — Python-инструмент, который как раз помогает сделать модель «понятной», превращая сложную алгоритмическую логику в наглядные визуализации.

Библиотека умеет генерировать интерактивную веб-панель, где наглядно показано, какие признаки и как влияют на работу модели. Поддерживается детальный разбор от глобального уровня до отдельных предсказаний. И самое важное — все графики сопровождаются понятными бизнес-лейблами, так что даже люди без техбэкграунда смогут быстро разобраться.

Работает с CatBoost, XGBoost, LightGBM и Sklearn — то есть покрывает основные ML-фреймворки.

Помимо визуализации, библиотека может одним вызовом собрать отдельный HTML-отчет для аудита. Есть даже легковесный предиктор для продакшена, который ставится через pip и сразу готов к использованию.

Если ты регулярно показываешь результаты моделей нетехническим командам или тебе нужна прозрачность для регуляторных проверок, этот проект реально экономит кучу времени на объяснениях.

📁 Language: #Python 14.3%

⭐️ Stars: 3.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2