This media is not supported in your browser
VIEW IN TELEGRAM
sam-3d-objects
Вчера Meta выложила в открытый доступ модель SAM 3D. Новость практически утонула на фоне хайпа вокруг Gemini 3 Pro, но ей точно стоит уделить внимание.
Когда человек видит какой-то предмет и хочет получить из него 3D модель, классические инструменты моделирования оказываются слишком сложными и требующими долгого обучения. А фотографировать объект со всех ракурсов — ещё тот гемор.
А вот SAM 3D Objects от Meta умеет собирать полноценную 3D модель по одной единственной фотографии. Причём сразу с формой, текстурами и пространственной позицией.
Модель уверенно работает в реальных условиях. Даже если объект частично закрыт, очень маленький или кадр забит деталями, она всё равно корректно реконструирует его. Плюс умеет восстанавливать несколько объектов одновременно и сохранять их взаимное расположение в сцене.
Кроме модели есть онлайн-демо и примеры в Jupyter. Результат можно экспортировать в формат 3D Gaussian Splatting, чтобы дальше спокойно работать с ним в пайплайне.
После установки зависимостей всё запускается прямо из коробки. Подходит для e-commerce, интерьерки, быстрого создания ассетов для игр или любых сценариев, где нужна быстрая генерация 3D по фото.
📁 Language: #Python 98.0%
⭐️ Stars: 2.3k
➡️ Cсылка на GitHub
📱 @git_developer
Вчера Meta выложила в открытый доступ модель SAM 3D. Новость практически утонула на фоне хайпа вокруг Gemini 3 Pro, но ей точно стоит уделить внимание.
Когда человек видит какой-то предмет и хочет получить из него 3D модель, классические инструменты моделирования оказываются слишком сложными и требующими долгого обучения. А фотографировать объект со всех ракурсов — ещё тот гемор.
А вот SAM 3D Objects от Meta умеет собирать полноценную 3D модель по одной единственной фотографии. Причём сразу с формой, текстурами и пространственной позицией.
Модель уверенно работает в реальных условиях. Даже если объект частично закрыт, очень маленький или кадр забит деталями, она всё равно корректно реконструирует его. Плюс умеет восстанавливать несколько объектов одновременно и сохранять их взаимное расположение в сцене.
Кроме модели есть онлайн-демо и примеры в Jupyter. Результат можно экспортировать в формат 3D Gaussian Splatting, чтобы дальше спокойно работать с ним в пайплайне.
После установки зависимостей всё запускается прямо из коробки. Подходит для e-commerce, интерьерки, быстрого создания ассетов для игр или любых сценариев, где нужна быстрая генерация 3D по фото.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
MobiAgent
Посмотрел MobiAgent. Это опенсорс фреймворк на GitHub, и выглядит он реально круто. Он позволяет ИИ управлять телефоном почти как живой пользователь, выполняя довольно сложные сценарии.
У них есть готовое приложение, куда можно просто ввести команду, и оно само выполнит нужные действия. Есть поддержка запоминания пользовательских предпочтений, кастомизации пайплайнов выполнения и даже параллельной обработки задач.
Самое интересное, что внутри есть модуль извлечения опыта, который автоматически оптимизирует планирование на основе предыдущих задач. То есть агент со временем реально учится и адаптируется.
📁 Language: #Python 61.9%
⭐️ Stars: 486
➡️ Cсылка на GitHub
📱 @git_developer
Посмотрел MobiAgent. Это опенсорс фреймворк на GitHub, и выглядит он реально круто. Он позволяет ИИ управлять телефоном почти как живой пользователь, выполняя довольно сложные сценарии.
У них есть готовое приложение, куда можно просто ввести команду, и оно само выполнит нужные действия. Есть поддержка запоминания пользовательских предпочтений, кастомизации пайплайнов выполнения и даже параллельной обработки задач.
Самое интересное, что внутри есть модуль извлечения опыта, который автоматически оптимизирует планирование на основе предыдущих задач. То есть агент со временем реально учится и адаптируется.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3
Compounding Engineering Plugin
Когда используешь ИИ для разработки, самая сложная часть обычно не в том, чтобы писать код, а в том, чтобы заставить ИИ строго соблюдать существующие инженерные стандарты команды, а не генерировать что попало каждый раз.
Недавно наткнулся на open-source проект Compounding Engineering Plugin. Он предлагает довольно жёсткий рабочий цикл Plan-Work-Review, который помогает делать так, чтобы каждая итерация разработки с участием ИИ улучшала качество кода, а не плодила техдолг.
Это не просто память или сохранение контекста. На этапе Plan плагин глубоко анализирует кодовую базу, выявляет паттерны и генерирует подробный issue. Дальше разработка происходит в изолированной среде (worktree), а затем результат проходит ревью сразу более чем у 10 специализированных агентов.
Самая интересная часть — механизм Review. Там есть такие агенты, как security-sentinel (безопасность) и performance-oracle (производительность). Они ведут себя как опытные инженеры и буквально устраивают полноценную проверку кода.
Если хочется, чтобы Claude Code был не просто генератором кода, а дисциплинированным виртуальным коллегой, который не только пишет, но и умеет сам себя проверять — этот плагин однозначно стоит изучить.
📁 Language: #Python 60.1%
⭐️ Stars: 2k
➡️ Cсылка на GitHub
📱 @git_developer
Когда используешь ИИ для разработки, самая сложная часть обычно не в том, чтобы писать код, а в том, чтобы заставить ИИ строго соблюдать существующие инженерные стандарты команды, а не генерировать что попало каждый раз.
Недавно наткнулся на open-source проект Compounding Engineering Plugin. Он предлагает довольно жёсткий рабочий цикл Plan-Work-Review, который помогает делать так, чтобы каждая итерация разработки с участием ИИ улучшала качество кода, а не плодила техдолг.
Это не просто память или сохранение контекста. На этапе Plan плагин глубоко анализирует кодовую базу, выявляет паттерны и генерирует подробный issue. Дальше разработка происходит в изолированной среде (worktree), а затем результат проходит ревью сразу более чем у 10 специализированных агентов.
Самая интересная часть — механизм Review. Там есть такие агенты, как security-sentinel (безопасность) и performance-oracle (производительность). Они ведут себя как опытные инженеры и буквально устраивают полноценную проверку кода.
Если хочется, чтобы Claude Code был не просто генератором кода, а дисциплинированным виртуальным коллегой, который не только пишет, но и умеет сам себя проверять — этот плагин однозначно стоит изучить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4🔥3
argos-translate
Если пользоваться Google, DeepL или онлайн-переводчиками на базе ИИ, всегда есть риск утечки чувствительных данных, а офлайн такие сервисы вообще недоступны.
Недавно наткнулся на офлайн-переводчик с открытым исходным кодом на Python: Argos Translate. Все данные обрабатываются локально, никуда не отправляются.
Поддерживает перевод между 40+ языками — китайский, английский, японский, французский, немецкий, испанский и другие. Если прямой модели нет, автоматически делает перевод через промежуточный язык, например испанский → английский → французский.
Работает как Python-библиотека, CLI-утилита и GUI-приложение. Есть поддержка GPU, умеет переводить HTML и разные документ-форматы, а также предоставляет онлайн-демку.
Если нужен офлайн-перевод или хочется поднять свой приватный переводчик ради защиты данных — проект точно стоит посмотреть.
📁 Language: #Python 94.7%
⭐️ Stars: 5.1k
➡️ Cсылка на GitHub
📱 @git_developer
Если пользоваться Google, DeepL или онлайн-переводчиками на базе ИИ, всегда есть риск утечки чувствительных данных, а офлайн такие сервисы вообще недоступны.
Недавно наткнулся на офлайн-переводчик с открытым исходным кодом на Python: Argos Translate. Все данные обрабатываются локально, никуда не отправляются.
Поддерживает перевод между 40+ языками — китайский, английский, японский, французский, немецкий, испанский и другие. Если прямой модели нет, автоматически делает перевод через промежуточный язык, например испанский → английский → французский.
Работает как Python-библиотека, CLI-утилита и GUI-приложение. Есть поддержка GPU, умеет переводить HTML и разные документ-форматы, а также предоставляет онлайн-демку.
Если нужен офлайн-перевод или хочется поднять свой приватный переводчик ради защиты данных — проект точно стоит посмотреть.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍8🔥5
Paper2All
После того как заканчиваешь писать научную работу, самый болезненный этап обычно — промо. Нужно делать проектный сайт, рисовать постер, монтировать видео, писать посты для соцсетей — и всё это иногда утомляет сильнее самой статьи.
Случайно наткнулся на Paper2All — открытый инструмент для академической продуктивности, который по одному загруженному PDF автоматически генерирует полный набор промо-материалов.
Он создаёт интерактивный сайт, научный постер, промо-видео, текст для соцсетей и прочее. Можно задать свои размеры постера, а для видео выбрать, нужен ли цифровой диктор.
Инструмент даже умеет генерировать посты под конкретные площадки вроде Twitter или Xiaohongshu, подстраивая стиль под платформу.
Достаточно развернуть у себя локально — есть подробная инструкция. Поддерживаются API моделей OpenAI, OpenRouter и другие.
Если у тебя вышла научная статья и нужно быстро собрать промо-пакет, чтобы повысить охват и видимость — эта штука серьёзно экономит время.
📁 Language: #Python 80.2%
⭐️ Stars: 275
➡️ Cсылка на GitHub
📱 @git_developer
После того как заканчиваешь писать научную работу, самый болезненный этап обычно — промо. Нужно делать проектный сайт, рисовать постер, монтировать видео, писать посты для соцсетей — и всё это иногда утомляет сильнее самой статьи.
Случайно наткнулся на Paper2All — открытый инструмент для академической продуктивности, который по одному загруженному PDF автоматически генерирует полный набор промо-материалов.
Он создаёт интерактивный сайт, научный постер, промо-видео, текст для соцсетей и прочее. Можно задать свои размеры постера, а для видео выбрать, нужен ли цифровой диктор.
Инструмент даже умеет генерировать посты под конкретные площадки вроде Twitter или Xiaohongshu, подстраивая стиль под платформу.
Достаточно развернуть у себя локально — есть подробная инструкция. Поддерживаются API моделей OpenAI, OpenRouter и другие.
Если у тебя вышла научная статья и нужно быстро собрать промо-пакет, чтобы повысить охват и видимость — эта штука серьёзно экономит время.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥5
Media is too big
VIEW IN TELEGRAM
MLE-agent
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
📁 Language: #Python 96.0%
⭐️ Stars: 1.4k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥3👍2
qxresearch-event-1
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
📁 Language: #Python 100%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5🔥4
python-markdownify
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
📁 Language: #Python 100%
⭐️ Stars: 1.9k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤3
Media is too big
VIEW IN TELEGRAM
OpenContracts
Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.
На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.
Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.
Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.
Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.
Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.
📁 Language: #TypeScript 52.3%, #Python 46.9%
⭐️ Stars: 985
➡️ Cсылка на GitHub
📱 @git_developer
Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.
На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.
Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.
Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.
Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.
Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍7🔥2
inksight
Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.
Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.
Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.
Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:
на уровне слов,
и на уровне всей страницы.
На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.
Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.
📁 Language: #Python 13.2%
⭐️ Stars: 759
➡️ Cсылка на GitHub
📱 @git_developer
Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.
Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.
Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.
Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:
на уровне слов,
и на уровне всей страницы.
На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.
Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤8👍7🔥3
shapash
Обучить модель машинного обучения — это только первый шаг. Самая болезненная часть начинается, когда нужно объяснить начальству или бизнес-команде, почему модель выдала именно такой прогноз. В случае с «черными ящиками» обычно просто нечего сказать.
Недавно я нашел на GitHub библиотеку Shapash — Python-инструмент, который как раз помогает сделать модель «понятной», превращая сложную алгоритмическую логику в наглядные визуализации.
Библиотека умеет генерировать интерактивную веб-панель, где наглядно показано, какие признаки и как влияют на работу модели. Поддерживается детальный разбор от глобального уровня до отдельных предсказаний. И самое важное — все графики сопровождаются понятными бизнес-лейблами, так что даже люди без техбэкграунда смогут быстро разобраться.
Работает с CatBoost, XGBoost, LightGBM и Sklearn — то есть покрывает основные ML-фреймворки.
Помимо визуализации, библиотека может одним вызовом собрать отдельный HTML-отчет для аудита. Есть даже легковесный предиктор для продакшена, который ставится через pip и сразу готов к использованию.
Если ты регулярно показываешь результаты моделей нетехническим командам или тебе нужна прозрачность для регуляторных проверок, этот проект реально экономит кучу времени на объяснениях.
📁 Language: #Python 14.3%
⭐️ Stars: 3.1k
➡️ Cсылка на GitHub
📱 @git_developer
Обучить модель машинного обучения — это только первый шаг. Самая болезненная часть начинается, когда нужно объяснить начальству или бизнес-команде, почему модель выдала именно такой прогноз. В случае с «черными ящиками» обычно просто нечего сказать.
Недавно я нашел на GitHub библиотеку Shapash — Python-инструмент, который как раз помогает сделать модель «понятной», превращая сложную алгоритмическую логику в наглядные визуализации.
Библиотека умеет генерировать интерактивную веб-панель, где наглядно показано, какие признаки и как влияют на работу модели. Поддерживается детальный разбор от глобального уровня до отдельных предсказаний. И самое важное — все графики сопровождаются понятными бизнес-лейблами, так что даже люди без техбэкграунда смогут быстро разобраться.
Работает с CatBoost, XGBoost, LightGBM и Sklearn — то есть покрывает основные ML-фреймворки.
Помимо визуализации, библиотека может одним вызовом собрать отдельный HTML-отчет для аудита. Есть даже легковесный предиктор для продакшена, который ставится через pip и сразу готов к использованию.
Если ты регулярно показываешь результаты моделей нетехническим командам или тебе нужна прозрачность для регуляторных проверок, этот проект реально экономит кучу времени на объяснениях.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2