Comic Translate
Comic Translate — это инструмент для перевода комиксов с использованием современных языковых моделей, таких как GPT-4o, поддерживающий множество языков.
Его основная цель — обеспечить качественный перевод, особенно в языковых парах, где традиционные переводчики не всегда справляются.
Проект предлагает пользователям графический интерфейс для ручного исправления ошибок и требует доступа к API от таких сервисов, как OpenAI и Google Cloud.
📁 Language: #Python 100.0%
⭐️ Stars: 2.2k
➡️ Cсылка на GitHub
📱 @git_developer
Comic Translate — это инструмент для перевода комиксов с использованием современных языковых моделей, таких как GPT-4o, поддерживающий множество языков.
Его основная цель — обеспечить качественный перевод, особенно в языковых парах, где традиционные переводчики не всегда справляются.
Проект предлагает пользователям графический интерфейс для ручного исправления ошибок и требует доступа к API от таких сервисов, как OpenAI и Google Cloud.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
skyvern
Раньше автоматизация в вебе держалась на разборе DOM и XPath. Больше всего бесило, что стоило сайту поменять разметку, приходилось снова отлавливать упавшие селекторы, чинить код и гонять отладку по кругу.
Сейчас можно попробовать Skyvern.
Это опенсорсный инструмент для браузерной автоматизации, который использует визуальные AI-модели, чтобы распознавать и понимать содержимое страницы.
Даже если верстку на сайте перекроят, он все равно постарается сохранить рабочий функционал. Поддерживает эмуляцию действий пользователя вроде заполнения форм, скачивания файлов, авторизации в аккаунте и прочих рутинных операций.
📁 Language: #Python 61.9%
⭐️ Stars: 17.8k
➡️ Cсылка на GitHub
📱 @git_developer
Раньше автоматизация в вебе держалась на разборе DOM и XPath. Больше всего бесило, что стоило сайту поменять разметку, приходилось снова отлавливать упавшие селекторы, чинить код и гонять отладку по кругу.
Сейчас можно попробовать Skyvern.
Это опенсорсный инструмент для браузерной автоматизации, который использует визуальные AI-модели, чтобы распознавать и понимать содержимое страницы.
Даже если верстку на сайте перекроят, он все равно постарается сохранить рабочий функционал. Поддерживает эмуляцию действий пользователя вроде заполнения форм, скачивания файлов, авторизации в аккаунте и прочих рутинных операций.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥7💊3❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenChatBI
Бесит, когда во время работы приходится каждый раз дергать базу за нужные данные. Каждый раз писать SQL, а если ещё и join'ы на несколько таблиц ..
Можно попробовать OpenChatBI. Это опенсорсная умная BI тулза, которая позволяет запрашивать и анализировать данные обычным человеческим языком. То есть можно забыть про ручной SQL.
Она построена на LangGraph и LangChain, понимает естественное описание запроса и сама генерирует SQL, выполняет его и может строить визуальные графики.
📁 Language: #Python 99.4%
⭐️ Stars: 207
➡️ Cсылка на GitHub
📱 @git_developer
Бесит, когда во время работы приходится каждый раз дергать базу за нужные данные. Каждый раз писать SQL, а если ещё и join'ы на несколько таблиц ..
Можно попробовать OpenChatBI. Это опенсорсная умная BI тулза, которая позволяет запрашивать и анализировать данные обычным человеческим языком. То есть можно забыть про ручной SQL.
Она построена на LangGraph и LangChain, понимает естественное описание запроса и сама генерирует SQL, выполняет его и может строить визуальные графики.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4❤1
WriteHERE
Пиши крупные тексты с ИИ и сталкиваешься с тем, что логика разваливается, структура плавает, а текст ощущается как набор случайных абзацев. Причина простая: большинство моделей пишет по фиксированным шаблонам и не умеет гибко менять ход мысли как человек.
Команда выложила в открытый доступ WriteHERE — фреймворк, который использует человекоподобный адаптивный подход к планированию. Он позволяет ИИ писать так, будто он реально думает по ходу работы и корректирует план, а не просто генерирует подряд.
WriteHERE рекурсивно разбивает большую задачу на подзадачи, динамически комбинирует поиск, рассуждения и генерацию текста и может менять стратегию прямо во время написания.
📁 Language: #Python 68.0%
⭐️ Stars: 628
➡️ Cсылка на GitHub
📱 @git_developer
Пиши крупные тексты с ИИ и сталкиваешься с тем, что логика разваливается, структура плавает, а текст ощущается как набор случайных абзацев. Причина простая: большинство моделей пишет по фиксированным шаблонам и не умеет гибко менять ход мысли как человек.
Команда выложила в открытый доступ WriteHERE — фреймворк, который использует человекоподобный адаптивный подход к планированию. Он позволяет ИИ писать так, будто он реально думает по ходу работы и корректирует план, а не просто генерирует подряд.
WriteHERE рекурсивно разбивает большую задачу на подзадачи, динамически комбинирует поиск, рассуждения и генерацию текста и может менять стратегию прямо во время написания.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4💊1
reader3
Когда хочется подключать ИИ вроде Gemini, чтобы он помогал разбирать книги или анализировать содержание, копирование текста с ридера обычно превращается в гемор.
Особенно если хочется обсуждать книгу по главам. Выделять текст руками, копировать его — выбивает из ритма и ощущается как банальная трата времени.
Вчера Анджей Карпати, известный специалист в области ИИ, выложил в open source новый проект: reader3, который решает эту проблему очень аккуратно. Это легкий EPUB-ридер, позволяющий читать книгу вместе с ИИ.
Интерфейс у него максимально минималистичный: только необходимые функции чтения и навигации. Библиотекой тоже можно управлять через папки.
Фишка в том, что он разбивает EPUB на главы и показывает контент по одной главе.
Благодаря этому можно легко скопировать нужную часть книги и передать её большой модели для анализа или обсуждения. Это заметно улучшает опыт чтения в связке с ИИ.
И запустить всё очень просто — достаточно выполнить две команды через uv. В итоге это отличный инструмент для тех, кто любит читать и хочет использовать ИИ как компаньона для анализа текста.
📁 Language: #Python 61.0%
⭐️ Stars: 1.5k
➡️ Cсылка на GitHub
📱 @git_developer
Когда хочется подключать ИИ вроде Gemini, чтобы он помогал разбирать книги или анализировать содержание, копирование текста с ридера обычно превращается в гемор.
Особенно если хочется обсуждать книгу по главам. Выделять текст руками, копировать его — выбивает из ритма и ощущается как банальная трата времени.
Вчера Анджей Карпати, известный специалист в области ИИ, выложил в open source новый проект: reader3, который решает эту проблему очень аккуратно. Это легкий EPUB-ридер, позволяющий читать книгу вместе с ИИ.
Интерфейс у него максимально минималистичный: только необходимые функции чтения и навигации. Библиотекой тоже можно управлять через папки.
Фишка в том, что он разбивает EPUB на главы и показывает контент по одной главе.
Благодаря этому можно легко скопировать нужную часть книги и передать её большой модели для анализа или обсуждения. Это заметно улучшает опыт чтения в связке с ИИ.
И запустить всё очень просто — достаточно выполнить две команды через uv. В итоге это отличный инструмент для тех, кто любит читать и хочет использовать ИИ как компаньона для анализа текста.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍4
This media is not supported in your browser
VIEW IN TELEGRAM
sam-3d-objects
Вчера Meta выложила в открытый доступ модель SAM 3D. Новость практически утонула на фоне хайпа вокруг Gemini 3 Pro, но ей точно стоит уделить внимание.
Когда человек видит какой-то предмет и хочет получить из него 3D модель, классические инструменты моделирования оказываются слишком сложными и требующими долгого обучения. А фотографировать объект со всех ракурсов — ещё тот гемор.
А вот SAM 3D Objects от Meta умеет собирать полноценную 3D модель по одной единственной фотографии. Причём сразу с формой, текстурами и пространственной позицией.
Модель уверенно работает в реальных условиях. Даже если объект частично закрыт, очень маленький или кадр забит деталями, она всё равно корректно реконструирует его. Плюс умеет восстанавливать несколько объектов одновременно и сохранять их взаимное расположение в сцене.
Кроме модели есть онлайн-демо и примеры в Jupyter. Результат можно экспортировать в формат 3D Gaussian Splatting, чтобы дальше спокойно работать с ним в пайплайне.
После установки зависимостей всё запускается прямо из коробки. Подходит для e-commerce, интерьерки, быстрого создания ассетов для игр или любых сценариев, где нужна быстрая генерация 3D по фото.
📁 Language: #Python 98.0%
⭐️ Stars: 2.3k
➡️ Cсылка на GitHub
📱 @git_developer
Вчера Meta выложила в открытый доступ модель SAM 3D. Новость практически утонула на фоне хайпа вокруг Gemini 3 Pro, но ей точно стоит уделить внимание.
Когда человек видит какой-то предмет и хочет получить из него 3D модель, классические инструменты моделирования оказываются слишком сложными и требующими долгого обучения. А фотографировать объект со всех ракурсов — ещё тот гемор.
А вот SAM 3D Objects от Meta умеет собирать полноценную 3D модель по одной единственной фотографии. Причём сразу с формой, текстурами и пространственной позицией.
Модель уверенно работает в реальных условиях. Даже если объект частично закрыт, очень маленький или кадр забит деталями, она всё равно корректно реконструирует его. Плюс умеет восстанавливать несколько объектов одновременно и сохранять их взаимное расположение в сцене.
Кроме модели есть онлайн-демо и примеры в Jupyter. Результат можно экспортировать в формат 3D Gaussian Splatting, чтобы дальше спокойно работать с ним в пайплайне.
После установки зависимостей всё запускается прямо из коробки. Подходит для e-commerce, интерьерки, быстрого создания ассетов для игр или любых сценариев, где нужна быстрая генерация 3D по фото.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
MobiAgent
Посмотрел MobiAgent. Это опенсорс фреймворк на GitHub, и выглядит он реально круто. Он позволяет ИИ управлять телефоном почти как живой пользователь, выполняя довольно сложные сценарии.
У них есть готовое приложение, куда можно просто ввести команду, и оно само выполнит нужные действия. Есть поддержка запоминания пользовательских предпочтений, кастомизации пайплайнов выполнения и даже параллельной обработки задач.
Самое интересное, что внутри есть модуль извлечения опыта, который автоматически оптимизирует планирование на основе предыдущих задач. То есть агент со временем реально учится и адаптируется.
📁 Language: #Python 61.9%
⭐️ Stars: 486
➡️ Cсылка на GitHub
📱 @git_developer
Посмотрел MobiAgent. Это опенсорс фреймворк на GitHub, и выглядит он реально круто. Он позволяет ИИ управлять телефоном почти как живой пользователь, выполняя довольно сложные сценарии.
У них есть готовое приложение, куда можно просто ввести команду, и оно само выполнит нужные действия. Есть поддержка запоминания пользовательских предпочтений, кастомизации пайплайнов выполнения и даже параллельной обработки задач.
Самое интересное, что внутри есть модуль извлечения опыта, который автоматически оптимизирует планирование на основе предыдущих задач. То есть агент со временем реально учится и адаптируется.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3
Compounding Engineering Plugin
Когда используешь ИИ для разработки, самая сложная часть обычно не в том, чтобы писать код, а в том, чтобы заставить ИИ строго соблюдать существующие инженерные стандарты команды, а не генерировать что попало каждый раз.
Недавно наткнулся на open-source проект Compounding Engineering Plugin. Он предлагает довольно жёсткий рабочий цикл Plan-Work-Review, который помогает делать так, чтобы каждая итерация разработки с участием ИИ улучшала качество кода, а не плодила техдолг.
Это не просто память или сохранение контекста. На этапе Plan плагин глубоко анализирует кодовую базу, выявляет паттерны и генерирует подробный issue. Дальше разработка происходит в изолированной среде (worktree), а затем результат проходит ревью сразу более чем у 10 специализированных агентов.
Самая интересная часть — механизм Review. Там есть такие агенты, как security-sentinel (безопасность) и performance-oracle (производительность). Они ведут себя как опытные инженеры и буквально устраивают полноценную проверку кода.
Если хочется, чтобы Claude Code был не просто генератором кода, а дисциплинированным виртуальным коллегой, который не только пишет, но и умеет сам себя проверять — этот плагин однозначно стоит изучить.
📁 Language: #Python 60.1%
⭐️ Stars: 2k
➡️ Cсылка на GitHub
📱 @git_developer
Когда используешь ИИ для разработки, самая сложная часть обычно не в том, чтобы писать код, а в том, чтобы заставить ИИ строго соблюдать существующие инженерные стандарты команды, а не генерировать что попало каждый раз.
Недавно наткнулся на open-source проект Compounding Engineering Plugin. Он предлагает довольно жёсткий рабочий цикл Plan-Work-Review, который помогает делать так, чтобы каждая итерация разработки с участием ИИ улучшала качество кода, а не плодила техдолг.
Это не просто память или сохранение контекста. На этапе Plan плагин глубоко анализирует кодовую базу, выявляет паттерны и генерирует подробный issue. Дальше разработка происходит в изолированной среде (worktree), а затем результат проходит ревью сразу более чем у 10 специализированных агентов.
Самая интересная часть — механизм Review. Там есть такие агенты, как security-sentinel (безопасность) и performance-oracle (производительность). Они ведут себя как опытные инженеры и буквально устраивают полноценную проверку кода.
Если хочется, чтобы Claude Code был не просто генератором кода, а дисциплинированным виртуальным коллегой, который не только пишет, но и умеет сам себя проверять — этот плагин однозначно стоит изучить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤4🔥3
argos-translate
Если пользоваться Google, DeepL или онлайн-переводчиками на базе ИИ, всегда есть риск утечки чувствительных данных, а офлайн такие сервисы вообще недоступны.
Недавно наткнулся на офлайн-переводчик с открытым исходным кодом на Python: Argos Translate. Все данные обрабатываются локально, никуда не отправляются.
Поддерживает перевод между 40+ языками — китайский, английский, японский, французский, немецкий, испанский и другие. Если прямой модели нет, автоматически делает перевод через промежуточный язык, например испанский → английский → французский.
Работает как Python-библиотека, CLI-утилита и GUI-приложение. Есть поддержка GPU, умеет переводить HTML и разные документ-форматы, а также предоставляет онлайн-демку.
Если нужен офлайн-перевод или хочется поднять свой приватный переводчик ради защиты данных — проект точно стоит посмотреть.
📁 Language: #Python 94.7%
⭐️ Stars: 5.1k
➡️ Cсылка на GitHub
📱 @git_developer
Если пользоваться Google, DeepL или онлайн-переводчиками на базе ИИ, всегда есть риск утечки чувствительных данных, а офлайн такие сервисы вообще недоступны.
Недавно наткнулся на офлайн-переводчик с открытым исходным кодом на Python: Argos Translate. Все данные обрабатываются локально, никуда не отправляются.
Поддерживает перевод между 40+ языками — китайский, английский, японский, французский, немецкий, испанский и другие. Если прямой модели нет, автоматически делает перевод через промежуточный язык, например испанский → английский → французский.
Работает как Python-библиотека, CLI-утилита и GUI-приложение. Есть поддержка GPU, умеет переводить HTML и разные документ-форматы, а также предоставляет онлайн-демку.
Если нужен офлайн-перевод или хочется поднять свой приватный переводчик ради защиты данных — проект точно стоит посмотреть.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍4🔥4
Paper2All
После того как заканчиваешь писать научную работу, самый болезненный этап обычно — промо. Нужно делать проектный сайт, рисовать постер, монтировать видео, писать посты для соцсетей — и всё это иногда утомляет сильнее самой статьи.
Случайно наткнулся на Paper2All — открытый инструмент для академической продуктивности, который по одному загруженному PDF автоматически генерирует полный набор промо-материалов.
Он создаёт интерактивный сайт, научный постер, промо-видео, текст для соцсетей и прочее. Можно задать свои размеры постера, а для видео выбрать, нужен ли цифровой диктор.
Инструмент даже умеет генерировать посты под конкретные площадки вроде Twitter или Xiaohongshu, подстраивая стиль под платформу.
Достаточно развернуть у себя локально — есть подробная инструкция. Поддерживаются API моделей OpenAI, OpenRouter и другие.
Если у тебя вышла научная статья и нужно быстро собрать промо-пакет, чтобы повысить охват и видимость — эта штука серьёзно экономит время.
📁 Language: #Python 80.2%
⭐️ Stars: 275
➡️ Cсылка на GitHub
📱 @git_developer
После того как заканчиваешь писать научную работу, самый болезненный этап обычно — промо. Нужно делать проектный сайт, рисовать постер, монтировать видео, писать посты для соцсетей — и всё это иногда утомляет сильнее самой статьи.
Случайно наткнулся на Paper2All — открытый инструмент для академической продуктивности, который по одному загруженному PDF автоматически генерирует полный набор промо-материалов.
Он создаёт интерактивный сайт, научный постер, промо-видео, текст для соцсетей и прочее. Можно задать свои размеры постера, а для видео выбрать, нужен ли цифровой диктор.
Инструмент даже умеет генерировать посты под конкретные площадки вроде Twitter или Xiaohongshu, подстраивая стиль под платформу.
Достаточно развернуть у себя локально — есть подробная инструкция. Поддерживаются API моделей OpenAI, OpenRouter и другие.
Если у тебя вышла научная статья и нужно быстро собрать промо-пакет, чтобы повысить охват и видимость — эта штука серьёзно экономит время.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥2
Media is too big
VIEW IN TELEGRAM
MLE-agent
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
📁 Language: #Python 96.0%
⭐️ Stars: 1.4k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥2
qxresearch-event-1
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
📁 Language: #Python 100%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3🔥2
python-markdownify
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
📁 Language: #Python 100%
⭐️ Stars: 1.9k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1