This media is not supported in your browser
VIEW IN TELEGRAM
Paper2Agent
Если код статьи на GitHub обычно вызывает головную боль при запуске, Paper2Agent решает это за тебя и превращает любой репозиторий в интерактивного AI-агента
Мульти-агентная система анализирует код, создаёт MCP-сервер и интегрирует его с Claude Code, чтобы методы статьи были доступны через диалог
Плюсы — автоматическая настройка среды, управление зависимостями, поддержка разных научных областей, предустановленные агенты для AlphaGenome, Scanpy, TISSUE
После установки Python 3.10+ и Claude Code одной командой можно превратить любой код статьи в AI-агента. Очень удобный инструмент для исследователей и разработчиков.
📁 Language: #Python 4.0%
⭐️ Stars: 417
➡️ Cсылка на GitHub
📱 @git_developer
Если код статьи на GitHub обычно вызывает головную боль при запуске, Paper2Agent решает это за тебя и превращает любой репозиторий в интерактивного AI-агента
Мульти-агентная система анализирует код, создаёт MCP-сервер и интегрирует его с Claude Code, чтобы методы статьи были доступны через диалог
Плюсы — автоматическая настройка среды, управление зависимостями, поддержка разных научных областей, предустановленные агенты для AlphaGenome, Scanpy, TISSUE
После установки Python 3.10+ и Claude Code одной командой можно превратить любой код статьи в AI-агента. Очень удобный инструмент для исследователей и разработчиков.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍6
DrizzleTime/Foxel
Если ваши файлы разбросаны по разным местам — облачные диски, локальный жёсткий диск или NAS —> иногда сложно вспомнить, где именно что хранится.
Рекомендуется обратить внимание на Foxel - этот open-source инструмент для приватного облачного хранения позволяет унифицированно управлять файлами, разбросанными по разным хранилищам.
Особенно интересно, что поддерживается AI‑семантический поиск —> можно искать картинки и документы по содержимому с помощью естественного языка, а не только по имени файла.
📁 Language: #TypeScript 55.5%, #Python 41.5%
⭐️ Stars: 624
➡️ Cсылка на GitHub
📱 @git_developer
Если ваши файлы разбросаны по разным местам — облачные диски, локальный жёсткий диск или NAS —> иногда сложно вспомнить, где именно что хранится.
Рекомендуется обратить внимание на Foxel - этот open-source инструмент для приватного облачного хранения позволяет унифицированно управлять файлами, разбросанными по разным хранилищам.
Особенно интересно, что поддерживается AI‑семантический поиск —> можно искать картинки и документы по содержимому с помощью естественного языка, а не только по имени файла.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Logics-Parsing
При обработке академических статей или исследовательских отчётов с помощью OCR, когда в документе есть сложные формулы, таблицы и графики, к качеству распознавания модели предъявляются особенно высокие требования.
Техническая команда Alibaba недавно выложила в опенсорс end-to-end модель для парсинга документов — Logics-Parsing, которая умеет напрямую конвертировать сложные документы в структурированный HTML.
Модель не только корректно распознаёт сложные научные формулы и химические структуры, но и автоматически отфильтровывает лишний контент вроде колонтитулов и футеров, фокусируясь на извлечении основной информации.
Поддерживаются разные типы входных данных: исследовательские отчёты, научные статьи, химическая документация, рукописные заметки и др.
В ряде бенчмарков модель показала результаты выше многих аналогов. Если у вас есть задачи по OCR сложных документов — стоит попробовать.
📁 Language: #Python 100.0%
⭐️ Stars: 369
➡️ Cсылка на GitHub
📱 @git_developer
При обработке академических статей или исследовательских отчётов с помощью OCR, когда в документе есть сложные формулы, таблицы и графики, к качеству распознавания модели предъявляются особенно высокие требования.
Техническая команда Alibaba недавно выложила в опенсорс end-to-end модель для парсинга документов — Logics-Parsing, которая умеет напрямую конвертировать сложные документы в структурированный HTML.
Модель не только корректно распознаёт сложные научные формулы и химические структуры, но и автоматически отфильтровывает лишний контент вроде колонтитулов и футеров, фокусируясь на извлечении основной информации.
Поддерживаются разные типы входных данных: исследовательские отчёты, научные статьи, химическая документация, рукописные заметки и др.
В ряде бенчмарков модель показала результаты выше многих аналогов. Если у вас есть задачи по OCR сложных документов — стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍8🔥1
anki-hyper-tts
Использовать Anki для заучивания слов действительно удобно, но вот его встроенный модуль озвучки оставляет желать лучшего — для тренировки произношения он не очень подходит.
Поэтому один разработчик сделал и выложил в open source мощный плагин anki-hyper-tts, который добавляет в Anki профессиональное качество синтеза речи.
Плагин поддерживает несколько TTS-сервисов с высоким качеством, благодаря чему можно добавить к карточкам естественное и плавное озвучивание на любом языке — обучение сразу становится более живым и интересным.
У плагина простой и удобный интерфейс, никаких сложных настроек — всё работает «из коробки». Поддерживается массовая обработка: можно в один клик озвучить сразу большое количество карточек.
Если вы учите иностранные языки через Anki, достаточно в меню «Получить дополнение» вставить код 111623432, чтобы установить плагин.
📁 Language: #Python 99.8%
⭐️ Stars: 188
➡️ Cсылка на GitHub
📱 @git_developer
Использовать Anki для заучивания слов действительно удобно, но вот его встроенный модуль озвучки оставляет желать лучшего — для тренировки произношения он не очень подходит.
Поэтому один разработчик сделал и выложил в open source мощный плагин anki-hyper-tts, который добавляет в Anki профессиональное качество синтеза речи.
Плагин поддерживает несколько TTS-сервисов с высоким качеством, благодаря чему можно добавить к карточкам естественное и плавное озвучивание на любом языке — обучение сразу становится более живым и интересным.
У плагина простой и удобный интерфейс, никаких сложных настроек — всё работает «из коробки». Поддерживается массовая обработка: можно в один клик озвучить сразу большое количество карточек.
Если вы учите иностранные языки через Anki, достаточно в меню «Получить дополнение» вставить код 111623432, чтобы установить плагин.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Code2Video
Команда Show Lab из Национального университета Сингапура представила open-source проект Code2Video - инструмент, который автоматически генерирует качественные образовательные видео из кода.
В основе решения — три AI-агента, которые работают совместно:
🔸 Планировщик создаёт сториборд,
🔸 Кодер пишет исполняемый код,
🔸 Оценщик оптимизирует визуальное оформление и логику.
Code2Video использует движок Manim для визуализации, поддерживает автоматическую интеграцию иконок и графики, а также включает MMMC-бенчмарк с 117 обучающими темами.
Разработчики могут клонировать репозиторий, установить зависимости и указать API-ключ LLM — после чего инструмент готов к работе.
Проект обещает сделать создание учебных видео столь же простым, как написание кода.
📁 Language: #Python 98.7%
⭐️ Stars: 136
➡️ Cсылка на GitHub
📱 @git_developer
Команда Show Lab из Национального университета Сингапура представила open-source проект Code2Video - инструмент, который автоматически генерирует качественные образовательные видео из кода.
В основе решения — три AI-агента, которые работают совместно:
Code2Video использует движок Manim для визуализации, поддерживает автоматическую интеграцию иконок и графики, а также включает MMMC-бенчмарк с 117 обучающими темами.
Разработчики могут клонировать репозиторий, установить зависимости и указать API-ключ LLM — после чего инструмент готов к работе.
Проект обещает сделать создание учебных видео столь же простым, как написание кода.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🌭2❤1👍1
Varia
Часто приходится использовать разные инструменты для загрузок: обычные файлы через браузер, торренты через отдельный клиент, а для видео вообще отдельный софт. Довольно неудобно.
К счастью, нашёл Varia — open source менеджер загрузок, который объединяет файлы, торренты и видеопотоки в одном интерфейсе.
Он поддерживает не только обычные файлы и BT-загрузки, но и умеет напрямую скачивать видео и аудио с популярных платформ. Есть даже расширения для браузеров, позволяющие в один клик отправлять загрузку в приложение.
Основные возможности:
🔸 Единое управление всеми задачами загрузки: файлы, торренты, видеопотоки и т.д.
🔸 Поддержка скачивания и конвертации аудио/видео с популярных видеосервисов.
🔸 Расширения для Firefox и Chrome — отправляйте загрузки одним кликом.
🔸 Основан на aria2 и yt-dlp, что гарантирует стабильность и совместимость.
🔸 Поддержка автоматического выключения ПК после завершения загрузок и других удобных функций.
Доступны готовые установочные пакеты для Windows и Linux — можно попробовать прямо сейчас.
📁 Language: #Python 92.5%
⭐️ Stars: 993
➡️ Cсылка на GitHub
📱 @git_developer
Часто приходится использовать разные инструменты для загрузок: обычные файлы через браузер, торренты через отдельный клиент, а для видео вообще отдельный софт. Довольно неудобно.
К счастью, нашёл Varia — open source менеджер загрузок, который объединяет файлы, торренты и видеопотоки в одном интерфейсе.
Он поддерживает не только обычные файлы и BT-загрузки, но и умеет напрямую скачивать видео и аудио с популярных платформ. Есть даже расширения для браузеров, позволяющие в один клик отправлять загрузку в приложение.
Основные возможности:
Доступны готовые установочные пакеты для Windows и Linux — можно попробовать прямо сейчас.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
NeuTTS Air
NeuTTS Air — сверхреалистичный AI-голос на локальной машине
Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.
Особенности:
🔸 Голос почти как у человека;
🔸 Клонирование голоса по 3 секундам аудио;
🔸 Полностью локально — приватность под контролем;
🔸 Лёгкая и быстрая генерация даже на средних устройствах;
🔸 Встроенные водяные знаки для отслеживаемости аудио.
📁 Language: #Python 100.0%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
NeuTTS Air — сверхреалистичный AI-голос на локальной машине
Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.
Особенности:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Use Preview
Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5
Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.
Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.
📁 Language: #Python 100.0%
⭐️ Stars: 931
➡️ Cсылка на GitHub
📱 @git_developer
Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5
Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.
Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3
LeetGPU Challenges
LeetCode для GPU-разработчиков
Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.
Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.
📁 Language: #Python 72.1%
⭐️ Stars: 170
➡️ Cсылка на GitHub
📱 @git_developer
LeetCode для GPU-разработчиков
Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.
Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.
Please open Telegram to view this post
VIEW IN TELEGRAM
PaddleOCR
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
📁 Language: #Python 77.0%
⭐️ Stars: 57.5k
➡️ Cсылка на GitHub
📱 @git_developer
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2
Ducky
Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.
Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.
Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.
📁 Language: #Python 99.0%
⭐️ Stars: 362
➡️ Cсылка на GitHub
📱 @git_developer
Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.
Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.
Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤2