Text Grab
Text Grab — бесплатный open-source OCR для Windows, распознаёт любой видимый текст на экране и копирует его в буфер обмена. Работает оффлайн на встроенном OCR API.
Фичи: полный экран, рамка для захвата текста, редактор с поддержкой регекспов и удаления дубликатов, быстрый поиск часто используемых фрагментов, пакетная обработка изображений, запуск через командную строку.
Устанавливается через Microsoft Store, GitHub, scoop или choco.
📁 Language: #Csharp 99.3%
⭐️ Stars: 4k
➡️ Cсылка на GitHub
📱 @git_developer
Text Grab — бесплатный open-source OCR для Windows, распознаёт любой видимый текст на экране и копирует его в буфер обмена. Работает оффлайн на встроенном OCR API.
Фичи: полный экран, рамка для захвата текста, редактор с поддержкой регекспов и удаления дубликатов, быстрый поиск часто используемых фрагментов, пакетная обработка изображений, запуск через командную строку.
Устанавливается через Microsoft Store, GitHub, scoop или choco.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍5❤3
Peersuite
На GitHub появился полностью децентрализованный open-source платформенный инструмент для командной работы — Peersuite. Создаёт приватные рабочие пространства с end-to-end шифрованием через WebRTC: все данные идут напрямую между клиентами, без серверов.
Фичи: каналы и личные чаты, превью изображений, передача файлов, совместное редактирование документов, канбан для задач, встроенная белая доска с поддержкой диаграмм и экспорта PNG.
Можно попробовать онлайн Demo или развернуть через Docker для работы на десктопе и мобильных устройствах.
📁 Language: #JavaScript 70.9%
⭐️ Stars: 4k
➡️ Cсылка на GitHub
📱 @git_developer
На GitHub появился полностью децентрализованный open-source платформенный инструмент для командной работы — Peersuite. Создаёт приватные рабочие пространства с end-to-end шифрованием через WebRTC: все данные идут напрямую между клиентами, без серверов.
Фичи: каналы и личные чаты, превью изображений, передача файлов, совместное редактирование документов, канбан для задач, встроенная белая доска с поддержкой диаграмм и экспорта PNG.
Можно попробовать онлайн Demo или развернуть через Docker для работы на десктопе и мобильных устройствах.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
NeuTTS Air
NeuTTS Air — сверхреалистичный AI-голос на локальной машине
Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.
Особенности:
🔸 Голос почти как у человека;
🔸 Клонирование голоса по 3 секундам аудио;
🔸 Полностью локально — приватность под контролем;
🔸 Лёгкая и быстрая генерация даже на средних устройствах;
🔸 Встроенные водяные знаки для отслеживаемости аудио.
📁 Language: #Python 100.0%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
NeuTTS Air — сверхреалистичный AI-голос на локальной машине
Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.
Особенности:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥5👍3
Faved
Если вы храните много веб-ссылок, встроенные закладки браузера часто кажутся слишком простыми и неудобными. Недавно я нашёл Faved — открытое self-hosted решение для управления закладками. Оно предлагает интуитивно понятный веб-интерфейс, поддерживает цветные вложенные теги и позволяет быстро сохранять ссылки через мини-виджет прямо в браузере.
Полностью open-source, лёгкое и быстрое, с возможностью импорта из Pocket и хранения всех данных на своём сервере. Развёртывается одной командой через Docker.
📁 Language: #TypeScript 76.5%, #PHP 21.2%
⭐️ Stars: 213
➡️ Cсылка на GitHub
📱 @git_developer
Если вы храните много веб-ссылок, встроенные закладки браузера часто кажутся слишком простыми и неудобными. Недавно я нашёл Faved — открытое self-hosted решение для управления закладками. Оно предлагает интуитивно понятный веб-интерфейс, поддерживает цветные вложенные теги и позволяет быстро сохранять ссылки через мини-виджет прямо в браузере.
Полностью open-source, лёгкое и быстрое, с возможностью импорта из Pocket и хранения всех данных на своём сервере. Развёртывается одной командой через Docker.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤5
cypht
Когда у тебя несколько почтовых аккаунтов, постоянно переключаться между Gmail, Outlook и корпоративной почтой действительно неудобно.
Совсем недавно нашёл Cypht — это open-source почтовый клиент, который позволяет управлять всеми почтовыми аккаунтами в одном месте.
Он объединяет все ящики в одном интерфейсе и даёт единый, «ридер-подобный» опыт работы с почтой, поддерживает управление папками и отправку писем.
Cypht построен на модульной архитектуре → помимо стандартных протоколов IMAP/SMTP, поддерживает современные JMAP и EWS.
Плюс упор сделан на приватность → все данные хранятся локально и полностью под твоим контролем.
Есть поддержка Docker-развёртывания и установка через Composer, так что Cypht подойдёт тем, у кого несколько почтовых ящиков и кто серьёзно относится к приватности.
📁 Language: #PHP 77.0%
⭐️ Stars: 1.3k
➡️ Cсылка на GitHub
📱 @git_developer
Когда у тебя несколько почтовых аккаунтов, постоянно переключаться между Gmail, Outlook и корпоративной почтой действительно неудобно.
Совсем недавно нашёл Cypht — это open-source почтовый клиент, который позволяет управлять всеми почтовыми аккаунтами в одном месте.
Он объединяет все ящики в одном интерфейсе и даёт единый, «ридер-подобный» опыт работы с почтой, поддерживает управление папками и отправку писем.
Cypht построен на модульной архитектуре → помимо стандартных протоколов IMAP/SMTP, поддерживает современные JMAP и EWS.
Плюс упор сделан на приватность → все данные хранятся локально и полностью под твоим контролем.
Есть поддержка Docker-развёртывания и установка через Composer, так что Cypht подойдёт тем, у кого несколько почтовых ящиков и кто серьёзно относится к приватности.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Gameboy.Live
Хочешь снова поиграть в классику вроде Tetris или Super Mario для Game Boy, но оригинальную консоль уже не найти, а современные устройства не поддерживают старые игры?
Недавно случайно наткнулся на Gameboy.Live open-source эмулятор, который не только отлично запускает ретро-игры на десктопе, но и позволяет играть прямо в терминале.
Проект написан на Go, поддерживает GUI-режим для настольных систем, облачный режим через терминал, а ещё даёт возможность запускать мультиплеер прямо на чьём-то GitHub-профиле.
📁 Language: #Go 98.6%
⭐️ Stars: 4.8k
➡️ Cсылка на GitHub
📱 @git_developer
Хочешь снова поиграть в классику вроде Tetris или Super Mario для Game Boy, но оригинальную консоль уже не найти, а современные устройства не поддерживают старые игры?
Недавно случайно наткнулся на Gameboy.Live open-source эмулятор, который не только отлично запускает ретро-игры на десктопе, но и позволяет играть прямо в терминале.
Проект написан на Go, поддерживает GUI-режим для настольных систем, облачный режим через терминал, а ещё даёт возможность запускать мультиплеер прямо на чьём-то GitHub-профиле.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2
desktop
Как человек, который занимается администрированием и пишет техдоки, я знаю, как это бывает: только что написал документацию — а она уже устарела. А когда что-то ломается, приходится судорожно искать нужные команды. Удобства — ноль.
Обрати внимание на Atuin Desktop — это опенсорс-приложение, которое объединяет документацию и терминал в одном окне.
Можно прямо в тексте документа выполнять shell-команды, SQL-запросы и HTTP-запросы.
Поддерживается даже синтаксис Jinja — можно использовать параметры, условия и прочую логику. Приложение интегрируется с историей команд в shell и умеет умно автодополнять команды.
Скачать можно с официального сайта под любую платформу. Работает офлайн, но при желании поддерживает реальную синхронизацию. В общем, штука стоящая, попробуй, если часто возишься с документацией и терминалом.
📁 Language: #TypeScript 78.2%
⭐️ Stars: 1.4k
➡️ Cсылка на GitHub
📱 @git_developer
Как человек, который занимается администрированием и пишет техдоки, я знаю, как это бывает: только что написал документацию — а она уже устарела. А когда что-то ломается, приходится судорожно искать нужные команды. Удобства — ноль.
Обрати внимание на Atuin Desktop — это опенсорс-приложение, которое объединяет документацию и терминал в одном окне.
Можно прямо в тексте документа выполнять shell-команды, SQL-запросы и HTTP-запросы.
Поддерживается даже синтаксис Jinja — можно использовать параметры, условия и прочую логику. Приложение интегрируется с историей команд в shell и умеет умно автодополнять команды.
Скачать можно с официального сайта под любую платформу. Работает офлайн, но при желании поддерживает реальную синхронизацию. В общем, штука стоящая, попробуй, если часто возишься с документацией и терминалом.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Use Preview
Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5
Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.
Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.
📁 Language: #Python 100.0%
⭐️ Stars: 931
➡️ Cсылка на GitHub
📱 @git_developer
Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5
Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.
Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Nook
Совершенно случайно наткнулся на GitHub на минималистичный опенсорсный браузер — Nook, чем-то похожий на Arc.
Весит всего 8.42 МБ, работает быстро и ест минимум оперативки. Использует боковую панель — даже если открыть кучу вкладок, всё остаётся наглядным и не превращается в кашу.
У него чистый минималистичный интерфейс, который помогает сосредоточиться на контенте. Можно использовать как запасной браузер на каждый день.
Сейчас поддерживается только macOS 15.5+, есть готовый инсталлер — можно скачать с релизов на GitHub.
Проект активно развивается, так что если интересно — скачайте и попробуйте.
📁 Language: #Swift 99.4%
⭐️ Stars: 746
➡️ Cсылка на GitHub
📱 @git_developer
Совершенно случайно наткнулся на GitHub на минималистичный опенсорсный браузер — Nook, чем-то похожий на Arc.
Весит всего 8.42 МБ, работает быстро и ест минимум оперативки. Использует боковую панель — даже если открыть кучу вкладок, всё остаётся наглядным и не превращается в кашу.
У него чистый минималистичный интерфейс, который помогает сосредоточиться на контенте. Можно использовать как запасной браузер на каждый день.
Сейчас поддерживается только macOS 15.5+, есть готовый инсталлер — можно скачать с релизов на GitHub.
Проект активно развивается, так что если интересно — скачайте и попробуйте.
Please open Telegram to view this post
VIEW IN TELEGRAM
💊8👍3🌭3❤1
LeetGPU Challenges
LeetCode для GPU-разработчиков
Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.
Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.
📁 Language: #Python 72.1%
⭐️ Stars: 170
➡️ Cсылка на GitHub
📱 @git_developer
LeetCode для GPU-разработчиков
Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.
Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
PicoShare
Когда нужно быстро скинуть файл другу или коллеге, а через «файлового помощника» ограничение по размеру, да и в облаке требуют регистрацию и это реально бесит.
Вот тут и выручает PicoShare — ультрапростое решение для личного файлообмена. Позволяет развернуть свой мини-сервис для шаринга файлов.
Разворачивается одной командой через Docker, плюс можно включить автоматическое резервное копирование в облако.
📁 Language: #Go 58.2%
⭐️ Stars: 2.7k
➡️ Cсылка на GitHub
📱 @git_developer
Когда нужно быстро скинуть файл другу или коллеге, а через «файлового помощника» ограничение по размеру, да и в облаке требуют регистрацию и это реально бесит.
Вот тут и выручает PicoShare — ультрапростое решение для личного файлообмена. Позволяет развернуть свой мини-сервис для шаринга файлов.
Разворачивается одной командой через Docker, плюс можно включить автоматическое резервное копирование в облако.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4🔥3
Stremio
На выходных хочется посмотреть фильм или сериал, но всё разбросано по разным платформам, и приходится ставить кучу приложений или держать в голове десяток ссылок. Утомляет ещё до начала просмотра.
На GitHub есть классное решение — Stremio, открытый медиацентр, который через систему плагинов объединяет все видеоисточники в одном месте.
Устанавливаешь нужные плагины и можно искать, смотреть, вести список желаемого и отслеживать прогресс прямо в едином интерфейсе. Всё работает в браузере, без установки отдельных клиентов.
📁 Language: #JavaScript 54.6%
⭐️ Stars: 7.7k
➡️ Cсылка на GitHub
📱 @git_developer
На выходных хочется посмотреть фильм или сериал, но всё разбросано по разным платформам, и приходится ставить кучу приложений или держать в голове десяток ссылок. Утомляет ещё до начала просмотра.
На GitHub есть классное решение — Stremio, открытый медиацентр, который через систему плагинов объединяет все видеоисточники в одном месте.
Устанавливаешь нужные плагины и можно искать, смотреть, вести список желаемого и отслеживать прогресс прямо в едином интерфейсе. Всё работает в браузере, без установки отдельных клиентов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍4💊1
systemctl-tui
При повседневной работе с серверами часто приходится по сто раз вводить команды systemctl, особенно когда нужно глянуть статус сервиса или логи — постоянно переключаешься между командами.
И тут на глаза попался open-source инструмент systemctl-tui, который позволяет управлять сервисами systemd через удобный TUI-интерфейс прямо в терминале.
Всё под рукой: запуск, остановка, перезапуск сервисов, просмотр логов в реальном времени, редактирование конфигов, всё это в одном окне.
Кроме того, можно наглядно просматривать состояние всех системных сервисов, пользоваться фильтрацией и быстрым поиском.
Есть поддержка хоткеев, что заметно ускоряет работу и избавляет от рутины в консоли.
Установить можно через cargo install или просто скачать готовый бинарь. Инструмент отлично подойдёт системным администраторам и разработчикам, которые часто возятся с Linux-сервисами.
📁 Language: #Rust 97.7%
⭐️ Stars: 1.4k
➡️ Cсылка на GitHub
📱 @git_developer
При повседневной работе с серверами часто приходится по сто раз вводить команды systemctl, особенно когда нужно глянуть статус сервиса или логи — постоянно переключаешься между командами.
И тут на глаза попался open-source инструмент systemctl-tui, который позволяет управлять сервисами systemd через удобный TUI-интерфейс прямо в терминале.
Всё под рукой: запуск, остановка, перезапуск сервисов, просмотр логов в реальном времени, редактирование конфигов, всё это в одном окне.
Кроме того, можно наглядно просматривать состояние всех системных сервисов, пользоваться фильтрацией и быстрым поиском.
Есть поддержка хоткеев, что заметно ускоряет работу и избавляет от рутины в консоли.
Установить можно через cargo install или просто скачать готовый бинарь. Инструмент отлично подойдёт системным администраторам и разработчикам, которые часто возятся с Linux-сервисами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤3😁1🤔1💊1
Gitnuro
Многие новички, начав пользоваться Git для управления кодом, быстро устают от кучи сложных команд в консоли. А хорошие визуальные клиенты, где всё можно делать мышкой, обычно платные — и это раздражает.
Недавно на GitHub появилась полностью бесплатная и открытая альтернатива — Gitnuro. Это мощный Git-клиент с открытым исходным кодом, без ограничений и с удобным интерфейсом. Он покрывает все повседневные задачи, от обычных коммитов и пушей до продвинутых операций вроде ребейза и интерактивных изменений.
📁 Language: #Kotlin 98.4%
⭐️ Stars: 1.6k
➡️ Cсылка на GitHub
📱 @git_developer
Многие новички, начав пользоваться Git для управления кодом, быстро устают от кучи сложных команд в консоли. А хорошие визуальные клиенты, где всё можно делать мышкой, обычно платные — и это раздражает.
Недавно на GitHub появилась полностью бесплатная и открытая альтернатива — Gitnuro. Это мощный Git-клиент с открытым исходным кодом, без ограничений и с удобным интерфейсом. Он покрывает все повседневные задачи, от обычных коммитов и пушей до продвинутых операций вроде ребейза и интерактивных изменений.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤4🤔3🌭2
Paperlib
Для тех, кто занимается исследовательской работой и постоянно имеет дело с кучей научных статей, Paperlib может стать настоящим спасением. Особенно когда речь идёт о конференционных публикациях без DOI и ISBN, каждый раз искать всё вручную в Google Scholar просто мучение.
Один разработчик столкнулся с той же проблемой и в итоге сделал Paperlib — опенсорсный инструмент для управления научными статьями, который решает массу болячек, связанных с организацией и цитированием литературы.
Главная фишка = мощный сбор метаданных: программа сама распознаёт и заполняет недостающую информацию о статье. Помимо этого, есть полнотекстовый поиск, умная фильтрация, а также RSS-подписки, чтобы следить за свежими публикациями в нужной области.
📁 Language: #TypeScript 60.7%
⭐️ Stars: 1.9k
➡️ Cсылка на GitHub
📱 @git_developer
Для тех, кто занимается исследовательской работой и постоянно имеет дело с кучей научных статей, Paperlib может стать настоящим спасением. Особенно когда речь идёт о конференционных публикациях без DOI и ISBN, каждый раз искать всё вручную в Google Scholar просто мучение.
Один разработчик столкнулся с той же проблемой и в итоге сделал Paperlib — опенсорсный инструмент для управления научными статьями, который решает массу болячек, связанных с организацией и цитированием литературы.
Главная фишка = мощный сбор метаданных: программа сама распознаёт и заполняет недостающую информацию о статье. Помимо этого, есть полнотекстовый поиск, умная фильтрация, а также RSS-подписки, чтобы следить за свежими публикациями в нужной области.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6
This media is not supported in your browser
VIEW IN TELEGRAM
pyscn
Когда используешь AI-инструменты вроде Claude Code или CodeX, код вроде работает, но понять, насколько он качественный, нет ли там мусора или скрытых багов, для новичков это часто тёмный лес.
В таких случаях пригодится pyscn — инструмент для анализа качества Python-кода. Он проверяет AI-сгенерированный код со всех сторон и делает это очень быстро, до 100 000 строк в секунду. Помимо поиска мёртвого и дублированного кода, pyscn умеет оценивать связность модулей и сложность функций.
📁 Language: #Go 97.1%
⭐️ Stars: 808
➡️ Cсылка на GitHub
📱 @git_developer
Когда используешь AI-инструменты вроде Claude Code или CodeX, код вроде работает, но понять, насколько он качественный, нет ли там мусора или скрытых багов, для новичков это часто тёмный лес.
В таких случаях пригодится pyscn — инструмент для анализа качества Python-кода. Он проверяет AI-сгенерированный код со всех сторон и делает это очень быстро, до 100 000 строк в секунду. Помимо поиска мёртвого и дублированного кода, pyscn умеет оценивать связность модулей и сложность функций.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍7❤4
OpenSpec
Новички часто теряют время, потому что сгенерированный код не совпадает с ожиданиями — обычно из-за нечетко сформулированных требований при работе с AI-ассистентами вроде Claude Code или Codex.
Можно взглянуть на OpenSpec — это опенсорс-инструмент, который помогает разработчикам и AI-ассистентам синхронизироваться по целям до начала написания кода, используя подход specification-driven development (разработка, основанная на спецификациях).
Он в основном объединяет управление изменениями, списками задач и обновлениями спецификаций, обеспечивая четкие цели и проверяемый результат для каждой сессии разработки.
📁 Language: #TypeScript 98.9%
⭐️ Stars: 2.7k
➡️ Cсылка на GitHub
📱 @git_developer
Новички часто теряют время, потому что сгенерированный код не совпадает с ожиданиями — обычно из-за нечетко сформулированных требований при работе с AI-ассистентами вроде Claude Code или Codex.
Можно взглянуть на OpenSpec — это опенсорс-инструмент, который помогает разработчикам и AI-ассистентам синхронизироваться по целям до начала написания кода, используя подход specification-driven development (разработка, основанная на спецификациях).
Он в основном объединяет управление изменениями, списками задач и обновлениями спецификаций, обеспечивая четкие цели и проверяемый результат для каждой сессии разработки.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4❤3
Media is too big
VIEW IN TELEGRAM
DrawPen
Когда делаешь онлайн-демонстрации или записываешь обучающие видео, часто хочется обвести важные моменты или показать стрелками, но под рукой нет удобного инструмента.
Совсем случайно я наткнулся на DrawPen — опенсорсный инструмент для аннотирования экрана, который позволяет рисовать и делать пометки прямо поверх любого содержимого на экране.
Он предлагает широкий набор инструментов: перо, фигуры, текст, маркер, лазерную указку, ластик и другие.
DrawPen поддерживает глобальные хоткеи для моментального включения — не прерывая процесс демонстрации. Можно свободно менять цвета и толщину линий.
Кроме того, есть режим белой доски, где можно объяснять ключевые моменты на чистом холсте и очищать его одним кликом.
Установить можно, скачав пакет для своей системы со страницы Releases, либо через Homebrew или Scoop.
📁 Language: #JavaScript 91.7%
⭐️ Stars: 401
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь онлайн-демонстрации или записываешь обучающие видео, часто хочется обвести важные моменты или показать стрелками, но под рукой нет удобного инструмента.
Совсем случайно я наткнулся на DrawPen — опенсорсный инструмент для аннотирования экрана, который позволяет рисовать и делать пометки прямо поверх любого содержимого на экране.
Он предлагает широкий набор инструментов: перо, фигуры, текст, маркер, лазерную указку, ластик и другие.
DrawPen поддерживает глобальные хоткеи для моментального включения — не прерывая процесс демонстрации. Можно свободно менять цвета и толщину линий.
Кроме того, есть режим белой доски, где можно объяснять ключевые моменты на чистом холсте и очищать его одним кликом.
Установить можно, скачав пакет для своей системы со страницы Releases, либо через Homebrew или Scoop.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3🌭2
PaddleOCR
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
📁 Language: #Python 77.0%
⭐️ Stars: 57.5k
➡️ Cсылка на GitHub
📱 @git_developer
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1
P2P Live Share
Когда команда сталкивается с критичным багом во время удалённой совместной разработки, а проблема воспроизводится только в локальной среде, объяснить всё текстом бывает непросто — проще дать коллегам доступ прямо к своей машине.
Можно попробовать P2P Live Share — это open-source плагин для VSCode, который является опенсорсной альтернативой Microsoft Live Share.
Он позволяет нескольким разработчикам одновременно редактировать один и тот же код в VSCode, шарить терминалы для выполнения команд и даже пробрасывать локальные порты для отладки — получается полноценное ощущение работы «в реальном времени».
Кроме того, плагин использует peer-to-peer соединение, данные передаются напрямую, что повышает безопасность. Также поддерживается развёртывание собственного relay-сервера для повышения стабильности подключения.
Установить можно через маркетплейс плагинов VSCode — как в локальной, так и в веб-версии. После установки достаточно нажать кнопку «share» на боковой панели, чтобы начать совместную работу.
📁 Language: #TypeScript 95.4%
⭐️ Stars: 133
➡️ Cсылка на GitHub
📱 @git_developer
Когда команда сталкивается с критичным багом во время удалённой совместной разработки, а проблема воспроизводится только в локальной среде, объяснить всё текстом бывает непросто — проще дать коллегам доступ прямо к своей машине.
Можно попробовать P2P Live Share — это open-source плагин для VSCode, который является опенсорсной альтернативой Microsoft Live Share.
Он позволяет нескольким разработчикам одновременно редактировать один и тот же код в VSCode, шарить терминалы для выполнения команд и даже пробрасывать локальные порты для отладки — получается полноценное ощущение работы «в реальном времени».
Кроме того, плагин использует peer-to-peer соединение, данные передаются напрямую, что повышает безопасность. Также поддерживается развёртывание собственного relay-сервера для повышения стабильности подключения.
Установить можно через маркетплейс плагинов VSCode — как в локальной, так и в веб-версии. После установки достаточно нажать кнопку «share» на боковой панели, чтобы начать совместную работу.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1