PaddleOCR
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
📁 Language: #Python 77.0%
⭐️ Stars: 57.5k
➡️ Cсылка на GitHub
📱 @git_developer
Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.
При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.
Почему это важно
В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или многоколоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.
Что умеет модель
Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.
Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.
Что можно извлекать
Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.
Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.
Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2
P2P Live Share
Когда команда сталкивается с критичным багом во время удалённой совместной разработки, а проблема воспроизводится только в локальной среде, объяснить всё текстом бывает непросто — проще дать коллегам доступ прямо к своей машине.
Можно попробовать P2P Live Share — это open-source плагин для VSCode, который является опенсорсной альтернативой Microsoft Live Share.
Он позволяет нескольким разработчикам одновременно редактировать один и тот же код в VSCode, шарить терминалы для выполнения команд и даже пробрасывать локальные порты для отладки — получается полноценное ощущение работы «в реальном времени».
Кроме того, плагин использует peer-to-peer соединение, данные передаются напрямую, что повышает безопасность. Также поддерживается развёртывание собственного relay-сервера для повышения стабильности подключения.
Установить можно через маркетплейс плагинов VSCode — как в локальной, так и в веб-версии. После установки достаточно нажать кнопку «share» на боковой панели, чтобы начать совместную работу.
📁 Language: #TypeScript 95.4%
⭐️ Stars: 133
➡️ Cсылка на GitHub
📱 @git_developer
Когда команда сталкивается с критичным багом во время удалённой совместной разработки, а проблема воспроизводится только в локальной среде, объяснить всё текстом бывает непросто — проще дать коллегам доступ прямо к своей машине.
Можно попробовать P2P Live Share — это open-source плагин для VSCode, который является опенсорсной альтернативой Microsoft Live Share.
Он позволяет нескольким разработчикам одновременно редактировать один и тот же код в VSCode, шарить терминалы для выполнения команд и даже пробрасывать локальные порты для отладки — получается полноценное ощущение работы «в реальном времени».
Кроме того, плагин использует peer-to-peer соединение, данные передаются напрямую, что повышает безопасность. Также поддерживается развёртывание собственного relay-сервера для повышения стабильности подключения.
Установить можно через маркетплейс плагинов VSCode — как в локальной, так и в веб-версии. После установки достаточно нажать кнопку «share» на боковой панели, чтобы начать совместную работу.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤5
Table Habit
Хочу развивать небольшие привычки вроде чтения и спорта каждый день. В начале был азарт, но через несколько дней переставал отмечаться: нет позитивной обратной связи и ощущения прогресса, из-за этого трудно держаться долго.
Недавно нашёл Table Habit — опенсорсный трекер привычек, который помогает эффективнее строить и удерживать микро-привычки с помощью визуальных графиков и системы очков.
Он даёт полные кривые прогресса и статистику, а ещё умеет синхронизировать данные между устройствами через WebDAV.
Интерфейс на Material 3, аккуратный и приятный. Отмечаться просто, разные привычки можно различать по цветам.
Поддерживаются Android, iOS, macOS, Windows, Linux. Проект полностью открытый, бесплатный и без рекламы. Ставится напрямую из магазинов приложений или с GitHub.
📁 Language: #Dart 96.3%
⭐️ Stars: 925
➡️ Cсылка на GitHub
📱 @git_developer
Хочу развивать небольшие привычки вроде чтения и спорта каждый день. В начале был азарт, но через несколько дней переставал отмечаться: нет позитивной обратной связи и ощущения прогресса, из-за этого трудно держаться долго.
Недавно нашёл Table Habit — опенсорсный трекер привычек, который помогает эффективнее строить и удерживать микро-привычки с помощью визуальных графиков и системы очков.
Он даёт полные кривые прогресса и статистику, а ещё умеет синхронизировать данные между устройствами через WebDAV.
Интерфейс на Material 3, аккуратный и приятный. Отмечаться просто, разные привычки можно различать по цветам.
Поддерживаются Android, iOS, macOS, Windows, Linux. Проект полностью открытый, бесплатный и без рекламы. Ставится напрямую из магазинов приложений или с GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2
Ducky
Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.
Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.
Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.
📁 Language: #Python 99.0%
⭐️ Stars: 362
➡️ Cсылка на GitHub
📱 @git_developer
Ежедневная работа сетевых инженеров часто превращается в жонглирование кучей разных инструментов — SSH-клиенты, сетевые сканеры, калькуляторы подсетей и прочее. Всё это утомляет и снижает эффективность.
Посмотри на Ducky — это open-source десктопное приложение, которое объединяет десяток привычных инструментов для сетевиков в одном интерфейсе. Установил — и можно сразу работать.
Ducky не просто поддерживает мультипротокольные терминальные подключения, но и автоматически сканирует сеть, определяет топологию и строит наглядные схемы. Вдобавок там есть полноценный набор инструментов для безопасности.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Ребята сделали крутейший курс по Linux, где понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами обучают работе с этой ОС
Внутри 20+ модулей: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой).
После прохождения вы получите сертификат, который можно добавить в резюме.
Есть бесплатные демо-уроки для ознакомления. В ближайшие 48ч курс доступен со скидкой 25% по промокоду «
LINUX=25
»: открыть курс на StepikPlease open Telegram to view this post
VIEW IN TELEGRAM
❤3💊3👍2
Yaak
В процессе разработки часто нужно тестировать разные API. Раньше для этого использовали Postman или Insomnia, но со временем они стали казаться чересчур громоздкими — куча функций, которые вообще не нужны.
На GitHub я случайно наткнулся на опенсорсный десктопный инструмент Yaak, созданный с упором на конфиденциальность и производительность. С ним можно спокойно заниматься API-тестированием, не переживая за утечки данных или тормоза.
Он написан на Tauri, Rust и React, работает очень быстро и полностью офлайн. Поддерживает разные протоколы — REST, GraphQL, gRPC, WebSocket и другие. Плюс умеет шифровать и хранить чувствительные данные в системном хранилище ключей.
Просто скачиваешь инсталлятор и пользуешься. Отлично подходит разработчикам и техкомандам, которым важны скорость, приватность и минимализм
📁 Language: #TypeScript 62.7%, #Rust 35.8%
⭐️ Stars: 8.2k
➡️ Cсылка на GitHub
📱 @git_developer
В процессе разработки часто нужно тестировать разные API. Раньше для этого использовали Postman или Insomnia, но со временем они стали казаться чересчур громоздкими — куча функций, которые вообще не нужны.
На GitHub я случайно наткнулся на опенсорсный десктопный инструмент Yaak, созданный с упором на конфиденциальность и производительность. С ним можно спокойно заниматься API-тестированием, не переживая за утечки данных или тормоза.
Он написан на Tauri, Rust и React, работает очень быстро и полностью офлайн. Поддерживает разные протоколы — REST, GraphQL, gRPC, WebSocket и другие. Плюс умеет шифровать и хранить чувствительные данные в системном хранилище ключей.
Просто скачиваешь инсталлятор и пользуешься. Отлично подходит разработчикам и техкомандам, которым важны скорость, приватность и минимализм
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥1