#ocr #pdf #model #opensource
SmolDocling: Опенсорс инструмент для OCR документов 📄✨
Коллеги, добрый день! 👋
Обычно первым шагом при построении ИИ-ассистентов является обработка/распознавание существующей документации.
Поэтому многие ищут хорошие решения для распознавания PDF-файлов, особенно когда речь идет о больших документах.
В связи с этим хочу поделиться интересной находкой.
SmolDocling — это новая мультимодальная визуально-языковая модель для полноценного OCR документов. Несмотря на компактный размер (всего 256M параметров), она обрабатывает страницу за 0.35 секунды! 🚀
Что умеет? 💪
• Распознает сложные макеты документов
• Корректно обрабатывает код
• Понимает математические формулы
• Распознает графики и диаграммы
• Работает с таблицами
• Классифицирует графические элементы
• Сохраняет структуру заголовков
• Группирует списки
Где пригодится? 📚
• Научные статьи
• Бизнес-документы
• Патенты
• Таблицы и отчеты
Удобные фишки ⚙️
• Пакетная обработка документов
• Экспорт в Markdown, HTML и JSON
Попробовать можно здесь: https://huggingface.co/ds4sd/SmolDocling-256M-preview
Кто уже тестировал? Делитесь впечатлениями в комментариях! 💬
SmolDocling: Опенсорс инструмент для OCR документов 📄✨
Коллеги, добрый день! 👋
Обычно первым шагом при построении ИИ-ассистентов является обработка/распознавание существующей документации.
Поэтому многие ищут хорошие решения для распознавания PDF-файлов, особенно когда речь идет о больших документах.
В связи с этим хочу поделиться интересной находкой.
SmolDocling — это новая мультимодальная визуально-языковая модель для полноценного OCR документов. Несмотря на компактный размер (всего 256M параметров), она обрабатывает страницу за 0.35 секунды! 🚀
Что умеет? 💪
• Распознает сложные макеты документов
• Корректно обрабатывает код
• Понимает математические формулы
• Распознает графики и диаграммы
• Работает с таблицами
• Классифицирует графические элементы
• Сохраняет структуру заголовков
• Группирует списки
Где пригодится? 📚
• Научные статьи
• Бизнес-документы
• Патенты
• Таблицы и отчеты
Удобные фишки ⚙️
• Пакетная обработка документов
• Экспорт в Markdown, HTML и JSON
Попробовать можно здесь: https://huggingface.co/ds4sd/SmolDocling-256M-preview
Кто уже тестировал? Делитесь впечатлениями в комментариях! 💬
huggingface.co
ds4sd/SmolDocling-256M-preview · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥8❤🔥3