Vue-FAQ
924 subscribers
562 photos
90 videos
557 links
Канал сайта https://vue-faq.org
Информация о Vue.js, фронтенд разработке и не только

Contacts: @RuslanMakarov
Download Telegram
Деривативом к Lissa Health создался телеграмный ботик для AI распознавания текста на фото и картинках

@argus_ocr_bot

Позволяет задать один уточняющий вопрос после распознавания для фильтрации данных, форматирования, перевода на другой язык или еще чего-то

Примеры:
1. Сфотографировать квитанцию СДЭК => Оставь только номер отправления
2. Сфотографировать визитку => Сделай json
3. Сфотографировать непонятный текст => Переведи на русский

Критика и предложения welcome

#lissa #tgbot #argus
Мой Argus бот для распознавания текста на фото и изображениях потихоньку раскручивается

Добавил к нему кнопки быстрых действий и увеличил число LLM до четырех - две основные и две на фоллбэк.

Эксперименты показали, что Mistral OCR в среднем по качеству близок к FineReader (где-то лучше, где-то хуже). Но выдают они данные, естественно, в разных форматах.

На неделе добавится распознавание рукописного текста

#tgbot #argus #php #ai
Добавил в Argus распознавание рукописного текста, а так же других сложных картинок (надо в подписи к картинке отправлять символ "+" для перехода в этот режим)

Для этого поэкспериментировал с 18 бесплатными LLM моделями для выбора лучшей, тут отчет

В комментариях люди поделились интересными ссылками для облегчения жизни AI энтузиастов:

https://github.com/marketplace/models/azure-openai/gpt-4o-mini/playground - бесплатный gpt-4o прям на GitHub

https://www.comss.ru/page.php?id=7315 - обход региональных блокировок и не только

#argus #ocr #tgbot