Mistral OCR
Коллеги по цеху выпустили мощную штуку: https://mistral.ai/news/mistral-ocr
По Черри-пикам выглядят вкусно, по метрикам — вообще не понятно, что за метрики, но:
1. Интересно, как обстоят дела с координатками (скорее всего никак, потому что они делают по сути интерливд и координаты им не всегда важны);
2. Чего у них с галлюцинациями;
3. Как они сравнивали сет классического OCR и OCR для DocAI.
Выглядит как и правда мега классная штука в разрезе RAGов, о чём и пишут у себя на страничке. Правда, технологически мне кажется ничего нового особо нет, ребята olmOCR уже показали, что в целом можно хорошо делать интерливд данные.
В общем, доберусь — потестирую! Но если кто-то вдруг уже — присылайте в комменты.
Коллеги по цеху выпустили мощную штуку: https://mistral.ai/news/mistral-ocr
По Черри-пикам выглядят вкусно, по метрикам — вообще не понятно, что за метрики, но:
1. Интересно, как обстоят дела с координатками (скорее всего никак, потому что они делают по сути интерливд и координаты им не всегда важны);
2. Чего у них с галлюцинациями;
3. Как они сравнивали сет классического OCR и OCR для DocAI.
Выглядит как и правда мега классная штука в разрезе RAGов, о чём и пишут у себя на страничке. Правда, технологически мне кажется ничего нового особо нет, ребята olmOCR уже показали, что в целом можно хорошо делать интерливд данные.
В общем, доберусь — потестирую! Но если кто-то вдруг уже — присылайте в комменты.
🔥6💯4🐳3👎2
Потестил Mistral OCR
Чо могу сказать: очень хорошо, но есть куда стремиться
— Русская рукописка точно не работает;
— Русский/Английский печатный работает очень хорошо;
— Формулы я так и не нашёл пока багов, даже сложные индексы находит;
— Иногда (редко) сжевывает какие-то столбцы в таблицах;
— Явных жоский галлюцинаций я не нашёл;
— Мне показалось, что очень хорошо строит layout.
Не знаю, что ребята делают под капотом, но это работает турбо быстро! Я заливал pdfки и меньше чем за минуту ко мне прилетал уже готовый markdown. В общем, топчик!
Оригиналы скринов, документов и распознаваний приложу в комментарии!
Чо могу сказать: очень хорошо, но есть куда стремиться
— Русская рукописка точно не работает;
— Русский/Английский печатный работает очень хорошо;
— Формулы я так и не нашёл пока багов, даже сложные индексы находит;
— Иногда (редко) сжевывает какие-то столбцы в таблицах;
— Явных жоский галлюцинаций я не нашёл;
— Мне показалось, что очень хорошо строит layout.
Не знаю, что ребята делают под капотом, но это работает турбо быстро! Я заливал pdfки и меньше чем за минуту ко мне прилетал уже готовый markdown. В общем, топчик!
Оригиналы скринов, документов и распознаваний приложу в комментарии!
🔥27🤯6❤3👎2🏆2👍1🤔1🐳1💯1
Начали подъезжать независимые бенчи
https://getomni.ai/ocr-benchmark
Так топ или не топ? Как обычно, выбирайте что вам лучше всего подходит.
https://getomni.ai/ocr-benchmark
Так топ или не топ? Как обычно, выбирайте что вам лучше всего подходит.
🔥4👎2💯1
Всех девушек поздравляю с прекрасным, как и вы, праздником!
Всегда восхищаюсь людьми, вне зависимости от пола. Но почему то именно в моей жизни выборка людей получается такой, что в ней девушки — это самые увлечённые, с самыми креативными и гениальными идеями люди. Именно вы самые заботливые и понимающие люди для меня!
Я желаю, чтобы этот день, наполненный вниманием к вам, был не только сегодня, а каждый день!
Всегда восхищаюсь людьми, вне зависимости от пола. Но почему то именно в моей жизни выборка людей получается такой, что в ней девушки — это самые увлечённые, с самыми креативными и гениальными идеями люди. Именно вы самые заботливые и понимающие люди для меня!
Я желаю, чтобы этот день, наполненный вниманием к вам, был не только сегодня, а каждый день!
🔥16❤12🐳4🤔3👎2🏆1
Очная лекция в [AI] Talent Hub
Ребята из @aitalenthubnews пригласили меня на очную встречу со студентами, попавшими на [AI] Workshop Week. Сама лекция проходила 11 марта, получается свежие новости😀
Рассказывал про свой опыт в IT, какую роль для этого сыграл ИТМО, а также вообще чем я руководствовался, когда хотел куда-то продолжать двигаться. После была сессия вопросов, из самых неожиданных моментов дискуссии:
— Почему я переименовал свой канал😂 ?
— Почему Produnction😍 ?
Было много вопросов про OCR и VLM. На часть из них я смог ответить полноценно, а про что-то ответил на поверхности. На много чего я смогу дать большую картинку для понимания на ближайшем ML Party, который будет проходить в Санкт-Петербурге, 18 марта.
Я тут чекнул, регистрация ещё открыта, так что приходите, будет точно интересно!
P.S. Ребята мне ещё подарили футболку размера L, а я правда S ношу. Но ничего, с женой вдвоём точно поместимся😂
P.P.S. Со мной сфотографировалось даже пару человек🔼
Ребята из @aitalenthubnews пригласили меня на очную встречу со студентами, попавшими на [AI] Workshop Week. Сама лекция проходила 11 марта, получается свежие новости
Рассказывал про свой опыт в IT, какую роль для этого сыграл ИТМО, а также вообще чем я руководствовался, когда хотел куда-то продолжать двигаться. После была сессия вопросов, из самых неожиданных моментов дискуссии:
— Почему я переименовал свой канал
— Почему Produnction
Было много вопросов про OCR и VLM. На часть из них я смог ответить полноценно, а про что-то ответил на поверхности. На много чего я смогу дать большую картинку для понимания на ближайшем ML Party, который будет проходить в Санкт-Петербурге, 18 марта.
Я тут чекнул, регистрация ещё открыта, так что приходите, будет точно интересно!
P.S. Ребята мне ещё подарили футболку размера L, а я правда S ношу. Но ничего, с женой вдвоём точно поместимся
P.P.S. Со мной сфотографировалось даже пару человек
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥20❤6💯4👎2🍾2👍1
Forwarded from CV Time
Личный опыт инженеров Яндекса — Антон Клочков
Продолжаем рассказывать об ML`щиках в Яндексе, их успехах и трендах, на которые они делают ставку. Сегодня наш герой — руководитель подгруппы распознавания текста в VLM Антон Клочков.
Больше карточек — по хештэгу #YaMLpeople.
CV Time
Продолжаем рассказывать об ML`щиках в Яндексе, их успехах и трендах, на которые они делают ставку. Сегодня наш герой — руководитель подгруппы распознавания текста в VLM Антон Клочков.
Больше карточек — по хештэгу #YaMLpeople.
CV Time
🔥14❤🔥6❤3👎2🐳2