Дратути Антон
4.01K subscribers
157 photos
27 videos
199 links
Мемы и личные размышления про управление, код, ml и здравый смысл.

Сейчас руковожу командой OCR in VLM в Яндексе.

Автор: @toshiksvg
Download Telegram
Mistral OCR

Коллеги по цеху выпустили мощную штуку: https://mistral.ai/news/mistral-ocr

По Черри-пикам выглядят вкусно, по метрикам — вообще не понятно, что за метрики, но:
1. Интересно, как обстоят дела с координатками (скорее всего никак, потому что они делают по сути интерливд и координаты им не всегда важны);
2. Чего у них с галлюцинациями;
3. Как они сравнивали сет классического OCR и OCR для DocAI.

Выглядит как и правда мега классная штука в разрезе RAGов, о чём и пишут у себя на страничке. Правда, технологически мне кажется ничего нового особо нет, ребята olmOCR уже показали, что в целом можно хорошо делать интерливд данные.

В общем, доберусь — потестирую! Но если кто-то вдруг уже — присылайте в комменты.
🔥6💯4🐳3👎2
Потестил Mistral OCR

Чо могу сказать: очень хорошо, но есть куда стремиться
— Русская рукописка точно не работает;
— Русский/Английский печатный работает очень хорошо;
— Формулы я так и не нашёл пока багов, даже сложные индексы находит;
— Иногда (редко) сжевывает какие-то столбцы в таблицах;
— Явных жоский галлюцинаций я не нашёл;
— Мне показалось, что очень хорошо строит layout.

Не знаю, что ребята делают под капотом, но это работает турбо быстро! Я заливал pdfки и меньше чем за минуту ко мне прилетал уже готовый markdown. В общем, топчик!

Оригиналы скринов, документов и распознаваний приложу в комментарии!
🔥27🤯63👎2🏆2👍1🤔1🐳1💯1
Начали подъезжать независимые бенчи

https://getomni.ai/ocr-benchmark

Так топ или не топ? Как обычно, выбирайте что вам лучше всего подходит.
🔥4👎2💯1
Всех девушек поздравляю с прекрасным, как и вы, праздником!

Всегда восхищаюсь людьми, вне зависимости от пола. Но почему то именно в моей жизни выборка людей получается такой, что в ней девушки — это самые увлечённые, с самыми креативными и гениальными идеями люди. Именно вы самые заботливые и понимающие люди для меня!

Я желаю, чтобы этот день, наполненный вниманием к вам, был не только сегодня, а каждый день!
🔥1612🐳4🤔3👎2🏆1
😂😂😂😂😂
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣49👍8🏆3👎2
Очная лекция в [AI] Talent Hub

Ребята из @aitalenthubnews пригласили меня на очную встречу со студентами, попавшими на [AI] Workshop Week. Сама лекция проходила 11 марта, получается свежие новости 😀

Рассказывал про свой опыт в IT, какую роль для этого сыграл ИТМО, а также вообще чем я руководствовался, когда хотел куда-то продолжать двигаться. После была сессия вопросов, из самых неожиданных моментов дискуссии:
— Почему я переименовал свой канал 😂?
— Почему Produnction 😍?

Было много вопросов про OCR и VLM. На часть из них я смог ответить полноценно, а про что-то ответил на поверхности. На много чего я смогу дать большую картинку для понимания на ближайшем ML Party, который будет проходить в Санкт-Петербурге, 18 марта.

Я тут чекнул, регистрация ещё открыта, так что приходите, будет точно интересно!

P.S. Ребята мне ещё подарили футболку размера L, а я правда S ношу. Но ничего, с женой вдвоём точно поместимся 😂
P.P.S. Со мной сфотографировалось даже пару человек 🔼
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥206💯4👎2🍾2👍1
И правда...
🤣23🔥10💯5👎21
Forwarded from CV Time
Личный опыт инженеров Яндекса — Антон Клочков

Продолжаем рассказывать об ML`щиках в Яндексе, их успехах и трендах, на которые они делают ставку. Сегодня наш герой — руководитель подгруппы распознавания текста в VLM Антон Клочков.

Больше карточек — по хештэгу #YaMLpeople.

CV Time
🔥14❤‍🔥63👎2🐳2
Решил потрогать лес на этих выходных!

А что делаете вы?
🔥20💯4🏆3👎2🐳1🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
Чо по графику работы?
😁16🤣7👍2👎2🔥1