тлдр:
вывел скриншотами (вместо скачивания пдф)
порезал поля в разы (оставил 4 прям из таблицы вместо 10 общих)
расставил обязательные значения
и теперь краудсорсинг людьми работает
остальные данные можно в интернете запросом подтянуть / спросить у оператора ИИ
и я теперь думаю – а зачем мне для распознавания 4 полей со скриншота люди?
вывел скриншотами (вместо скачивания пдф)
порезал поля в разы (оставил 4 прям из таблицы вместо 10 общих)
расставил обязательные значения
и теперь краудсорсинг людьми работает
остальные данные можно в интернете запросом подтянуть / спросить у оператора ИИ
и я теперь думаю – а зачем мне для распознавания 4 полей со скриншота люди?
с другой стороны это стоит 0.5-2р за строчку, а остальное можно автономным агентом считать по ссылке из гуглмапс или типа того