Есть вопрос связанный с недавно выложенными T5 от сбера.
Файнтюнил обе модельки под свою задачу, кодом, которым успешно файнтюнились другие T5 и оно даже работает, но...
Выглядит, что моделька научилась тому, что я от ней хотел, но, выдав последовательность, не научилась "успокаиваться" после предсказания ей токена конца предложения )
Например, результат
generate
может быть таким:
<unk> Современные производители используют различные материалы для изготовления посуды, используемой в кулинарии.</s> tv.</s> tv.</s> tv.</s> tv.</s> tv.</s> tv.</s> tv.</s> tv.</s>
В последовательностях, на которых она тюнилась, токен </s> завершал и входное и выходное предложение
Есть мысли: кто виноват и что делать?
Workaround очевиден, но...