Градиент обреченный

Потестировал вчера Ideogram и gpt-4o и вот что скажу — качество очень прилично подросло за последние несколько месяцев. Если вам в работе и хобби надо делать какие-то прототипы дизайнов и картинок, то надо обязательно использовать (если еще не).

Порисовал обложки для книг. За час получилось несколько десятков веселых обложек. Можно делать так: любой LLM с web-поиском генерируете промпт для генерации картинок (я вбивал в perplexity), что-нибудь типа такого:

"Найди информацию о книге Стругацких "Улитка на склоне". В выводе напиши только промпт для генерации изображения для обложки этой книги. На обложке должна быть яркая сцена из книги, название и имя автора на русском, промпт должен быть на английском. Стиль укиё-э."

Так как есть поиск, то книгу можно задавать любую, которую можно найти в интернете. Полученный промпт уже можно использовать.

gtp-4o работает с русскими надписями гораздо стабильней, хотя тоже ошибается. Самое частое у них — это либо удвоить какую-нибудь букву, либо написать одну вместо удвоенной (либо написать кракозябры). Причем, если просить не писать надписей вообще (чтобы самому дописать в иллюстраторе), то получается как-будто бы похуже. Ideogram делает более разнообразные картинки, быстрей (секунд за 20) и сразу по 4 штуки. Кроме того, на платных подписках там есть редактор с всем типичным функционалом типа inpainting'а, outpainting'а, создания стиля по своим картинкам и т.д. Как специализированный инструмент он кажется получше.

👉 Еще нащупал лайфхак. Если к надписям в полученном промпте добавлять что-то типа "label is in Russian, reads exactly as '...' " и писать не капсом, то процент правильных надписей получается выше.

В общем надо тестить еще и, наверное, накидать пет-проект для end-2-end генерации.

❤28🔥13👍4🆒2

3.58K viewsSergei Averkiev, 10:19