Botlicker

Обновление GPT Image вышло, теперь она 1.5

Звёзд с неба явно не хватают, заявки на конкуренцию с Nano Banana Pro нет, исходя из нумерации продукта. Из беглого просмотра по телеграмму и твиттеру понятно, что в целом это фиаско. Модель сильно не дотягивает до гугловского фрукта (банан же фрукт?). Она медленнее и не фотореалистичная. Стилизация, как обычно у ОпенАИ, на уровне, но это уже прошлый век, по меркам стремительно развивающейся поляны картинкогенерации.

Блин, даже Z Image и новый Flux не побивает. Но будем проверять в рабочем пайплайне.

Промптинг-гайд по модели.

127 viewsedited 01:15

Botlicker

YouTube Gaming релизнул в закрытой бете приложение по созданию игр на Gemini 3. Скоро по всему миру. И каждый сможет создавать свои платформеры. А там и до своей личной GTA 6 недалеко.

🤯3👍1

118 viewsedited 01:27

Botlicker

Слева Nano Banana Pro, справа GPTImage 1.5 (upd: это старая версия, см. следующий пост)

Ваншот. GPTImage пытается показать больше и точнее, но видно, что её стремления расходятся с той частью модели, которая, собственно, рисует. Она честно и довольно точно показывает 3 узнаваемых достопримечательности Алматы, против одной у Бананы. Но у Бананы всё куда более детализированнее, чище, машинки едут по полосам, а не по разметке и с текстом она не накосячила. И желтизна, она у джипитишки никуда не делась(

Промпт:

Покажи Алматы в 3D-изометрии

Блин, как-будто у GPT вообще нет разницы с прошлой моделью, но я честно генерил именно в обновлённой приле, там даже диффузор был новый.

🔥1

112 views01:52

Botlicker

Все-таки у меня в приле стоит старая модель генерации GPTImage (почему так?), а вот на сайте Соры довольно быстро сгенерились одновременно две картинки, очевидно, на новой модели.

Вот здесь конкуренция наблюдается. ОпенАИшная модель намного точнее и узнаваемее показала мой родной город. Это конечно, все еще тёплая рисованная иллюстрация, но уже намного лучше, чем в прошлой версии.

🔥1

110 viewsedited 02:02

Botlicker

GPTImage 1.5 vs Nano Banana Pro, ч. 2

Слева GPT, справа Banana. Обе сгенерены за 18 секунд, но джипити дала за это время две картинки, а банана одну. НО: джипити генерилась на сайте Соры (максимально 2 картинки за раз), а банана в приложении (1 картинка за раз); а если бы банана генерилась на полном аналоге сайта Соры — во Флоу, то там было бы 4 картинки за раз. НО: Флоу не дает банане генерить известные лица, а вот в приле ок.

Промпт:

Президент Казахстана Токаев вместе с Трампом на американских горках

Вердикт: GPTImage 1.5 сильно стилизует живые фотки.

🔥1

115 views02:15

Botlicker

Тем временем, в Google Flow тоже обнова, теперь можно апскейлить сгенерированные изображения до 2К (Pro и Ultra-юзерам) и до 4К (Ultra-юзерам).

🔥1

122 viewsedited 02:18

Botlicker

GPTImage 1.5 vs Nano Banana Pro, ч. 3

Посмотрим, что у нас по инфографике. Слева GPT, справа Banana. Тут у GPTImage самый сильный прогресс. Я бы сказал, что альтмановцам удалось догнать Гугл. Очень неплохой результат, текст консистентен. НО: 2 картинки за 50 сек (Sora) vs 4 картинки за 20 сек (Flow). Правда, Флоу автоматически переводит промпт на английский, по сему и инфографика на английском. В приле за те же 20 сек одна инфографика на русском, аналогичного качества.

Промпт:

Инфографика, показывающая работу нейросетевой архитектуры трансформер в сравнении с архитектурой нейро-символической сети

🔥1

128 views02:40

Botlicker

GPTImage 1.5 vs Nano Banana Pro, ч. 4

С рекламными креативами для Инстаграма забавное. GPTImage клепает безбожно устаревшие коллажи, в то время как Nano Banana Pro воспринимает задачу не просто как создание продающей картинки, но как раскадровку под готовый сторис. Неплохо-с.

Промпт:

Креатив для Инстаграма с рекламой батиного супа

😁2

172 views03:47

Botlicker

GPTImage 1.5 vs Nano Banana Pro, ч. 5

А чё со стилизацией? Бодро! На первой картинке референс, на второй Банана, на третьей ГПТ. И Банана и ГПТ точно передали референс, но Банана буквально перенесла артефакты на лицах и небольшую шакальность. ГПТ же честно передала референс, избавившись от артефактов.

Промпт:

Сделай такой же постер с Сон Хын Мин в актуальной на сегодня форме ФК «Тоттенхем Хоттспур» и Мохамед Салах в актуальной сегодня форме ФК «Ливерпуль».

🔥1

190 views03:56

Botlicker

Плотно поработав несколько часов с GPT Image 1.5 (а это десятки генераций), все-таки понял, что это минорное развитие предыдущего дебюта. Единственное, в чем хороша модель — в стилизованных репортажных фотографиях и инфографике. И то, не всегда так же хорошо, как Банана. В остальном это та самая GPT Image 1, что очень печально.

Спустя две ответки Google очевидно, что OpenAI не смогли изменить ситуацию и остаются в роли догоняющего.

Такие дела.

❤1

169 views06:06

Botlicker

Forwarded from Силиконовый Мешок

Под конец года голова уже кипит от всех этих отчетов, графиков и бенчмарков. Я реально минут пять изучал эту картинку в надежде понять, какие показатели моделей она визуализирует.

А потом минут десять громко ржал и нервно хихикал, поняв, что это «бенчмарк версий». Короче, ChatGPT с версией 5.2 рвет всех в клочья.

Ну а с другой стороны - этот график символизирует 2025 год. Столько бенчмарков, как в этом году, еще никогда не выходило. С пятницей!

😁4🤣2❤1

144 views11:53

Botlicker