Botlicker
280 subscribers
264 photos
184 videos
3 files
185 links
Тут любят иишки
Download Telegram
Обновление GPT Image вышло, теперь она 1.5

Звёзд с неба явно не хватают, заявки на конкуренцию с Nano Banana Pro нет, исходя из нумерации продукта. Из беглого просмотра по телеграмму и твиттеру понятно, что в целом это фиаско. Модель сильно не дотягивает до гугловского фрукта (банан же фрукт?). Она медленнее и не фотореалистичная. Стилизация, как обычно у ОпенАИ, на уровне, но это уже прошлый век, по меркам стремительно развивающейся поляны картинкогенерации.

Блин, даже Z Image и новый Flux не побивает. Но будем проверять в рабочем пайплайне.

Промптинг-гайд по модели.
YouTube Gaming релизнул в закрытой бете приложение по созданию игр на Gemini 3. Скоро по всему миру. И каждый сможет создавать свои платформеры. А там и до своей личной GTA 6 недалеко.
🤯3👍1
Слева Nano Banana Pro, справа GPTImage 1.5 (upd: это старая версия, см. следующий пост)

Ваншот. GPTImage пытается показать больше и точнее, но видно, что её стремления расходятся с той частью модели, которая, собственно, рисует. Она честно и довольно точно показывает 3 узнаваемых достопримечательности Алматы, против одной у Бананы. Но у Бананы всё куда более детализированнее, чище, машинки едут по полосам, а не по разметке и с текстом она не накосячила. И желтизна, она у джипитишки никуда не делась(

Промпт:
Покажи Алматы в 3D-изометрии


Блин, как-будто у GPT вообще нет разницы с прошлой моделью, но я честно генерил именно в обновлённой приле, там даже диффузор был новый.
🔥1
Все-таки у меня в приле стоит старая модель генерации GPTImage (почему так?), а вот на сайте Соры довольно быстро сгенерились одновременно две картинки, очевидно, на новой модели.

Вот здесь конкуренция наблюдается. ОпенАИшная модель намного точнее и узнаваемее показала мой родной город. Это конечно, все еще тёплая рисованная иллюстрация, но уже намного лучше, чем в прошлой версии.
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 2

Слева GPT, справа Banana. Обе сгенерены за 18 секунд, но джипити дала за это время две картинки, а банана одну. НО: джипити генерилась на сайте Соры (максимально 2 картинки за раз), а банана в приложении (1 картинка за раз); а если бы банана генерилась на полном аналоге сайта Соры — во Флоу, то там было бы 4 картинки за раз. НО: Флоу не дает банане генерить известные лица, а вот в приле ок.

Промпт:
Президент Казахстана Токаев вместе с Трампом на американских горках


Вердикт: GPTImage 1.5 сильно стилизует живые фотки.
🔥1
Тем временем, в Google Flow тоже обнова, теперь можно апскейлить сгенерированные изображения до 2К (Pro и Ultra-юзерам) и до 4К (Ultra-юзерам).
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 3

Посмотрим, что у нас по инфографике. Слева GPT, справа Banana. Тут у GPTImage самый сильный прогресс. Я бы сказал, что альтмановцам удалось догнать Гугл. Очень неплохой результат, текст консистентен. НО: 2 картинки за 50 сек (Sora) vs 4 картинки за 20 сек (Flow). Правда, Флоу автоматически переводит промпт на английский, по сему и инфографика на английском. В приле за те же 20 сек одна инфографика на русском, аналогичного качества.

Промпт:
Инфографика, показывающая работу нейросетевой архитектуры трансформер в сравнении с архитектурой нейро-символической сети
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 4

С рекламными креативами для Инстаграма забавное. GPTImage клепает безбожно устаревшие коллажи, в то время как Nano Banana Pro воспринимает задачу не просто как создание продающей картинки, но как раскадровку под готовый сторис. Неплохо-с.

Промпт:
Креатив для Инстаграма с рекламой батиного супа
😁2
GPTImage 1.5 vs Nano Banana Pro, ч. 5

А чё со стилизацией? Бодро! На первой картинке референс, на второй Банана, на третьей ГПТ. И Банана и ГПТ точно передали референс, но Банана буквально перенесла артефакты на лицах и небольшую шакальность. ГПТ же честно передала референс, избавившись от артефактов.

Промпт:
Сделай такой же постер с Сон Хын Мин в актуальной на сегодня форме ФК «Тоттенхем Хоттспур» и Мохамед Салах в актуальной сегодня форме ФК «Ливерпуль».
🔥1
Плотно поработав несколько часов с GPT Image 1.5 (а это десятки генераций), все-таки понял, что это минорное развитие предыдущего дебюта. Единственное, в чем хороша модель — в стилизованных репортажных фотографиях и инфографике. И то, не всегда так же хорошо, как Банана. В остальном это та самая GPT Image 1, что очень печально.

Спустя две ответки Google очевидно, что OpenAI не смогли изменить ситуацию и остаются в роли догоняющего.

Такие дела.
1
Под конец года голова уже кипит от всех этих отчетов, графиков и бенчмарков. Я реально минут пять изучал эту картинку в надежде понять, какие показатели моделей она визуализирует.

А потом минут десять громко ржал и нервно хихикал, поняв, что это «бенчмарк версий». Короче, ChatGPT с версией 5.2 рвет всех в клочья.

Ну а с другой стороны - этот график символизирует 2025 год. Столько бенчмарков, как в этом году, еще никогда не выходило. С пятницей!
😁4🤣21
This media is not supported in your browser
VIEW IN TELEGRAM
Роботы Unitree в подтанцовке, где-то в Китае. Через два года везде. Вроде прикольно, но всё-равно криповато как-то :)
Киньте 🎁 в ваш ChatGPT и она вас приятно поздравит ;)