Обновление GPT Image вышло, теперь она 1.5
Звёзд с неба явно не хватают, заявки на конкуренцию с Nano Banana Pro нет, исходя из нумерации продукта. Из беглого просмотра по телеграмму и твиттеру понятно, что в целом это фиаско. Модель сильно не дотягивает до гугловского фрукта (банан же фрукт?). Она медленнее и не фотореалистичная. Стилизация, как обычно у ОпенАИ, на уровне, но это уже прошлый век, по меркам стремительно развивающейся поляны картинкогенерации.
Блин, даже Z Image и новый Flux не побивает. Но будем проверять в рабочем пайплайне.
Промптинг-гайд по модели.
Звёзд с неба явно не хватают, заявки на конкуренцию с Nano Banana Pro нет, исходя из нумерации продукта. Из беглого просмотра по телеграмму и твиттеру понятно, что в целом это фиаско. Модель сильно не дотягивает до гугловского фрукта (банан же фрукт?). Она медленнее и не фотореалистичная. Стилизация, как обычно у ОпенАИ, на уровне, но это уже прошлый век, по меркам стремительно развивающейся поляны картинкогенерации.
Блин, даже Z Image и новый Flux не побивает. Но будем проверять в рабочем пайплайне.
Промптинг-гайд по модели.
YouTube Gaming релизнул в закрытой бете приложение по созданию игр на Gemini 3. Скоро по всему миру. И каждый сможет создавать свои платформеры. А там и до своей личной GTA 6 недалеко.
🤯3👍1
Слева Nano Banana Pro, справа GPTImage 1.5 (upd: это старая версия, см. следующий пост)
Ваншот. GPTImage пытается показать больше и точнее, но видно, что её стремления расходятся с той частью модели, которая, собственно, рисует. Она честно и довольно точно показывает 3 узнаваемых достопримечательности Алматы, против одной у Бананы. Но у Бананы всё куда более детализированнее, чище, машинки едут по полосам, а не по разметке и с текстом она не накосячила. И желтизна, она у джипитишки никуда не делась(
Промпт:
Блин, как-будто у GPT вообще нет разницы с прошлой моделью, но я честно генерил именно в обновлённой приле, там даже диффузор был новый.
Ваншот. GPTImage пытается показать больше и точнее, но видно, что её стремления расходятся с той частью модели, которая, собственно, рисует. Она честно и довольно точно показывает 3 узнаваемых достопримечательности Алматы, против одной у Бананы. Но у Бананы всё куда более детализированнее, чище, машинки едут по полосам, а не по разметке и с текстом она не накосячила. И желтизна, она у джипитишки никуда не делась(
Промпт:
Покажи Алматы в 3D-изометрии
Блин, как-будто у GPT вообще нет разницы с прошлой моделью, но я честно генерил именно в обновлённой приле, там даже диффузор был новый.
🔥1
Все-таки у меня в приле стоит старая модель генерации GPTImage (почему так?), а вот на сайте Соры довольно быстро сгенерились одновременно две картинки, очевидно, на новой модели.
Вот здесь конкуренция наблюдается. ОпенАИшная модель намного точнее и узнаваемее показала мой родной город. Это конечно, все еще тёплая рисованная иллюстрация, но уже намного лучше, чем в прошлой версии.
Вот здесь конкуренция наблюдается. ОпенАИшная модель намного точнее и узнаваемее показала мой родной город. Это конечно, все еще тёплая рисованная иллюстрация, но уже намного лучше, чем в прошлой версии.
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 2
Слева GPT, справа Banana. Обе сгенерены за 18 секунд, но джипити дала за это время две картинки, а банана одну. НО: джипити генерилась на сайте Соры (максимально 2 картинки за раз), а банана в приложении (1 картинка за раз); а если бы банана генерилась на полном аналоге сайта Соры — во Флоу, то там было бы 4 картинки за раз. НО: Флоу не дает банане генерить известные лица, а вот в приле ок.
Промпт:
Вердикт: GPTImage 1.5 сильно стилизует живые фотки.
Слева GPT, справа Banana. Обе сгенерены за 18 секунд, но джипити дала за это время две картинки, а банана одну. НО: джипити генерилась на сайте Соры (максимально 2 картинки за раз), а банана в приложении (1 картинка за раз); а если бы банана генерилась на полном аналоге сайта Соры — во Флоу, то там было бы 4 картинки за раз. НО: Флоу не дает банане генерить известные лица, а вот в приле ок.
Промпт:
Президент Казахстана Токаев вместе с Трампом на американских горках
Вердикт: GPTImage 1.5 сильно стилизует живые фотки.
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 3
Посмотрим, что у нас по инфографике. Слева GPT, справа Banana. Тут у GPTImage самый сильный прогресс. Я бы сказал, что альтмановцам удалось догнать Гугл. Очень неплохой результат, текст консистентен. НО: 2 картинки за 50 сек (Sora) vs 4 картинки за 20 сек (Flow). Правда, Флоу автоматически переводит промпт на английский, по сему и инфографика на английском. В приле за те же 20 сек одна инфографика на русском, аналогичного качества.
Промпт:
Посмотрим, что у нас по инфографике. Слева GPT, справа Banana. Тут у GPTImage самый сильный прогресс. Я бы сказал, что альтмановцам удалось догнать Гугл. Очень неплохой результат, текст консистентен. НО: 2 картинки за 50 сек (Sora) vs 4 картинки за 20 сек (Flow). Правда, Флоу автоматически переводит промпт на английский, по сему и инфографика на английском. В приле за те же 20 сек одна инфографика на русском, аналогичного качества.
Промпт:
Инфографика, показывающая работу нейросетевой архитектуры трансформер в сравнении с архитектурой нейро-символической сети
🔥1
GPTImage 1.5 vs Nano Banana Pro, ч. 4
С рекламными креативами для Инстаграма забавное. GPTImage клепает безбожно устаревшие коллажи, в то время как Nano Banana Pro воспринимает задачу не просто как создание продающей картинки, но как раскадровку под готовый сторис. Неплохо-с.
Промпт:
С рекламными креативами для Инстаграма забавное. GPTImage клепает безбожно устаревшие коллажи, в то время как Nano Banana Pro воспринимает задачу не просто как создание продающей картинки, но как раскадровку под готовый сторис. Неплохо-с.
Промпт:
Креатив для Инстаграма с рекламой батиного супа
😁2
GPTImage 1.5 vs Nano Banana Pro, ч. 5
А чё со стилизацией? Бодро! На первой картинке референс, на второй Банана, на третьей ГПТ. И Банана и ГПТ точно передали референс, но Банана буквально перенесла артефакты на лицах и небольшую шакальность. ГПТ же честно передала референс, избавившись от артефактов.
Промпт:
А чё со стилизацией? Бодро! На первой картинке референс, на второй Банана, на третьей ГПТ. И Банана и ГПТ точно передали референс, но Банана буквально перенесла артефакты на лицах и небольшую шакальность. ГПТ же честно передала референс, избавившись от артефактов.
Промпт:
Сделай такой же постер с Сон Хын Мин в актуальной на сегодня форме ФК «Тоттенхем Хоттспур» и Мохамед Салах в актуальной сегодня форме ФК «Ливерпуль».
🔥1
Плотно поработав несколько часов с GPT Image 1.5 (а это десятки генераций), все-таки понял, что это минорное развитие предыдущего дебюта. Единственное, в чем хороша модель — в стилизованных репортажных фотографиях и инфографике. И то, не всегда так же хорошо, как Банана. В остальном это та самая GPT Image 1, что очень печально.
Спустя две ответки Google очевидно, что OpenAI не смогли изменить ситуацию и остаются в роли догоняющего.
Такие дела.
Спустя две ответки Google очевидно, что OpenAI не смогли изменить ситуацию и остаются в роли догоняющего.
Такие дела.
❤1
Forwarded from Силиконовый Мешок
Под конец года голова уже кипит от всех этих отчетов, графиков и бенчмарков. Я реально минут пять изучал эту картинку в надежде понять, какие показатели моделей она визуализирует.
А потом минут десять громко ржал и нервно хихикал, поняв, что это «бенчмарк версий». Короче, ChatGPT с версией 5.2 рвет всех в клочья.
Ну а с другой стороны - этот график символизирует 2025 год. Столько бенчмарков, как в этом году, еще никогда не выходило. С пятницей!
А потом минут десять громко ржал и нервно хихикал, поняв, что это «бенчмарк версий». Короче, ChatGPT с версией 5.2 рвет всех в клочья.
Ну а с другой стороны - этот график символизирует 2025 год. Столько бенчмарков, как в этом году, еще никогда не выходило. С пятницей!
😁4🤣2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Роботы Unitree в подтанцовке, где-то в Китае. Через два года везде. Вроде прикольно, но всё-равно криповато как-то :)