Machinelearning

🌟 Diffusion-4K – это новый инструмент для синтеза изображений в 4K.

Модель text-to-image генерирует фотореалистичные изображения с высоким уровнем детализации и точно следует заданным промптам.

Алгоритм синтеза изображений в рамках Diffusion-4K работает следующим образом:

🟢Обучение модели: Используется латентная диффузионная модель, такая как SD3-2B или Flux-12B, которая предварительно обучена на изображениях более низкого разрешения.

🟢

Wavelet-based дообучение: Модель дообучается на 4K-изображениях с применением вейвлет-преобразования.
Wavelet-based Fine-tuning – это метод, который использует вейвлет-преобразование для разложения данных (например, изображений) на составляющие с разными частотными характеристиками, после чего проводится дополнительное обучение модели с акцентом на восстановление высокочастотных деталей.
Это позволяет модели фокусироваться на высокочастотных компонентах изображения, улучшая детализацию и качество синтезируемых изображений.

🟢

Генерация изображений: После дообучения модель способна генерировать фотореалистичные 4K-изображения на основе текстовых описаний, обеспечивая высокую точность и соответствие заданным текстовым промптам.

Алгоритм сочетает в себе предварительное обучение на низких разрешениях и специализированное дообучение на высококачественных 4K-изображениях и позволяет получать качественные генерации на выходе.

Также разработчики выложили Aesthetic-4K – датасет на 10.2 GB отобранных вручную изображений с описаниями к ним, сгенерированными GPT-4o.

🟢

Github

🟢

Flux wavelet

🟢

Dataset

🟢

Статья

@ai_machinelearning_big_data

#ml #ai #4k #imagegenerator

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍51🔥19❤12

19.1K views14:11

Machinelearning

✔️

А что там OPENAI?

На стриме показали редактор изображений для ChatGPT.

Основные особенности:
🟢ChatGPT поддерживает генерацию видео через Sora(пока очень тормозит).

🟢

Улучшенная генерация текста. Разработчики значительно повысили качество генераций текстовых элементов, теперь они получаются читаемыми и почти без ошибок.

🟢Модель показывает высокий уровень реализма, генератор может создавать изображения с точной передачей деталей, которые вы задаете в промпте.

🟢

ИИ хорошо следует инструкциям. Вы можете попросить его изменить небольшие части изображения и Chatgpt пришлет картинку с запрошенными вами изменениям

🟢

Поддержка прозрачного фона. Пользователи могут создавать изображения с прозрачным фоном, что особенно полезно для создания стикеров, логотипов и других графических элементов.

🟢Хорошо справляется с генерацией мемов, комиксов и других графических материалов.

📌 https://openai.com/index/introducing-4o-image-generation/

@ai_machinelearning_big_data

#openai #imagegenerator #chatgpt

Please open Telegram to view this post

VIEW IN TELEGRAM

❤42👍26🔥14❤‍🔥5🥰1

16.2K viewsedited 18:35

About

Blog

Apps

Platform