Черепашки - Народная
Suno 4.5+ — кайф. 😮
Давайте поговорим про функцию Cover в Suno. Точнее, послушаем. Сделал мини-альбом каверов на опенинг из старого мультика про Черепашек-ниндзя.
Если коротко: Cover — круто. Загружаете мелодию / трек / напев с микрофона, крутите настройки, пишете промт — и у вас качественный кавер в любой аранжировке за минуту. Если бы я был музыкантом — сочинял бы черновики и сразу прогонял их через Cover, чтобы протестировать разные ходы, а потом писал на чистовую.
Несколько особенностей по моим тестам:
1) Не даёт загружать известные треки и тексты.
Но, например, русский рок за "известную музыку" особо не считается.
Если ругается на текст — попробуйте заменить некоторые буквы на фонетически близкие или убрать один куплет.
2) Настройки. Есть три ползунка:
🥴 Weirdness — лучше не трогать или понижать.
Выше 50% — и начинается каша.
😎 Style Influence — влияет на силу промта.
Для каверов хорошо работает диапазон 80–100%.
🎧 Audio Influence — определяет, насколько кавер будет близок к загруженному аудио по структуре и мелодике. Здесь всё зависит от жанра и задачи.
У меня хорошо работало в диапазоне 10–50% — чтобы модель интерпретировала по-своему, но сохраняла узнаваемость оригинала.
Естественно, только в платной подписке (но это того стоит). 🙃
P.S: Почему-то при репосте поста с приклеенным аудио не отображается канал. Знайте, что он из Ai molodca. Ну и подписывайтесь!
Давайте поговорим про функцию Cover в Suno. Точнее, послушаем. Сделал мини-альбом каверов на опенинг из старого мультика про Черепашек-ниндзя.
Если коротко: Cover — круто. Загружаете мелодию / трек / напев с микрофона, крутите настройки, пишете промт — и у вас качественный кавер в любой аранжировке за минуту. Если бы я был музыкантом — сочинял бы черновики и сразу прогонял их через Cover, чтобы протестировать разные ходы, а потом писал на чистовую.
Несколько особенностей по моим тестам:
1) Не даёт загружать известные треки и тексты.
Но, например, русский рок за "известную музыку" особо не считается.
Если ругается на текст — попробуйте заменить некоторые буквы на фонетически близкие или убрать один куплет.
2) Настройки. Есть три ползунка:
🥴 Weirdness — лучше не трогать или понижать.
Выше 50% — и начинается каша.
😎 Style Influence — влияет на силу промта.
Для каверов хорошо работает диапазон 80–100%.
🎧 Audio Influence — определяет, насколько кавер будет близок к загруженному аудио по структуре и мелодике. Здесь всё зависит от жанра и задачи.
У меня хорошо работало в диапазоне 10–50% — чтобы модель интерпретировала по-своему, но сохраняла узнаваемость оригинала.
Естественно, только в платной подписке (но это того стоит). 🙃
P.S: Почему-то при репосте поста с приклеенным аудио не отображается канал. Знайте, что он из Ai molodca. Ну и подписывайтесь!
Forwarded from Джимми Нейрон 🚀
Ideogram Character
Идеограм выпустил Characters — модель, которая работает только с одним эталонным изображением. Загружаете изображение (или делаете селфи), прописываете промпт и получаете другие фотографии. Можно воспользоваться готовыми шаблонами на сайте.
Попробовать можно бесплатно здесь.
Первые впечатления:
🔹Лицо подхватывает очень хорошо, нет мыльности (как у flux или higgsfield), не плавит лицо как Миджорни и ChatGPT.
🔹Т.к. я не не использовал референсы, а только текстовые промпты, результаты получились похожими на фотосессию на фоне фотообоев (впрочем, генерации можно отредактировать в фотошопе, как обычные фотографии). Нейросетевые референсы, которые вы можете сделать в других нейросетях — залог успеха.
🔹Результат генерации напрямую зависит от качества исходного изображения (с селфи у меня получилось не очень).
Классная штука, чтобы создать другие ракурсы вашего персонажа (или сделать гламурную фотосессию для Шрека). Еще подойдет мужикам, у которых есть ровно одна хорошая фотка.
Идеограм выпустил Characters — модель, которая работает только с одним эталонным изображением. Загружаете изображение (или делаете селфи), прописываете промпт и получаете другие фотографии. Можно воспользоваться готовыми шаблонами на сайте.
Попробовать можно бесплатно здесь.
Первые впечатления:
🔹Лицо подхватывает очень хорошо, нет мыльности (как у flux или higgsfield), не плавит лицо как Миджорни и ChatGPT.
🔹Т.к. я не не использовал референсы, а только текстовые промпты, результаты получились похожими на фотосессию на фоне фотообоев (впрочем, генерации можно отредактировать в фотошопе, как обычные фотографии). Нейросетевые референсы, которые вы можете сделать в других нейросетях — залог успеха.
🔹Результат генерации напрямую зависит от качества исходного изображения (с селфи у меня получилось не очень).
Классная штука, чтобы создать другие ракурсы вашего персонажа (или сделать гламурную фотосессию для Шрека). Еще подойдет мужикам, у которых есть ровно одна хорошая фотка.
Forwarded from Нейросети без дураков
Обнаружил, что Gemini может делать прикольные портреты на основе ваших селфи 😂
Получился слегка толстоват, но надо отдать должное, мешки под глазами исчезли))) Я использовал номер4️⃣
Заходите на сайт Gemini (можно даже ничего не платить) и закидываете в него один из промптов, которые мне нагенерил ChatGPT. Когда будете фоткаться, встаньте напротив хорошего источника света, так результат будет лучше
©️ Профессиональное и корпоративное фото
1️⃣ Руководитель
2️⃣ Юрист
©️ Для нетворкинга
3️⃣ На hh.ru
4️⃣ Эксперт в отрасли
©️ Творческие специалисты
5️⃣ Художник / Креативный профессионал
6️⃣ Контентмейкер
©️ Здравоохранение и помощь
7️⃣ Медицинский специалист
8️⃣ Терапевт / Консультант
©️ Бизнес и предпринимательство
9️⃣ Предприниматель / Стартап
* Instagram принадлежит компании Meta, признанной экстремистской и запрещённой на территории РФ
Скидывайте в комменты, что у вас получилось😂
Получился слегка толстоват, но надо отдать должное, мешки под глазами исчезли))) Я использовал номер
Заходите на сайт Gemini (можно даже ничего не платить) и закидываете в него один из промптов, которые мне нагенерил ChatGPT. Когда будете фоткаться, встаньте напротив хорошего источника света, так результат будет лучше
"Сначала попроси у меня селфи. Преобразуй моё селфи в чёткий, профессиональный портрет уровня руководителя, подходящий для профилей C-suite в LinkedIn. Освещение — драматичное, но деловое, с мягкими тенями. Моя осанка уверенная и дружелюбная; на мне тёмно-синий пиджак. Фон — современный корпоративный офис с окнами «от пола до потолка», слегка размытый."
"Сначала попроси у меня селфи. Преврати моё селфи в резкий, авторитетный портрет, идеальный для партнёров юрфирм и правовых каталогов. Освещение — классическое и вне времени, с контролируемыми тенями. Выражение — серьёзное, но доброжелательное; плечи ровно и прямо к камере. Фон — традиционный кабинет с панелями из красного дерева и книжными полками, элегантно размытый."
"Сначала попроси у меня селфи. Преврати моё селфи в располагающий портрет для Head Hunter, который буквально говорит: «возьмите меня на работу прямо сейчас». Освещение — естественный дневной свет с мягким, ровным покрытием. Улыбка искренняя и уверенная, взгляд прямо в камеру. Фон — светлое, современное коворкинг-пространство с растениями и природными элементами, профессионально размытое."
"Сначала попроси у меня селфи. Преврати моё селфи в портрет эксперта, подходящий для подкастов и медиа-интервью. Освещение — телевизионного качества с профессиональной постановкой. Манера — знающая и чёткая, осанка — готовая к выступлению. Фон — профессиональная студия или вещательная среда, кинематографично размытая."
"Сначала попроси у меня селфи. Преврати моё селфи в художественный портрет для креативного портфолио и галерей. Освещение — атмосферное и драматичное, с художественными тенями. Выражение — созерцательное и вдохновлённое, в глазах — креативность. Фон — арт-студия с полотнами и инструментами, художественно размытая."
"Сначала попроси у меня селфи. Преврати моё селфи в эффектный портрет инфлюенсера — для коллабораций с брендами и спонсорских предложений. Освещение — оптимизированное для соцсетей, с аккуратным улучшением кожи. Вайб — трендовый и вовлекающий, выражение — естественно фотогеничное. Фон — стильная локация в духе Instagram* с эстетичными деталями, красиво размытая."
"Сначала попроси у меня селфи. Преврати моё селфи в заслуживающий доверия портрет медицинского работника, идеально подходящий для сайтов клиник. Освещение — чистое и «клиническое», но тёплое и располагающее. Выражение — заботливое и уверенное, передающее профессионализм. Фон — современный медицинский офис с деликатными медицинскими деталями, профессионально размытый."
"Сначала попроси у меня селфи. Преврати моё селфи в портрет терапевта, который сразу дарит чувство безопасности. Освещение — мягкое и уютное, с естественным теплом. Образ — спокойный и эмпатичный, взгляд — понимающий и поддерживающий. Фон — спокойный кабинет терапии с растениями и умиротворяющими цветами, мягко размытый."
"Сначала попроси у меня селфи. Преврати моё селфи в портрет предпринимателя, привлекающий инвесторов и партнёров. Освещение — визионерское и амбициозное, с тенями, акцентирующими ощущение успеха. Образ — инновационный и целеустремлённый; взгляд отражает деловую хватку. Фон — офис стартапа или современная бизнес-среда, деликатно размытая.
* Instagram принадлежит компании Meta, признанной экстремистской и запрещённой на территории РФ
Скидывайте в комменты, что у вас получилось😂
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from WaveCut
Black Forest Labs представляет FLUX.2 [klein] — быструю ИИ-модель для генерации и редактирования изображений профессионального качества менее чем за одну секунду.
https://bfl.ai/models/flux-2-klein
https://huggingface.co/black-forest-labs/FLUX.2-klein-base-4B
https://huggingface.co/black-forest-labs/FLUX.2-klein-4B
https://huggingface.co/black-forest-labs/FLUX.2-klein-base-9B
https://huggingface.co/black-forest-labs/FLUX.2-klein-9B
* Модель FLUX.2 [klein] 9B является дистиллированной версией для высокого качества на субсекундной скорости.
* Для работы FLUX.2 [klein] 9B требуется 19,6 ГБ видеопамяти для локального вывода на оборудовании.
* Недистиллированная базовая модель 9B предлагает максимальную гибкость и контроль, идеально подходя для тонкой настройки.
* Базовой модели FLUX.2 [klein] 9B для работы требуется около 21,7 ГБ видеопамяти (VRAM).
* Вариант модели 4B является самым быстрым в семействе Klein и создан для интерактивных приложений.
* Для запуска модели FLUX.2 [klein] 4B требуется примерно 8,4 ГБ видеопамяти (VRAM).
* Существует вариант 4B Base для локального развертывания на оборудовании с ограниченными аппаратными ресурсами.
* Модель FLUX.2 [klein] 4B Base использует для своей работы 9,2 ГБ видеопамяти (VRAM).
* Модели 4B и 4B Base выпускаются под разрешительной лицензией Apache 2.0, способствующей открытому использованию.
* Более крупные модели 9B и 9B Base используют более строгую некоммерческую лицензию FLUX.
* Утверждается, что модель более чем на 30% быстрее любой из конкурирующих на рынке моделей.
* Веса всех вариантов моделей FLUX.2 [klein] доступны для скачивания на платформе Hugging Face.
* Исходный код и примеры реализации проекта опубликованы в открытом доступе на платформе GitHub.
* Компания предоставляет интерактивную «песочницу» (Playground) для тестирования модели без необходимости регистрации или настройки.
* Для коммерческого использования моделей требуется отдельная лицензия, условия которой доступны на сайте компании.
https://bfl.ai/models/flux-2-klein
https://huggingface.co/black-forest-labs/FLUX.2-klein-base-4B
https://huggingface.co/black-forest-labs/FLUX.2-klein-4B
https://huggingface.co/black-forest-labs/FLUX.2-klein-base-9B
https://huggingface.co/black-forest-labs/FLUX.2-klein-9B
* Модель FLUX.2 [klein] 9B является дистиллированной версией для высокого качества на субсекундной скорости.
* Для работы FLUX.2 [klein] 9B требуется 19,6 ГБ видеопамяти для локального вывода на оборудовании.
* Недистиллированная базовая модель 9B предлагает максимальную гибкость и контроль, идеально подходя для тонкой настройки.
* Базовой модели FLUX.2 [klein] 9B для работы требуется около 21,7 ГБ видеопамяти (VRAM).
* Вариант модели 4B является самым быстрым в семействе Klein и создан для интерактивных приложений.
* Для запуска модели FLUX.2 [klein] 4B требуется примерно 8,4 ГБ видеопамяти (VRAM).
* Существует вариант 4B Base для локального развертывания на оборудовании с ограниченными аппаратными ресурсами.
* Модель FLUX.2 [klein] 4B Base использует для своей работы 9,2 ГБ видеопамяти (VRAM).
* Модели 4B и 4B Base выпускаются под разрешительной лицензией Apache 2.0, способствующей открытому использованию.
* Более крупные модели 9B и 9B Base используют более строгую некоммерческую лицензию FLUX.
* Утверждается, что модель более чем на 30% быстрее любой из конкурирующих на рынке моделей.
* Веса всех вариантов моделей FLUX.2 [klein] доступны для скачивания на платформе Hugging Face.
* Исходный код и примеры реализации проекта опубликованы в открытом доступе на платформе GitHub.
* Компания предоставляет интерактивную «песочницу» (Playground) для тестирования модели без необходимости регистрации или настройки.
* Для коммерческого использования моделей требуется отдельная лицензия, условия которой доступны на сайте компании.
Forwarded from mimagie
NBP_R&D_part2_2026_air.pdf
45.2 MB
Сделали исследование возможностей NBP. Все картинки сделаны чистым t2i.
Исследование показывает, что Nano Banana Pro предлагает фундаментально иной подход к созданию стиля по сравнению с функцией SREF в Midjourney. NBP использует семантическую деконструкцию, что позволяет управлять «ДНК» изображения.
Высокая точность в коммерческой эстетике:
NBP продемонстрировал способность различать тонкие нюансы текстур и создавать сложное освещение.
Работа со светом как инструментом нарратива:
В отличие от простых фильтров, NBP успешно интерпретирует сложные схемы смешанного освещения . Модель корректно воспроизводит температурные контрасты для создания кинематографического напряжения и драматизма.
Геометрия и физика сцены:
Для сюрреалистичных и концептуальных задач NBP показал способность выстраивать сложные пространственные композиции , строго следуя логике сцены.
Исследование показывает, что Nano Banana Pro предлагает фундаментально иной подход к созданию стиля по сравнению с функцией SREF в Midjourney. NBP использует семантическую деконструкцию, что позволяет управлять «ДНК» изображения.
Высокая точность в коммерческой эстетике:
NBP продемонстрировал способность различать тонкие нюансы текстур и создавать сложное освещение.
Работа со светом как инструментом нарратива:
В отличие от простых фильтров, NBP успешно интерпретирует сложные схемы смешанного освещения . Модель корректно воспроизводит температурные контрасты для создания кинематографического напряжения и драматизма.
Геометрия и физика сцены:
Для сюрреалистичных и концептуальных задач NBP показал способность выстраивать сложные пространственные композиции , строго следуя логике сцены.