ИИгорь
342 subscribers
41 photos
32 videos
3 files
37 links
Новости и техники ИИ и 3D
Как поставить Stable Diffusion: https://t.me/Aigor3D/20
Download Telegram
Stable Diffusion вообще без видеокарты

Вот буквально только что кто-то выложил на гитхаб рабочую версию Stable Diffusion, которая работает полностью на процессоре.

Есть версия для винды и линукса, установилась у меня в 1 клик. Генерит изображение в 4 шагов за 20 секунд или 10 шагов примерно за минуту. Процессор у меня 5800x3D. Не знаю, можно ли сравнивать с количеством шагов в обычном SD. Для сравнения, на видюхе картинка 512 х 512 , 30 шагов генерится пару секунд в зависимости от видеокарты. По моим прикидкам, получается где-то в 50 раз медленнее, чем на 4070 ti.

Настроек очень мало, по сути только размер, количество шагов и CFG. Чекпоинт стоит Dreamshaper 7, выглядит так, как будто можно поставить другой, но это неточно. Качество картинок как будто похуже, чем в обычном SD на видюхе. Вероятно, это связано с малым количеством шагов и отсутствием нормального VAE. Непонятно, какой там семплер к тому же.

В общем, впечатляет, что эта штука легко устанавливается условно на любой компьютер и стабильно, хоть и медленно работает. Называется FastSDCPU, потому что предыдущие попытки реализовать SD на проце были не фаст.
Stability AI радует плюшками. Недавно выпустили Stable Video Diffusion, бесплатный аналог Runway и ему подобным, вот только что показали SDXL, который генерит в реальном времени, пока печатаешь промпт.
Попробовать можно на Clipdrop.
К сожалению, бесплатные попытки кончаются так же быстро, как он выдает картинки, но к счастью, это все же Stability AI, так что модель уже доступна бесплатно на Huggingface. Ждем минут 15, пока кто-ниубдь ее не прикрутит к Automatic1111 и к Comfy.
Media is too big
VIEW IN TELEGRAM
Я вообще на работе, но это срочно в номер. 😮

Мои предсказания полностью сбылись, SDXL turbo реализовали на Comfy UI как только я пошел спать.

Надо обновить Comfy UI, скачать саму модель и вот эту милую картинку. Картинку закидываем в комфи в качестве воркфлоу, в доп. настройках включаем Auto Queue.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Раньше меня мало интересовала анимация в нейронках, но анимация - это логическое развитие статического изображения, как кино развитие фотографии. В общем просидел весь день в Comfy UI с логотипом любимой студии.
По-моему вышло неплохо.
This media is not supported in your browser
VIEW IN TELEGRAM
Продолжаю рассказывать про любимый софт, не реклама, если что.

На этот раз Anki — это чит в реальной жизни на бесконечную память.

Я считаю, что, учить, например, языки без Анки — это все равно, что ползти в другую страну на четвереньках, а с Анки — лететь на самолете. И при этом учить не обязательно языки, можно учить что угодно, что требует запоминания большого объема информации. Анки невероятно популярна среди американских студентов-медиков, которым все время нужно заучивать огромное количество фактов из разных сфер.

Анки работает на принципе интервального повторения, о нем очень наглядно рассказывает вот эта интерактивная страница.
Недавно в Анки добавили FSRS. Это новый алгоритм, который вычисляет оптимальное время для повторения каждой карточки. Старый алгоритм был разработан в 1987 году. Даже он был эффективнее простой зубрежки во много много раз. Новый алгоритм принимает во внимание больше факторов и сводит к минимуму бесполезные повторения материала, который вы и так неплохо помните. Т.е. главная цель — учиться меньше, запоминать лучше. Вчера вышел отличный видос от самого авторитетного эксперта по Анки, в котором он рассказывает про новый алгоритм и показывает оптимальные настройки программы.

Анки есть на Андроид и iOS. Вполне в духе этих платформ, Анки на андроид скачивается с гитхаба в виде альфа версии (только в ней пока есть FSRS, но версия вполне стабильная, несмотря на пометку альфа), а на iOS Анки просто стоит 25 баксов. Все остальные версии бесплатные. Есть также бесплатный сервис AnkiWeb для синхронизации коллекции между компом и телефоном. Повторять карточки однозначно удобнее на телефоне, но следить за коллекцией — на компьютере.

Также Анки — это не Дуолинго, в нем нет заранее зашитых курсов. Вы либо создаете нужные карточки самостоятельно, как обычные бумажные флэш-карточки, либо скачиваете колоды, созданные сообществом. Их также выкладывают на AnkiWeb. В разделе Russian, кстати, много колод не только для изучающих русский, но и для тех, для кого русский язык родной.
Forwarded from Нейронично
Media is too big
VIEW IN TELEGRAM
Приглашаю вас в Dead&Breakfast - леденящий душу отель для монстров, ведьм и мифических существ!


Это моё первое нейровидео 💫
Завела канал на ютубе - там тоже можно посмотреть.

Генерации - Minimax
Музыка - Suno
Звук - FreeSound
Озвучка - ElevenLabs
Монтаж и цветокор - DaVinci
Я, мягко говоря, давно не постил ничего, конечно, из-за нехватки времени. Не знаю, буду ли я когда-нибудть продолжать регулярно постить тут. Пока что приглашаю всех в Ксюшин канал из предыдущего поста, можно сказать, что это идейное продолжение этого канала. ) Она также пишет про нейронки, про работу в CG сфере, и немного про то как, работая там, не поехать кукухой.
This media is not supported in your browser
VIEW IN TELEGRAM
Это один из лучших советов по блендеру, что я видел. Как никогда не выключать face orientation. Не могу не поделиться.
This media is not supported in your browser
VIEW IN TELEGRAM
И как включить отображение флипнутых нормалей по умолчанию.
Media is too big
VIEW IN TELEGRAM
Вчера был просто парад планет для видеонейронок, поэтому просто невозможно не восстать из мертвых ненадолго и не поделиться новостями.

1. Ксюша завела твич и провела свой первый стрим. Рассказала про все основные нейроночные сервисы всех видов: текст, картинки, звук, видео. Что для чего хорошо, что сколько стоит, на что стоит подписываться. Пришло много народу, и все прошло супер. Стрим получился длинный 3:40, Ксюша сказала, что порежет на логические части и выложит запись на ютуб.

2. lllyasviel, легендарный разработчик из ИИ сообщества допилил Hunyuan Video и сделал Frame Pack. С его помощью можно оживлять картинки локально на видюхе от 6 гб видеопамяти. Т.е. буквально на многих ноутах будет работать. И вторая киллер-фича, что можно генерить почти сколько угодно длинные видео. Что интересно, генерит он как-то с конца к началу. На 4090 1 сек видео генерится где-то минуту, на 4070ti - 2 - 2,5 минуты. Разрешение 512x768 и сразу в 30 фпс. Есть сборка на Pinokio для легкой установки (но почти 50 гб придется скачать). Kijai, другой легендарный разработчик уже прикручивает это дело к комфи.

3. Обнова LTX видео, которая позволяет генерить видео очень быстро. Буквально за секунды. Некоторые картинки во Flux генерятся дольше. И качество нормальное вроде.

4. Wan выпустили новую модель, которая позволяет указать первый и последний кадр. Потенциально можно будет делать прикольные длинные цепочки из ключевых кадров. Модель 720p, ждем прикручивания к комфи, квантованных вариантов и т.д.

5. Не новость, но если вы хотели попробовать Wan video, но не знали как, очень советую вот этот воркфлоу. Там парень основательно подошел. Есть подробная инструкция по использованию, скрипт для автоустановки комфи и всего необходимого. Есть разные модели под разный объем видеопамяти. Генерится достаточно быстро и качество хорошее. Советую заморочиться и поставить Sage attention по отдельной инструкции, чтобы еще быстрее было. Есть прикольные лоры, точнее одна, которая позволяет делать из картинки 360 турнтейбл, например.
Media is too big
VIEW IN TELEGRAM
После недавнего Ксюшиного стрима про 3д нейронки, многие снова спрашивали, как поставить Hunyuan3d локально. Решил записать коротенький видос, в котором показываю подробно весь процесс.
Ссылки на ресурсы:
https://git-scm.com/
https://github.com/comfyanonymous/ComfyUI
https://github.com/Comfy-Org/ComfyUI-Manager
https://github.com/kijai/ComfyUI-Hunyuan3DWrapper
https://civitai.com/models
Я несколько лет назад столкнулся с тем, что надо было работать в ACES в блендере, но нормального решения для этого не было. В итоге я сделал конфиг для блендера с поддержкой цветовых пространств и вью-трансформов ACES, выложил бесплатно на гамроуде: https://alphyn.gumroad.com/l/OscarBlend
Судя по статистике, до сих пор этот конфиг скачивают, и на профильных форумах, реддите и т.д. продолжают задавать на эту тему вопросы.
В честь этого я обновил сам конфиг, пофиксил пару багов, сделал установку проще, и главное, записал видос про то, как всем этим пользоваться. Загрузил его на YouTube, чтобы можно было нагуглить, т.к. я в свое время нормального видоса на эту тему так и не нашел.
Вообще все это нужно и потому, что приходится иногда работать в нормальном пайплайне, где есть общий контроль над цветом, и чисто для себя прикольно иметь какое-то подобие системы общего цветового пайплайна. Чтобы в каждом софте не было новых неожиданных и удивительных цветов.
В видео показываю только самые основы, чтобы начать работать. Конечно, про это книги есть толстенные и можно вообще всю жизнь изучать.
https://youtu.be/9vELTAnxWP0?si=He9DYgoVoIj58J-l
Я когда-то давно делал пост про то, как в простом StableDiffusion генерить в 4к с добавлением деталей, запостил это также на реддит. И хотя сама картинка была скорее как технический тест, какой-то человек нашел меня и попросил разрешение распечатать и повесить ее на стене у них в студии. )) Мелочь, а приятно.
Опять про ACES, только что узнал, что добавят, наконец, поддержку ACES 2.0 из коробки в пятый блендер (11 ноября).
В 4.5 добавили нормальную поддержку OCIO, но если хотел ACES, его все равно надо было отдельно подгружать извне. Возможно, это было частью подготовки к имплементации ACES.
Это позволит лучше интегрировать Blender с в пайплайны с другим софтом и иметь везде сочные и, главные, консистентные цвета.
Отличные новости, не мог не поделиться.
https://www.youtube.com/watch?v=9mMtZWs6sto
Media is too big
VIEW IN TELEGRAM
Видос про установку и тест 2х плагинов с нейронками для фотошопа, а именно Nano-Banana И ComfyUi. Записан экспромтом в моем обычном стиле, поэтому лучше смотреть на 1.5 скорости.

Установка Nano-Banana на 6:30.
Начало про Comfy на 14:50.

🍌 Скрипт для Nano-Banana и Flux Context: Гамроуд
ВНИМАНИЕ. Автор этого скрипта (который теперь стал плагином) сменил сервис, через который поставляется API. Не надо пополнять Replicate. Новый сервис называется Astria. Ссылка на него в интерфейсе самого плагина после установки, чтобы не ошибиться.
🎷 Плагин c Comfy UI: Гитхаб
Тут надо скачать Required Files, сам плагин отсюда качать не надо, т.к. он старый, кривой и больше не пашет.
🐪 Вот тут починенный мной плагин: Гугол диск

Там 2 папки и файл json.

Папку comfyui-photoshop кладем в
\ComfyUI\custom_nodes

Папку Ai-Comfy кладем в
c:\Program Files\Adobe\Adobe Photoshop 2025\Plug-ins

Воркфлоу кладем либо сюда, либо перетаскиваем в комфи и сохраняем.
\ComfyUI\user\default\workflows\PHOTOSHOP.json

Ну и, конечно, надо будет обновить сам комфи до последней версии и установить недостающие ноды через менеджер.
Media is too big
VIEW IN TELEGRAM
Небольшой апдейт к предыдущему посту про плагины для ФШ.

1. Скрипт для нано-бананы вырос в плагин, переехал с гамроуда на свой сайт. И переехал на другого поставщика API. Стало больше нейронок на выбор. Можно загружать в дополнение к промпту изображение-реф. Раньше можно было только на маке. https://www.astria.ai/nano-banana-photoshop

2. 4:44 Еще потестил плагин Comfy-Photoshop, пробую подключить Flux Context. На самом деле, хз, почему на видео получился так себе результат, скорее всего из-за разрешения. В других тестах у меня получались результаты прям вообще нормальные.

3. 8:45 Ну и по приколу подключил к фотошопу воркфлоу для генерации видео. Можно прям в фотошопе кнопку нажимать и, например, получать облет персонажа 360.

Еще раз простите, если плохо видно, записывал буквально с кота.
Media is too big
VIEW IN TELEGRAM
Обновились основные 3д-нейронки. Захотелось сделать стресс-тест.

1. Hunyuan 3d 3.0 - как будто остается фаворитом.
2. Tripo v3 - зачем, если Хуньюань лучше и бесплатнее? Но пытается догонять. Сетка заковыристая, ремеш так себе, с дырками.
3. Hitem3d 1.5 - долго, дорого, фигово. Но есть свои положительные моменты. В плане пбр текстур отстает, по форме более-менее.
4. Meshy 6 - интересный подход к форме в шестой версии, отличается от других нейронок, но текстуры просто мрак пока что.

При моральной поддержке сообщества Неиронично.
This media is not supported in your browser
VIEW IN TELEGRAM
Внезапно вышел расшакаливатель от Flux - LucidFlux. Выглядит очень интересно.

Веса есть, весят мало.

Можно уже пробовать, кому не лень с кондой возиться.
Кому лень, можно подождать 15 минут, пока не сделают для Comfy реализацию.


Сразу интересно, что будет с временной консистенцией, будет ли работать на видео.
Сбылась моя CG мечта, в Blender 5 нормально работает ACES. Картинка в Blender выглядит почти идентично вьюпорту Substance Painter. Отличия есть, конечно, но это при том, что в SP у меня стоит ACES 1.2, в Блендере - 1.3 (также доступен 2.0), ну и рендер движок Cycles vs iRay, не совсем корректно сравнивать цвета в двух разных рендерах. Самое главное, что можно теперь экспортить картинку в EXR в Davinci, например, и там грейдить, и без грейда цвета будут абсолютно как в блендере. Это значит, что блендер на большой шаг ближе к использованию в больших крутых профессиональных пайплайнах.
Всем рекомендую переходить со всяких фильмиков и AGX на ACES.
Для этого создаем новый файл и в настройках рендера в Color Management ставим:
View - ACES (1.3 или 2.0) в зависимости от того, какая версия используется в остальном софте, с которым работаем.
Look - Reference Gamut Compression
Желательно также поставить Working Space - AcesCg. Для лучшей работы с расширенным цветовым охватом.
После этого можно сохранить файл по умолчанию.
Т.е. теперь всякие конфиги, которые я делал и выкладывал на гамроуд, больше не нужны.