Derp Learning – Telegram

Derp Learning

13.1K subscribers

3.15K photos

908 videos

9 files

1.31K links

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Download Telegram

About

Blog

Apps

Platform

13.1K subscribers

Forwarded from Борис опять

Скинули в нашем Опять чате

😁38😱3❤1🤡1

3.99K views11:53

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

В HeyGen новая фича - Photo Avatar

И да, она тоже связана с тренировкой своих аватаров на пачке входных изображений.

Почитайте полный пайплайн тут:

Если вкратце: Flux, Magnific, Heygen, Elevent Labs, chatGPT, Topaz

Ну, за дикторов и блоггеров..

@cgevent

😁11👍3🔥2❤1

3.76K views22:58

Forwarded from Love. Death. Transformers.

китай удар!

🤩26❤2

3.26K views09:33

Forwarded from Сиолошная

$100

💯49😁12👍4❤1

3.95K views10:12

Сиолошная

😁34🔥2

3.86K views10:12

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Что-то это уже слишком хорошо для липсинка.

У Тиктока 4 месяца назад вышел X-Portrait
https://github.com/bytedance/X-Portrait

Но сейчас они бахнули X-Portrait 2 и это уже запредельно выразительно.
Я прям очень жду код, потому что они похоже могут уделать Runway Act One - и все это будет локально, без подписок и кредитов.

Поглядите вот тут, это стоит того:
https://byteaigc.github.io/X-Portrait2/

@cgevent

🔥27👀7👍2

3.94K views01:21

Forwarded from Dev Meme / devmeme

😱28😁11❤4😢3

3.85K views10:16

Forwarded from Dev Meme / devmeme

😁43💯9🤬4🤣1

3.93K views15:41

This media is not supported in your browser

VIEW IN TELEGRAM

Runwayml: анонсирует camera controls, успевает похайповать полчаса.
Опенсорс: hold my beer

DimensionX Lora для Cogvideo. Моё увожение!

Github

🔥42❤4

12.9K views17:49

Forwarded from Dev Meme / devmeme

😁37😢9🤩7👍6❤3🤗1

3.94K views08:29

Forwarded from эйай ньюз

Media is too big

VIEW IN TELEGRAM

Очередной хайп-тул от китайцев из ByteDance — SeedEdit

По сути, это еще один text2photoshop или по простому текстовый редактор картинок, но качество — моё почтение (судя по черипикам, а демо на Hugging Face у меня пока лежит).

Результаты получаются очень похожими на то, что даёт наш Emu Edit из соседней команды.

Пробежался по тех-репорту. Деталей там зиро, так же как и novelty:
Все таже начинают с обычной pre-trained text2img диффузии и генерят пары синтетических данных - картинка и ее отредактированная версия с инструкцией. Далее это все дело сильно фильтрут, дообучают модель на отфильтрованных парах с инструкциями. Затем опять повторяют по кругу - генерят синтетику, фильтруют и дотренивают модель. Так несколько раз.

По архитектуре: вместо добавления оригинальной картинки на вход с помощью конкатенации дополнительных каналов как в Emu Edit, тут кормят фичи оригинальной картинки в контекст self-attention блоков. Эта фишечка не новая, так делали уже например в Story Diffusion для генерации консистентных кадров.

Иначе говоря, ничего нового в методе нет, челы просто очень хорошо приготовили синтетические данные (data is the king).

Больше примеров ниже.

Демо на Hugging Face
Пейпер
Project page

@ai_newz

🔥7

3.81K views11:57

Forwarded from Dankest Memes // Данкест Мемс

😁43❤30🤣4👀1

4.64K views14:03

Forwarded from Dev Meme / devmeme

😁31💯4

4.9K views06:25