Love. Death. Transformers.

уважающий себя итшник:

🍌25🤮8🌭8🍾7🤔1

3.47K views12:07

Если б программисты строили бы дом

Когда взял энкодер с dim 2048, а unet с dim 768

Когда не синканул контракты ml с бэкэндом

😁29🤡6🍓2👍1🔥1

3.45K viewsedited 12:54

Love. Death. Transformers.

LoRA: Low-Rank Adaptation of Large Language Models или как ее сунуть то

есть такая эвристика - оптимайзер модели без хаков занимает в 4 раза больше памяти чем сама модель. Тут открывается простор для оптимизаций: перенос оптимайзера на cpu, заморозка модели fp16 и fp8 и все это требует некоторой интелектуальной нагрузки чтобы аккуратно все обучилось и взорвалось.

Но есть путь проще - адаптеры, идея такая: давайте в attention разложи Wqkv на Wk и Wv что дает выигрышь в 4 раза

github
paper

Не так давно тоже самое сделали для SD, тюн/dreamboth влезает в 12гб карты с adamw 32bit
github

👍10

3.7K viewsedited 18:07

Love. Death. Transformers.

Шел третий год с выхода JAX 1.0, авторы наконец выложили лекцию на youtube

YouTube

What is JAX?

JAX is a high performance numerical computing framework that brings together differentiation to Python code (Autograd) and Accelerated Linear Algebra (XLA) that compiles to low level, high performing code on accelerators, such as GPUs and TPUS. In this video…

😈15👍5

4.02K views18:10

Love. Death. Transformers.

😁37

3.69K views06:23