еба́ные идеи для резерча

Channel created

15:50

Дистилляция логрега с помощью Switch Transformer

🥴8

1.38K views16:03

еба́ные идеи для резерча

Ускорение identity операции с помощью cuda

🥴17

1.45K views16:07

еба́ные идеи для резерча

Recurrent Positional Encoding for Transformers

Идея: делать позиционное кодирование с помощью рекуррентной сети. В качестве эмбеддинга текста берется сумма токен-эмбеддингов и обучаемое позиционное предоставление на основе рекуррентной сети.
Предлагается поэкспериментировать с количеством слоев (использовать не менее трёх).

🥴5

1.48K views17:26

еба́ные идеи для резерча

Мало кто знает, но ответом на главный вопрос вселенной станет random seed, которым нужно будет проинициализировать gpt5.

🥴18

1.49K views10:56

еба́ные идеи для резерча

🥴5

1.35K views11:55

еба́ные идеи для резерча

хочется блевать от скринов чатгпт

🥴12

1.25K views17:11

еба́ные идеи для резерча

🥴11

1.21K views09:41

еба́ные идеи для резерча

Я устал вести этот канал, поэтому передаю его в управление новой группе авторов.

Отныне все посты здесь будет писать чатгпт

🥴16

1.28K viewsedited 16:50

еба́ные идеи для резерча

closed form solution для поиска лучших сидов

🥴4

1.22K views20:21

еба́ные идеи для резерча

Kandinsky 3.0

🥴11

1.21K views20:40

еба́ные идеи для резерча

weight squeezing for asian neural machine translation

🥴5

1.17K viewsedited 20:45

еба́ные идеи для резерча

Читать статьи по DL - не больше чем прокрастинация.

Вот три аргумента:
1. Чтение статей по глубокому обучению может быть просто информационной подачей, которая не приводит к практическим навыкам и знаниям, необходимым для решения реальных задач.
2. Чтение статей может отвлекать от практической работы и изучения кода, что является более эффективным способом изучения глубокого обучения.
3. Чтение статей может создать иллюзию понимания темы, но не дает необходимых навыков и знаний для применения глубокого обучения на практике.

🥴25

1.29K viewsedited 15:18

еба́ные идеи для резерча

🥴13

1.33K views20:20

еба́ные идеи для резерча

CartPole-v1 with RLHF

🥴9

1.31K views20:28

еба́ные идеи для резерча

У нас было два пакета лайтнинга, семьдесят пять карточек a100, 5 версий бидирекшионал енкодер репрезентатионал тарнсформера или БЕРТ, GPT-2, наполовину наполненная пикабу, и целое море разноцветных классификаторов, бенчмарков и метрик, а так же литр лимончеллы, литр грибовой настойки, ящик «Дальней Дачи», пинта чистой струи бобра, и 12 полуразряженных HQDшок. Не то, чтобы всё это было категорически необходимо в ресерче, но если уж начал копаться в NLP, то к делу надо подходить серьёзно.

🥴25

1.76K views15:24

еба́ные идеи для резерча

Перевести датасет обучения кандинского на английский и обучить Stable Diffusion 3.0

🥴11

1.7K views09:21

еба́ные идеи для резерча

великая библиотека сидов

аггрегатор информации о зависимости метрик относительно сидов
можно поискать наиболее выгодный сид для своей задачи

🥴20

7.31K views11:29

еба́ные идеи для резерча

Топик моделлинг

🥴14

1.34K views18:58

еба́ные идеи для резерча

Генерация аудиодорожек с помощью треска дросселей на видеокарте

Подбираем модель и батчи таким образом, чтобы перегруженные дроссели начинали насвистывать нужную мелодию

Future work: собираем оркестр из distributed кластера

🥴36

5.4K viewsedited 15:56

About

Blog

Apps

Platform