Техножнец
5K subscribers
1.46K photos
254 videos
12 files
669 links
Канал моих увлечений и поделок. Всё ,что я делаю и выкладываю здесь - делается с любовью.

Поддержать канал: https://tbank.ru/cf/8Xnajl01ehm

Поддержать канал: https://yoomoney.ru/fundraise/1C86E2DGIU9.250819
Download Telegram
| Матрица            | N    | Speedup    | Ошибка (max)
| ------------------ | ---- | ---------- | ------------
| **hilbert** | 1024 | **13.09x** | 6.39e-02%
| **hilbert** | 2048 | **33.61x** | 2.68e-02%
| **hilbert** | 4096 | **62.16x** | 6.49e-07%



🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆226👏2🕊1
Делюсь артефактом из детства. Я собрал весь журнал. Там надо было наклеивать стикеры дабы раскрыть сцены с разными персонажами. Клёвые описания на русском, обозначение спец приёмов любимых героев. Воистину легендарные картинки. Следом скину часть своего любимого разворота.

Мне было 8

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3913👍6🕊2👀221
Вот моя любимая страничка из этого журнала. На новогодний утренник я уговорил маму сделать мне через знакомых на заказ костюм скорпиона.

Это было эффектно. Больше такого тогда никто не повторял.

Первый косплейер на деревне.

Фоток не сохранилось, соррян.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👏2215🔥14🕊2🏆1🍾1
Пока что без особых деталей, но я включаю режим слабоумие и отвага.

В ближайшее время будут лютые нагибы.
🔥37👍8👏4👌211🕊1🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
И заказал еды...
1022👏8🤩5🕊2🤓2🥰1
Я спать.

ИИШКА РАБОТАЕТ! Подписка скоро будет и обнова дизайна.
180👏35🔥1032👍22🕊1🤝1
Режим сбит как вражеский самолет. Пилот катапультировался , а я проснулся.
1👏17🔥8😢51🕊1👻11
Доброе утро!
🔥25🤝1151🕊1😎1
Фух, ну и денёк. Сегодня разбирался с проектом моего ученика\студента (правда он старше меня, но ничего).
У него своя реализация KAN языковой модели, свой движок интересный и свои подходы ОЧЕНЬ перспективные.

Вот разбирался с его контентом и продакшеном. Очень интересно...поэтому особо не отвечал. в замороче был.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍365🔥3🕊21
Rukallama V11 (TrueKAN) Эпоха 2. Данные на скриншотах.

МОЕ ЭКСПЕРТЫ ВСЕ ОК! САТУРАЦИИ tahn БОЛЬШЕ НЕТ! ЗНАНИЯ РАСПРЕДЕЛЯЮТСЯ ПРАВИЛЬНО!

   Hidden norms — clip работает

Layers 0-2: 593→760→933 (растёт)
Layers 3-23: 1000 (clip активен)

Range 593→1000, ratio 1.7× —стабильно, без inflation.


  Это умеренная просадка warmup. Высокий LR (1e-4 →
3e-4) расшатал attention, заодно эмерджентно укрепил
sink в L21. Не катастрофа — теория говорит «1-2
stable sink — норма для трансформеров».



🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍722🕊2🆒1
Техножнец
Rukallama V11 (TrueKAN) Эпоха 2. Данные на скриншотах. МОЕ ЭКСПЕРТЫ ВСЕ ОК! САТУРАЦИИ tahn БОЛЬШЕ НЕТ! ЗНАНИЯ РАСПРЕДЕЛЯЮТСЯ ПРАВИЛЬНО! Hidden norms — clip работает Layers 0-2: 593→760→933 (растёт) Layers 3-23: 1000 (clip активен) Range 593→1000…
Эпоха 2 RUKALLAMA V11. Болезни вылечены, эксперты живут, всё едет.

Что показал probe.

Норма скрытого состояния. Проблема V9 — внутренний сигнал в модели раздувался проходя через слои. Норма росла в 6.8 раза от первого слоя до последнего. Это значит градиенты при обучении взрывались, модель глохла в шуме на глубине.
В V11 поставил жёсткий потолок — clip на 1000.

И вот что вижу:

— слои 0-2: норма растёт естественно (593 → 760 → 933). Это нормальный физиологический рост, модель собирает контекст. — слои 3-23: норма упирается в 1000 и держится. Clip работает, инфляции нет.
Размах от 593 до 1000, отношение 1.7×. Для сравнения — было 6.8×.
В четыре раза стабильнее. Сигнал больше не разваливается на глубине.

Эксперты MoE — все 32 живые. В V9 эксперты умирали2 из 4 в слое работали в режиме 50/50, остальные 2 простаивали мёртвым грузом. Это значит половина мощности модели лежала без дела.

В V11 я поднял auxiliary loss балансировки в 5 раз и добавил Gumbel шум в gate во время тренировки. Результат: все 32 эксперта по всем слоям активны. Знания распределяются по всей модели, а не концентрируются в двух популярных кладовках.
tanh saturation — больше нет.

В V9 функция активации tanh в .down слоях TrueKAN залипала на 0.99 у 52-90% размерностей. Это превращало FFN в константу — что бы ни приходило на вход, выход одинаковый. Модель глохла.

В V11 поставил RMSNorm перед tanh с обучаемым pretanh_scale. Сигнал нормализуется до того как попадает в насыщающуюся часть. Saturation исчезла. Активации работают как должны — реагируют на разный вход разным выходом.

Attention. Один stable sink в L21.
Sink — это когда голова внимания залипает на первом токене независимо от контекста и не видит остальное. В V9 их было четыре, и из-за них модель срывалась в бесконечные петли.

В V11 на эпохе 2 — один умеренный sink в слое 21. Это не катастрофа. Литература по трансформерам говорит что 1-2 stable sink — норма, потому что модели нужен «сборный буфер» куда сваливать неиспользованное внимание. Эта роль естественно эмерджирует и она полезна.
Что произошло: я поднял learning rate с 1e-4 до 3e-4 на warmup. Высокий LR расшатал attention в моменте, и в L21 эмерджентно укрепился один sink как стабилизирующая функция. Просадка временная и контролируемая, не системная как в V9.


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👏4👍21🕊1🤝1
Что-то устал. Сейчас пойду в chillябинск лежать. (от слова - chill / чилл)

С демоном интересные движения, с космологией тоже - я поделюсь скоро. Туго идёт.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🕊4
Forwarded from Техножнец
Media is too big
VIEW IN TELEGRAM
KELLM - TrueKan оркестратор топологического пространства языка.

ЯЗЫК = ТРАЕКТОРИЯ

Техножнец


ПОДДЕРЖАТЬ ПРОЕКТ


2200271101581263 - МИР \ СОВКОМБАНК
https://yoomoney.ru/fundraise/1C86E2DGIU9.250819 - YOOMONEY
👍24🔥14🥰4🤔2👏1🕊1🏆1