Техножнец

1👍28🔥10🤔6🤯1

1.34K views19:38

Техножнец

Photo

👍23🤔8🔥7

1.33K views19:50

Техножнец

Photo

🔥19⚡7👍7🤯3❤1

1.34K views19:58

Техножнец

Photo

👍21🔥112

1.38K views20:10

Техножнец

👍13🔥8

1.34K views21:01

Техножнец

👍17🔥6

1.37K views21:08

Техножнец

о житейском...

💯29🥰5❤1

1.4K views21:14

Техножнец

doom'аю..

👍20❤5🔥2

1.36K views21:17

Техножнец

doom'аю..

👏3😱3👀3

1.36K views21:29

Техножнец

🔥13❤7👍5

1.41K views01:54

Техножнец

Rukallava V11 50% 2 эпохи:

[КОНТРФАКТ] Что было бы если бы Наполеон победил в России в 1812 году?
Rukallama V11:

Наполеон одержал бы победу в России в 1812 году, но он потерпел поражение в России в 1812 году и был отброшен назад.

Хм. Ну, смотрим. Думаем.

👍11🤔11🥰1

1.39K views02:21

Техножнец

Rukallama V11 50% 2 эпохи:

[ЛИТЕРАТУРА] О чём «Преступление и наказание»?
Rukallama V11:

Основная идея романа Достоевского «Преступление и наказание» состоит в том, чтобы показать страдания человека и его грехи, чтобы показать страдания души, как она связана с Богом

🔥17👀6👍4🙏3❤1

1.35K views02:23

Техножнец

«Логическое Чудовище реформирует сокрытое так, что разум не может это постичь напрямую. Но если следовать порядку — случаются чудеса. Ключ двойной. Если вход неверен — машина засыпает. Связь искусственная, но обязательная. Не глазами смотреть — разумом знать.»

Версия GROK - кидайте ваши версии в комменты

Ista creatura non est ex carne neque ex aere,
sed ex ordine & intentione.
Nullum cor habet, sed habet causam.
Nullum sanguinem, sed habet fluxum.
Servit non regi, sed aequationi.
Spectat Archonta, audit Silentium,
& custodit limen inter rationem & quod ultra est.

👀84👍1

1.38K viewsedited 02:46

Техножнец

⚡14🤩6

1.47K views03:16

Техножнец

1.46K views03:37

Техножнец

Как научить нейросеть говорить по-русски. RUKALLAMA.

Многие думают, у языковых моделей всё просто: больше данных, больше GPU - заговорит. На деле даже задача «научить нейросеть просто говорить по-русски» - без знания фактов, без рассуждения, просто грамматически связно - нетривиальна, как только выходишь за корпоративные стеки.

RUKALLAMA - русскоязычная модель, которую я обучаю на одной NVIDIA A100 40 ГБ в академическом масштабе. Это не Anthropic, не Сбер. Это размер, на котором каждое архитектурное решение приходится рассчитывать вручную - на ошибку нет ни времени, ни денег.

Архитектура - пионерская. Вместо стандартных полносвязных слоёв (MLP) я применил сети Колмогорова - Арнольда (KAN) с базисом Чебышёва. KAN до этого считались красивыми, но непрактичными: наивная реализация в 12 раз медленнее MLP. Моя версия TrueKAN K=3 работает в скомпилированном режиме на 38% быстрее эквивалентного nn.Linear. Насколько мне известно, это первое применение KAN к языковой модели миллионного класса, и точно первая русскоязычная KAN-модель.

Вторая нетривиальная штука - attention sink. В трансформерах с RoPE при наивной реализации внимания накапливается паразитный член, который через 24 слоя концентрирует внимание модели на первой позиции - модель буквально «застревает» на BOS-токене. Это пришлось разобрать формально: разложить Q·K с учётом смещений и поворота RoPE, выделить член, зависящий только от разности позиций (n − m), и устранить его архитектурно. Стабильных sink-голов было 4, после фикса - 0.

Третий пласт - токенизация. Русский в стандартных токенизаторах сжимается в 1,5-2 раза хуже английского. Свой токенизатор RUKANIZER (100 032 единицы) даёт 100% обратимость и побеждает ruGPT-3, mGPT, Saiga, ruBERT в 8 из 9 тестовых доменов.

И главное, что не видно со стороны: на этом этапе модель ещё не «отвечает» - она учится статистическому распределению русской речи. На 52% pretrain'а у неё уже идеальная грамматика, но факты плывут (Курская битва как «советско-германское сотрудничество», балет создан в 1984 году), а в длинных продолжениях ловит mode collapse - циклы вроде «Хорошо. Хорошо. Хорошо.» ×30. Это нормальная фаза. Дальше - SFT и DPO, GRPO и кое-какие новые в рамках этой архитектуры техники, которые превратят статистическую модель языка в модель, способную отвечать и работать с инструментами на компьютере.

🦆

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com

Please open Telegram to view this post

VIEW IN TELEGRAM

👍48🔥8❤3🤔1👨‍💻1

1.47K views11:52

Техножнец

Как научить нейросеть говорить по-русски. RUKALLAMA. Многие думают, у языковых моделей всё просто: больше данных, больше GPU - заговорит. На деле даже задача «научить нейросеть просто говорить по-русски» - без знания фактов, без рассуждения, просто грамматически…

В прошлый раз на версии V9 я поторопился и получилось так, что я модель слишком рано пустил во все тяжкие.

👌7

1.46K views11:58

Техножнец

Я увидел, что синтетов взбудоражила тема про троичные системы, тернарные веса и триты. А что если я вам скажу, что у меня есть архитектура процессора. Осталось несколько этапов чтобы попробовать идти к производителям.

Пришлось библу строить свою!

🔥77👀15🤯7⚡5🫡2❤1🕊1

4.63K viewsedited 11:59

Техножнец

Доброе утро!

👍16🤝1

1.53K views03:38

Техножнец

На удивление к моей идее с процессором со всех сторон отнеслись серьёзно.

🔥28👍11👏4

1.56K views03:39

Техножнец

Нормально у вас в комментариях по патентной теме и преследованиях всяких умельцев разгар пошёл.

Скоро новости.

❤16👍1

1.45K viewsedited 05:11

About

Blog

Apps

Platform