Техножнец
5.06K subscribers
1.49K photos
256 videos
12 files
689 links
Канал моих увлечений и поделок. Всё ,что я делаю и выкладываю здесь - делается с любовью.

Поддержать канал: https://tbank.ru/cf/8Xnajl01ehm

Поддержать канал: https://yoomoney.ru/fundraise/1C86E2DGIU9.250819
Download Telegram
Доброе утро.
🤝40🕊4🦄3🫡1
PromeTorch - А что там?

Ну как..вот ведь:

А: Распределённое обучение сразу на несколько процессоров для всей линейки Эльбрусов (частично дорабатывается)

Б: Своя ollama и llama.cpp ...только без ollama и llama.cpp и работает на Эльбрусах...называется PromeServe

В: Распределённый инференс сразу на множестве процессоров Эльбрус (в будущем не важно каких, может быть сборная солянка)

У тех у кого голова на месте, прочитайте, подумайте , что можно сделать хотя бы с теми, которые якобы списаны или считаются не нужными, но обретают жизнь как востребованные для обучения или инференса. (я про процессоры)

Думаем...размышляем.


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥103
Периодически возникают комментарии, что я распыляюсь на множество проектов. Но...это иллюзия. Нет никаких множеств проектов ;)

P.S. Есть одна большая дыра в плане экосистемы домашней, которую надо заполнить мало того, что зоопарком моделей, так ещё и функционалом независимым. Это большое скопище связанных друг с другом одной нитью частей образующих один механизм.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал USDT (trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍33🔥113
PromeTorch переходит в лицензию Apache 2.0 чтобы быть доступным через pip install в PyPi

Потихонечку история становится официальной.
👍42🔥132🤔2
В доступе 3 сервера с Эльбрусами - делаю pip
🔥271
Вдохновляясь скриншотом от синтета!

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал USDT (trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47👍7🕊32
Хм...квадратично-тернарное внимание для контекста...хм хм хм...

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал USDT (trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
Please open Telegram to view this post
VIEW IN TELEGRAM
👀18🎅3🕊2
Я нашёл новый способ улучшить вообще все свойства модели считывая её внутреннее пространство и вводя внутренний руль на основе логики. В итоге вот... это QWEN 2.5 / 0.6B
🤔24🔥18🕊3
НЕ НАДО ВЕЗДЕ О СЕБЕ КРИЧАТЬ. ПОЧЕМУ?

Последние пару лет в IT-чатах и личках наблюдаю стабильный поток странных персонажей. Приходит человек, начинает сыпать терминами в произвольных сочетаниях. Всё в одно предложение. Перескок уровней абстракции, нулевые границы доменов, апелляция к "реальному применению" вместо метрик. Узнаваемо как продавец сломанных телефонов на третьесортном базаре: куча блестящего хлама, навешано аляповато, с пафосом "IT-отдел".

У феномена есть имя. И не одно.


Frankfurt, "On Bullshit" (Princeton, 2005). Bullshit это не ложь. Ложь предполагает знание правды и намерение её скрыть. Bullshit это речь, безразличная к оси правда/неправда. Цель только впечатление. Это другой класс высказываний, не подлежащий обычному опровержению фактами, потому что фактов в нём изначально не предполагалось.

Feynman, "Cargo Cult Science" (Caltech, 1974). Внешние атрибуты науки без её содержания. Островитяне после войны строили деревянные диспетчерские вышки и надевали наушники из бамбука, ожидая что самолёты прилетят сами. Форма соблюдена идеально. Никаких самолётов не будет. Феймановский диагноз: первый принцип в том, что нельзя обманывать самого себя, а себя обмануть проще всего.

Kruger & Dunning, 1999 (J. Pers. Soc. Psychol., 77(6):1121). "Unskilled and Unaware of It". Низкая компетентность лишает человека метакогнитивной способности увидеть собственную некомпетентность. Тот же дефицит, который мешает решить задачу, мешает понять, что задача не решена. Поэтому громче всех кричит тот, кто меньше всех видит.

Brandolini, 2013. Bullshit asymmetry principle. Энергия, необходимая для опровержения чуши, на порядок выше энергии её производства. Мир заполнен неопровергнутой чушью не потому что её никто не видит, а потому что опровергать невыгодно по бюджету.

Hicks, Humphries & Slater, 2024 ("ChatGPT is bullshit", Ethics Inf Technol 26:38, doi:10.1007/s10676-024-09775-5). LLM не "галлюцинируют" в техническом смысле. Они производят bullshit по Френкфурту: текст, безразличный к собственной истинности, потому что у модели нет внутренней оси правда/ложь. Есть только распределение правдоподобных продолжений.

И вот тут стыкуется главное.

Раньше для technobabble требовался входной барьер: надо было хоть как-то нахвататься терминов из реальных источников. Это сдерживало поток. Сейчас LLM генерируют синтаксически безупречную термин-суп = бесплатно. Любой за один промпт получает речь "сотрудника DeepMind", копирует, переставляет пару слов, относит в чат. Барьер на роль "IT-отдела" упал до нуля. Барьер на вход в реальное IT остался прежним. Зазор заполнился ровно теми персонажами, о которых речь.

Полевые маркеры распознавания:
Перескок уровней абстракции в одной фразе: транзистор, ML, сознание, exploit. Эксперт так не говорит, потому что знает границы доменов. Шарлатан не говорит так, потому что границ для него не существует.

Отсутствие чисел. Ни одной метрики, ни одного коммита, ни одного воспроизводимого шага. "Работает у меня", "результаты говорят сами", "в реальном бытие".

Отказ от фальсификации утверждений. Любой контр-пример интерпретируется как подтверждение исходной идеи. Это закрытая система убеждений, не работа.

Эмоциональная апелляция вместо доказательства. "Ты не понимаешь", "посмотри как красиво", "почувствуй".

Объём вместо качества. Чем больше блестящих побрякушек на витрине, тем меньше у собеседника времени проверить каждую. Прямое применение Brandolini's law со стороны продавца.

Громкость пропорциональна расстоянию до компетентности. Ровно по Kruger-Dunning.


Что с этим делать.


Ничего. Brandolini показал: опровергать дороже, чем игнорировать. Эксперт молчит не потому что согласен. Он молчит потому что бюджет на опровержение каждой проходящей мимо ерунды превышает бюджет на собственную работу. Поэтому профессиональная среда выглядит тихой не из-за пустоты, а из-за того, что внутри неё происходит работа.

Главный вывод поста.

Громкость это не показатель компетентности, это её обратная функция. Кто реально что-то умеет, занят тем, что это делает. Метрики, коммиты, воспроизводимые цифры в открытом репозитории.
💯40👏9👍64🤔2👌1🕊1👻1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
Работаем...

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
🔥29👍125🫡4🕊2🤓1
Я нашёл механизм на основе демона, который читает внутренности модели, оценивает ситуацию и без обучения улучшает показатели модели на 3-5pp.

Сейчас буду давить газ на полную, есть вероятность выйти на 20+ улучшения.

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
🔥25🕊3
Техножнец
Я нашёл механизм на основе демона, который читает внутренности модели, оценивает ситуацию и без обучения улучшает показатели модели на 3-5pp. Сейчас буду давить газ на полную, есть вероятность выйти на 20+ улучшения. Поддержать канал: ТБАНК Поддержать канал:…
Что такое здесь Synthetic Narrow - это те задачи, которые вне бенчмарков создаются человеком и моделью. Если такой механизм настроить правильно, то буквально все ответы от модели улучшаются на 40-50%

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
🤔10🔥4🕊2🤝2
Когда ваш coding агент говорит вам:

Выбирай - вариант А, вариант Б, вариант В.

Моментально врубайте режим "черпаком по башке" и резко пишите ему в ответ:

"Слышь, ты такой учёный как моя мама космонавт. Как ты думаешь, если бы учёные выбирали вместо опробования всех вариантов, что придут в голову (учёному, а не психу), то были бы они учёными или ангажированными скотами, которые борются с истиной и обожают подкладные исследования? А ну СДЕЛАЛ НОРМАЛЬНЫЙ СКРИПТ СО ВСЕМИ ВАРИАНТАМИ!"


Сразу всё станет хорошо.

P.S. Кодекс от OpenAI - даунито. мне советовали, разочарован. Это убого, потом объясню.

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
🔥26🤔12👏52👻2🕊1
4 дня до ответа - одобрят статьи в журнал Список от СПБГУ или нет.

В ожидании.

На скриншоте темы моих научных статей + когда я выступал с докладом по ним, собсна, оттуда меня и одобрили.

Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
30👍16😱3🕊2👻11
Закинете, подписки обновлю! Заранее респект! С Вашей поддержкой никакие инвесторы не нужны!

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал USDT (trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
Please open Telegram to view this post
VIEW IN TELEGRAM
🕊8🔥5
Продолжаю давить. Метод интересный, осталось унифицировать для всех моделей. Сначала прогон по темам - математика, физика, литература, история. После этого все ответы можно улучшить.

Механизм покажу позже.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Поддержать канал: USDT(trc20) TTk8CqGF9dd4avQcSPDwDF5z3jMcCxGqqT
Поддержать канал: BITCOIN bc1q9ajp3p72xukrvqscm847psmsn948pr8jc5snt7
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥16👍41🕊11
я тут кое что придумал...
1👍25👏5🔥4😱3❤‍🔥11🤔1🕊1
Сделал Log16 внимание. 450 мб и 1млн контекста, автоматический компактинг и сжатие контекста. Не 1тб или гигабайты, а 450 мб фиксированно. Но это при условии, что вокабуляр 256, значит байтовый трансформер сработал бы.
НО! Меня так ДОКАНАЛИ ТРАНСФОРМЕРЫ.....просто устал от них. какая-то игрушка для богатых.

Делаю другое...совсем другое. GRU - наше всё. Главное починить чтобы градиенты текли, но я уже сделал. Смотрим!

Скоро буду выкладывать полноценно архитектуру PIR чтобы вы тоже тренировали!
1🔥205🤯3👍1🕊1
И, насколько я понимаю, мне стоит побыстрее возобновить эфиры потому что запутанность людей в функционале ЛЛМ и в текстовом движе - МАКСИМАЛЬНОЕ!
1💯23👏11👍8🕊2