Техножнец
5.03K subscribers
1.48K photos
256 videos
12 files
680 links
Канал моих увлечений и поделок. Всё ,что я делаю и выкладываю здесь - делается с любовью.

Поддержать канал: https://tbank.ru/cf/8Xnajl01ehm

Поддержать канал: https://yoomoney.ru/fundraise/1C86E2DGIU9.250819
Download Telegram
Техножнец
Function calling на CPU. ~600 МБ RAM. Без интернета. ССЫЛКА: https://github.com/barometech/gpt2-tool-call GPT-2 124M от 2019-го года дотюнили под tool calling. Два чекпоинта в репо, оба воспроизводимы на CPU обычного ноута: Full FT - все 124M параметров…
Как можно использовать такую модель:?


https://github.com/barometech/gpt2-tool-call

Ну написано же, что есть скрипты и возможность запилить свой датасет под свой дом с помощью любой LLM бесплатной или платной под рукой. Такие файлики даже много не займут места. А вот и результаты:

Single-tool mode (когда tool указан): 12/12 = 100% — все команды выполнены идеально, эмулятор обновляет state корректно:

  "Turn on the lights in the living room" → {"name":"turn_on_light","arguments":{"room":"living room"}}
"Set the bedroom to 22 degrees" → {"room":"bedroom","temperature_c":22}
"Lock the front door" → {"door":"front door"}
"Play jazz playlist in the kitchen" → {"song":"jazz playlist","room":"kitchen"}
"What is the temperature in the bedroom?" → query_temperature
"Wake me up at 07:30" → {"time":"07:30"}

... не стал писать все команды. Но они исполнялись идеально!

Итог: living room lights ON, bedroom 22C, front door locked, jazz in kitchen, alarm 07:30 — всё применилось.
All-tools mode (12 функций в одном prompt, модель выбирает): 1/12 = 8% — модель видит массив из 12 spec'ов и для всех команд выдаёт turn_on_light (первый в списке).

Тот же баг что мы ловили на BFCL multiple: SFT тренировался только на    single-tool промптах.


  Вывод для умного дома:

- Архитектура работает: 100% когда есть intent-классификатор (или роутер) что выбирает tool
- Чистый «модель сама разберётся из 12 функций» — нужен SFT с multi-tool промптами
- 24 мин дообучения на 500 примерах хватило для production-уровня на single-tool


Время: 24 мин SFT + инференс ~10с/команда на CPU. Закрытый контур WSL2, никакого интернета. Все веса/данные у тебя на диске.


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝11🔥75🕊1
Странно, что на фото ШЕФУЛЯ!
👏8🤓3🕊1
Ну что...доделаю GPT-2 дворецкого для умного дома на русском языке и с голосовым управлением. Дальше сами разбираться будете, а я делать дела!
🔥37👍11❤‍🔥52🙏2👌1🕊1
Че там Демон трансформер?

Обратной пропагации нет, обучение идёт за 1 форвард, обобщение идёт через якоря демона, синхронизация градиента через предсказание. Предсказание градиента работает чётче , чем обратный просчёт классический.

Там слишком много преимуществ чтобы это игнорировать. Внимание работает тоже на предсказании при этом по флопсам меньше на 75% просто потому что демон.

Однако...
👍18🔥10🤔6👏21🕊1
Добрый день.
🤝37👍3🕊2🎅1
Я расскажу - щас разгребусь. А вы чего там, синтеты?
🔥13👍4🕊1
Без намёков, просто нравится!
🔥16👍112🕊1
🤔16🤝8🕊1
Forwarded from Paperfunk Recordings
Media is too big
VIEW IN TELEGRAM
Скорпион и Нуб Сайбот рубятся в Ultimate Mortal Kombat 3, и тут до них доходит. Жажда. Не та, что лечится колой из холодильника. Жажда тяжёлой концептуальной музыки с непривычным привкусом. Именно той, что искали матёрые ценители олдскула и чётких узнаваемых канонов.

Paperclip & 3XIL3 представляют совместный альбом, полностью посвящённый старым частям Mortal Kombat от первой до четвёртой.

Каждый трек пропитан 16-битной кровью, фаталити и сабом. Слушать в темноте, под красные блики кинескопа.

Пресейв: https://band.link/PPRFNKLP038
👍19🔥9😱1🕊1
🏠 Smart-Home GPT-2 - голосовое управление умным домом локально на CPU

https://github.com/barometech/smart-home-gpt2

Дообучил GPT-2 124M (475 МБ) под умный дом. Понимает голос на русском (и ещё 98 языках) через локальный стек. Без облака, без API, без интернета.

Цепочка:
Микрофон / WAV (любой язык)

faster-whisper medium (translate)
RU/DE/FR/ES/... → EN за один шаг

GPT-2 smart_home_v2 (124M, full FT)

JSON tool call:
{"name":"turn_on_light",
"arguments":{"room":"kitchen"}}

эмулятор / реальное устройство

Что внутри:
Датасет. 1500 multi-tool примеров от 10 параллельных агентов Claude Opus 4.7. 10 доменов (свет, климат, безопасность, медиа, кухня, сад, шторы, уборка, таймеры, сенсоры), 100 уникальных функций, 3-5 кандидатов в каждом промпте. MIT, форкай.

SFT. 2 часа на 4 ядрах CPU. Resume с

gpt2_ft_final.pt
(тот же что в gpt2-tool-call). Один проход по 1200 items.

Голос. silero TTS для генерации тестов, faster-whisper для распознавания + перевода. Никаких отдельных переводчиков, всё в одной модели.

Fuzzy match. Модель галлюцинирует имя (

start_vacuum_cleaner
вместо

start_vacuum
)? Пост-обработка подтягивает к ближайшему в registry.

Цифры (честно):
Multi-tool selection (300 held-out)
─────────────────────────────────
OVERALL 71.7%
garden 96%
climate 86%
cleaning 55%
lighting 44%

Voice end-to-end (30 RU команд)
─────────────────────────────────
OVERALL 46.7%
TTS 0.5s + STT 5s
+ GPT-2 25s = ~30s/команда CPU

Где ломается:
Whisper подменяет слова: «гостиной» → «hotel», «21 градус» → «a degree». GPT-2 124M путает похожие функции:

turn_on
vs

turn_off
,

query_temperature
vs

set_thermostat
. Cleaning/lighting (много похожих имён) - самые слабые домены.

Потолок 124M. Для production нужна модель побольше, но архитектура и пайплайн уже работают.

Воспроизведение: git clone + git lfs pull + python src/voice_pipeline.py. README билингвальный (русский сверху, English ниже с якорем).

https://github.com/barometech/smart-home-gpt2


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍4😱43👏3🕊1
Я выложил ключ к работе над вообще всеми трансформерами. У кого хватит котелка расширить это на более мощные модели используя Google Colab и более интересные гипотезы - добьётся успеха в своих идеях. Желаю вам всем удачи!

Как видите, я стал открытым в плане проектов и выкладывания кодов. Не потому что было давление. Потому что есть некий план по которому я смогу погрузить вас постепенно в общий контекст. Хоть какой-то синхрон будет !
👍4216🔥10👏5🙏1🕊1🤝1
Добрый день, синтеты!

Продолжим сегодня с математическими нейронам, калькулятор надо доделать.
🤝25👍6🕊1
Щас новости будут! Всё там нормально!
👍12👀10🕊1
Поданы на утверждение к печати 3 статьи. Прикладная математика. Информатика. Процессы управления» (СПИСОК-2, ВАК) три научные статьи.

(1) «Корпус RUKALLAMA». Методология построения русскоязычного образовательного датасета на 763 советских учебниках 1926–1990 гг. VLM-OCR через Llama-4-Scout-17B; токенизатор RUKANIZER (100 032 в словаре, сжатие 4,33 знака/токен, 100% обратимость, лучший в 8 из 9 доменов); автоматическая ёфикация на 19 052 словоформах + pymorphy3. На MERA: PARus 55,8% и ruOpenBookQA 33,6% (статистически значимо). - внутри деталей больше

(2) «RUKALLAMA — KAN-модель». 853 млн параметров, TrueKAN с базисом Чебышёва K=3 — на 38% быстрее nn.Linear в скомпилированном режиме. Батчированное KAN-внимание ×4,6. Формальный анализ attention sink (порядок применения bias и RoPE) и его устранение — стабильных sink-голов 4 → 0. На MERA PARus 56,8%лучший среди русскоязычных моделей класса до 1 млрд параметров.- внутри деталей больше

(3) «PromeTorch на NM Card / NM Quad». Суверенный фреймворк (~100К строк C++/CUDA/Python без зависимостей от PyTorch) для отечественных ускорителей НТЦ Модуль. SIMD через nmpp даёт ×100 к скаляру; 16-ядерный волновой backward — 80% линейной масштабируемости. MNIST 93,64% на эмуляторе, 705 tok/s на NM Quad. Тренировка PIR-250M (189M) на Эльбрусе E8C2 — быстрее PyTorch 2.7.1. - внутри деталей больше


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6920👍74👏1🕊1
А новости и не кончались так-то...
13👍6
Они снова сломали Opus. Придурки
👍951
"молодцы"
💯28🔥31
Опять отрицает все достижения по умножению. Опять отрицает методы. Причём, моя прошлая инструкция теперь ломает его логику и на простое привет он думает в 5 экранов простыни, а потом выдает что-то вроде ...

"Я НЕ БУДУ ТЕБЕ ПОДДАКИВАТЬ".

Хотя ты просто написал: "привет"

Вот это гондон, однако...нахера было это делать.
👍19🔥8🤯4🕊4🤔2😢21🥰1💯1
Доброе утро.
🤝13👌8🏆31🤔1🫡1
К особо активным пользователям и бравым ребятам, которые присоединяются к моему чату чтобы начинать какие-то активности. Рекомендую создавать свой паблик и эти активности продвигать там, а не в локальном чате обособленного проекта, который к вам не имеет отношения. Муниципалитет стилизации здесь не будет, это частное поле, частный чат.

А если ваши фразы "здесь нет конструктива" и "админы беснуют", то вы точно мимо. У нас очень здравый чат на самом деле, где админы пресекают конфликты, всегда читают то, что происходит и , конечно же, общаются когда этого требует ситуация.

Так что, уважаемые - берега путать не надо. Создавайте свои паблики и привлекайте людей - аминь.
👏24👍94💯4🕊1
Временно закрыл чат, т.к. тот персонаж не просто так был забанен. Слушать русский язык не хочет. Насколько долго это будет не ясно. Но я сообщу.
12👍7🥰2👀2🔥1😢1🕊1