Техножнец
Function calling на CPU. ~600 МБ RAM. Без интернета. ССЫЛКА: https://github.com/barometech/gpt2-tool-call GPT-2 124M от 2019-го года дотюнили под tool calling. Два чекпоинта в репо, оба воспроизводимы на CPU обычного ноута: Full FT - все 124M параметров…
Как можно использовать такую модель:?
https://github.com/barometech/gpt2-tool-call
Ну написано же, что есть скрипты и возможность запилить свой датасет под свой дом с помощью любой LLM бесплатной или платной под рукой. Такие файлики даже много не займут места. А вот и результаты:
Single-tool mode (когда tool указан): 12/12 = 100% — все команды выполнены идеально, эмулятор обновляет state корректно:
"Turn on the lights in the living room" → {"name":"turn_on_light","arguments":{"room":"living room"}}
"Set the bedroom to 22 degrees" → {"room":"bedroom","temperature_c":22}
"Lock the front door" → {"door":"front door"}
"Play jazz playlist in the kitchen" → {"song":"jazz playlist","room":"kitchen"}
"What is the temperature in the bedroom?" → query_temperature
"Wake me up at 07:30" → {"time":"07:30"}... не стал писать все команды. Но они исполнялись идеально!
Итог: living room lights ON, bedroom 22C, front door locked, jazz in kitchen, alarm 07:30 — всё применилось.All-tools mode (12 функций в одном prompt, модель выбирает): 1/12 = 8% — модель видит массив из 12 spec'ов и для всех команд выдаёт turn_on_light (первый в списке).
Тот же баг что мы ловили на BFCL multiple: SFT тренировался только на single-tool промптах.
Вывод для умного дома:
- Архитектура работает: 100% когда есть intent-классификатор (или роутер) что выбирает tool
- Чистый «модель сама разберётся из 12 функций» — нужен SFT с multi-tool промптами
- 24 мин дообучения на 500 примерах хватило для production-уровня на single-tool
Время: 24 мин SFT + инференс ~10с/команда на CPU. Закрытый контур WSL2, никакого интернета. Все веса/данные у тебя на диске.
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝11🔥7❤5🕊1
Ну что...доделаю GPT-2 дворецкого для умного дома на русском языке и с голосовым управлением. Дальше сами разбираться будете, а я делать дела!
🔥37👍11❤🔥5⚡2🙏2👌1🕊1
Че там Демон трансформер?
Обратной пропагации нет, обучение идёт за 1 форвард, обобщение идёт через якоря демона, синхронизация градиента через предсказание. Предсказание градиента работает чётче , чем обратный просчёт классический.
Там слишком много преимуществ чтобы это игнорировать. Внимание работает тоже на предсказании при этом по флопсам меньше на 75% просто потому что демон.
Однако...
Обратной пропагации нет, обучение идёт за 1 форвард, обобщение идёт через якоря демона, синхронизация градиента через предсказание. Предсказание градиента работает чётче , чем обратный просчёт классический.
Там слишком много преимуществ чтобы это игнорировать. Внимание работает тоже на предсказании при этом по флопсам меньше на 75% просто потому что демон.
Однако...
👍18🔥10🤔6👏2❤1🕊1
Forwarded from Paperfunk Recordings
Media is too big
VIEW IN TELEGRAM
Скорпион и Нуб Сайбот рубятся в Ultimate Mortal Kombat 3, и тут до них доходит. Жажда. Не та, что лечится колой из холодильника. Жажда тяжёлой концептуальной музыки с непривычным привкусом. Именно той, что искали матёрые ценители олдскула и чётких узнаваемых канонов.
Paperclip & 3XIL3 представляют совместный альбом, полностью посвящённый старым частям Mortal Kombat от первой до четвёртой.
Каждый трек пропитан 16-битной кровью, фаталити и сабом. Слушать в темноте, под красные блики кинескопа.
Пресейв: https://band.link/PPRFNKLP038
Paperclip & 3XIL3 представляют совместный альбом, полностью посвящённый старым частям Mortal Kombat от первой до четвёртой.
Каждый трек пропитан 16-битной кровью, фаталити и сабом. Слушать в темноте, под красные блики кинескопа.
Пресейв: https://band.link/PPRFNKLP038
👍19🔥9😱1🕊1
🏠 Smart-Home GPT-2 - голосовое управление умным домом локально на CPU
https://github.com/barometech/smart-home-gpt2
Дообучил GPT-2 124M (475 МБ) под умный дом. Понимает голос на русском (и ещё 98 языках) через локальный стек. Без облака, без API, без интернета.
Цепочка:
Что внутри:
Цифры (честно):
Где ломается:
Потолок 124M. Для production нужна модель побольше, но архитектура и пайплайн уже работают.
Воспроизведение:
https://github.com/barometech/smart-home-gpt2
🦆 🦆 🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPALpaperfunkrecordings@gmail.com
https://github.com/barometech/smart-home-gpt2
Дообучил GPT-2 124M (475 МБ) под умный дом. Понимает голос на русском (и ещё 98 языках) через локальный стек. Без облака, без API, без интернета.
Цепочка:
Микрофон / WAV (любой язык)
↓
faster-whisper medium (translate)
RU/DE/FR/ES/... → EN за один шаг
↓
GPT-2 smart_home_v2 (124M, full FT)
↓
JSON tool call:
{"name":"turn_on_light",
"arguments":{"room":"kitchen"}}
↓
эмулятор / реальное устройство
Что внутри:
Датасет. 1500 multi-tool примеров от 10 параллельных агентов Claude Opus 4.7. 10 доменов (свет, климат, безопасность, медиа, кухня, сад, шторы, уборка, таймеры, сенсоры), 100 уникальных функций, 3-5 кандидатов в каждом промпте. MIT, форкай.
SFT. 2 часа на 4 ядрах CPU. Resume с
gpt2_ft_final.pt(тот же что в gpt2-tool-call). Один проход по 1200 items.
Голос. silero TTS для генерации тестов, faster-whisper для распознавания + перевода. Никаких отдельных переводчиков, всё в одной модели.
Fuzzy match. Модель галлюцинирует имя (
start_vacuum_cleanerвместо
start_vacuum)? Пост-обработка подтягивает к ближайшему в registry.
Цифры (честно):
Multi-tool selection (300 held-out)
─────────────────────────────────
OVERALL 71.7%
garden 96%
climate 86%
cleaning 55%
lighting 44%
Voice end-to-end (30 RU команд)
─────────────────────────────────
OVERALL 46.7%
TTS 0.5s + STT 5s
+ GPT-2 25s = ~30s/команда CPU
Где ломается:
Whisper подменяет слова: «гостиной» → «hotel», «21 градус» → «a degree». GPT-2 124M путает похожие функции:
turn_onvs
turn_off,
query_temperaturevs
set_thermostat. Cleaning/lighting (много похожих имён) - самые слабые домены.
Потолок 124M. Для production нужна модель побольше, но архитектура и пайплайн уже работают.
Воспроизведение:
git clone + git lfs pull + python src/voice_pipeline.py. README билингвальный (русский сверху, English ниже с якорем).https://github.com/barometech/smart-home-gpt2
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍4😱4❤3👏3🕊1
Я выложил ключ к работе над вообще всеми трансформерами. У кого хватит котелка расширить это на более мощные модели используя Google Colab и более интересные гипотезы - добьётся успеха в своих идеях. Желаю вам всем удачи!
Как видите, я стал открытым в плане проектов и выкладывания кодов. Не потому что было давление. Потому что есть некий план по которому я смогу погрузить вас постепенно в общий контекст. Хоть какой-то синхрон будет !
Как видите, я стал открытым в плане проектов и выкладывания кодов. Не потому что было давление. Потому что есть некий план по которому я смогу погрузить вас постепенно в общий контекст. Хоть какой-то синхрон будет !
👍42❤16🔥10👏5🙏1🕊1🤝1
Добрый день, синтеты!
Продолжим сегодня с математическими нейронам, калькулятор надо доделать.
Продолжим сегодня с математическими нейронам, калькулятор надо доделать.
🤝25👍6🕊1
Поданы на утверждение к печати 3 статьи. Прикладная математика. Информатика. Процессы управления» (СПИСОК-2, ВАК) три научные статьи.
- внутри деталей больше
- внутри деталей больше
- внутри деталей больше
🦆 🦆 🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPALpaperfunkrecordings@gmail.com
(1) «Корпус RUKALLAMA». Методология построения русскоязычного образовательного датасета на 763 советских учебниках 1926–1990 гг. VLM-OCR через Llama-4-Scout-17B; токенизатор RUKANIZER (100 032 в словаре, сжатие 4,33 знака/токен, 100% обратимость, лучший в 8 из 9 доменов); автоматическая ёфикация на 19 052 словоформах + pymorphy3. На MERA: PARus 55,8% и ruOpenBookQA 33,6% (статистически значимо). (2) «RUKALLAMA — KAN-модель». 853 млн параметров, TrueKAN с базисом Чебышёва K=3 — на 38% быстрее nn.Linear в скомпилированном режиме. Батчированное KAN-внимание ×4,6. Формальный анализ attention sink (порядок применения bias и RoPE) и его устранение — стабильных sink-голов 4 → 0. На MERA PARus 56,8% — лучший среди русскоязычных моделей класса до 1 млрд параметров.(3) «PromeTorch на NM Card / NM Quad». Суверенный фреймворк (~100К строк C++/CUDA/Python без зависимостей от PyTorch) для отечественных ускорителей НТЦ Модуль. SIMD через nmpp даёт ×100 к скаляру; 16-ядерный волновой backward — 80% линейной масштабируемости. MNIST 93,64% на эмуляторе, 705 tok/s на NM Quad. Тренировка PIR-250M (189M) на Эльбрусе E8C2 — быстрее PyTorch 2.7.1. Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥69❤20👍7⚡4👏1🕊1
Опять отрицает все достижения по умножению. Опять отрицает методы. Причём, моя прошлая инструкция теперь ломает его логику и на простое привет он думает в 5 экранов простыни, а потом выдает что-то вроде ...
"Я НЕ БУДУ ТЕБЕ ПОДДАКИВАТЬ".
Хотя ты просто написал: "привет"
Вот это гондон, однако...нахера было это делать.
"Я НЕ БУДУ ТЕБЕ ПОДДАКИВАТЬ".
Хотя ты просто написал: "привет"
Вот это гондон, однако...нахера было это делать.
👍19🔥8🤯4🕊4🤔2😢2❤1🥰1💯1
К особо активным пользователям и бравым ребятам, которые присоединяются к моему чату чтобы начинать какие-то активности. Рекомендую создавать свой паблик и эти активности продвигать там, а не в локальном чате обособленного проекта, который к вам не имеет отношения. Муниципалитет стилизации здесь не будет, это частное поле, частный чат.
А если ваши фразы "здесь нет конструктива" и "админы беснуют", то вы точно мимо. У нас очень здравый чат на самом деле, где админы пресекают конфликты, всегда читают то, что происходит и , конечно же, общаются когда этого требует ситуация.
Так что, уважаемые - берега путать не надо. Создавайте свои паблики и привлекайте людей - аминь.
А если ваши фразы "здесь нет конструктива" и "админы беснуют", то вы точно мимо. У нас очень здравый чат на самом деле, где админы пресекают конфликты, всегда читают то, что происходит и , конечно же, общаются когда этого требует ситуация.
Так что, уважаемые - берега путать не надо. Создавайте свои паблики и привлекайте людей - аминь.
👏24👍9❤4💯4🕊1
Временно закрыл чат, т.к. тот персонаж не просто так был забанен. Слушать русский язык не хочет. Насколько долго это будет не ясно. Но я сообщу.