Техножнец
5.04K subscribers
1.49K photos
256 videos
12 files
687 links
Канал моих увлечений и поделок. Всё ,что я делаю и выкладываю здесь - делается с любовью.

Поддержать канал: https://tbank.ru/cf/8Xnajl01ehm

Поддержать канал: https://yoomoney.ru/fundraise/1C86E2DGIU9.250819
Download Telegram
Forwarded from Paperfunk Recordings
Media is too big
VIEW IN TELEGRAM
Скорпион и Нуб Сайбот рубятся в Ultimate Mortal Kombat 3, и тут до них доходит. Жажда. Не та, что лечится колой из холодильника. Жажда тяжёлой концептуальной музыки с непривычным привкусом. Именно той, что искали матёрые ценители олдскула и чётких узнаваемых канонов.

Paperclip & 3XIL3 представляют совместный альбом, полностью посвящённый старым частям Mortal Kombat от первой до четвёртой.

Каждый трек пропитан 16-битной кровью, фаталити и сабом. Слушать в темноте, под красные блики кинескопа.

Пресейв: https://band.link/PPRFNKLP038
👍19🔥9😱1🕊1
🏠 Smart-Home GPT-2 - голосовое управление умным домом локально на CPU

https://github.com/barometech/smart-home-gpt2

Дообучил GPT-2 124M (475 МБ) под умный дом. Понимает голос на русском (и ещё 98 языках) через локальный стек. Без облака, без API, без интернета.

Цепочка:
Микрофон / WAV (любой язык)

faster-whisper medium (translate)
RU/DE/FR/ES/... → EN за один шаг

GPT-2 smart_home_v2 (124M, full FT)

JSON tool call:
{"name":"turn_on_light",
"arguments":{"room":"kitchen"}}

эмулятор / реальное устройство

Что внутри:
Датасет. 1500 multi-tool примеров от 10 параллельных агентов Claude Opus 4.7. 10 доменов (свет, климат, безопасность, медиа, кухня, сад, шторы, уборка, таймеры, сенсоры), 100 уникальных функций, 3-5 кандидатов в каждом промпте. MIT, форкай.

SFT. 2 часа на 4 ядрах CPU. Resume с

gpt2_ft_final.pt
(тот же что в gpt2-tool-call). Один проход по 1200 items.

Голос. silero TTS для генерации тестов, faster-whisper для распознавания + перевода. Никаких отдельных переводчиков, всё в одной модели.

Fuzzy match. Модель галлюцинирует имя (

start_vacuum_cleaner
вместо

start_vacuum
)? Пост-обработка подтягивает к ближайшему в registry.

Цифры (честно):
Multi-tool selection (300 held-out)
─────────────────────────────────
OVERALL 71.7%
garden 96%
climate 86%
cleaning 55%
lighting 44%

Voice end-to-end (30 RU команд)
─────────────────────────────────
OVERALL 46.7%
TTS 0.5s + STT 5s
+ GPT-2 25s = ~30s/команда CPU

Где ломается:
Whisper подменяет слова: «гостиной» → «hotel», «21 градус» → «a degree». GPT-2 124M путает похожие функции:

turn_on
vs

turn_off
,

query_temperature
vs

set_thermostat
. Cleaning/lighting (много похожих имён) - самые слабые домены.

Потолок 124M. Для production нужна модель побольше, но архитектура и пайплайн уже работают.

Воспроизведение: git clone + git lfs pull + python src/voice_pipeline.py. README билингвальный (русский сверху, English ниже с якорем).

https://github.com/barometech/smart-home-gpt2


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍4😱43👏3🕊1
Я выложил ключ к работе над вообще всеми трансформерами. У кого хватит котелка расширить это на более мощные модели используя Google Colab и более интересные гипотезы - добьётся успеха в своих идеях. Желаю вам всем удачи!

Как видите, я стал открытым в плане проектов и выкладывания кодов. Не потому что было давление. Потому что есть некий план по которому я смогу погрузить вас постепенно в общий контекст. Хоть какой-то синхрон будет !
👍4216🔥10👏5🙏1🕊1🤝1
Добрый день, синтеты!

Продолжим сегодня с математическими нейронам, калькулятор надо доделать.
🤝25👍6🕊1
Щас новости будут! Всё там нормально!
👍12👀10🕊1
Поданы на утверждение к печати 3 статьи. Прикладная математика. Информатика. Процессы управления» (СПИСОК-2, ВАК) три научные статьи.

(1) «Корпус RUKALLAMA». Методология построения русскоязычного образовательного датасета на 763 советских учебниках 1926–1990 гг. VLM-OCR через Llama-4-Scout-17B; токенизатор RUKANIZER (100 032 в словаре, сжатие 4,33 знака/токен, 100% обратимость, лучший в 8 из 9 доменов); автоматическая ёфикация на 19 052 словоформах + pymorphy3. На MERA: PARus 55,8% и ruOpenBookQA 33,6% (статистически значимо). - внутри деталей больше

(2) «RUKALLAMA — KAN-модель». 853 млн параметров, TrueKAN с базисом Чебышёва K=3 — на 38% быстрее nn.Linear в скомпилированном режиме. Батчированное KAN-внимание ×4,6. Формальный анализ attention sink (порядок применения bias и RoPE) и его устранение — стабильных sink-голов 4 → 0. На MERA PARus 56,8%лучший среди русскоязычных моделей класса до 1 млрд параметров.- внутри деталей больше

(3) «PromeTorch на NM Card / NM Quad». Суверенный фреймворк (~100К строк C++/CUDA/Python без зависимостей от PyTorch) для отечественных ускорителей НТЦ Модуль. SIMD через nmpp даёт ×100 к скаляру; 16-ядерный волновой backward — 80% линейной масштабируемости. MNIST 93,64% на эмуляторе, 705 tok/s на NM Quad. Тренировка PIR-250M (189M) на Эльбрусе E8C2 — быстрее PyTorch 2.7.1. - внутри деталей больше


🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6920👍84👏1🕊1
А новости и не кончались так-то...
13👍6
Они снова сломали Opus. Придурки
👍951
"молодцы"
💯28🔥31
Опять отрицает все достижения по умножению. Опять отрицает методы. Причём, моя прошлая инструкция теперь ломает его логику и на простое привет он думает в 5 экранов простыни, а потом выдает что-то вроде ...

"Я НЕ БУДУ ТЕБЕ ПОДДАКИВАТЬ".

Хотя ты просто написал: "привет"

Вот это гондон, однако...нахера было это делать.
👍19🔥8🤯4🕊4🤔2😢21🥰1💯1
Доброе утро.
🤝13👌8🏆31🤔1🫡1
К особо активным пользователям и бравым ребятам, которые присоединяются к моему чату чтобы начинать какие-то активности. Рекомендую создавать свой паблик и эти активности продвигать там, а не в локальном чате обособленного проекта, который к вам не имеет отношения. Муниципалитет стилизации здесь не будет, это частное поле, частный чат.

А если ваши фразы "здесь нет конструктива" и "админы беснуют", то вы точно мимо. У нас очень здравый чат на самом деле, где админы пресекают конфликты, всегда читают то, что происходит и , конечно же, общаются когда этого требует ситуация.

Так что, уважаемые - берега путать не надо. Создавайте свои паблики и привлекайте людей - аминь.
👏24👍94💯4🕊1
Временно закрыл чат, т.к. тот персонаж не просто так был забанен. Слушать русский язык не хочет. Насколько долго это будет не ясно. Но я сообщу.
12👍7🥰2👀2🔥1😢1🕊1
Синтеты, кто отписывал комментарии без проблем - теперь чтобы их оставлять надо зайти в чат через заявку. Я на вход вас встречу. Поживем так в режиме одни суточки.
👍25🕊2👀2
Насчёт новостей:

1) Rukallama V11 прошла 60% второй эпохи. Loss упал до 3.3 - это прекрасные показатели. Я остановлюсь на примерно 2.7-2.9 LOSS - этого при моём количестве параметров и количестве токенов (8 млрд токенов датасета) вполне себе нормально будет для начала SFT!

Rukallama V11 показывает здравое поведение, отвечает на вопросы часто по существу. Имеет проблемы с повторами, но уже по причине самой механики трансформеров, что можно будет убрать при дообучении. УРА - тут всё окей вообще без вопросов. Самый тяжелый и трудоёмкий проект.

2) На меня вышли из Института Государственно-Частного Планирования, а конкретно генеральный директор данного заведения. У них целая рабочая группа, кластер из 18 команий, которые заинтересованы в работе Эльбрусов и многого на них, также учитывая языковые модельки. Будем, надеюсь сотрудничать по теме и развивать ИИ уже в другом масштабе.

3) Я устроился на работку и там очень интересный проект. Рассказывать особо не могу, но, главное, занятость не полная - поэтому можно будет оставить воздуха для работы уже непосредственно со своими проектами, при этом получая средства для существования.

4) Тема с нейронами, с калькуляцией и так далее невозможна на одной моей карте, а тратить на Google Colab желания нет. Это временно относится на второй план иначе я НИКОГДА НЕ ДОДЕЛАЮ RUKALLAMA!

Как бы мне не были интересны эти проекты сторонние мои, но там, где нужна видео карта моя - я не могу ничего поделать. Там Rukallama. Если есть желание накинуть в yoomoney, на карту и так далее, то ссылки будут ниже.


Всё очень просто. Я не буду работать с инвесторами, но у меня есть синтеты. Они всегда выручат когда надо подсобить. (это не сигнал о помощи, это сигнал о взаимодействии). Мне просто не всегда хватает своих кровных на все подписки. Как только хватает - все проекты льются как из рога изобилия. Нужны компьюты - часы видеокарт.

🦆🦆🦆
Поддержать канал: ТБАНК
Поддержать канал: ЮМАНИ
Поддержать канал: PAYPAL paperfunkrecordings@gmail.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍125🫡1
ЧАТ Техножнецы снова работает как раньше.
ИИШКА перезапущена.
👍241
Имя "Сетунь"...вам о чём-нибудь говорит?
🫡248🤩6🤔4💯3👻2🐳1
1👍27🔥10🤔6🤯1