Qwen0.6B.wav
1.1 MB
Ревизия озвучки для ассистента.
Четыре месяца, словно четыре сезона в саду, прошли с той поры,
как мы косили траву над голосом. 🍂
Серьезных подвижек не случилось, ибо гора не пришла к Магомеду,
а голос лишь дремлет в своей чащобе.
Qwen-STT по-прежнему стоит на вершине горы для русского языка,
обладая даром клонирования и тонкой настройкой.
Однако в его сердце нет потока (stream режима) из коробки, как в колодце нет воды без ведра;
мастеру-умельцу пришлось сотворить fork, чтобы жизнь текла. 🌊
Долгое время мы держали модель на 0.6B, чтобы не мучить GPU и влезть в RTF < 1.0, где время расчета и время воспроизведения танцуют в идеальном равновесии.
Сегодня на демо же я поставил 1.7B против 0.6B на одних настройках, словно сравнивая два зеркала.
Разницы толком нет, ибо суть не в размере чаши, а в воде. Цифра 2033 провалена и там, и там, как лодка в шторм, но остальное круто, как резкий ветер. 🌀
Сравнения прилагаю.
#STT #qwen #zenAi
Четыре месяца, словно четыре сезона в саду, прошли с той поры,
как мы косили траву над голосом. 🍂
Серьезных подвижек не случилось, ибо гора не пришла к Магомеду,
а голос лишь дремлет в своей чащобе.
Qwen-STT по-прежнему стоит на вершине горы для русского языка,
обладая даром клонирования и тонкой настройкой.
Однако в его сердце нет потока (stream режима) из коробки, как в колодце нет воды без ведра;
мастеру-умельцу пришлось сотворить fork, чтобы жизнь текла. 🌊
Долгое время мы держали модель на 0.6B, чтобы не мучить GPU и влезть в RTF < 1.0, где время расчета и время воспроизведения танцуют в идеальном равновесии.
Сегодня на демо же я поставил 1.7B против 0.6B на одних настройках, словно сравнивая два зеркала.
Разницы толком нет, ибо суть не в размере чаши, а в воде. Цифра 2033 провалена и там, и там, как лодка в шторм, но остальное круто, как резкий ветер. 🌀
Сравнения прилагаю.
#STT #qwen #zenAi
1👨💻1
Посетил лекцию нобелевского лауреата по физике за 2023.
Утром пилил домашнего ассистента, а птом сразу туда…
Премию получили 3 человека.
Пьер Агостини, Ференц Краус и Анн ЛʼЮилье. Суть в том что они смогли создать на столько короткие лазерные импульсы (аттосекундные), что смогли визуализировать поле электронов в веществе.
Слайды очень емкие и простые по наполнению, но даже с учетом того что я на днях закончил писать теорию для дисера, это помогло понять только 20% математических выкладок. У меня все таки дифракция, а у них уровни квантового состояния для лазерной эмиссии. Не моя тема.
Докладывала Anne L'Huillier
Качество доклада: речь, слайды. Можно брать за эталон к чему стремиться. С ее слов лично занималась экспериментами вплоть до получения премии. На банкете после награждения сидела рядом с королем Швеции 👑
#новости
Утром пилил домашнего ассистента, а птом сразу туда…
Премию получили 3 человека.
Пьер Агостини, Ференц Краус и Анн ЛʼЮилье. Суть в том что они смогли создать на столько короткие лазерные импульсы (аттосекундные), что смогли визуализировать поле электронов в веществе.
Слайды очень емкие и простые по наполнению, но даже с учетом того что я на днях закончил писать теорию для дисера, это помогло понять только 20% математических выкладок. У меня все таки дифракция, а у них уровни квантового состояния для лазерной эмиссии. Не моя тема.
Докладывала Anne L'Huillier
Качество доклада: речь, слайды. Можно брать за эталон к чему стремиться. С ее слов лично занималась экспериментами вплоть до получения премии. На банкете после награждения сидела рядом с королем Швеции 👑
#новости
🔥2❤1🤯1
В режиме агента
Разработка стала быстрей.
То сколько сейчас нужно согласовать и оптимизировать кода под оборудование вероятно 4 года назад создавалось отделом за год.
Истратил лимиты от Codex в VS Code. Даже в бесплатной версии он сделал много.
Это последней каплей в том что переходить на платные агенты. Даже для хобби-задач. Особенно то когда стало понятно как с ними работать через VS Code. Потому что отдельные IDE не привлекали.
Купил Token Plan у MiniMax. Китайский агент. Для меня оплачивать его легко и дешево (4.5 $). По отзывам и бенчмаркам стоит рядом с Claud.
Через API закинул в IDE.
PS. Господа, написание кода через слабейший чат-бот DeepSeek - это не тот уровень кодинга, по которому можно оценивать полезность ИИ моделей сегодня. Это опыт 3х летней давности. Понимаю что доступ сложный...
PSS. Рофляная картинка это SVG еще и анимированная. Нарисовать такое векторами - не плохо. В пеинте в 8 лет так и рисовал. Агента для рисования в чатботе Minimax не нашлось.
#агенты #ИИ
Разработка стала быстрей.
То сколько сейчас нужно согласовать и оптимизировать кода под оборудование вероятно 4 года назад создавалось отделом за год.
Истратил лимиты от Codex в VS Code. Даже в бесплатной версии он сделал много.
Это последней каплей в том что переходить на платные агенты. Даже для хобби-задач. Особенно то когда стало понятно как с ними работать через VS Code. Потому что отдельные IDE не привлекали.
Купил Token Plan у MiniMax. Китайский агент. Для меня оплачивать его легко и дешево (4.5 $). По отзывам и бенчмаркам стоит рядом с Claud.
Через API закинул в IDE.
PS. Господа, написание кода через слабейший чат-бот DeepSeek - это не тот уровень кодинга, по которому можно оценивать полезность ИИ моделей сегодня. Это опыт 3х летней давности. Понимаю что доступ сложный...
PSS. Рофляная картинка это SVG еще и анимированная. Нарисовать такое векторами - не плохо. В пеинте в 8 лет так и рисовал. Агента для рисования в чатботе Minimax не нашлось.
#агенты #ИИ
✍1
Перевожу проект прошивки микрофона с Arduino на ESP-IDF. С Последним никогда не работал.
Как сейчас выглядит работа через агента.
Как сейчас выглядит работа через агента.
✍2
Агент Max. MiniMax.🤖
Неделю поработал с платным Minimax M2.7 и один из этих дней был с Kimi K2.6 (бесплатный пробный период).📅
Все через API в режиме агента в VS Code.🛠
Это китайские LLM, рассчитанные больше под агентский режим, чем на чат-бот режим. 🧠
Kimi K2.6, ощущается, мощнее, но и дороже. Возможно, в следующем месяце перейду на него.
В юанях цена/качество Minimax M2.7 — огонь! 🔥
Что сделал: ✅
1. Перевел часть диссера на 50 страниц из MS Word в Latex. 📝 Конвертер + Агент. Агент помогал убрать все ошибки, чтобы документ компилировался. Теперь агент может просматривать диссер целиком для форматирования, перевода, редактуры и факт-чекинга. 🔍
2. Перевел скетч из Arduino IDE на ESP-IDF. 📜 Теперь мой ESP32-S3 на микрофоне кроме дуплексной связи по UDP еще и поднимает Wake Word благодаря библиотеке ESP-SR. Напомню - это ключевое слово для начала диалога.
🎙 Такое только с чат-ботами не сделал бы. Очень большая архитектура.
Контекста в диалогах по 150к токенов, это 450 страниц английского текста. 📚
Неделю поработал с платным Minimax M2.7 и один из этих дней был с Kimi K2.6 (бесплатный пробный период).📅
Все через API в режиме агента в VS Code.🛠
Это китайские LLM, рассчитанные больше под агентский режим, чем на чат-бот режим. 🧠
Kimi K2.6, ощущается, мощнее, но и дороже. Возможно, в следующем месяце перейду на него.
В юанях цена/качество Minimax M2.7 — огонь! 🔥
Что сделал: ✅
1. Перевел часть диссера на 50 страниц из MS Word в Latex. 📝 Конвертер + Агент. Агент помогал убрать все ошибки, чтобы документ компилировался. Теперь агент может просматривать диссер целиком для форматирования, перевода, редактуры и факт-чекинга. 🔍
2. Перевел скетч из Arduino IDE на ESP-IDF. 📜 Теперь мой ESP32-S3 на микрофоне кроме дуплексной связи по UDP еще и поднимает Wake Word благодаря библиотеке ESP-SR. Напомню - это ключевое слово для начала диалога.
🎙 Такое только с чат-ботами не сделал бы. Очень большая архитектура.
Контекста в диалогах по 150к токенов, это 450 страниц английского текста. 📚
🔥1🍾1🦄1
PIFI SIOM Summer School(1).docx
44.1 KB
Мой институт SIOM организовывает 2 недельную школу в Шанхае в Сентябре
Вдруг кто захочет попутешествовать =)
Написано, что:
- рассчитывают набрать 30 человек;
- только из России;
- длительность 2 недели;
- магистры, аспиранты и постдоки;
- бесплатно расселяют; бесплатно кормят, бесплатно привозят-увозят.
Вдруг кто захочет попутешествовать =)
Написано, что:
- рассчитывают набрать 30 человек;
- только из России;
- длительность 2 недели;
- магистры, аспиранты и постдоки;
- бесплатно расселяют; бесплатно кормят, бесплатно привозят-увозят.
🔥1👨💻1
Сознание обретает
На сколько же он нафарширован сейчас…
Дня не хватит рассказать сколько тут технологий реализовано.
Огонь же 🔥 да?
#робот #ассистент
На сколько же он нафарширован сейчас…
Дня не хватит рассказать сколько тут технологий реализовано.
Огонь же 🔥 да?
#робот #ассистент
🔥7😁1🤯1
Sмарт-Пауза
Сознание обретает На сколько же он нафарширован сейчас… Дня не хватит рассказать сколько тут технологий реализовано. Огонь же 🔥 да? #робот #ассистент
⚽️Все происходит по воздуху: WiFi по UDP. Провод только для питания.
🏀Подсветкой управляет MCU.
🏈Wake-word целиком на MCU.
⚾️Фразы-реакции тоже на MCU.
🥎На стороне сервера:
STT, TTS локальные.
LLM облачная. 3 дня тестовых запросов потратили 60к токенов суммарной стоимостью 0.04 юаня.
🏐LLM здесь DeepSeek. Не путать с агентом о котором я писал ранее — на Minimax я код пишу.
🏀Подсветкой управляет MCU.
🏈Wake-word целиком на MCU.
⚾️Фразы-реакции тоже на MCU.
🥎На стороне сервера:
STT, TTS локальные.
LLM облачная. 3 дня тестовых запросов потратили 60к токенов суммарной стоимостью 0.04 юаня.
🏐LLM здесь DeepSeek. Не путать с агентом о котором я писал ранее — на Minimax я код пишу.
✍2
Двухнедельный итог работы над прошивкой микрофона. 🔊
ESP-IDF ответил на вопрос, как вообще работать над сложными прошивками, требующими структуру. 🛠
Удалось реализовать даже самые влажные фантазии. 💭✨
Позже продолжу прокачивать. Сейчас достаточно, чтобы интегрировать управление. Для ROS2. 🤖
Связующее звено — это LLM с системой скилов, о которой я когда-то писал. 🧠🔗
ESP-IDF ответил на вопрос, как вообще работать над сложными прошивками, требующими структуру. 🛠
Удалось реализовать даже самые влажные фантазии. 💭✨
Позже продолжу прокачивать. Сейчас достаточно, чтобы интегрировать управление. Для ROS2. 🤖
Связующее звено — это LLM с системой скилов, о которой я когда-то писал. 🧠🔗
❤1⚡1
😁4⚡1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
По щучьему веленью по моему хотенью.
В общем-то вот и всё. 👑
Связал микрофон на esp32, локальные ИИ на сервере и ROS2 на одноплатнике в одну систему. И все это может существовать гибко друг без друга. Микрофон от платформы только питание берет.
Реакция и ответы быстрые. Даже не пришлось делать фразу-отбивку, чтобы было время на подумать.
Дальше буду настраивать для устойчивого поведения. Чтобы LLM могла сама выкручиваться из всех ситуаций.
И самое последнее найти кейсы зачем мне вообще эта телега в доме 😄
#робот #ассистент
В общем-то вот и всё. 👑
Связал микрофон на esp32, локальные ИИ на сервере и ROS2 на одноплатнике в одну систему. И все это может существовать гибко друг без друга. Микрофон от платформы только питание берет.
Реакция и ответы быстрые. Даже не пришлось делать фразу-отбивку, чтобы было время на подумать.
Дальше буду настраивать для устойчивого поведения. Чтобы LLM могла сама выкручиваться из всех ситуаций.
И самое последнее найти кейсы зачем мне вообще эта телега в доме 😄
#робот #ассистент
🔥5⚡1