4 День тестирую RustDesk
Флоу
Ноут запущен всегда и стоит дома
На телефон и ноут установлен RustDesk, так же настроен remote id(который стабилизирует скорость и качество отклика) это мой сервер развернутый в РУ облаке имеет сатик IP
В целом очень доволен такой связкой, (подписка не 200 макс) по этому ремоут потестить не могу
Из бонусов, голосовой ввод от клавиатуры IPhone
Завязал на этот ноут разработку одного сервиса (24/7 могу вкинуть идею и четко управлять сессией Claude Code, честно поражен насколько проработан интерфейс для мобилы)
Скажу я вам очень удобно и только так я выгребаю фулл лимиты!
Флоу
Ноут запущен всегда и стоит дома
На телефон и ноут установлен RustDesk, так же настроен remote id(который стабилизирует скорость и качество отклика) это мой сервер развернутый в РУ облаке имеет сатик IP
В целом очень доволен такой связкой, (подписка не 200 макс) по этому ремоут потестить не могу
Из бонусов, голосовой ввод от клавиатуры IPhone
Завязал на этот ноут разработку одного сервиса (24/7 могу вкинуть идею и четко управлять сессией Claude Code, честно поражен насколько проработан интерфейс для мобилы)
Скажу я вам очень удобно и только так я выгребаю фулл лимиты!
🔥31❤13👍9💯1
Рубрика LLM Ops
Как и обещал в чатике выгружаю тесты qwen3.5-35b-a3b на своих 4090(48gb x2)
К станку
Как обычно взял FP16 и
Загрузка
Работа по анализу ValeDesk в курсоре
Ризонинг в итоге вырубил настройкой пока что на инфренесне, так как это конечно тьма, на привет 1-2 минуты думает в формате ПТСР
Single request: 90-100 tok/s (короткий контекст), 37-43 tok/s (длинный 5-9K)
- Tool calling TTFT: 329-396 ms (45-65 т/c)
- Concurrent throughput: 57 tok/s (3 параллельных)
- Degradation на длинном контексте: скорость падает с ростом промпта (~100→24 tok/s на 9K)
Точность и качество работы скоро будет (разослал друзьям по цеху доступы на сервер)
Напомню бенчи, модель якобы обгоняет sonnet 4.5 в некоторых задачах и что бы поднять ее фулл на весь контекст хватает сервера на 900-1.2 млн
Как и обещал в чатике выгружаю тесты qwen3.5-35b-a3b на своих 4090(48gb x2)
К станку
Как обычно взял FP16 и
image: vllm/vllm-openai:nightly"--tensor-parallel-size", "2",
"--enable-expert-parallel",
"--data-parallel-size", "1",
"--distributed-executor-backend", "mp",
"--gpu-memory-utilization", "0.97",
Загрузка
qwen3.5-35b-a3b | (Worker pid=132) (Worker_TP0_EP0 pid=132) INFO 03-02 11:16:40 [gpu_worker.py:423] Available KV cache memory: 11.59 GiB
qwen3.5-35b-a3b | (EngineCore_DP0 pid=93) INFO 03-02 11:16:40 [kv_cache_utils.py:1314] GPU KV cache size: 303,072 tokens
qwen3.5-35b-a3b | (EngineCore_DP0 pid=93) INFO 03-02 11:16:40 [kv_cache_utils.py:1319] Maximum concurrency for 200,000 tokens per request: 5.96x
Работа по анализу ValeDesk в курсоре
qwen3.5-35b-a3b | (APIServer pid=1) INFO 03-02 11:46:53 [loggers.py:259] Engine 000: Avg prompt throughput: 4376.5 tokens/s, Avg generation throughput: 68.0 tokens/s, Running: 1 reqs, Waiting: 0 reqs, GPU KV cache usage: 0.6%, Prefix cache hit rate: 0.0%, MM cache hit rate: 66.7%
Ризонинг в итоге вырубил настройкой пока что на инфренесне, так как это конечно тьма, на привет 1-2 минуты думает в формате ПТСР
Single request: 90-100 tok/s (короткий контекст), 37-43 tok/s (длинный 5-9K)
- Tool calling TTFT: 329-396 ms (45-65 т/c)
- Concurrent throughput: 57 tok/s (3 параллельных)
- Degradation на длинном контексте: скорость падает с ростом промпта (~100→24 tok/s на 9K)
Точность и качество работы скоро будет (разослал друзьям по цеху доступы на сервер)
Напомню бенчи, модель якобы обгоняет sonnet 4.5 в некоторых задачах и что бы поднять ее фулл на весь контекст хватает сервера на 900-1.2 млн
🔥24🤔12❤3👍3👌1
Forwarded from Остриков пилит агентов
🤣🤣🤣
кому нужны все ваши superpowers и beads, когда есть такое
https://github.com/i1kazantsev/claude-code-spinner
кому нужны все ваши superpowers и beads, когда есть такое
https://github.com/i1kazantsev/claude-code-spinner
38😁83❤14🔥6👍5🤣1
Forwarded from Pavel Zloi
Соцсети доживают свой век
Всё чаще замечаю, что листать динамическую ленту на ютубе, в твиттере, инсте и тиктоке в последнее время становится невыносимо, cоцсети завалены низкокачественным нейроконтентом.
Заметная часть коротких видео это говорилка в стиле озвучивателя местности, треш на тему популярных киновселенных, песенки среднего качества, ожившие картинки и прочий ai slop разного пошиба.
Площадки, на которых доминируют текстовые сообщения, заполнены пресным и безэмоциональным текстовым нейрослопом, в котором авторы даже не стараются почистить текст, убрав из него клише, присущие нейросетям. Каждый второй пост это лонгриды, каждый первый пост раздутая вода на киселе. Да даже мемчиков новых почти не появляется, а то, что попадается на глаза, лишь переосмысление древних скрижалей.
Соцсети, в которых доминируют картинки, заполнены людьми с "идеальными" фигурами, "идеальными" снимками идеальных "отпусков", сгенерированных зверей, детей и так далее.
Это я к тому веду, что настоящего как будто ничего не осталось. Отсюда возникает вопрос, а нужны ли социальные сети в эпоху ai slop в принципе? Какой от них прок, если пока значительная часть, а скоро и вовсе почти вся, контента будет сгенерирована модельками? Для кого публикуется весь этот контент, для других нейросетей, а как же реклама? Заметен ли уже негативный экономический эффект от засилья нейрослопа?
Подводя итог, хочу сказать, что мне кажется, что соцсети в привычном нам виде уже почти изжили себя, если так дальше пойдёт дело, то скоро их ждёт закат, и мне очень любопытно, что будет дальше.
Всё чаще замечаю, что листать динамическую ленту на ютубе, в твиттере, инсте и тиктоке в последнее время становится невыносимо, cоцсети завалены низкокачественным нейроконтентом.
Заметная часть коротких видео это говорилка в стиле озвучивателя местности, треш на тему популярных киновселенных, песенки среднего качества, ожившие картинки и прочий ai slop разного пошиба.
Площадки, на которых доминируют текстовые сообщения, заполнены пресным и безэмоциональным текстовым нейрослопом, в котором авторы даже не стараются почистить текст, убрав из него клише, присущие нейросетям. Каждый второй пост это лонгриды, каждый первый пост раздутая вода на киселе. Да даже мемчиков новых почти не появляется, а то, что попадается на глаза, лишь переосмысление древних скрижалей.
Соцсети, в которых доминируют картинки, заполнены людьми с "идеальными" фигурами, "идеальными" снимками идеальных "отпусков", сгенерированных зверей, детей и так далее.
Это я к тому веду, что настоящего как будто ничего не осталось. Отсюда возникает вопрос, а нужны ли социальные сети в эпоху ai slop в принципе? Какой от них прок, если пока значительная часть, а скоро и вовсе почти вся, контента будет сгенерирована модельками? Для кого публикуется весь этот контент, для других нейросетей, а как же реклама? Заметен ли уже негативный экономический эффект от засилья нейрослопа?
Подводя итог, хочу сказать, что мне кажется, что соцсети в привычном нам виде уже почти изжили себя, если так дальше пойдёт дело, то скоро их ждёт закат, и мне очень любопытно, что будет дальше.
👍47😁18💯11🤣6❤4🤡3🤔2
Kanban для управления кодовыми агентами
Самое интересное что только вчера обсуждали что openclaw не хватает канбан доски для командной работой над кодовыми агентами, и вот подход акторов на элексире
Гоу разбирать на части ребят!
OpenAI открыла "ДЕМКУ" оркестратор Symphony — платформу для построения сложных AI‑воркфлоу
Почему демка? Да потому что интеграция в Linear да и только, зато отличный пример как надо привлекать пользователей тратить токены подписки Codex CLI? =)
https://github.com/openai/symphony
Самое интересное что только вчера обсуждали что openclaw не хватает канбан доски для командной работой над кодовыми агентами, и вот подход акторов на элексире
Гоу разбирать на части ребят!
OpenAI открыла "ДЕМКУ" оркестратор Symphony — платформу для построения сложных AI‑воркфлоу
Почему демка? Да потому что интеграция в Linear да и только, зато отличный пример как надо привлекать пользователей тратить токены подписки Codex CLI? =)
https://github.com/openai/symphony
GitHub
GitHub - openai/symphony: Symphony turns project work into isolated, autonomous implementation runs, allowing teams to manage work…
Symphony turns project work into isolated, autonomous implementation runs, allowing teams to manage work instead of supervising coding agents. - openai/symphony
1🔥21🤣8❤7👍1
Нейро Ковальский
Kanban для управления кодовыми агентами
This media is not supported in your browser
VIEW IN TELEGRAM
Kovalskii варианты?
4 часа в режиме Ralph loop (шутка, я делал это руками)
Получилось на основе ValeDesk/OpenClaw/PiClaw/Topsha
Сделать LocalTaskClaw (да да основная идея взять кодовых агентов на локал моделях и засунуть из в среду Kanban моя идея не новая но может реализация вам понравится)
Что сделанно
Засунул их в апи канбана
Создал туда Оркестратора
И смотреть как всегорит что они натворят если поставить им задачку наспавниться и решить что-то
Почти VibeKanban
https://github.com/vakovalskii/LocalTaskClaw
За что больше всего попотел так это за онбординг и простую установку из cli
При первых 2 вариантах за сохранность файлов не ручаюсь вообще никаких тестов не делал! =)
4 часа в режиме Ralph loop (шутка, я делал это руками)
Получилось на основе ValeDesk/OpenClaw/PiClaw/Topsha
Сделать LocalTaskClaw (да да основная идея взять кодовых агентов на локал моделях и засунуть из в среду Kanban моя идея не новая но может реализация вам понравится)
Что сделанно
Засунул их в апи канбана
Создал туда Оркестратора
И смотреть как все
Почти VibeKanban
https://github.com/vakovalskii/LocalTaskClaw
За что больше всего попотел так это за онбординг и простую установку из cli
curl -fsSL https://raw.githubusercontent.com/vakovalskii/LocalTaskClaw/main/install.sh | bash
При первых 2 вариантах за сохранность файлов не ручаюсь вообще никаких тестов не делал! =)
3🔥42❤12 11
This media is not supported in your browser
VIEW IN TELEGRAM
4 Mac Studio 512 gb RAM каждый
2TB памяти и возможность поднять Kimi K2.5?
В захлеб поглядел этот видос от NetworkChuck видос не новый но все же https://youtu.be/bFgTxr5yst0?si=MGyFe0Qak6-c0Yz3
Кстати соединили их через exo вот это я понимаю local openclaw
Ваши ставки сколько стоит?)
22 t/s кстати выдает
2TB памяти и возможность поднять Kimi K2.5?
В захлеб поглядел этот видос от NetworkChuck видос не новый но все же https://youtu.be/bFgTxr5yst0?si=MGyFe0Qak6-c0Yz3
Кстати соединили их через exo вот это я понимаю local openclaw
Ваши ставки сколько стоит?)
22 t/s кстати выдает
2😁27👍15❤9🤔1🤮1
Нейро Ковальский
Kovalskii варианты? 4 часа в режиме Ralph loop (шутка, я делал это руками) Получилось на основе ValeDesk/OpenClaw/PiClaw/Topsha Сделать LocalTaskClaw (да да основная идея взять кодовых агентов на локал моделях и засунуть из в среду Kanban моя идея не новая…
Обучаюсь UX/UI тонкостям, все больше концентрируюсь на анализе паттернов как делают все и как я бы считал удобно, запилил небольшое демо того как я вижу генерацию картинок и StoryBoard для раскадровки
В продолжение UI от предыдущего проекта создал быстрый прототип вокруг FLUX Klein 4b
https://leeloomina.neuraldeep.tech/
Будьте аккуратны с загрузкой фото, галерею видят все пользователя сайта
У него кстати открытое апи, нужное кому-то такое на GitHub?
Кто угадает какая ГПУ под капотом?)
В продолжение UI от предыдущего проекта создал быстрый прототип вокруг FLUX Klein 4b
https://leeloomina.neuraldeep.tech/
Будьте аккуратны с загрузкой фото, галерею видят все пользователя сайта
У него кстати открытое апи, нужное кому-то такое на GitHub?
Кто угадает какая ГПУ под капотом?)
1👍15🔥11👀2❤1
8 марта с любовью в Lovable, ребята сделали очень щедрый подкат в честь праздника
Сегодня полностью фри
А кредиты надо будет активировать и в течение 24 часов сжечь на проекты
100 кредитов на апи Антропик
250 кредитов на Страйп
Достаточно войти в акк
Прекрасную, независимую и сильную половину мира с праздником!
За новость спасибо подписчику @Pritkij
Сегодня полностью фри
А кредиты надо будет активировать и в течение 24 часов сжечь на проекты
100 кредитов на апи Антропик
250 кредитов на Страйп
Достаточно войти в акк
Прекрасную, независимую и сильную половину мира с праздником!
За новость спасибо подписчику @Pritkij
🔥32❤12👍4
Forwarded from Остриков пилит агентов
Итак, завтра в 11.00 по МСК делаем первый комьюнити стрим в zoom, отвечаем на любые ваши вопросы.
Делаем его с Валерой @neuraldeep, держитесь братья 👊🏻👊🏻👊🏻
Лучше задавать вопросы про агентов - как их писать, на каких фреймворках (n8n спок ), как вкатиться в AI, что изучать, какие видюшки покупать и что на них гонять/файнтюнить, какие нас ждут изменения в компаниях профессиях, как приготовиться к этому будущему и вот это всё.
Постараемся не флеймить и ответить на максимальное количество вопросов, это главный KPI. Так что думайте и тащите завтра))
Зум ссылка будет за 15 минут до эвента
Делаем его с Валерой @neuraldeep, держитесь братья 👊🏻👊🏻👊🏻
Лучше задавать вопросы про агентов - как их писать, на каких фреймворках (
Постараемся не флеймить и ответить на максимальное количество вопросов, это главный KPI. Так что думайте и тащите завтра))
Зум ссылка будет за 15 минут до эвента
51👍41🔥16❤2
Forwarded from Остриков пилит агентов
Начинаем звонок через 30 минут.
Кот обиделся после вчерашних комментов в чате и он грустит.
Поэтому мы организовали коту сбор на бусте где все деньги пойдут на поднятие ему настроения: https://boosty.to/aostrikov/donate
Пока тестируем связь и через полчаса начинаем.
Zoom: https://us06web.zoom.us/j/88296637775?pwd=Ec6oUzww9BKVklEaAL52AujqNJlOVq.1
Кот обиделся после вчерашних комментов в чате и он грустит.
Поэтому мы организовали коту сбор на бусте где все деньги пойдут на поднятие ему настроения: https://boosty.to/aostrikov/donate
Пока тестируем связь и через полчаса начинаем.
Zoom: https://us06web.zoom.us/j/88296637775?pwd=Ec6oUzww9BKVklEaAL52AujqNJlOVq.1
1😁12🤯6❤2
Нейро Ковальский
Откопал тут в старых вещах Raspberry pi4 8gb Подниму там себе легкую(будет форк) версию Topsha только облегчить точно придется и упаковать как сервис, подсмотрю в picoclaw подход
Перед вами на столе так же raspberry pi 4 8gb
Пишем образ под малинку на 128гб карту
Дальше раскаиваемся picoclaw
Потом ему дам глазики через MaixCAM2 (уже едет ко мне) на первое время будет обынчая USB камера
Так же заказал мини колонку
Микрофон на usb
И откопал свой старый лидар для проектов
Суть в том что raspberry это готовый дев кит что бы дать ему
Микрофон
Камеру
Колеса?
Динамики
Поискав по репо я понял что такое еще пока никто не делал, буду пилить как пет проект
Дадим клешне доступ в этот мир
Пишем образ под малинку на 128гб карту
Дальше раскаиваемся picoclaw
Потом ему дам глазики через MaixCAM2 (уже едет ко мне) на первое время будет обынчая USB камера
Так же заказал мини колонку
Микрофон на usb
И откопал свой старый лидар для проектов
Суть в том что raspberry это готовый дев кит что бы дать ему
Микрофон
Камеру
Колеса?
Динамики
Поискав по репо я понял что такое еще пока никто не делал, буду пилить как пет проект
Дадим клешне доступ в этот мир
3🔥66👍11🤣11🤝2❤1🦄1
Forwarded from Denis Sexy IT 🤖
В Китае хайп OpenClaw только растёт:
Район Шэньчжэня, Лунган - принял черновик политики, где написано:
субсидируем развёртывание OpenClaw и поддерживаем «АИ-компании из одного человека»
В черновике:
• бесплатные для использования места где OpenClaw предустановлен (типа технопарков)
• 50% субсидии на сервисы, 30% на железо
• 3 месяца бесплатного компьюта для новых проектов
• до ¥10M поддержки для стартапов
Твиттерские быстро превратили новость в «Шэньчжэнь даёт всем OpenClaw бесплатно!!1» - но пока это черновик, один район и нужно пройти отбор (источник)
Но вдумайтесь, китайские власти начали субсидировать агентский слой АИ - не чипы и модели, а конкретно то, что запускает агентов, полный цикл покрыть хотят
2026 будет диким во всех смыслах мне кажется
Район Шэньчжэня, Лунган - принял черновик политики, где написано:
субсидируем развёртывание OpenClaw и поддерживаем «АИ-компании из одного человека»
В черновике:
• бесплатные для использования места где OpenClaw предустановлен (типа технопарков)
• 50% субсидии на сервисы, 30% на железо
• 3 месяца бесплатного компьюта для новых проектов
• до ¥10M поддержки для стартапов
Твиттерские быстро превратили новость в «Шэньчжэнь даёт всем OpenClaw бесплатно!!1» - но пока это черновик, один район и нужно пройти отбор (источник)
Но вдумайтесь, китайские власти начали субсидировать агентский слой АИ - не чипы и модели, а конкретно то, что запускает агентов, полный цикл покрыть хотят
2026 будет диким во всех смыслах мне кажется
🔥47🤯17❤10
Нейро Ковальский
Перед вами на столе так же raspberry pi 4 8gb Пишем образ под малинку на 128гб карту Дальше раскаиваемся picoclaw Потом ему дам глазики через MaixCAM2 (уже едет ко мне) на первое время будет обынчая USB камера Так же заказал мини колонку Микрофон на usb…
PicoClaw и 3 часа настройки? На малине =)
Понятно почему в целом все ломаются на кастомную настройки в РФ и в целом не хотят юзать ничего кроме ориг openclaw решений
Что бы подрубить любую(заблоканную по IP) подписку нужен впн прям на устройство но вы с таким и на mac mini столкнетесь (ну окей вы закинули клоду креды впн и он все настроил)
А если хотите юзать подписку? И только для ллм реквестом нужен впн допустим кодекс?
Значит нужен хороший сервер со статик ИП и туда прокинуть ssh конфиги от туда настроить прокси, либо прокинуть nginx прокси либо http прокси, в настройки или либо на уровень codex cli, в итоге пришлось найти сервер в хостингере который спокойно пропустил меня даже с заголовками прокси кстати нашел готовый проект
Я же хочу что бы он остался в сети и не юзал никакие ВПН и тунели
И я уже тут наговорил на целый созвон на 3 часа для начинающего если не сделать настройку за него и не знать что говорить агенту (и сам провозился почти час с настройкой)
Вот список что мы решили с CC в обнимку
Кстати не знаю че гнали на малину
Блин 155 мб на потребления агентом
И далее раздаем wifi с мобилы такой же как дома, берем powerbank и настраиваем потребление и возим своего агента с собой)))
Понятно почему в целом все ломаются на кастомную настройки в РФ и в целом не хотят юзать ничего кроме ориг openclaw решений
Что бы подрубить любую(заблоканную по IP) подписку нужен впн прям на устройство но вы с таким и на mac mini столкнетесь (ну окей вы закинули клоду креды впн и он все настроил)
А если хотите юзать подписку? И только для ллм реквестом нужен впн допустим кодекс?
Значит нужен хороший сервер со статик ИП и туда прокинуть ssh конфиги от туда настроить прокси, либо прокинуть nginx прокси либо http прокси, в настройки или либо на уровень codex cli, в итоге пришлось найти сервер в хостингере который спокойно пропустил меня даже с заголовками прокси кстати нашел готовый проект
Я же хочу что бы он остался в сети и не юзал никакие ВПН и тунели
И я уже тут наговорил на целый созвон на 3 часа для начинающего если не сделать настройку за него и не знать что говорить агенту (и сам провозился почти час с настройкой)
Вот список что мы решили с CC в обнимку
1. WiFi не поднимается — стандартный netplan в cloud-init на Trixie (Debian 13) не работает. Пришлось писать
NetworkManager .nmconnection файл вручную через write_files
2. Cloud-init кэширует — после первой загрузки игнорирует изменения на SD-карте. Пришлось перезаписывать образ
целиком
3. OAuth логин заблокирован по гео — auth login сразу отказывает. Логинился на маке через VPN, потом копировал
auth.json на малину по SCP
4. API заблокирован по гео — даже с токеном, chatgpt.com/backend-api/codex отдаёт 403. Обычный HTTP-прокси
(tinyproxy) не помогает — Cloudflare режет
5. Нужен reverse proxy — поставил nginx на сервер в USA (Hostinger $5/мес), прокинул chatgpt.com через него
6. Прокси не применяется — 3 бага в коде: конфиг с OAuth без api_key считался "пустым", proxy не передавался в
провайдер, миграция пропускала OAuth-записи
Кстати не знаю че гнали на малину
Блин 155 мб на потребления агентом
И далее раздаем wifi с мобилы такой же как дома, берем powerbank и настраиваем потребление и возим своего агента с собой)))
7👍22💊9🔥5❤3👌1
Нейро Ковальский
PicoClaw и 3 часа настройки? На малине =) Понятно почему в целом все ломаются на кастомную настройки в РФ и в целом не хотят юзать ничего кроме ориг openclaw решений Что бы подрубить любую(заблоканную по IP) подписку нужен впн прям на устройство но вы с…
Как и говорил на стриме самая важная часть что бы у агента были логи, дописал для PicoClaw трейсы ReAct лупа в Langfuse кстати все с телефона навайбил через RustDesk
Теперь легко можно будет задавать вопросы по агентному циклу и не гадать что да как, тоже не видел что бы хоть один блогер настроил логи и трейсинг для своего openclaw
Теперь легко можно будет задавать вопросы по агентному циклу и не гадать что да как, тоже не видел что бы хоть один блогер настроил логи и трейсинг для своего openclaw
3🔥37❤12