n8n на минималках для курильщика?
Замутил на базе Drift в хабе https://hub.neuraldeep.ru/ agent as a service (aaas).
Запрос на aaas есть? Реализация тоже за 120 минут!
Кстати, за последнее время на хабе зарегистрировалось 1500 человек
И один из зеров векторизировал 1 млн документов «кто ты воин?» =)
В целом на сегодня 10 млрд токенов суммарно прошло через наш хаб
Ещё ЦОД переехал физически и теперь работает более стабильно!
Кстати скоро будет залита из теста страничка https://hub.neuraldeep.ru/news
там вы точно не упустите все новости!
Что еще?
1) встроил vllm-router (крутая штука для кеша)
2) Так и не перешел на sglang O_o
3) Встроил b2b режим покупки моделей по токенам
4) Стабилизировал работу Drift раз 10 ловил регресс =)
5) Вроде настроил пайп создание и деплоя фичей (вроде)
6) Все откладываю почтовый сервис
По MRR отбил аренду колекейшена!
В общем следите за новостями
А ваш карманных эксперт на данныз момент по уши в агентах и в AI (P)(S)DLC!
Stay tuned!
Замутил на базе Drift в хабе https://hub.neuraldeep.ru/ agent as a service (aaas).
Запрос на aaas есть? Реализация тоже за 120 минут!
Кстати, за последнее время на хабе зарегистрировалось 1500 человек
И один из зеров векторизировал 1 млн документов «кто ты воин?» =)
В целом на сегодня 10 млрд токенов суммарно прошло через наш хаб
Ещё ЦОД переехал физически и теперь работает более стабильно!
Кстати скоро будет залита из теста страничка https://hub.neuraldeep.ru/news
там вы точно не упустите все новости!
Что еще?
1) встроил vllm-router (крутая штука для кеша)
2) Так и не перешел на sglang O_o
3) Встроил b2b режим покупки моделей по токенам
4) Стабилизировал работу Drift раз 10 ловил регресс =)
5) Вроде настроил пайп создание и деплоя фичей (вроде)
6) Все откладываю почтовый сервис
По MRR отбил аренду колекейшена!
В общем следите за новостями
А ваш карманных эксперт на данныз момент по уши в агентах и в AI (P)(S)DLC!
Stay tuned!
🔥63👍9⚡5👏4 3😁2🤔1
Человек-оркестр это не мем это диагноз
Люблю этот летний утренний хайп сегодня
"накидал агентов они сами всё сделали ты только оркестрируешь, кодинг умер инженеры не нужны!!!"
Так вот скажу как человек который завёл первый MVP хаба за вечер на клоде (11 контейнеров, 15к строк), а потом полтора месяца и 693 коммита доводил его до того что он реально держит прод и принимает деньги
Демка взлетает за сутки, а продукт это месяцы?
Чет не так как продают на ютубе, но возможно я смотрю неправильный ютуб
Скиллы, саб-агенты для ревью, оркестраторы, спеки на 1000 строк, workflow
каждый новый слой не убирал баги а добавлял новые места где они прячутся и добалял мне чертов СДВГ что бы я за всем этим следил!
Регресс ловил раз 10 на ровном месте фича зелёная локально, катишь на прод и оно отваливается на эндпоинте про который агент «забыл»
ни один скилл / плагин / MCP не дал мне гарантии что после раскатки будет ок
ни один =(
Что реально спасло
Четкий пайплайн тестов/дел/задач перед выкаткой (он описан скриптом)
А дальше
тесты, логи, тесты, логи, ещё раз логи, потом снова тесты 💀
smoke перед каждым пушем, полный прогон перед продом
читать логи всех сторон системы (vllm, litellm, гейт, вебхук) там вся соль, а не в "агент сказал готово"
деплой не когда модель написала done, а когда зелёный гейт сказал done и я глазами дернул метод и увидел ответ
единственная «фича» которая ни разу не подвела это дисциплина смотреть в логи да через агента но смотреть каждый раз ждать по 5/10/20 минут у терминала и смотреть логи создавать события самому или ждать юзеров
А за счёт чего это вообще едет?
За счёт своей базы, не агентской О_о
тащит то что накоплено за 6 лет карьеры
девопс, сети, линукс, докер
поднять, изолировать, разрулить роутинг, не уронить прод или уронить и поднять!
vllm и модели изнутри
чат-темплейты, constrained decoding, harmony, парсеры тулов, я лазил в кишки и переписывал
железо, нагрузка, температуры: знаю что мои 4090 48гб или rtx6000 держат и когда кипят, а не гадаю
питон, бекенд, фронтенд: что б прочитать что нагенерил агент и понять где он наврал
агент без этой базы это джун с уверенным тоном
на проде опасная штука
Человек-AI-оркестр не миф, но сделали меня им не агенты и уж точно не супер скилл или md файл
я стал им за 6 лет, пока руками поднимал инфру, ронял и чинил прод, лез в инференс, считал нагрузку и температуры
агент это рычаг, а опора это те самые 6 лет в голове
поэтому всё что нужно что б хаб не просто крутился а начал приносить деньги и принимать платежи я настроил сам
роутинг, sticky-кеш, биллинг через юкассу, лимиты, грейсы, рефанды, изоляция песочниц, бекапы, мониторинг
агент писал код, а что куда и зачем решал я
И тут небольшая ремарка про психику
По ощущениям на сегодня у меня либо раздвоение личности, либо продуктивность на уровне целой команды
пока сам не разобрал что именно
но визит к специалисту чувствую точно не помешает 🙂
Моё решение чутка сложнее мобильного приложения с бекендом и прокси к облачным ллмкам
тут свой инференс на своём железе, мультисервис, изоляция, биллинг, b2b по токенам, агент со своей песочницей, часть живет в k8s
поэтому это и не делается за сутки
поэтому мне и интересно
поэтому я и вкладываю столько времени
будь это тонкий клиент к api gpt мне стало бы скучно через день
Агенты замена инженера сегодня?
Нет
Они дают рычаг тому у кого есть на что опереться
думать, резать на куски, проверять, читать логи и нести ответственность за прод всё ещё ты
и тянет это твоя база по всему стеку собранная годами, а не очередной плагин
чем проще обвязка тем надёжнее едет: пара промптов в рукаве, context7, web search, playwright и железная дисциплина тестов
остальное лестницы из спичек, проще сжечь чем поддерживать
Так что когда вам в сотый раз скажут «оркестратор агентов всех заменил»
покажите мой пост и мой хаб
попросите показать логи
и тесты
и что было когда он раскатил это на прод
и что было когда у него было 200 рпс
и спросите сколько лет он до этого собирал свою базу😈
Люблю этот летний утренний хайп сегодня
"накидал агентов они сами всё сделали ты только оркестрируешь, кодинг умер инженеры не нужны!!!"
Так вот скажу как человек который завёл первый MVP хаба за вечер на клоде (11 контейнеров, 15к строк), а потом полтора месяца и 693 коммита доводил его до того что он реально держит прод и принимает деньги
Демка взлетает за сутки, а продукт это месяцы?
Чет не так как продают на ютубе, но возможно я смотрю неправильный ютуб
Скиллы, саб-агенты для ревью, оркестраторы, спеки на 1000 строк, workflow
каждый новый слой не убирал баги а добавлял новые места где они прячутся и добалял мне чертов СДВГ что бы я за всем этим следил!
Регресс ловил раз 10 на ровном месте фича зелёная локально, катишь на прод и оно отваливается на эндпоинте про который агент «забыл»
ни один скилл / плагин / MCP не дал мне гарантии что после раскатки будет ок
ни один =(
Что реально спасло
Реально спасло что у тебя тут армия тестировщиков преданных! @nyxandroЧеткий пайплайн тестов/дел/задач перед выкаткой (он описан скриптом)
А дальше
тесты, логи, тесты, логи, ещё раз логи, потом снова тесты 💀
smoke перед каждым пушем, полный прогон перед продом
читать логи всех сторон системы (vllm, litellm, гейт, вебхук) там вся соль, а не в "агент сказал готово"
деплой не когда модель написала done, а когда зелёный гейт сказал done и я глазами дернул метод и увидел ответ
единственная «фича» которая ни разу не подвела это дисциплина смотреть в логи да через агента но смотреть каждый раз ждать по 5/10/20 минут у терминала и смотреть логи создавать события самому или ждать юзеров
А за счёт чего это вообще едет?
За счёт своей базы, не агентской О_о
тащит то что накоплено за 6 лет карьеры
девопс, сети, линукс, докер
поднять, изолировать, разрулить роутинг, не уронить прод или уронить и поднять!
vllm и модели изнутри
чат-темплейты, constrained decoding, harmony, парсеры тулов, я лазил в кишки и переписывал
железо, нагрузка, температуры: знаю что мои 4090 48гб или rtx6000 держат и когда кипят, а не гадаю
питон, бекенд, фронтенд: что б прочитать что нагенерил агент и понять где он наврал
агент без этой базы это джун с уверенным тоном
на проде опасная штука
Человек-AI-оркестр не миф, но сделали меня им не агенты и уж точно не супер скилл или md файл
я стал им за 6 лет, пока руками поднимал инфру, ронял и чинил прод, лез в инференс, считал нагрузку и температуры
агент это рычаг, а опора это те самые 6 лет в голове
поэтому всё что нужно что б хаб не просто крутился а начал приносить деньги и принимать платежи я настроил сам
роутинг, sticky-кеш, биллинг через юкассу, лимиты, грейсы, рефанды, изоляция песочниц, бекапы, мониторинг
агент писал код, а что куда и зачем решал я
И тут небольшая ремарка про психику
По ощущениям на сегодня у меня либо раздвоение личности, либо продуктивность на уровне целой команды
пока сам не разобрал что именно
но визит к специалисту чувствую точно не помешает 🙂
Моё решение чутка сложнее мобильного приложения с бекендом и прокси к облачным ллмкам
тут свой инференс на своём железе, мультисервис, изоляция, биллинг, b2b по токенам, агент со своей песочницей, часть живет в k8s
поэтому это и не делается за сутки
поэтому мне и интересно
поэтому я и вкладываю столько времени
будь это тонкий клиент к api gpt мне стало бы скучно через день
Агенты замена инженера сегодня?
Нет
Они дают рычаг тому у кого есть на что опереться
думать, резать на куски, проверять, читать логи и нести ответственность за прод всё ещё ты
и тянет это твоя база по всему стеку собранная годами, а не очередной плагин
чем проще обвязка тем надёжнее едет: пара промптов в рукаве, context7, web search, playwright и железная дисциплина тестов
остальное лестницы из спичек, проще сжечь чем поддерживать
Так что когда вам в сотый раз скажут «оркестратор агентов всех заменил»
покажите мой пост и мой хаб
попросите показать логи
и тесты
и что было когда он раскатил это на прод
и что было когда у него было 200 рпс
и спросите сколько лет он до этого собирал свою базу
Please open Telegram to view this post
VIEW IN TELEGRAM
21🔥147❤53👍32💯20 7🤔3🤝2
SOTA OCR на хабе
Теперь вы можете строить свои решения вместе с сервисом https://sotaocr.com/ от @glebkudr1
На базе нашего хаба, это нативная интеграция с его сервисом в рамках нашей стратегии развития таких решений в РФ
https://hub.neuraldeep.ru/docs#ocr
Теперь вы можете строить свои решения вместе с сервисом https://sotaocr.com/ от @glebkudr1
На базе нашего хаба, это нативная интеграция с его сервисом в рамках нашей стратегии развития таких решений в РФ
https://hub.neuraldeep.ru/docs#ocr
🔥53👍10❤2
Голосуем за модели!
В нашем полку прибыло видеопамяти
Какую модель вы хотели бы увидеть на хабе?
Heretic не предлагать😈
Предложения жду в комментариях.
В нашем полку прибыло видеопамяти
Какую модель вы хотели бы увидеть на хабе?
Heretic не предлагать
Предложения жду в комментариях.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁17🔥7
AI полезен на все 25% жирности
Установил в офисе и дома кондиционеры MDV=Midea
Заранее выяснил, чтобы они работали с Алисой и имели приложение для телефона
Узнал, что для этого в них устанавливается Wi-Fi-модуль под панелью в виде wifi usb свистка
Привезли и установили
Скачал приложение, подключил к Алисе, настроил автоматизации и забыл
Вчера вспомнил, потому что Алиса сказала, что соединения нет
В приложении оба кондиционера были не в сети
Проверил через роутер, оба есть в списке DHCP и оба даже пытаются что-то получить по пакетам из «Пятёрочки» =)
Но результат тишина
Не помогли ни перезагрузка, ни питание, даже новая настройка не сработала
Нашел что их серваки стали блокать, решил проверить можно ли локально перебрать протокол
В итоге скормил Клоду все спецификации, и шерстил он китайские форумы но все нашел!
И через 30 минут получил приложение, работающее за NAT, которое умеет управлять и опрашивать сразу два кондиционера в разных точках моего города.
Кстати, пока прокидывал другой кондей из офиса по статик NAT, ещё дал Клоду временный доступ к MikroTik, и там мы тоже прибрались знатно (я это откладывал, наверное, года два)
Stay tuned!
РЕПО: https://github.com/vakovalskii/midea-local-web
Установил в офисе и дома кондиционеры MDV=Midea
Заранее выяснил, чтобы они работали с Алисой и имели приложение для телефона
Узнал, что для этого в них устанавливается Wi-Fi-модуль под панелью в виде wifi usb свистка
Привезли и установили
Скачал приложение, подключил к Алисе, настроил автоматизации и забыл
Вчера вспомнил, потому что Алиса сказала, что соединения нет
В приложении оба кондиционера были не в сети
Проверил через роутер, оба есть в списке DHCP и оба даже пытаются что-то получить по пакетам из «Пятёрочки» =)
Но результат тишина
Не помогли ни перезагрузка, ни питание, даже новая настройка не сработала
Нашел что их серваки стали блокать, решил проверить можно ли локально перебрать протокол
В итоге скормил Клоду все спецификации, и шерстил он китайские форумы но все нашел!
И через 30 минут получил приложение, работающее за NAT, которое умеет управлять и опрашивать сразу два кондиционера в разных точках моего города.
Кстати, пока прокидывал другой кондей из офиса по статик NAT, ещё дал Клоду временный доступ к MikroTik, и там мы тоже прибрались знатно (я это откладывал, наверное, года два)
Stay tuned!
РЕПО: https://github.com/vakovalskii/midea-local-web
🔥91👍22👏10😁7❤2👌1
Самое простое и самое рабочее?
README-first база знаний: markdown + git, и всё». Это и есть «самое простое»
Уже второй месяц экспериментирую с очень простым подходом создания и управления базой знаний по коду, при разработке с AI ассистентами
На картинке как на сегодня выглядит граф документации для https://hub.neuraldeep.ru/
Точка входа CLAUDE.md/AGENT.md
/docs
README
/service
README(всегда как индекс страницы)
Для управления знаниями я брал концепцию Gotham от Palantir (использует технику онтологий, средствами которых разнородные данные из множества источников оснащаются смысловой информацией и унифицируются для совместного анализа. Онтологии в продуктах Palantir могут быть одного из трёх типов:
сущности — cубъекты или объекты реального мира
события — действия над сущностями, происходящие в определённый момент времени и в определённой точке пространства)
документы — подтверждения сведений о реальном мире, сведённые в унифицированный формат (используется HTML)
Только я применил разметку md как это сейчас везде заведено!
Для себя сделал skill + plagin который имеет CLI для поиска и построения индекса
Но что действительно может быть вам интересно что я так развиваю и делаю продукт дальше, по этому считаю свой подход экспериментально наблюдаемым так как вы можете не просто видеть в "теории" как такое может работать, а как именно такое работает с хабом
Кстати таким образом я веду не только кодовые базы но и личную, так же недавно перевел все решения что разрабатываю с ИИ агентами по моим внутренним тестам и ощущениям этого хватает более чем!
Но эксперимент продолжается посомтрим куда меня это все приведет =)
РЕПО: https://github.com/vakovalskii/gitmark-memory-bank
Claude Code install
README-first база знаний: markdown + git, и всё». Это и есть «самое простое»
Уже второй месяц экспериментирую с очень простым подходом создания и управления базой знаний по коду, при разработке с AI ассистентами
На картинке как на сегодня выглядит граф документации для https://hub.neuraldeep.ru/
Точка входа CLAUDE.md/AGENT.md
/docs
README
/service
README(всегда как индекс страницы)
Для управления знаниями я брал концепцию Gotham от Palantir (использует технику онтологий, средствами которых разнородные данные из множества источников оснащаются смысловой информацией и унифицируются для совместного анализа. Онтологии в продуктах Palantir могут быть одного из трёх типов:
сущности — cубъекты или объекты реального мира
события — действия над сущностями, происходящие в определённый момент времени и в определённой точке пространства)
документы — подтверждения сведений о реальном мире, сведённые в унифицированный формат (используется HTML)
Только я применил разметку md как это сейчас везде заведено!
Для себя сделал skill + plagin который имеет CLI для поиска и построения индекса
Но что действительно может быть вам интересно что я так развиваю и делаю продукт дальше, по этому считаю свой подход экспериментально наблюдаемым так как вы можете не просто видеть в "теории" как такое может работать, а как именно такое работает с хабом
Кстати таким образом я веду не только кодовые базы но и личную, так же недавно перевел все решения что разрабатываю с ИИ агентами по моим внутренним тестам и ощущениям этого хватает более чем!
Но эксперимент продолжается посомтрим куда меня это все приведет =)
РЕПО: https://github.com/vakovalskii/gitmark-memory-bank
Claude Code install
/plugin marketplace add vakovalskii/gitmark-memory-bank
/plugin install gitmark@gitmark-marketplace🔥52👍18❤14🤔6
IMAGE API в рамках текущих тарифов, включая FREE!
https://neuraldeep.ru/docs#images
Все тарифы:
1) FLUX image · генерация (/v1/images · промпт RU→EN авто)
2) Upscale ×4 image · апскейл RealESRGAN (еще будут замены)
3) Background-remove image · удаление фона (ISNet/RMBG)
4) Enhance image · улучшение (FLUX)
5) Avatar image · аватар из фото
Кстати если вы потеряли базу скиллов она теперь тут https://neuraldeep.ru/skills
https://neuraldeep.ru/docs#images
Все тарифы:
1) FLUX image · генерация (/v1/images · промпт RU→EN авто)
2) Upscale ×4 image · апскейл RealESRGAN (еще будут замены)
3) Background-remove image · удаление фона (ISNet/RMBG)
4) Enhance image · улучшение (FLUX)
5) Avatar image · аватар из фото
Кстати если вы потеряли базу скиллов она теперь тут https://neuraldeep.ru/skills
🔥36👍7❤2👌2👏1
Питер готовьте календари, я еду на Conversations
Если думали, куда ворваться этим летом ради крутых ИИ докладов и нормального нетворка, то вам точно сюда.
Буду 25 и 26 июня просто в качестве слушателя. Хочу походить по кулуарам послушать коллег и поболтать.
Точно загляну послушать Сергея Нотевского из Битрикс24 ❤️ про локальные модели и онпрем
Вы же знаете, как я люблю свои железки
И, конечно,послушаю Стаса Округа из R77 про боль перехода от прототипа за пару недель до реального прода.
Это прям жиза – hub показал нам, как сложно строить такие решения особенно в одного!
На конфе соберется весь крупняк: от VK до Касперского и X5.
А 25 июня будет крутое афтерпати, где я точно задержусь
Выбил для вас промокод на скидку: CVS26sKaV
Забирайте билеты по ссылке ниже и увидимся на площадке
Кто пойдет – пишите в комменты, пересечемся ☕️
Регистрация и подробности
Если думали, куда ворваться этим летом ради крутых ИИ докладов и нормального нетворка, то вам точно сюда.
Буду 25 и 26 июня просто в качестве слушателя. Хочу походить по кулуарам послушать коллег и поболтать.
Точно загляну послушать Сергея Нотевского из Битрикс24 ❤️ про локальные модели и онпрем
Вы же знаете, как я люблю свои железки
И, конечно,послушаю Стаса Округа из R77 про боль перехода от прототипа за пару недель до реального прода.
Это прям жиза – hub показал нам, как сложно строить такие решения особенно в одного!
На конфе соберется весь крупняк: от VK до Касперского и X5.
А 25 июня будет крутое афтерпати, где я точно задержусь
Выбил для вас промокод на скидку: CVS26sKaV
Забирайте билеты по ссылке ниже и увидимся на площадке
Кто пойдет – пишите в комменты, пересечемся ☕️
Регистрация и подробности
🔥22❤12👍2👀2
Валера Ковальский
Человек-оркестр это не мем это диагноз Люблю этот летний утренний хайп сегодня "накидал агентов они сами всё сделали ты только оркестрируешь, кодинг умер инженеры не нужны!!!" Так вот скажу как человек который завёл первый MVP хаба за вечер на клоде (11…
Оркестрация себя это только начало пути?
Да-да, я, как и вы, учусь, и сегодня я наконец пришел к осознанию того что не знаю как расширять свою способность кодить с ИИ на команду клонов Валеры
Осознание это нечеткое, точно его еще не удалось описать, в md файл точно не влезет
ИИ тут тоже не помощник все его рекомендации как клеше из утренней газеты
Но я точно знаю, что мы с вами все в одной лодке, просто русло не такое широкое, и не все успевают пройти вверх по течению
Кто-то в совершенстве освоил делегирование с ИИ
Кто-то в совершенстве освоил автоматизацию, что SaaS соберет за 120 минут
Кто-то может рассказать так про ИИ что тебе станет понятно как последние 20 лет все развивалось за 60 минут
Но у всего этого есть планка, предел, что-то, что мешает двигаться дальше, и когда вы придете к этому ощущению, оно заставит вас искать пути как от него избавиться
Я его еще не достиг, но уже сегодня думаю, как все эти знания масштабировать
И тут должна на помощь прийти системность и порядок, воспроизводимость и четкость
Каждый приходит к этому по-своему через свою призму понимания методологии и правильности бытия!
Так что я хочу сказать еще одним куском этого опуса, что сегодня мы все находимся в вечной стадии обучения.
ИИ точно ускорил и расширил границы наших возможностей сегодня
Но не забывайте, что у вас должно быть время на отдых и другие мирские занятия
DevOps с вами!
Да-да, я, как и вы, учусь, и сегодня я наконец пришел к осознанию того что не знаю как расширять свою способность кодить с ИИ на команду клонов Валеры
Осознание это нечеткое, точно его еще не удалось описать, в md файл точно не влезет
ИИ тут тоже не помощник все его рекомендации как клеше из утренней газеты
Но я точно знаю, что мы с вами все в одной лодке, просто русло не такое широкое, и не все успевают пройти вверх по течению
Кто-то в совершенстве освоил делегирование с ИИ
Кто-то в совершенстве освоил автоматизацию, что SaaS соберет за 120 минут
Кто-то может рассказать так про ИИ что тебе станет понятно как последние 20 лет все развивалось за 60 минут
Но у всего этого есть планка, предел, что-то, что мешает двигаться дальше, и когда вы придете к этому ощущению, оно заставит вас искать пути как от него избавиться
Я его еще не достиг, но уже сегодня думаю, как все эти знания масштабировать
И тут должна на помощь прийти системность и порядок, воспроизводимость и четкость
Каждый приходит к этому по-своему через свою призму понимания методологии и правильности бытия!
Так что я хочу сказать еще одним куском этого опуса, что сегодня мы все находимся в вечной стадии обучения.
ИИ точно ускорил и расширил границы наших возможностей сегодня
Но не забывайте, что у вас должно быть время на отдых и другие мирские занятия
DevOps с вами!
❤45👍12💯12🤡1
Валера Ковальский
О, тоже подъехало Пойду делать AGI https://t.me/neuraldeepchat/63651
Блин я вспомнил эту имбу
Если она что-то похожее будет творить просто топ!
Кто-то проходил за добряка?
Если она что-то похожее будет творить просто топ!
Кто-то проходил за добряка?
🔥26😁12👍6❤1