Кажется, мы окончательно перешли от игрушек к суровому AgentOps
Приглашаем на наш обновлённый курс по разработке ИИ-агентов. Никакой воды про «будущее нейросетей», только инженерный подход.
На курсе мы:
— пошагово строим готовые системы на
— настраиваем кэширование и роутинг, чтобы бот не сожрал токены;
— разбираемся со стейтом, учимся дебажить через time-travel и прикручиваем human-in-the-loop;
— выводим RAG в прод так, чтобы безопасники не завернули архитектуру из-за 152-ФЗ.
В пекло скучные лекции про общую инфраструктуру — сразу фокусируемся на агентных фреймворках и написании кода. Занятия ведут бывалые лиды из Газпромбанка и Альфы, набившие шишки на реальных задачах.
Сегодня последний день, когда можно забрать курс по старым ценам. Базовый тариф сейчас стоит 49 000 ₽ (вместо 62 990 ₽), продвинутый трек — 99 000 ₽ (вместо 124 990 ₽). Если не хочется отдавать всю сумму сразу, есть рассрочка. Торопитесь — на потоке осталось всего 5 мест!
→ Зафиксировать цену и перейти к сборке своих агентов
Приглашаем на наш обновлённый курс по разработке ИИ-агентов. Никакой воды про «будущее нейросетей», только инженерный подход.
На курсе мы:
— пошагово строим готовые системы на
LangGraph, CrewAI и MCP;— настраиваем кэширование и роутинг, чтобы бот не сожрал токены;
— разбираемся со стейтом, учимся дебажить через time-travel и прикручиваем human-in-the-loop;
— выводим RAG в прод так, чтобы безопасники не завернули архитектуру из-за 152-ФЗ.
В пекло скучные лекции про общую инфраструктуру — сразу фокусируемся на агентных фреймворках и написании кода. Занятия ведут бывалые лиды из Газпромбанка и Альфы, набившие шишки на реальных задачах.
Кстати, на днях мы пилили агента в прямом эфире, если пропустили — есть запись вебинара.
Сегодня последний день, когда можно забрать курс по старым ценам. Базовый тариф сейчас стоит 49 000 ₽ (вместо 62 990 ₽), продвинутый трек — 99 000 ₽ (вместо 124 990 ₽). Если не хочется отдавать всю сумму сразу, есть рассрочка. Торопитесь — на потоке осталось всего 5 мест!
→ Зафиксировать цену и перейти к сборке своих агентов
Какой тип базы данных использует Prometheus?
Prometheus использует TSDB (time series database).
Библиотека задач по DevOps
Prometheus использует TSDB (time series database).
Библиотека задач по DevOps
Что реально гарантирует PodDisruptionBudget (PDB) в Kubernetes?
👾 — Защиту от OOM и крэшей ноды
👍 — Ограничение добровольных эвикшенов (drain/upgrade), ниже минимума не опустят; от аварий не спасает
🥰 — Нулевой простой при любых инцидентах
⚡️ — Автоматический автоскейлинг при эвикшене
Библиотека задач по DevOps
👾 — Защиту от OOM и крэшей ноды
👍 — Ограничение добровольных эвикшенов (drain/upgrade), ниже минимума не опустят; от аварий не спасает
🥰 — Нулевой простой при любых инцидентах
⚡️ — Автоматический автоскейлинг при эвикшене
Библиотека задач по DevOps
👍4
Как корректно посчитать процент ошибок в Prometheus?
👾 — sum(http_errors_total) / sum(http_requests_total) (сырые счетчики)
👍 — rate(http_errors_total[5m]) / rate(http_requests_total[5m]) с теми же фильтрами/лейблами и затем агрегацией
🥰 — avg_over_time(http_errors_total[5m])
⚡️ — irate(http_errors_total[5m]) для алерта по SLO
Библиотека задач по DevOps
👾 — sum(http_errors_total) / sum(http_requests_total) (сырые счетчики)
👍 — rate(http_errors_total[5m]) / rate(http_requests_total[5m]) с теми же фильтрами/лейблами и затем агрегацией
🥰 — avg_over_time(http_errors_total[5m])
⚡️ — irate(http_errors_total[5m]) для алерта по SLO
Библиотека задач по DevOps
👍4
Как масштабировать по p95 латентности в Kubernetes?
👾 — Через HPA v1 по CPU/Memory
👍 — Через HPA v2 с custom/external метрикой (Prometheus Adapter) и таргетом p95
🥰 — Через VPA: он меняет реплики по задержке
⚡️ — ReplicaSet сам увеличит реплики при росте p95
Библиотека задач по DevOps
👾 — Через HPA v1 по CPU/Memory
👍 — Через HPA v2 с custom/external метрикой (Prometheus Adapter) и таргетом p95
🥰 — Через VPA: он меняет реплики по задержке
⚡️ — ReplicaSet сам увеличит реплики при росте p95
Библиотека задач по DevOps
👍1
Начать рассказывать интервьюеру, как вы ловко дёргаете ручки API через базовый
Звучит как отличный план, да? Нет, это мгновенный отказ.
В свежем отчёте по рынку GPU говорится, что 54% компаний стопают ИИ-внедрения тупо из-за конских затрат на инфраструктуру. На серверах более 70% стоимости — это видеокарты. Поэтому на собесах сейчас спрашивают не про красивые промпты, а про жёсткую экономику агентов.
По сути, от вас ждут понимания, как лимитировать ресурсы на лету, роутить запросы и дебажить отказы через механизм
Что требуют от мидлов и выше:
— интеграция мультиагентных систем по стандарту
— суровый AgentOps: метрики, трейсинг, защита от деградации пайплайнов;
— локальный деплой Open Source под 152-ФЗ (без этого в финтех можно даже не стучаться).
Прямо сейчас можно урвать курс с увесистой скидкой(49 000 ₽ 62 990 ₽ за базовый тариф и 99 000 ₽ 124 990 ₽ за продвинутый трек) , но стоит поторопиться — на потоке осталось всего 5 мест.
👉 Подтянуть архитектуру до уровня прода
LangChain.Звучит как отличный план, да? Нет, это мгновенный отказ.
В свежем отчёте по рынку GPU говорится, что 54% компаний стопают ИИ-внедрения тупо из-за конских затрат на инфраструктуру. На серверах более 70% стоимости — это видеокарты. Поэтому на собесах сейчас спрашивают не про красивые промпты, а про жёсткую экономику агентов.
По сути, от вас ждут понимания, как лимитировать ресурсы на лету, роутить запросы и дебажить отказы через механизм
time-travel в LangGraph. Если вы до сих пор собираете ботов в ноутбуках, гляньте обновлённый курс «Разработка ИИ-агентов» — фокус там смещён с игрушечных концепций на суровый энтерпрайз.Что требуют от мидлов и выше:
— интеграция мультиагентных систем по стандарту
MCP;— суровый AgentOps: метрики, трейсинг, защита от деградации пайплайнов;
— локальный деплой Open Source под 152-ФЗ (без этого в финтех можно даже не стучаться).
Прямо сейчас можно урвать курс с увесистой скидкой
👉 Подтянуть архитектуру до уровня прода
🥱1
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
🐸 Библиотека задач по DevOps
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16
Что такое error budget в SRE?
👾 — Плановый бюджет на инфраструктуру в долларах
👍 — Допустимая доля несоответствия SLO за окно наблюдения (напр., 0.1% при SLO 99.9%), используемая для темпа релизов и алертинга
🥰 — Сумма логов, которую можно хранить
⚡️ — Максимальный RTO при аварии
Библиотека задач по DevOps
👾 — Плановый бюджет на инфраструктуру в долларах
👍 — Допустимая доля несоответствия SLO за окно наблюдения (напр., 0.1% при SLO 99.9%), используемая для темпа релизов и алертинга
🥰 — Сумма логов, которую можно хранить
⚡️ — Максимальный RTO при аварии
Библиотека задач по DevOps
👍8
😱 Если ваш продукт не умеет отдавать данные в формате, понятном AI-агенту, то вас просто не существует
Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности.
Как адаптировать продукт и не исчезнуть из выдачи:
— интегрировать
— научиться контролировать стоимость (лимиты, кэш, роутинг между моделями);
— настроить AgentOps: трейсинг, логирование и отлов регрессий.
Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях.
Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше.
Зафиксировать цену и начать деплоить агентов без слива бюджета 👈
Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности.
Как адаптировать продукт и не исчезнуть из выдачи:
— интегрировать
MCP и A2A-взаимодействие, чтобы агенты могли вас читать;— научиться контролировать стоимость (лимиты, кэш, роутинг между моделями);
— настроить AgentOps: трейсинг, логирование и отлов регрессий.
Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях.
Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше.
Зафиксировать цену и начать деплоить агентов без слива бюджета 👈
Как выдать CI job облачные права без хранения долгоживущих ключей?
👾 — Хранить access-keys в переменных окружения репозитория
👍 — OIDC/workload identity: обмен короткоживущего токена раннера на временные креды (AWS STS/GCP WIF/Azure)
🥰 — Прокинуть ключи через ARG в Dockerfile
⚡️ — Закоммитить .env и закодировать Base64
Библиотека задач по DevOps
👾 — Хранить access-keys в переменных окружения репозитория
👍 — OIDC/workload identity: обмен короткоживущего токена раннера на временные креды (AWS STS/GCP WIF/Azure)
🥰 — Прокинуть ключи через ARG в Dockerfile
⚡️ — Закоммитить .env и закодировать Base64
Библиотека задач по DevOps
👍8
Что такое Kubernetes HPA (горизонтальное автомасштабирование Pod)?
👾 — Механизм автоматического масштабирования количества модулей в зависимости от использования ресурсов
👍 — Способ динамической корректировки ресурсов, выделяемых модулю, в зависимости от спроса
🥰 — Метод распределения сетевого трафика между несколькими модулями
⚡ — Инструмент для мониторинга и оптимизации использования ресурсов в кластере
Библиотека задач по DevOps
👾 — Механизм автоматического масштабирования количества модулей в зависимости от использования ресурсов
👍 — Способ динамической корректировки ресурсов, выделяемых модулю, в зависимости от спроса
🥰 — Метод распределения сетевого трафика между несколькими модулями
Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👾8❤1
Какой тип метрики Prometheus использовать для латентности с агрегируемыми перцентилями?
👾 — Gauge
👍 — Histogram с бакетами, перцентили через histogram_quantile по агрегированному rate
🥰 — Summary — легко агрегируется между инстансами
⚡️ — Counter — подходит для p99
Библиотека задач по DevOps
👾 — Gauge
👍 — Histogram с бакетами, перцентили через histogram_quantile по агрегированному rate
🥰 — Summary — легко агрегируется между инстансами
⚡️ — Counter — подходит для p99
Библиотека задач по DevOps
👍6
Как корректно алертить по SLO?
👾 — Триггерить при ошибках >1% за последнюю минуту
👍 — Алертить по скорости сжигания error budget на двух окнах (например, 2%/1ч и 5%/6ч)
🥰 — Считать только Apdex, игнорировать ошибки
⚡️ — Раз в день проверять среднюю ошибку
Библиотека задач по DevOps
👾 — Триггерить при ошибках >1% за последнюю минуту
👍 — Алертить по скорости сжигания error budget на двух окнах (например, 2%/1ч и 5%/6ч)
🥰 — Считать только Apdex, игнорировать ошибки
⚡️ — Раз в день проверять среднюю ошибку
Библиотека задач по DevOps
👍3👾2
Что такое SLO?
👾 — Текстовый договор с клиентом
👍 — Цель для метрики SLI за период
🥰 — Алгоритм алертинга
⚡ — Доля ошибок за час
Библиотека задач по DevOps
👾 — Текстовый договор с клиентом
👍 — Цель для метрики SLI за период
🥰 — Алгоритм алертинга
Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
По какой причине организации предпочитают Canary Deployments?
👾 — Избежание всех проблем с задержкой сети
👍 — Строго случайные обновления
🥰 — Полный сброс системы
⚡️ — Более быстрое развертывание с меньшим количеством прерываний
Библиотека задач по DevOps
👾 — Избежание всех проблем с задержкой сети
👍 — Строго случайные обновления
🥰 — Полный сброс системы
⚡️ — Более быстрое развертывание с меньшим количеством прерываний
Библиотека задач по DevOps
⚡3
Какой тип IP-адреса по умолчанию назначается сервису в Kubernetes?
👾 — Внешний IP
👍 — Внутренний IP
🥰 — Кластерный IP
⚡ — Виртуальный IP
Библиотека задач по DevOps
👾 — Внешний IP
👍 — Внутренний IP
🥰 — Кластерный IP
Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰4