Библиотека задач по DevOps | тесты, код, задания
2.96K subscribers
168 photos
7 videos
2 files
529 links
Задачи и тесты по DevOps для тренировки и обучения.

По рекламе: @proglib_adv

Наши каналы: https://t.me/proglibrary/9197

Учиться у нас: https://proglib.io/w/2b07c285

Для обратной связи: @proglibrary_feeedback_bot
Download Telegram
Кажется, мы окончательно перешли от игрушек к суровому AgentOps

Приглашаем на наш обновлённый курс по разработке ИИ-агентов. Никакой воды про «будущее нейросетей», только инженерный подход.

На курсе мы:

— пошагово строим готовые системы на LangGraph, CrewAI и MCP;
— настраиваем кэширование и роутинг, чтобы бот не сожрал токены;
— разбираемся со стейтом, учимся дебажить через time-travel и прикручиваем human-in-the-loop;
— выводим RAG в прод так, чтобы безопасники не завернули архитектуру из-за 152-ФЗ.

В пекло скучные лекции про общую инфраструктуру — сразу фокусируемся на агентных фреймворках и написании кода. Занятия ведут бывалые лиды из Газпромбанка и Альфы, набившие шишки на реальных задачах.

Кстати, на днях мы пилили агента в прямом эфире, если пропустили — есть запись вебинара.


Сегодня последний день, когда можно забрать курс по старым ценам. Базовый тариф сейчас стоит 49 000 ₽ (вместо 62 990 ₽), продвинутый трек — 99 000 ₽ (вместо 124 990 ₽). Если не хочется отдавать всю сумму сразу, есть рассрочка. Торопитесь — на потоке осталось всего 5 мест!

Зафиксировать цену и перейти к сборке своих агентов
Какой тип базы данных использует Prometheus?

Prometheus использует TSDB (time series database).


Библиотека задач по DevOps
Что реально гарантирует PodDisruptionBudget (PDB) в Kubernetes?

👾 — Защиту от OOM и крэшей ноды
👍 — Ограничение добровольных эвикшенов (drain/upgrade), ниже минимума не опустят; от аварий не спасает
🥰 — Нулевой простой при любых инцидентах
⚡️ — Автоматический автоскейлинг при эвикшене

Библиотека задач по DevOps
👍4
Как корректно посчитать процент ошибок в Prometheus?

👾 — sum(http_errors_total) / sum(http_requests_total) (сырые счетчики)
👍 — rate(http_errors_total[5m]) / rate(http_requests_total[5m]) с теми же фильтрами/лейблами и затем агрегацией
🥰 — avg_over_time(http_errors_total[5m])
⚡️ — irate(http_errors_total[5m]) для алерта по SLO

Библиотека задач по DevOps
👍4
Как масштабировать по p95 латентности в Kubernetes?

👾 — Через HPA v1 по CPU/Memory
👍 — Через HPA v2 с custom/external метрикой (Prometheus Adapter) и таргетом p95
🥰 — Через VPA: он меняет реплики по задержке
⚡️ — ReplicaSet сам увеличит реплики при росте p95

Библиотека задач по DevOps
👍1
Начать рассказывать интервьюеру, как вы ловко дёргаете ручки API через базовый LangChain.

Звучит как отличный план, да? Нет, это мгновенный отказ.

В свежем отчёте по рынку GPU говорится, что 54% компаний стопают ИИ-внедрения тупо из-за конских затрат на инфраструктуру. На серверах более 70% стоимости — это видеокарты. Поэтому на собесах сейчас спрашивают не про красивые промпты, а про жёсткую экономику агентов.

По сути, от вас ждут понимания, как лимитировать ресурсы на лету, роутить запросы и дебажить отказы через механизм time-travel в LangGraph. Если вы до сих пор собираете ботов в ноутбуках, гляньте обновлённый курс «Разработка ИИ-агентов» — фокус там смещён с игрушечных концепций на суровый энтерпрайз.

Что требуют от мидлов и выше:

— интеграция мультиагентных систем по стандарту MCP;
— суровый AgentOps: метрики, трейсинг, защита от деградации пайплайнов;
— локальный деплой Open Source под 152-ФЗ (без этого в финтех можно даже не стучаться).

Прямо сейчас можно урвать курс с увесистой скидкой (49 000 ₽ 62 990 ₽ за базовый тариф и 99 000 ₽ 124 990 ₽ за продвинутый трек), но стоит поторопиться — на потоке осталось всего 5 мест.

👉 Подтянуть архитектуру до уровня прода
🥱1
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?

👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать

🐸Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16
Что такое error budget в SRE?

👾 — Плановый бюджет на инфраструктуру в долларах
👍 — Допустимая доля несоответствия SLO за окно наблюдения (напр., 0.1% при SLO 99.9%), используемая для темпа релизов и алертинга
🥰 — Сумма логов, которую можно хранить
⚡️ — Максимальный RTO при аварии

Библиотека задач по DevOps
👍8
😱 Если ваш продукт не умеет отдавать данные в формате, понятном AI-агенту, то вас просто не существует

Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности.

Как адаптировать продукт и не исчезнуть из выдачи:

— интегрировать MCP и A2A-взаимодействие, чтобы агенты могли вас читать;
— научиться контролировать стоимость (лимиты, кэш, роутинг между моделями);
— настроить AgentOps: трейсинг, логирование и отлов регрессий.

Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях.

Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше.

Зафиксировать цену и начать деплоить агентов без слива бюджета 👈
Как выдать CI job облачные права без хранения долгоживущих ключей?

👾 — Хранить access-keys в переменных окружения репозитория
👍 — OIDC/workload identity: обмен короткоживущего токена раннера на временные креды (AWS STS/GCP WIF/Azure)
🥰 — Прокинуть ключи через ARG в Dockerfile
⚡️ — Закоммитить .env и закодировать Base64

Библиотека задач по DevOps
👍8
Что такое Kubernetes HPA (горизонтальное автомасштабирование Pod)?

👾 — Механизм автоматического масштабирования количества модулей в зависимости от использования ресурсов
👍 — Способ динамической корректировки ресурсов, выделяемых модулю, в зависимости от спроса
🥰 — Метод распределения сетевого трафика между несколькими модулями
— Инструмент для мониторинга и оптимизации использования ресурсов в кластере

Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👾81
Какой тип метрики Prometheus использовать для латентности с агрегируемыми перцентилями?

👾 — Gauge
👍 — Histogram с бакетами, перцентили через histogram_quantile по агрегированному rate
🥰 — Summary — легко агрегируется между инстансами
⚡️ — Counter — подходит для p99

Библиотека задач по DevOps
👍6
Как корректно алертить по SLO?

👾 — Триггерить при ошибках >1% за последнюю минуту
👍 — Алертить по скорости сжигания error budget на двух окнах (например, 2%/1ч и 5%/6ч)
🥰 — Считать только Apdex, игнорировать ошибки
⚡️ — Раз в день проверять среднюю ошибку

Библиотека задач по DevOps
👍3👾2
Что такое SLO?

👾 — Текстовый договор с клиентом
👍 — Цель для метрики SLI за период
🥰 — Алгоритм алертинга
— Доля ошибок за час

Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
По какой причине организации предпочитают Canary Deployments?

👾 — Избежание всех проблем с задержкой сети
👍 — Строго случайные обновления
🥰 — Полный сброс системы
⚡️ — Более быстрое развертывание с меньшим количеством прерываний

Библиотека задач по DevOps
3
Какой тип IP-адреса по умолчанию назначается сервису в Kubernetes?

👾 — Внешний IP
👍 — Внутренний IP
🥰 — Кластерный IP
— Виртуальный IP

Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰4