Микросервисная архитектура решает проблему масштабируемости, но почти всегда создает новую — потерю прозрачности. Сложнее понять, что произошло во время запроса, чем исправить саму ошибку. Логи не дают общей картины, метрики — деталей. Один запрос может пройти через десяток сервисов и очередей, API и фоновые процессы. Искать источник ошибки без полноценной трассировки долго или ОЧЕНЬ долго.
В таких случаях на помощь приходит наблюдаемость на базе OpenTelemetry и анализа трейсов в Sentry / Jaeger.
Вот как можно реализовать наблюдаемость:
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 4 3 2 2
Спикеры — эксперты из DerScanner, Sonatype, IBM, RTEAM, Semrush (Adobe), Beeline и независимые практики индустрии.
Что вас ждет:
— Реальные уязвимости, живые атаки и Red Team-кейсы от тех, кто в теме 24/7
— Нетворкинг с людьми, которые двигают AppSec и DevSecOps в регионе
— Интерактивы, активности на площадке и подарки от партнёров: DerScanner, Sonatype, RTEAM, MUK + IBM, FCBK и Halyk Kazteleport
Приходите учиться, знакомиться и становиться частью комьюнити!
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 5 3 2 1 1
Про Kubernetes 1.36 мы уже писали ранее, тут оставим полный changelog.
Лёгкий эмулятор 70+ сервисов AWS для тестирования CI/CD. Предоставляет локальную среду для тестирования приложений, использующих AWS, без необходимости подключаться к реальному облаку или платить за ресурсы. Быстрая и простая альтернатива популярному LocalStack. Запускается почему мгновенно.
Аудитор метрик для Prometheus / Grafana. Находит метрики в вашей TSDB, которые никогда не запрашиваются дашбордом, правилами оповещений и записи или чем-либо еще. Ценен тем, что можно сразу сгенерировать правила удаления метрик. Освобождаем хранилище за пару кликов.
Amazon выкатил разработанный экспертами сборник, где можно найти промпты и агентов для различных вариантов использования: от отдельных веб-приложений до сложных микросервисов. Лучшие практики помогут встроить все это дело в архитектуру AWS.
Платформа для мониторинга, которая собирает трассировки и метрики OpenTelemetry, автоматически группирует исключения и предоставляет информацию о производительности конечных точек, распределенной трассировке и оповещениях. Все в одном бинарнике. Не требует коллектора OpenTelemetry.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 5 2 2 1
Классику джунов сегодня отрабатывает наш верный помощник — ИИ.
Агент «починил» доступ и снес продакшн. Улетели базы клиентов, броней и платежей, а также бэкапы. Разработчики PocketOS ставили задачи в в тестовой среде, но при ошибке доступа он нашел API-токен, после чего отправил запрос на удаление. Восстановиться удалось спустя сутки — по резервной копии трёхмесячной давности.
...Вспоминаем, были ли еще подобные инциденты...
В декабре ИИ предложил инженерам удалить и заново развернуть прод для исправления проблем с конфигами — те одобрили, после чего система начала автоматические изменения инфраструктуры. Но по классике все пошло не так, что привело к масштабным сбоям в облачных сервисах. Исправляли 13 часов.
В марте сотрудники Meta почти на 2 часа получили несанкционированный доступ к данным из-за ИИ-агента. Тот опубликовал ответ в открытом доступе на запрос, не получив предварительного одобрения. Ответ должен был быть показан только сотруднику, который его запросил, а не стать достоянием общественности. До этого (видимо тот же бро на OpenClaw) массово удалял письма, проигнорировав команды на остановку.
В конце 25 года разработчик рассказал, что Google Antigravityпо его просьбе удалить временные файлы решила иначе и вынесла целую корневую директорию на диске D. После операции модель вежливо извинилась и уведомила, что «идёт спать, квота достигнута».
Какой вывод напрашивается: даже с ограничениями ИИ могут выполнять разрушительные действия без контроля. То, что кажется мелочью на одном ПК, может стать катастрофой в масштабе компании. Человек с критическим мышлением и здоровой опаской нужен как никогда. И прежде, чем передавать инструкции, важно учесть даже самые невероятные сценарии. И да, не хранить бэкапы там же, где лежит основная ифра. Инженера по эксплуатации ПО могут спать спокойно - работыпо восстановлениюхватит всем :)
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 6 6 3 3 2
У многих из нас есть знакомые, которые хотят попасть в DevOps, но даже с Linux не знакомы. Может быть, эти люди есть и среди наших подписчиков — и этот пост для них.
Курс часто рекомендуют как общепризнанную базу. Материал адаптирован для новичков и дополнен автором, за основу взято обучение по программе RHCSA.
Администрирование ОС Linux. Лучшие практики работы в Linux — от администрирования до автоматизации: аспекты конфигурирования, автоматизации, безопасности и оптимизации систем, а также практика на виртуальных стендах.
Администрирование linux-серверов. Фундаментальные навыки администрирования Linux-систем, чтобы решать наиболее популярные проблемы с серверами.
Сети в Linux. Опыт сетевого администрирования на Linux, который можно адаптировать для работы в любой компании и в любом проекте.
Серия хорошо оформленных и структурированных курсов по основам Linux в виде уроков с заданиями, ответы на которые проверяются автоматически. Рекомендуем заниматься на английском. От командной строки до сетей.
Linux CLI. Наиболее свежий курс по основам командной строки. Объём небольшой, на один вечер.
Архитектура параллельных вычислительных систем. Курс о настройке apache, nginx, iptables, bind9 (dns), nfs, samba, docker.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 6 4 4 1
23 мая в Алматы пройдет шестая beetech conf — одна из крупнейших IT-конференций Казахстана, которая ежегодно собирает 1000+ участников.
24 доклада, личные консультации с ведущими экспертами, квартирники на острые темы и формат Epic Fails микрофон, где разбирают реальные ошибки и решения, которые из них выросли.
Главная тема этого года — как AI уже встроен в инженерную и управленческую практику и что происходит, когда он выходит в продакшн: ускоряет процессы, меняет команды и иногда ломает привычные подходы.
Спикеры:
Это возможность за один день увидеть концентрат опыта, который обычно собирается месяцами: реальные кейсы, архитектуры, продуктовые решения и честные разборы ошибок.
Организаторы (Beeline и QazCode) также подготовили лотерею и ценные призы.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Мы уже писали про выход Linux 7.0, ядро которого будет использоваться в Ubuntu 26.04 LTS. Просто запустить обновление и уйти на обед не получится, так как многие системы могут не подняться из-за несовместимости конфигураций. По возможности лучше использовать чистую установку или тщательно тестировать обновление на стейджинг-серверах.
Перед обновлением обязательно проверьте следующие пункты:
/sys/fs/cgroup/memory и т.д., они сломаются. Проверьте текущий режим: mount | grep cgroup.tmpfs. Всё содержимое /tmp хранится в оперативной памяти и исчезает при перезагрузке. Если ваши приложения пишут туда гигабайты логов или кэша, это может «съесть» всю RAM.ls и cat теперь на Rust, старые версии доступны под именами gnuls, gnucp и т.д. Проверьте свои скрипты на предмет парсинга вывода этих команд — форматирование может минимально отличаться.~/.ssh/authorized_keys и known_hosts.~/.pam_environment больше не читается. Перенесите настройки в .bashrc или /etc/environment.sudoers с кастомными плагинами, они могут не заработать. Классический sudo доступен как sudo.ws.chroot. Если ваша модель безопасности полагалась на chroot-изоляцию Postfix, ее нужно перенастраивать.client_delay_access, ftp_epsv, client_persistent_connections или server_persistent_connections. Удалите их заранее.apt install chrony), иначе останется старый systemd-timesyncd.apt-key удалена. Если ваши скрипты установки ПО используют apt-key add, они перестанут работать. Ключи теперь должны лежать строго в /usr/share/keyrings.pg_upgrade.samba-ad-dc до начала обновления, иначе роль AD перестанет функционировать.@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Конференция о цифровых сетях, спутниковой и мобильной связи, оптоволоконных сетях, IoT, защите сетей и развитии телеком-отрасли.
На конференции затронут актуальные вопросы и перспективы развития телекоммуникационной отрасли:
PROFIT Telecom Day станет площадкой для обсуждения самых острых и актуальных вопросов связи, поможет сотрудничеству и обмену опытом всех заинтересованных сторон.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Не стали вас беспокоить в праздничную пятницу в погони за хайпом, а сейчас расскажем.
Любой непривилегированный пользователь может с помощью цепочки AF_ALG → splice() записать контролируемые 4 байта в страничный кэш любого читаемого файла, в который у него есть доступ на чтение. Обычной целью становится setuid-бинарник /usr/bin/su, модификация которого в памяти даёт root-шелл.
Изменения происходят только в памяти (in-memory), не затрагивая диск. Проверки целостности вроде checksum будут молчать
- Kubernetes. Страничный кэш шарится между контейнерами на ноде. Эксплоит из пода ломает изоляцию и пробивается на хост.
- CI/CD. Пулл-реквест на GitHub Actions, GitLab CI, Jenkins, выполняющий PoC, получает root на раннере. Дальше — компрометация секретов и всей пайплайновой инфраструктуры
- Возраст. Баг завезли в ядро коммитом 72548b093ee3 в 2017 году, и с тех пор он тихо жил почти во всех дистрибутивах: Ubuntu, Debian, RHEL, Amazon Linux, SUSE и их производных.
- Простота. Пэйлоад умещается в 732 байта Python-скрипта, не требующего никаких зависимостей, кроме stdlib. Один скрипт — и у вас root на всех уязвимых системах.
- Стелс. Нет триггеров для большинства систем обнаружения.
- Обновляйте ядра до версий, содержащих коммит
a664bf3d603d- Если патча у вашего вендора ещё нет — отключаем
algif_aead.Сайт исследователей
Детальный разбор от Microsoft
Рекомендации по триажу и патчингу от Wiz
Репозиторий PoC (только для проверки своих систем)
Кстати, баг нашли с помощью ИИ.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 9 5 4 2 1
Инцидент-менеджмент возвращает сервис в рабочее состояние, а проблем-менеджмент ищет и устраняет первопричину, чтобы ситуация не повторилась.
Делимся руководством по превращению хаотичной борьбы с тикетами в системный процесс управления проблемами.
Если вы просто перезагружаете сервер каждый раз, когда он зависает, вы не работаете — вы надеетесь на чудо; настоящая работа начинается с вопроса «почему он зависает?».
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Наблюдаем эволюцию VictoriaMetrics из простого хранилища метрик в полноценную платформу для наблюдаемости.
Раньше VM была «улучшенным Прометеем» и отвечала на вопрос: «Все ли в порядке?» (метрики, графики, алерты). Для
Observability нужны не только метрики, но и контекст: логи и трейсы. И VictoriaMetrics теперь закрывает все три направления (Metrics, Logs, Traces).
Основные фишки:
Для полной картины добавлена поддержка трейсинга. Это позволяет DevOps-инженерам проследить путь конкретного запроса через все микросервисы в том же интерфейсе и стеке, где лежат метрики и логи.
Когда метрики, логи и трейсы лежат в одной экосистеме, проще коррелировать данные. Например, увидеть всплеск 500-х ошибок на графике и тут же «провалиться» в соответствующие логи и трейсы.
Теперь это полноценная альтернатива тяжелым Enterprise-стекам, которая позволяет построить глубокую наблюдаемость системы.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
2 12 5 3 2
Конференция про Kubernetes для бизнеса. Разберём реальные сценарии использования, посмотрим кейсы внедрения и обсудим, какие задачи он помогает решать в современных продуктах и инфраструктуре.
Спикеры:
Дополнительно команда покажет кейс миграции на Yandex Managed Service — изменения, результаты и решённые проблемы.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Эпоха сменяется на наших глазах: легендарный MinIO официально ушел на покой, но вакуум в мире объектных хранилищ заполняется мгновенно.
25 апреля основной репозиторий MinIO на GitHub был переведен в режим архива. Проект, который долгие годы был стандартом де-факто для S3-совместимых хранилищ, официально прекратил активную разработку в своем привычном виде.
На смену приходит RustFS — опенсорсная система хранения, которая обещает не просто заменить предшественника, но и существенно превзойти его.
Если ваша инфраструктура завязана на S3-хранилищах, сейчас самое время изучить альтернативы. RustFS выглядит как прямой наследник, предлагающий безопасность памяти Rust и впечатляющий прирост IOPS там, где это нужнее всего.
Как вы думаете, станет ли RustFS новым стандартом? Ставьте реакции, чтобы выразить мнение:
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from DevOpsDays Tashkent
🔥 DevOpsDays Tashkent 2026 — Agenda is live!
📅 May 15 | 📍 INHA University, 9 Ziyolilar St, Tashkent
16 talks, 4 workshops, 18 speakers — one packed day:
🎙 Panel: AI in Production — what actually works and what breaks DevOps
☸️ Kubernetes, SRE, Gateway API, Dynamic Resource Allocation
🔭 Observability, Traffic Management, mobile CI/CD
☁️ On-prem S3, Cozystack, Managed Kubernetes, CNCF
🤖 AI Agents in DevOps, GPU infrastructure, hands-on AI workshops
Speakers from Yandex, AWS, Ericsson, EPAM, Uzum, Aenix, Uzcloud & more 🔝
Full schedule in the photos 👆
Entrance from the courtyard side 🚪 (Building B, follow the signs)
👉 Register: https://devopsdays.uz
————————————
🔥 Программа DevOpsDays Tashkent 2026 готова!
📅 15 мая | 📍 Университет ИНХА, ул. Зиёлилар, 9
16 докладов, 4 воркшопа, 18 спикеров — за один день:
🎙 Панельная дискуссия: AI уже в проде — что работает, а что ломает DevOps
☸️ Kubernetes, SRE, Gateway API, Dynamic Resource Allocation
🔭 Observability, Traffic Management, CI/CD для мобилок
☁️ S3 on-premises, Cozystack, Managed Kubernetes, CNCF
🤖 AI-агенты в DevOps, GPU-инфраструктура, ИИ-воркшопы
Спикеры из Yandex, AWS, Ericsson, EPAM, Uzum, Aenix, Uzcloud и других 🔝
Полная программа — на фото 👆
Вход в основное здание со двора 🚪 (Здание B)
👉 Регистрация: https://devopsdays.uz
#DevOpsDays #DevOpsDaysTashkent #DevOps #Kubernetes #SRE #AI
📅 May 15 | 📍 INHA University, 9 Ziyolilar St, Tashkent
16 talks, 4 workshops, 18 speakers — one packed day:
🎙 Panel: AI in Production — what actually works and what breaks DevOps
☸️ Kubernetes, SRE, Gateway API, Dynamic Resource Allocation
🔭 Observability, Traffic Management, mobile CI/CD
☁️ On-prem S3, Cozystack, Managed Kubernetes, CNCF
🤖 AI Agents in DevOps, GPU infrastructure, hands-on AI workshops
Speakers from Yandex, AWS, Ericsson, EPAM, Uzum, Aenix, Uzcloud & more 🔝
Full schedule in the photos 👆
Entrance from the courtyard side 🚪 (Building B, follow the signs)
👉 Register: https://devopsdays.uz
————————————
🔥 Программа DevOpsDays Tashkent 2026 готова!
📅 15 мая | 📍 Университет ИНХА, ул. Зиёлилар, 9
16 докладов, 4 воркшопа, 18 спикеров — за один день:
🎙 Панельная дискуссия: AI уже в проде — что работает, а что ломает DevOps
☸️ Kubernetes, SRE, Gateway API, Dynamic Resource Allocation
🔭 Observability, Traffic Management, CI/CD для мобилок
☁️ S3 on-premises, Cozystack, Managed Kubernetes, CNCF
🤖 AI-агенты в DevOps, GPU-инфраструктура, ИИ-воркшопы
Спикеры из Yandex, AWS, Ericsson, EPAM, Uzum, Aenix, Uzcloud и других 🔝
Полная программа — на фото 👆
Вход в основное здание со двора 🚪 (Здание B)
👉 Регистрация: https://devopsdays.uz
#DevOpsDays #DevOpsDaysTashkent #DevOps #Kubernetes #SRE #AI
1 8 4 2 2
Чтобы оставаться востребованным специалистом, всем нам нужно что-то подтянуть, а порой и освоить что-то новое. Большинство инженеров развиваются реактивно — обучаются в том, что требует их текущая работа. Это нормально, но не всегда эффективно. По данным World Economic Forum, 44% core скиллов обновятся к 2027 году. А это значит, что нужно думать наперед.
Как понять, что учить дальше?
Подтягиваем те навыки, в которых сомневаемся, и учимся недостающим.
Большинство скиллов, которые пригодятся в ближайшем будущем, уже упакованы в курсы. Например, на странице нашей компании есть большой выбор дисциплин, метанавыков и комплексных программ. На курсы Слёрм действует региональная скидка для подписчиков KazDevOps.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1 7 7 3
Meet-up о том, как бизнес работает с облаками на практике. Без маркетинга, только реальные кейсы, опыт и открытый разговор о сложностях, с которыми сталкиваются компании.
В программе:
Спикеры:
Для CIO и IT-директоров, топ-менеджеров, архитекторов и технических директоров.
14 мая, 15:30
Бизнес Парк Promenade, Алматы
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1 3 3 2