Мониторим ИТ

cdebug — нож швейцарской армии для отладки работы контейнеров

С помощью этого инструмента вы можете:

⚡️Устранять неполадки в контейнерах, для которых нет системной оболочки и/или инструментов отладки

⚡️Перенаправлять неопубликованные или даже локальные порты на хост-систему

⚡️Открывать конечные точки из хост-системы для контейнеров и сетей Kubernetes

⚡️Удобно экспортировать файловую систему образа и/или контейнера в локальные папки

⚡️и многое другое

Репыч на Гитхабе

2.3K views06:30

Мониторим ИТ

Monitoring benchmark: how to generate 100 million samples/s of production-like data (статья из блога Victoria Metrics)

Не смотря на то, что VictoriaMetrics может обрабатывать данные со скоростью 100 миллионов событий в секунду для одного миллиарда активных временных рядов, эталонный инструмент, используемый для создания такой нагрузки, обычно упускается из виду. В этой статье рассказывается о проблемах масштабирования инструмента prometheus-benchmark для создания такой нагрузки. Читать дальше.

3.84K views12:30

Мониторим ИТ

How to Monitor the Kubelet

Мониторинг Kubelet необходим при работе Kubernetes в проде. Kubelet—- это важная служба в кластере Kubernetes.

Этот компонент Kubernetes отвечает за обеспечение работоспособности и здоровья контейнеров, определенных в Pods. Как только планировщик назначает узел для запуска Pod, Kubelet принимает это назначение и запускает Pod. В этой статье рассказывается о том, как контролировать Kubelet и каковы наиболее важные метрики Kubelet. Читать дальше.

2.38K views06:30

Мониторим ИТ

How to monitor Istio, the Kubernetes service mesh

Istio service mesh добавляет такие ключевые возможности, как наблюдаемость, безопасность и управление трафиком, в приложения без необходимости вносить изменения в код или конфигурацию. В этой статье рассказывается об основных концепциях Istio. Вы узнаете, какие метрики наиболее интересны для мониторинга Istio. Кроме того, узнаете о наборе инструментов, необходимых для управления Istio и проверки того, что находится под капотом.

В статье рассматриваются следующие темы:

⚡️Что такое Istio?
⚡️Обзор Istio
⚡️Как контролировать Istio с помощью Prometheus
⚡️Дашборды Grafana для Istio
⚡️Что такое Kiali?
⚡️Что такое Jaeger?

Читать дальше.

3.2K views12:30

Мониторим ИТ

json_exporter

Экспортер Prometheus, который забирает JSON в формате JSONPath.

Проверка конфигурации JSONPath, поддерживаемой экспортером

Каталог примеров для примера конфигурации экспортера, конфигурации prometheus и ожидаемого формата данных.

Репыч на Гитхабе

3.47K views10:05

Мониторим ИТ

Что должен знать каждый SRE о внутреннем устройстве оболочки GNU/Linux: файловые дескрипторы, каналы, терминалы, пользовательские сессии, группы процессов и демоны

Несмотря на эру контейнеров, виртуализации и растущего числа пользовательских интерфейсов всех видов, SRE часто проводят значительную часть своего времени в оболочках GNU/Linux. Это может быть отладка, тестирование, разработка или подготовка новой инфраструктуры. Это может быть старый добрый bash, более новый и модный zsh, или даже fish или tcsh с их интересными и уникальными возможностями.

В этой статье показаны примеры пайплайнов, файловых дескрипторов, оболочек, терминалов, процессов, заданий и сигналов, как все они взаимодействуют друг с другом для создания простой и надежной среды. И все это будет показано в контексте ядра Linux, его внутренних компонентов, а также различных инструментов и подходов к отладке. Читать дальше.

4.23K views12:30

Мониторим ИТ

Мониторинг HTTP и SSL через Prometheus blackbox_exporter

Опыт наладки мониторинга статус-кодов ответов web-сервисов, а также сроков действия SSL-сертификатов. Читать дальше на Хабре.

2.63K views06:00

Мониторим ИТ

Экономный APM для backend или как использовать Loki+Grafana+логи приложения для APM

Решено было использовать логи приложения из nginx и сервера приложения (php-fpm в данном случае), отправляемые в loki, для складирования агрегированной информации по запросам-ответам, которые потому будут агрегированы grafana+loki и по которым будут построены графики. Читать дальше на Хабре.

2.44K views12:30

Мониторим ИТ

How We Improved Our Monitoring Stack With Only a Few Small Changes

В этом посте рассказ о процессе совершенствования системы мониторинга в компании Riskified (на примере улучшений в Prometheus). Читать дальше.

2.3K views06:00

Мониторим ИТ

OpenTelemetry — Understanding SLI and SLO with OpenTelemetry Demo

Даже если вы не предполагаете, что вам не нужны или даже не используете Service Level Objectives (SLO), вы так или иначе используете их. В этой статье на примере приложения электронной коммерции из OpenTelemetry Demo показан анализ и визуализация реального сценария с использованием SLIs и SLOs. Читать дальше.

2.54K views12:30

Мониторим ИТ

Monitoring Kubernetes layers: Key metrics to know

Метрики Kubernetes можно извлекать из службы kube-state-metrics, которая слушает сервер Kubernetes control plane/API и генерирует метрики о задействованных ресурсах или объектах. Как и в случае с другими видами мониторинга, можно использовать собранную информацию для оповещения команды о том, что происходит внутри системы. Создание алертов по определенным метрикам также может предупредить о приближающихся сбоях, что поможет сократить время решения проблемы. В этой статье в блоге Grafana разобраны 5 типов метрик k8s, которые рекомендуется отслеживать. Читать дальше.

3.93K views06:00

Мониторим ИТ

Analyzing Kubernetes Traffic with Kubeshark

Kubeshark — это веб-инструмент, который позволяет захватывать и анализировать сетевой трафик в кластере Kubernetes. Он интегрируется с Wireshark, фильтровать и анализировать сетевые пакеты в режиме реального времени. Kubeshark также предоставляет удобный интерфейс для визуализации сетевого трафика, облегчая понимание сетевых потоков и выявление потенциальных проблем.

Kubeshark построен на базе Cilium, Kubernetes-нативной сетевой платформы и платформы безопасности, которая обеспечивает расширенные возможности применения сетевых политик и наблюдения. Cilium использует технологию eBPF для перехвата сетевого трафика на уровне ядра, что обеспечивает низкоуровневую видимость сетевых потоков без значительных накладных расходов на кластер. Читать статью.

Репыч на Гитхабе.

3.35K views13:00

Мониторим ИТ

How to find unused Prometheus metrics using mimirtool

В этой статье рассказывается, как с помощью mimirtool определить, какие метрики используются Prometheus, а какие нет. Читать дальше.

Medium

How to find unused Prometheus metrics using mimirtool

In this article, I will explain how I used mimirtool to identify which metrics were used on the platform, and which wasn’t.

3.29K viewsedited 10:44

Мониторим ИТ

В сервис добавили сканер уязвимостей в Yandex Container Registry

Платформа Yandex Cloud открыла общий доступ к сканеру, который до этого был доступен только в режиме превью.

С помощью него вы можете:

— проводить анализ контейнерных образов на предмет уязвимостей;
— использовать крупнейшую базу уязвимостей;
— сканировать образы при непрерывном развёртывании приложений;
— создавать CI-сценарии для проверки безопасности.

Из нового — теперь можно сканировать контейнерные образы автоматически при загрузке.

Сканер уязвимостей работает только с образами из Container Registry.

Подробнее о сканере уязвимостей ➡️

2.3K viewsedited 14:00

Мониторим ИТ

Prometheus’ performance and cardinality in practice

В этой статье рассказано, как я проанализировать и настроить Prometheus, чтобы значительно снизить использование ресурсов. Читать дальше.

3.38K views16:00

Мониторим ИТ

Unpacking Observability: The Observability Stack

"Наш текущий стек Observability выглядит как набор различных продуктов с открытым исходным кодом, в результате того, что команда X хотела использовать инструмент A, а команда Y хотела использовать инструмент B. В итоге мы получили стек, включающий кучу различных инструментов, собранных вместе в надежде обеспечить Observability. В последний год или около того я внимательно следил за развитием Observability, и я был уверен, что мы можем уменьшить этот стек в разы."

В этой статье разбирается кейс уменьшения набора решений для Observability. Читать дальше.

2.36K views06:00

Мониторим ИТ

An overview of metrics in Prometheus

В этой статье вы найдете обзор типов метрик, которые есть в Prometheus, включая назначение каждого типа метрик. Читать дальше.

2.31K views13:00

Мониторим ИТ

Grafana Alerting: Searching for Grafana alerts just got faster, easier, and more accurate

Управление сотнями, если не тысячами, правил оповещения в Grafana является обычным явлением и становится все более нетривиальным для пользователей.

Чтобы решить эту проблему, в Grafana внедрена поисковая система, призванная помочь пользователям быстро выполнять поиск по оповещениям и упростить управление большим количеством правил и сложными воркфлоу. Читать дальше.

2.27K views06:00

Мониторим ИТ

26 апреля вышла Grafana 9.5

В этом посте рассмотрим пару ключевых улучшений.

Обновление алертов

В Grafana Alerting появился поиск правил оповещения для нескольких источников данных, доступ к правилам оповещений непосредственно из дашбордов, а также переход к соответствующим дашбордам или панели управления правилами оповещения. Также внесены обновления в настройки правил оповещения и политики уведомлений, которые помогают уменьшить количество шумовых оповещений.

Появились саппорт бандлы

Теперь можно быстро собрать набор файлов с настройками Grafana для того, чтобы, например, поделиться ими с коллегами.

и несколько других улучшений. Читать в блоге Grafana.

4.55K views13:00

Мониторим ИТ

Integrate Zabbix with your data pipelines by configuring real-time metric and event streaming

До версии 6.4 метрики можно было экспортировать в файлы в формате JSON. С выходом Zabbix 6.4 метрики, собранные Zabbix, и события, сгенерированные на основе триггеров, могут быть переданы во внешние системы с помощью новой функции потоковой передачи метрик и событий в режиме реального времени. Чтобы передавать только необходимые метрики или события, их можно фильтровать по тегам. Данные передаются в формате JSON. Самый, наверное, популярный use case этой новой функции может заключаться в передаче исторических данных во внешние озера данных для целей аналитики, машинного обучения и прочих модных слов.

Читать статью в блоге Zabbix.

❤1

2.82K views06:00

About

Blog

Apps

Platform