Мониторим ИТ
7.65K subscribers
103 photos
2 files
1.39K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Семь «НЕ» мониторинга ИТ-инфраструктуры

Это повтор поста почти 4-летней давности, не потерявшего актуальность и сегодня.

Пост на Хабре от представителя Сбербанка (-теха). Его советы, конечно же, расширяются на любой проект по мониторингу (не только для инфраструктуры) и при некоторой модификации на проекты внедрения вообще любого софта.

📌1. НЕ внедряйте инструмент мониторинга
📌2. Интегратор НЕ сделает за вас всей работы
📌3. НЕ путайте мониторинг и администрирование ИТ-инфраструктуры
📌4. НЕ рассчитывайте, что ваши подчиненные будут использовать мониторинг, если вы сами этого не делаете
📌5. НЕ заставляйте сотрудников работать с системой мониторинга
📌6. НЕ концентрируйтесь на проверке функциональности системы мониторинга во время ее испытаний
📌7. Мониторинг НЕ начнет приносить пользу, пока вы не начнете работать с ним и адаптировать его под свои потребности

Особенно близким оказался для меня п.7. Очень часто, когда с начала и до конца проекта у заказчика нет понимания «а кто же будет пользоваться системой», проекты заканичваются внедрением системы, которой никто не будет пользоваться. А деньги потрачены. Лол.
Диагностика и мониторинг Wi-Fi устройств в Grafana

В этой статье про опыт сбора метрик с устройств IoT (датчики потребления воды) и их передачи в единое хранилище. Читать на Хабре.
Онлайн-сервис для проверки релейбелинга в Prometheus.

https://relabeler.promlabs.com/
Визуальные интерфейсы для Clickhouse от сторонних разработчиков

Это страница документации Clickhouse. Читать.
Forwarded from /usr/bin
iperf

iperf — это инструмент для активного измерения максимально достижимой пропускной способности в IP-сетях. Он поддерживает настройку различных параметров, связанных с синхронизацией, протоколами и буферами. Для каждого теста он сообщает измеренную пропускную способность/битрейт, потери и другие параметры.

Статья с описание работы на Medium.

Репыч на Гитхабе.

@usr_bin_linux
grafana-dashboard-manager

A simple cli utility for importing or exporting dashboard json definitions using the Grafana HTTP API.

Репыч на Гитхабе.
Парочка утилит для мониторинга kubernetes

Kubenurse

kubenurse is a little service that monitors all network connections in a Kubernetes cluster. Kubenurse measures request durations, records errors and exports those metrics in Prometheus format. Репыч на Гитхабе.

Goldpinger

Goldpinger makes calls between its instances to monitor your networking. It runs as a DaemonSet on Kubernetes and produces Prometheus metrics that can be scraped, visualised and alerted on. Репыч на Гитхабе.
Performance/Load Testing with k6 +InfluxDB + Grafana on Windows

k6 — это инструмент нагрузочного тестирования с открытым исходным кодом, который предоставляет разработчикам возможности тестирования производительности API и веб-сайтов. В этой статье про использование связки k6 +InfluxDB + Grafana для целей нагрузочного тестирования. Читать дальше.
The mathematics behind monitoring

Статья про использование математических функций в Prometheus. Читать дальше.
Creating context-sensitive problem thresholds with Zabbix user macros

Пороговые схемы могут различаться для одной и той же метрики на разных конечных точках мониторинга. У вас может быть сервер, на котором наличие 10% свободного места совершенно нормально, и сервер, на котором все, что ниже 20% - критичное событие. В этом видео рассказывают как модифицировать триггеры в зависимости от контекста (системы, на которой они должны сработать).
Multi-site monitoring with HA and dynamic scale using VictoriaMetrics. A Practical guide

Это продолжение предыдущего поста What makes VictoriaMetrics the next leading choice for open-source monitoring. Цель этой статьи — рассказать, как спроектировать и развернуть многосайтовую кластерную архитектуру VictoriaMetrics в Kubernetes, которая работает на узлах Spot и On-demand и обеспечивает высокую доступность, динамическую масштабируемость, высокую производительность и экономию средств. Читать дальше.
Monitoring MySQL using Prometheus, Grafana and mysqld_exporter in Kubernetes

This is a basic guide on monitoring MySQL Database containers in a Kubernetes environment. We’ll use Prometheus and Grafana here. It is an open-source monitoring solution that is widely used in Kubernetes. Читать дальше.
Karma — единый событийный дашборд для кучи Alertmanager'ов

Агрегация, дедупликация, фильтрация и много других фич в этом полезном в хозяйстве инструменте.

Репыч на Гитхабе.
Managing Prometheus at scale with Cortex

Несколько слов про Cortex — горизонтально масштабируемое хранилище для Prometheus. Читать дальше.
The missing plugin to create business and industrial charts in Grafana

Apache ECharts — это бесплатная библиотека построения диаграмм и визуализации, предлагающая возможности создания интуитивно понятных, интерактивных и настраиваемых диаграмм. Она написана на чистом JavaScript и основана на zrender.

Панель Apache ECharts — это плагин для Grafana, который позволяет использовать библиотеку Apache ECharts в Grafana. Оригинальный плагин был разработан для Grafana 6.3/7.0 и ECharts 4.9.0. С тех пор он не поддерживается. В VolkovLabs этот плагин адаптировали к Grafana 9 и рассказывают об этом в статье на Медиуме.

Репыч на Гитхабе.
Performance testing with Iter8, now with custom metrics

Iter8 — это оптимизатор релизов приложений и моделей машинного обучения, развернутых с помощью Kubernetes, на основе метрик с открытым исходным кодом. Можно использовать Iter8 для проведения экспериментов, которые решают различные задачи, такие как сбор метрик из разных версий сервиса, проверка этих метрик на соответствие SLO, определение наиболее эффективной версии и многое другое. Читать дальше.

Репыч на Гитхабе.
Scaling Kubernetes workloads using custom Prometheus metrics

В этой статье вы узнаете про использования адаптера Prometheus для сбора метрик и передачи их в kube-api. HPA (horizontal pod autoscaler) будет использовать эти данные для принятия решений о масштабировании. Читать дальше.
Creating A Basic Load Test Infrastructure Via Using K6/Grafana/InfluxDB

В этой статье описано создание тестового окружения для тестирования производительности с помощью K6/Grafana/InfluxDB. Читать дальше.
Single Prometheus job for dozens of Blackbox exporters

Эта история не про установку экспортера Blackbox, а скорее о настройке со стороны Prometheus. Цель состоит в том, чтобы получить простую, минимальную, но гибкую конфигурацию, избегая путаницы в конфигурации Prometheus.

Представьте, что у вас есть более 20 экспортеров Blackbox в разных местах мира, которые не принадлежат ни к какому кластеру или среде, а просто работают как автономные приложения для мониторинга конечных точек из разных мест. Например, вы должны отслеживать более 100 URL-адресов из всех мест, чтобы убедиться в доступности вашего веб-сайта, задержке и т. д. Читать дальше.
How to Handle Terabytes of Metrics in Kubernetes Monitoring

Мы использовали Prometheus, Thanos и Grafana для обрабатки около 40 000 метрик, генерируемых каждую секунду. В этом посте наша команда инженеров делится некоторыми мыслями и знаниями о нашем пути по настройке мониторинга. Читать дальше.