Мониторим ИТ
7.66K subscribers
103 photos
2 files
1.39K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Top PostgreSQL monitoring metrics for Prometheus – Includes cheat sheet

В этой статье вы узнаете о 10 основных метриках мониторинга PostgreSQL с примерами алертов как для экземпляров PostgreSQL в Kubernetes, так и для экземпляров AWS RDS PostgreSQL. Читать дальше.
NGINX Monitoring: Best Tools and Key Metrics You Should Know About

В этой статье вы узнаете об основных метриках NGINX, которые нужно измерять, и о инструментах мониторинга, которые могут помочь повысить производительность веб-сервера. Читать дальше.
End-to-end tracing with OpenTelemetry

Мониторинг — это только начало пути. Когда запросы или вызовы начинают массово отказывать, вам нужно агрегированное представление по всем компонентам. Это называется отслеживанием и является одним из столпов наблюдаемости; два других — это метрики и логи.

В этом посте я сосредоточусь исключительно на трассировках и опишу, как вы можете начать свой путь к наблюдаемости. Читать дальше.
Monika

Моника, моника, поиграем в слоника. Monika — это утилита, работающая из командной строки, для синтетического мониторинга с помощью простого файла конфигурации JSON. Репыч на Гитхабе.

Monika можно подключить к Prometheus. Статья на Медиум.
Uptime Kuma

Аптайм-мониторинг веб-страниц и веб-приложений, написанный на NodeJs. Репыч на Гитхабе.

Описание и принцип работы на Медиум.
COMPLETE DEVOPS ROADMAP

Становимся девопсом за несколько шагов:

⚡️изучаем языки программирования

⚡️изучаем операционные системы

⚡️изучаем сетевую безопасность и сетевые протоколы

⚡️приходим к пониманию iaaC

⚡️изучаем инструменты и процессы CI/CD

⚡️ изучаем инструменты мониторинга инфраструктуры и приложений

⚡️ изучаем облачные инструменты

Поздравляю, вы девопс! А теперь подробнее.
Observable Kubernetes Cluster Using Grafana-Loki-Prometheus

How-to гайд.
Jaeger Tracing: The Ultimate Guide

В этой статье вы узнаете, что такое Jaeger, что такое распределенная трассировка и как ее настроить. Будет рассмотрен пользовательский интерфейс Jaeger и расширенные концепции, таких как выборка и развертывание в продуктиве.

В результате вы узнаете как создавать наборы данных с помощью OpenTelemetry и отправлять их в Jaeger для визуализации. С нуля. Читать дальше.
Optimizing Linkerd Metrics in Prometheus

Linkerd — это решение класса service mesh с идеологией «делай меньше, но лучше». У него есть расширение Viz, которое предоставляет собственную панель мониторинга для отображения ланных в реальном времени и Grafana с предварительно настроенными панелями мониторинга для анализа исторических данных. Все информационные панели используют Prometheus в качестве серверной части для обработки, хранения и запроса метрик. Читать дальше.
Getting started with Grafana dashboard design

Сегодня в 19:30 по московскому времени Grafana проведет вебинар. На вебинаре вы узнаете:

Вы узнаете:

⚡️ Почему учет контекста приведет к улучшению дизайна дашбордов в Grafana
⚡️ Как можно создать согласованный стиль дашбордов, который будет легко доступным и красивым
⚡️ Как можно структурировать дашборды, чтобы рассказать историю
⚡️ Как оценить и улучшить существующие дашборды

Регистрация.
Zabbix Handy Tips: Collecting custom metrics with Zabbix agent user parameters

В этом видео от команды Zabbix вы узнаете, как расширить функциональность агента Zabbix и создать новые пользовательские ключи элементов данных, определив пользовательские параметры агента Zabbix. Смотреть.
List of System Monitoring Tools in Real-Time

В этой подборке: ATOP, TOP, HTOP, GLANCES, VIRT-TOP, TIPTOP, IOTOP, BASHTOP, BEPYTOP, POWERTOP, NUMATOP, DNSTOP, IFTOP, NETHOGS, LATENCY TOP, IPTRAF-NG, IPTABLES STATE (iptstate), NETSNIFF-NG, APACHE TOP, GOACCESS, INNOTOP, MYTOP, PGTOP и PGCENTER.

Читать дальше.
SREboard — A blog about SRE and DevOps

Агрегатор блогов по SRE и DevOps тематикам. Посмотреть.
My Prometheus is Overwhelmed! Help!

В этой статье разбор причин замедления работы Prometheus. Читать дальше.
Grafana variables at a glance, Environment data source explained

В этой статье описываются три логических уровня с соответствующими переменными и их назначением. Читать дальше.
Grafana OnCall — Open Source хаб для алертов и инцидентов

OnCall — это инструмент, который поможет организовать надежные оповещения/реагирование на инциденты в команде, соблюдать SLA и не просыпаться ночью от звонков.

OnCall — новичок в мире Open Source, но уже совсем не новичок как продукт. Он начался как отдельный SaaS под названием Amixr.IO несколько лет назад. Потом Amixr.IO приобрела Grafana Labs и интегрировала в свою экосистему. И вот недавно, наконец, мы смогли выложить исходный код OnCall в открытый доступ 🎉 А это значит, что он стал доступен большему кругу пользователей — и тем, кто работает в инфраструктуре без интернета, и тем, кто просто любит Open Source.

Читать дальше на Хабре.
Airflow Tutorial — Monitoring Prometheus, StatsD and Grafana

В Airflow есть предустановленный демон под названием statsd. Statsd отправляет метрики на указанный порт, и эти метрики используются для мониторинга. Читать дальше.
SRE cheat sheet

Инструменты для полной проверки работоспособности системы, администрирования баз данных, тестов производительности и ссылки на соответствующую документацию. Читать дальше.
A Quick Introduction to Top Metrics & Tools to Track the Kubernetes Observability

Ключевые метрики доступности и производительности Kubernetes. Читать дальше.
Grafana alerts as code: Get started with Terraform and Grafana Alerting

Провайдер Terraform для Grafana Alerting. Статья в блоге Grafana.