Мониторим ИТ
7.45K subscribers
53 photos
2 files
1.31K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Getting started with Grafana dashboard design

Сегодня в 19:30 по московскому времени Grafana проведет вебинар. На вебинаре вы узнаете:

Вы узнаете:

⚡️ Почему учет контекста приведет к улучшению дизайна дашбордов в Grafana
⚡️ Как можно создать согласованный стиль дашбордов, который будет легко доступным и красивым
⚡️ Как можно структурировать дашборды, чтобы рассказать историю
⚡️ Как оценить и улучшить существующие дашборды

Регистрация.
Zabbix Handy Tips: Collecting custom metrics with Zabbix agent user parameters

В этом видео от команды Zabbix вы узнаете, как расширить функциональность агента Zabbix и создать новые пользовательские ключи элементов данных, определив пользовательские параметры агента Zabbix. Смотреть.
List of System Monitoring Tools in Real-Time

В этой подборке: ATOP, TOP, HTOP, GLANCES, VIRT-TOP, TIPTOP, IOTOP, BASHTOP, BEPYTOP, POWERTOP, NUMATOP, DNSTOP, IFTOP, NETHOGS, LATENCY TOP, IPTRAF-NG, IPTABLES STATE (iptstate), NETSNIFF-NG, APACHE TOP, GOACCESS, INNOTOP, MYTOP, PGTOP и PGCENTER.

Читать дальше.
SREboard — A blog about SRE and DevOps

Агрегатор блогов по SRE и DevOps тематикам. Посмотреть.
My Prometheus is Overwhelmed! Help!

В этой статье разбор причин замедления работы Prometheus. Читать дальше.
Grafana variables at a glance, Environment data source explained

В этой статье описываются три логических уровня с соответствующими переменными и их назначением. Читать дальше.
Grafana OnCall — Open Source хаб для алертов и инцидентов

OnCall — это инструмент, который поможет организовать надежные оповещения/реагирование на инциденты в команде, соблюдать SLA и не просыпаться ночью от звонков.

OnCall — новичок в мире Open Source, но уже совсем не новичок как продукт. Он начался как отдельный SaaS под названием Amixr.IO несколько лет назад. Потом Amixr.IO приобрела Grafana Labs и интегрировала в свою экосистему. И вот недавно, наконец, мы смогли выложить исходный код OnCall в открытый доступ 🎉 А это значит, что он стал доступен большему кругу пользователей — и тем, кто работает в инфраструктуре без интернета, и тем, кто просто любит Open Source.

Читать дальше на Хабре.
Airflow Tutorial — Monitoring Prometheus, StatsD and Grafana

В Airflow есть предустановленный демон под названием statsd. Statsd отправляет метрики на указанный порт, и эти метрики используются для мониторинга. Читать дальше.
SRE cheat sheet

Инструменты для полной проверки работоспособности системы, администрирования баз данных, тестов производительности и ссылки на соответствующую документацию. Читать дальше.
A Quick Introduction to Top Metrics & Tools to Track the Kubernetes Observability

Ключевые метрики доступности и производительности Kubernetes. Читать дальше.
Grafana alerts as code: Get started with Terraform and Grafana Alerting

Провайдер Terraform для Grafana Alerting. Статья в блоге Grafana.
Enable Istio stats monitoring with Grafana & Prometheus

В этом посте о том, как использовать инструменты для сбора метрик istio в Prometheus и визуализировать в Grafana. Читать дальше.
Top 20 Observability Tools Every Startup Should Know About in 2022

Облачные и on-prem решения. Читать дальше.
How to Forward Kubernetes Logs to Elasticsearch (ELK) using Fluent-bit and visualize it by kibana

В этой статье рассматривается настройка сбора логов Kubernetes в Elasticsearch. Читать дальше.
Distributed Tracing for Kafka with OpenTelemetry in Python

В этой статье об Apache Kafka, OpenTelemetry и о том, как они работают вместе с практическими примерами на Python.

Вы узнаете, как включить трассировку OpenTelemetry в Python для создания наборов данных для визуализации трассировок для Kafka. Читать дальше.
MariaDB: настройка и мониторинг с помощью Zabbix

От правильной настройки и надежной работы сервера СУБД зависит работоспособность и быстродействие интернет-магазинов, работающих на сервисе SAAS. То же самое относится к любым сайтам, если им нужна база данных.

Очень часто в качестве СУБД используется MySQL или MariaDB.

Из этой статьи вы узнаете, как установить сервер MariaDB в ОС Debian 11, как оптимизировать его параметры сразу после установки и как контролировать работу MariaDB вручную и с помощью Zabbix. Читать дальше.
Репликация MySQL и MariaDB: мониторинг с помощью Zabbix

Когда к отказоустойчивости интернет-магазина или другого сервиса с базами данных предъявляются повышенные требования, не обойтись без репликации серверов СУБД и файлов. Репликация совместно с другими технологиями отказоустойчивости помогает полностью защититься от сбоя оборудования, например, от выхода из строя отдельных серверов.

Из этой статьи вы узнаете, как настроить и проверить репликацию Master-Slave для MySQL и MariaDB, а также как контролировать ее работу с помощью Zabbix. Читать дальше.
What does “ — “ (double-dash) mean in the bash shell? And the difference between arguments and options

В этой статье об использовании двойного тире «- -» в оболочке. Но перед этим давайте разберемся с проблемой, с которой я столкнулся, и как она была решена с помощью «- -». Читать дальше.
How To Monitor Your Machine With One Spectacular CLI Tool — Btop

Вы когда-нибудь задумывались, почему ваш компьютер тормозит? Btop может не дать полного ответа, но он наверняка покажет вам возможные причины. Возможно, один процесс занимает много циклов процессора, или ваш раздел подкачки заполнен. Для этого вы можете использовать такие инструменты, как ps, df или swapon, или просто использовать btop и получить все на блюдечке с голубой каемочкой. Читать дальше.