Мониторим ИТ
7.41K subscribers
49 photos
2 files
1.29K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Интересный блог Adri Villela на Медиуме. Много пишет про подход к Observability, как правильно строить этот процесс, какие инструменты использовать и т.д. Велкоме.
Что означает load average

Кто-то считает, что load average — это загрузка CPU в единицу времени, например, средняя загрузка: 0,51, 0,72, 0,86 означает, что загрузка CPU составляет 51% за последнюю 1 минуту. Но это не так. Средняя загрузка относится к среднему количеству процессов, находящихся в запущенном и непрерывном состоянии в единицу времени, то есть к среднему количеству активных процессов, которое не связано напрямую с использованием CPU. Читать дальше.
Если Mikrotik — ваше альтер эго. По этой ссылке 55 шаблонов от Zabbix для мониторинга если не всей, то большей части моделей устройств Mikrotik. Выбирайте на свой вкус.
Максимальный таймаут для скриптов в Zabbix - 30 секунд. Если нужно больше, то выход - это использование Zabbix Trapper. Вот и статья соответствующая есть. Ссылка.
Federating Prometheus Effectively

Федерация позволяет Prometheus собирать временные ряды с другого сервера Prometheus. Федерацию Prometheus можно использовать для масштабирования до сотен кластеров или для переноса связанных показателей из Prometheus одного сервиса в другой. Он поддерживает иерархическую и межсервисную федерацию. В этой статье о настройке федерации серверов Prometheus.
Kubernetes Monitoring with Kythira

Kythira — это десктопный визуализатор и инструмент мониторинга Kubernetes с открытым исходным кодом, предназначенный для централизации мониторинга Kubernetes. Kythira опрашивает все локальные неймспейсы и представляет разработчикам информацию о текущем статусе. Kythira поддерживает интеграцию с Prometheus и Grafana. В этой статье описание инструмента.

Репыч на Гитхабе.
Telegram-бот мониторинга состояния серверов на Haskell

Состояние сервера необходимо постоянно мониторить, чтобы в случае ошибки быстро ее исправить. Удобнее всего отслеживать работоспособность с помощью смартфона, а именно Telegram-бота, он позволяет осуществлять проверку на ходу. Реализуем Telegram-бот на функциональном языке Haskell, заодно разберемся в его преимуществах. Читать дальше.
Forwarded from Elastic Stack recipes
Arkime — opensource NTA решение, которое парсит и складывает трафик в Elasticsearch и pcap’ы. Это позволяет анализировать сетевой трафик из веб-интерфейса, что очень и очень удобно. Для безопасников предусмотрена интеграция c Suricata – Arkime умеет сопоставлять алерт с сессией и отображать это в интерфейсе.

В этой статье описание работы с Arkime.

@elasticstack_ru
Мониторинг PHP-приложений с помощью OpenTelemetry и SigNoz

OpenTelemetry помогает генерировать и собирать данные телеметрии. Затем собранные данные необходимо отправить в инструмент анализа на бэкенде. OpenTelemetry предоставляет свободу выбора любого внутреннего инструмента, с помощью которого будет удобнее всего хранить и визуализировать данные телеметрии. А с этим нам может помочь SigNoz. Читать дальше.
SRE/DevOps Interview Questions — Linux Troubleshooting

В этой статье примеры вопросов на собеседовании на должность SRE. Если хотите им стать, эти знания лишними не будут. Статью написал человек, который был как собеседуемым так собеседующим на интервью. Читать дальше.
Квадрант Gartner 2022 года по решениям для мониторинга приложений (APM)

7 июня 2022 года вышел новый квадрант Gartner по APM-решениям. Произошло несколько изменений среди лидеров, а также наметился новый интересный тренд. Запилил статью на Хабре.
Monitoring your Zabbix instance health - Zabbix caches and processes, Zabbix queue and housekeeper

Zabbix состоит из компонентов, которые выполняют повседневные задачи мониторинга. Эти компоненты необходимо контролировать, выполнять правильную конфигурацию и настройку Zabbix, чтобы обеспечить бесперебойный сбор и анализ данных.

В этом видео рассмотрены основы мониторинга состояния Zabbix и его настройки в соответствии с ежедневными нагрузками.
Alerts, what are they good for?

Признаки хорошего алерта:

⚡️ алерт имеет run-book / документированный план действий

⚡️ приоритет установлен соответственно влиянию

⚡️ имеет соответствующий дашборд

⚡️ метки и теги назначены правильно (владелец, служба, среда)

⚡️ маршрутизируется правильно (если это критический алерт, будет ли он правильно эскалирован)

Статья с рекомендациями по правильному алертингу.
Организаторы ежегодной конференции по мониторингу Monitorama разместили записи прошедшего 27-29 июня 2022 года мероприятия. Записей интересных много, нужно изучать.

Смотреть.
Анализ производительности с помощью Guider

Guider — это анализатор производительности.
Он предназначен для измерения, анализа, тестирования и проверки производительности систем. Устанавливается через менеджер pip.

Репыч на Гитхабе.
Monitoror — однофайловое приложение для мониторинга, написанное на Go. Умеет работать на Linux, macOS, WIndows.

Репыч на Гитхабе.

Демо.
Percona Monitoring and Management

An open source database monitoring, observability and management tool

Это бесплатный инструмент для мониторинга различных БД. Поддерживаются MySQL, MongoDB, PostgreSQL, Amazon Aurora/RDS, ProxySQL, Percona XtraDB Cluster. Под капотом легко угадывается Grafana.

Посмотреть демо.

Документация.

Установка.
New in Grafana 9: The Prometheus query builder makes writing PromQL queries easier

Когда Grafana была запущена в 2014 году, ее главной целью было стать отличным решением для создания дашбордов Graphite. Примерно в то же время начал набирать обороты проект Prometheus, но было неясно, стоит ли его добавлять в Grafana. В конце концов, Grafana была интерфейсом Graphite, в то время было неясно, станет ли Prometheus популярным, и это отнимет ресурсы у основной цели создания Grafana.

Для Graphite и SQL у Grafana уже был построитель запросов. Теперь пришло время и Prometheus. Перенестись в блог Grafana и читать дальше.
SysMonTask — простой десктопный мониторинг производительности Linux-системы.

Репыч на Гитхабе.