Интересный блог Adri Villela на Медиуме. Много пишет про подход к Observability, как правильно строить этот процесс, какие инструменты использовать и т.д. Велкоме.
Medium
Adriana Villela – Medium
Read writing from Adriana Villela on Medium. DevRel | OTel End User SIG Maintainer | {CNCF, HashiCorp} Ambassador | Podcaster | Former corporate 🤖 | Speaker | Bouldering Addict | Opinions my own.
Что означает load average
Кто-то считает, что load average — это загрузка CPU в единицу времени, например, средняя загрузка: 0,51, 0,72, 0,86 означает, что загрузка CPU составляет 51% за последнюю 1 минуту. Но это не так. Средняя загрузка относится к среднему количеству процессов, находящихся в запущенном и непрерывном состоянии в единицу времени, то есть к среднему количеству активных процессов, которое не связано напрямую с использованием CPU. Читать дальше.
Кто-то считает, что load average — это загрузка CPU в единицу времени, например, средняя загрузка: 0,51, 0,72, 0,86 означает, что загрузка CPU составляет 51% за последнюю 1 минуту. Но это не так. Средняя загрузка относится к среднему количеству процессов, находящихся в запущенном и непрерывном состоянии в единицу времени, то есть к среднему количеству активных процессов, которое не связано напрямую с использованием CPU. Читать дальше.
gals.software
Что такое Load Average в Linux
Разберемся что из себя представляет понятие load average и чем оно отличается от загрузки процессора
Если Mikrotik — ваше альтер эго. По этой ссылке 55 шаблонов от Zabbix для мониторинга если не всей, то большей части моделей устройств Mikrotik. Выбирайте на свой вкус.
Federating Prometheus Effectively
Федерация позволяет Prometheus собирать временные ряды с другого сервера Prometheus. Федерацию Prometheus можно использовать для масштабирования до сотен кластеров или для переноса связанных показателей из Prometheus одного сервиса в другой. Он поддерживает иерархическую и межсервисную федерацию. В этой статье о настройке федерации серверов Prometheus.
Федерация позволяет Prometheus собирать временные ряды с другого сервера Prometheus. Федерацию Prometheus можно использовать для масштабирования до сотен кластеров или для переноса связанных показателей из Prometheus одного сервиса в другой. Он поддерживает иерархическую и межсервисную федерацию. В этой статье о настройке федерации серверов Prometheus.
Kubernetes Monitoring with Kythira
Kythira — это десктопный визуализатор и инструмент мониторинга Kubernetes с открытым исходным кодом, предназначенный для централизации мониторинга Kubernetes. Kythira опрашивает все локальные неймспейсы и представляет разработчикам информацию о текущем статусе. Kythira поддерживает интеграцию с Prometheus и Grafana. В этой статье описание инструмента.
Репыч на Гитхабе.
Kythira — это десктопный визуализатор и инструмент мониторинга Kubernetes с открытым исходным кодом, предназначенный для централизации мониторинга Kubernetes. Kythira опрашивает все локальные неймспейсы и представляет разработчикам информацию о текущем статусе. Kythira поддерживает интеграцию с Prometheus и Grafana. В этой статье описание инструмента.
Репыч на Гитхабе.
Telegram-бот мониторинга состояния серверов на Haskell
Состояние сервера необходимо постоянно мониторить, чтобы в случае ошибки быстро ее исправить. Удобнее всего отслеживать работоспособность с помощью смартфона, а именно Telegram-бота, он позволяет осуществлять проверку на ходу. Реализуем Telegram-бот на функциональном языке Haskell, заодно разберемся в его преимуществах. Читать дальше.
Состояние сервера необходимо постоянно мониторить, чтобы в случае ошибки быстро ее исправить. Удобнее всего отслеживать работоспособность с помощью смартфона, а именно Telegram-бота, он позволяет осуществлять проверку на ходу. Реализуем Telegram-бот на функциональном языке Haskell, заодно разберемся в его преимуществах. Читать дальше.
Forwarded from Elastic Stack recipes
Arkime — opensource NTA решение, которое парсит и складывает трафик в Elasticsearch и pcap’ы. Это позволяет анализировать сетевой трафик из веб-интерфейса, что очень и очень удобно. Для безопасников предусмотрена интеграция c Suricata – Arkime умеет сопоставлять алерт с сессией и отображать это в интерфейсе.
В этой статье описание работы с Arkime.
@elasticstack_ru
В этой статье описание работы с Arkime.
@elasticstack_ru
Мониторинг PHP-приложений с помощью OpenTelemetry и SigNoz
OpenTelemetry помогает генерировать и собирать данные телеметрии. Затем собранные данные необходимо отправить в инструмент анализа на бэкенде. OpenTelemetry предоставляет свободу выбора любого внутреннего инструмента, с помощью которого будет удобнее всего хранить и визуализировать данные телеметрии. А с этим нам может помочь SigNoz. Читать дальше.
OpenTelemetry помогает генерировать и собирать данные телеметрии. Затем собранные данные необходимо отправить в инструмент анализа на бэкенде. OpenTelemetry предоставляет свободу выбора любого внутреннего инструмента, с помощью которого будет удобнее всего хранить и визуализировать данные телеметрии. А с этим нам может помочь SigNoz. Читать дальше.
SRE/DevOps Interview Questions — Linux Troubleshooting
В этой статье примеры вопросов на собеседовании на должность SRE. Если хотите им стать, эти знания лишними не будут. Статью написал человек, который был как собеседуемым так собеседующим на интервью. Читать дальше.
В этой статье примеры вопросов на собеседовании на должность SRE. Если хотите им стать, эти знания лишними не будут. Статью написал человек, который был как собеседуемым так собеседующим на интервью. Читать дальше.
Квадрант Gartner 2022 года по решениям для мониторинга приложений (APM)
7 июня 2022 года вышел новый квадрант Gartner по APM-решениям. Произошло несколько изменений среди лидеров, а также наметился новый интересный тренд. Запилил статью на Хабре.
7 июня 2022 года вышел новый квадрант Gartner по APM-решениям. Произошло несколько изменений среди лидеров, а также наметился новый интересный тренд. Запилил статью на Хабре.
Monitoring your Zabbix instance health - Zabbix caches and processes, Zabbix queue and housekeeper
Zabbix состоит из компонентов, которые выполняют повседневные задачи мониторинга. Эти компоненты необходимо контролировать, выполнять правильную конфигурацию и настройку Zabbix, чтобы обеспечить бесперебойный сбор и анализ данных.
В этом видео рассмотрены основы мониторинга состояния Zabbix и его настройки в соответствии с ежедневными нагрузками.
Zabbix состоит из компонентов, которые выполняют повседневные задачи мониторинга. Эти компоненты необходимо контролировать, выполнять правильную конфигурацию и настройку Zabbix, чтобы обеспечить бесперебойный сбор и анализ данных.
В этом видео рассмотрены основы мониторинга состояния Zabbix и его настройки в соответствии с ежедневными нагрузками.
Alerts, what are they good for?
Признаки хорошего алерта:
⚡️ алерт имеет run-book / документированный план действий
⚡️ приоритет установлен соответственно влиянию
⚡️ имеет соответствующий дашборд
⚡️ метки и теги назначены правильно (владелец, служба, среда)
⚡️ маршрутизируется правильно (если это критический алерт, будет ли он правильно эскалирован)
Статья с рекомендациями по правильному алертингу.
Признаки хорошего алерта:
⚡️ алерт имеет run-book / документированный план действий
⚡️ приоритет установлен соответственно влиянию
⚡️ имеет соответствующий дашборд
⚡️ метки и теги назначены правильно (владелец, служба, среда)
⚡️ маршрутизируется правильно (если это критический алерт, будет ли он правильно эскалирован)
Статья с рекомендациями по правильному алертингу.
Организаторы ежегодной конференции по мониторингу Monitorama разместили записи прошедшего 27-29 июня 2022 года мероприятия. Записей интересных много, нужно изучать.
Смотреть.
Смотреть.
Анализ производительности с помощью Guider
Guider — это анализатор производительности.
Он предназначен для измерения, анализа, тестирования и проверки производительности систем. Устанавливается через менеджер pip.
Репыч на Гитхабе.
Guider — это анализатор производительности.
Он предназначен для измерения, анализа, тестирования и проверки производительности систем. Устанавливается через менеджер pip.
Репыч на Гитхабе.
GitHub
GitHub - iipeace/guider: Real-time Performance & Fault Detection Service Enabled by Comprehensive Built-in Command
Real-time Performance & Fault Detection Service Enabled by Comprehensive Built-in Command - iipeace/guider
Monitoror — однофайловое приложение для мониторинга, написанное на Go. Умеет работать на Linux, macOS, WIndows.
Репыч на Гитхабе.
Демо.
Репыч на Гитхабе.
Демо.
Percona Monitoring and Management
An open source database monitoring, observability and management tool
Это бесплатный инструмент для мониторинга различных БД. Поддерживаются MySQL, MongoDB, PostgreSQL, Amazon Aurora/RDS, ProxySQL, Percona XtraDB Cluster. Под капотом легко угадывается Grafana.
Посмотреть демо.
Документация.
Установка.
An open source database monitoring, observability and management tool
Это бесплатный инструмент для мониторинга различных БД. Поддерживаются MySQL, MongoDB, PostgreSQL, Amazon Aurora/RDS, ProxySQL, Percona XtraDB Cluster. Под капотом легко угадывается Grafana.
Посмотреть демо.
Документация.
Установка.
New in Grafana 9: The Prometheus query builder makes writing PromQL queries easier
Когда Grafana была запущена в 2014 году, ее главной целью было стать отличным решением для создания дашбордов Graphite. Примерно в то же время начал набирать обороты проект Prometheus, но было неясно, стоит ли его добавлять в Grafana. В конце концов, Grafana была интерфейсом Graphite, в то время было неясно, станет ли Prometheus популярным, и это отнимет ресурсы у основной цели создания Grafana.
Для Graphite и SQL у Grafana уже был построитель запросов. Теперь пришло время и Prometheus. Перенестись в блог Grafana и читать дальше.
Когда Grafana была запущена в 2014 году, ее главной целью было стать отличным решением для создания дашбордов Graphite. Примерно в то же время начал набирать обороты проект Prometheus, но было неясно, стоит ли его добавлять в Grafana. В конце концов, Grafana была интерфейсом Graphite, в то время было неясно, станет ли Prometheus популярным, и это отнимет ресурсы у основной цели создания Grafana.
Для Graphite и SQL у Grafana уже был построитель запросов. Теперь пришло время и Prometheus. Перенестись в блог Grafana и читать дальше.