Что нового в плане мониторинга в PostgreSQL (Алексей Лесовский)
Расшифровка доклада Алексея Лесовского про то, что нового есть в PostgreSQL в плане мониторинга. Читать на Хабре.
Расшифровка доклада Алексея Лесовского про то, что нового есть в PostgreSQL в плане мониторинга. Читать на Хабре.
How to reduce your Prometheus cost
Пишут как снизили количество инжестируемых метрик в Prometheus. Читать на Медиуме.
Пишут как снизили количество инжестируемых метрик в Prometheus. Читать на Медиуме.
How Prometheus Operator facilitates Prometheus configuration updates
The goal: Update Prometheus configuration nicely! Читать дальше на Медиуме.
The goal: Update Prometheus configuration nicely! Читать дальше на Медиуме.
Using Environment Variables for Configuration, Provisioning, and Dashboards in Grafana
The number of use cases operating Grafana as a platform to build modern applications is increasing. Compared to a single central Grafana instance, we are looking at multiple distributed installations with new kinds of data sources. Читать дальше на Медиуме.
The number of use cases operating Grafana as a platform to build modern applications is increasing. Compared to a single central Grafana instance, we are looking at multiple distributed installations with new kinds of data sources. Читать дальше на Медиуме.
Обход аутентификации и способы выполнения произвольного кода в ZABBIX
В этой статье мы поговорим о некоторых атаках на систему мониторинга Zabbix и рассмотрим сценарии удаленного выполнения кода (RCE). Дальше на Хабре.
В этой статье мы поговорим о некоторых атаках на систему мониторинга Zabbix и рассмотрим сценарии удаленного выполнения кода (RCE). Дальше на Хабре.
Grafana и автотесты: учимся измерять работу тестов
Grafana позволяет собрать на одном экране разную информацию:
⚡️результаты тестов в режиме реального времени,
⚡️срезы по окружениям, браузерам и чему угодно ещё,
⚡️скорость выполнения тестов,
⚡️покрытие тестами страниц и действий на них,
⚡️результаты релизов.
На примерах тестов вы узнаете, как Grafana помогает в анализе результатов автотестирования, чтобы точнее понимать, что происходит. Читать дальше на Хабре.
Grafana позволяет собрать на одном экране разную информацию:
⚡️результаты тестов в режиме реального времени,
⚡️срезы по окружениям, браузерам и чему угодно ещё,
⚡️скорость выполнения тестов,
⚡️покрытие тестами страниц и действий на них,
⚡️результаты релизов.
На примерах тестов вы узнаете, как Grafana помогает в анализе результатов автотестирования, чтобы точнее понимать, что происходит. Читать дальше на Хабре.
Installing Grafana plugins from a Private repository
Grafana Marketplace application is one of our favorite features introduced in Grafana 8. It allows installing registered plugins from the official Grafana repository when connected to the Internet, but how to upgrade and manage Grafana plugins without access to external network? Читать дальше.
Grafana Marketplace application is one of our favorite features introduced in Grafana 8. It allows installing registered plugins from the official Grafana repository when connected to the Internet, but how to upgrade and manage Grafana plugins without access to external network? Читать дальше.
How we scaled our new Prometheus TSDB Grafana Mimir to 1 billion active series
Полторы недели назад Grafana анонсировала собственную TSDB Mimir, и вот теперь рассказывает как они затестили Mimir с миллиардом серий данных.
Блог Grafana
Полторы недели назад Grafana анонсировала собственную TSDB Mimir, и вот теперь рассказывает как они затестили Mimir с миллиардом серий данных.
Блог Grafana
How relabeling in Prometheus works
Relabeling is a powerful tool that allows you to classify and filter Prometheus targets and metrics by rewriting their label set. Блог Grafana.
Relabeling is a powerful tool that allows you to classify and filter Prometheus targets and metrics by rewriting their label set. Блог Grafana.
Grafana Labs
How relabeling in Prometheus works | Grafana Labs
Relabeling in Prometheus is a powerful tool that allows you to classify and filter targets and metrics.
How summary metrics work in Prometheus
A summary is a metric type in Prometheus that can be used to monitor latencies (or other distributions like request sizes). For example, when you monitor a REST endpoint you can use a summary and configure it to provide the 95th percentile of the latency. If that percentile is 120ms that means that 95% of the calls were faster than 120ms, and 5% were slower. Читать дальше.
A summary is a metric type in Prometheus that can be used to monitor latencies (or other distributions like request sizes). For example, when you monitor a REST endpoint you can use a summary and configure it to provide the 95th percentile of the latency. If that percentile is 120ms that means that 95% of the calls were faster than 120ms, and 5% were slower. Читать дальше.
Упрощаем мониторинг и управление контейнерами Docker при помощи инструментов CLI
Dockly, Dive, Ctop, Dry, Lazy Docker, Poco, Sen и Skopeo.
Dockly, Dive, Ctop, Dry, Lazy Docker, Poco, Sen и Skopeo.
Intro to metrics with Grafana: Prometheus, Grafana Mimir, Graphite, and beyond
Вебинар завтра в 19:30 МСК. Регистрация.
Вебинар завтра в 19:30 МСК. Регистрация.
Grafana Labs
Intro to metrics with Grafana: Prometheus, Grafana Mimir, and beyond | Grafana Labs
In this webinar, we’ll go over challenges when scaling metrics systems, with a particular focus on Prometheus and Grafana Mimir.
How to drop and delete metrics in Prometheus
Keeping your Prometheus optimized can be a tedious task over time, but it’s essential in order to maintain the stability of it and also to keep the cardinality under control. Identifying the unnecessary metrics at source, deleting the existing unneeded metrics from your TSDB regularly will keep your Prometheus storage & performance intact.
In this article we’ll look at both identifying, dropping them at source and deleting the already stored metrics from Prometheus.
Читать дальше на Медиуме.
Keeping your Prometheus optimized can be a tedious task over time, but it’s essential in order to maintain the stability of it and also to keep the cardinality under control. Identifying the unnecessary metrics at source, deleting the existing unneeded metrics from your TSDB regularly will keep your Prometheus storage & performance intact.
In this article we’ll look at both identifying, dropping them at source and deleting the already stored metrics from Prometheus.
Читать дальше на Медиуме.
Культура postmortems или как мы учимся на ̶с̶в̶о̶и̶х̶ факапах
Где-то три года назад я выступал на небольшом митапе с темой, которая вынесена в название этой статьи. В том докладе я рассказывал о том, как мы за несколько лет выстроили работу с инцидентами у себя в привлечении Tinkoff. Ну и чтобы доклад был не таким скучным я поделился несколькими postmortems, которые произошли в командах “моего друга”. Читать дальше.
Где-то три года назад я выступал на небольшом митапе с темой, которая вынесена в название этой статьи. В том докладе я рассказывал о том, как мы за несколько лет выстроили работу с инцидентами у себя в привлечении Tinkoff. Ну и чтобы доклад был не таким скучным я поделился несколькими postmortems, которые произошли в командах “моего друга”. Читать дальше.
Calculating composite SLA
How to serial and parallel dependencies affect the total SLA. Читать дальше.
How to serial and parallel dependencies affect the total SLA. Читать дальше.
15 months of 24x7 Primary On-Call — Here’s How I Survived
I just finished 15 months of primary 24x7 on call. Although it is always stressful to be paged in the middle of the night or on a weekend or holiday I was able to lean on my SRE background to ensure that every alert that woke me up faithfully indicated a critical issue with our system and required human intervention. Here’s how I did it. Читать дальше.
I just finished 15 months of primary 24x7 on call. Although it is always stressful to be paged in the middle of the night or on a weekend or holiday I was able to lean on my SRE background to ensure that every alert that woke me up faithfully indicated a critical issue with our system and required human intervention. Here’s how I did it. Читать дальше.