Мониторим ИТ
7.58K subscribers
110 photos
2 files
1.4K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Deploying a Modern Monitoring Stack (Part 1)

В этой статье описание типовой инсталляции: OpenTelemetry, Thanos, Grafana (+AlertManager). Читать дальше.
Understanding Prometheus Metrics

Если задались вопросом «а какие типы метрик есть в Prometheus», в этой статье есть ответ. Читать дальше.
How To Monitor a Spring Boot App With Prometheus and Grafana

Пошаговый гайд по настройке мониторинга Spring Boot App при помощи Prometheus и Grafana. Читать дальше.
Distributed Logging and Tracing with Spring Boot 3 and Kafka

В этой статье рассказано о о распределенной трассировке в микросервисах Kafka. В статье приводится подробный пример подключения Micrometer и Brave в приложениях Spring Boot 3 Kafka для обеспечения распределенной трассировки и корреляции с логами. Читать дальше.

Brave и Micrometer — решения с открытым исходным кодом.

Репыч Brave на Гитхабе

Репыч Micrometer на Гитхабе
How To Create DevOps Tooling Strategy

Советы по выбору DevOps-инструментов. Читать дальше.
Create alerts for OpenShift user workload

Начиная с OpenShift 4.6, мониторинг нагрузки на кластер официально поддерживается путем добавления второго экземпляра Prometheus в новом пространстве имен openshift-user-workload-monitoring. В этой статье описано, как можно отслеживать нагрузку и создавать оповещения. Читать дальше.
Reduce compliance TCO by using Grafana Loki for non-SIEM logs

В этой статье обсуждаются решения, используемые компаниями для решения проблемы соответствия нормативным требованиям, а также то, в чем эти инструменты не подходят компаниям, которые хотят эффективнее работать с логами. Далее вы узнаете почему Grafana Loki можно сделать ключевым элементом стратегии соответствия нормативным требованиям. Читать дальше.
OpenTelemetry Up and Running

Как устроено решение OpenTelemetry и как при помощи него настроить трейсинг вызовов — обзорная статья. Читать дальше.
Log Management and Distributed Tracing using Grafana Loki and Tempo

Воркшоп по разворачиванию всего перечисленного в кластере Kubernetes. Читать дальше.
A Step-by-Step Guide to Calculating SLAs, SLIs, and SLOs for Your IT Services

Соглашения об уровне обслуживания (SLA), показатели уровня обслуживания (SLI) и цели уровня обслуживания (SLO) — это критически важные метрики для измерения производительности и надежности ИТ-услуг. Эти показатели дают ценную информацию о качестве обслуживания клиентов и помогают командам определить области для улучшения. В этой статье представлено пошаговое руководство по расчету SLA, SLI и SLO для ИТ-услуг на примере приложения электронной коммерции на базе микросервисов. Читать дальше.
👍2
ИТ-мониторинг ДОМ.РФ: от идеи к рабочему инструменту

История допиливания плагина Status Panel для Grafana до соответствия требованиям. Читать на Хабре.
@golanglibrary - книги и статьи по Go.
Подключаем VictoriaMetrics в Deckhouse и настраиваем уведомления в Telegram

В статье рассмотрено, как в Kubernetes-кластере под управлением Deckhouse удобно и быстро настраивать мониторинг с уведомлениями в Telegram. VictoriaMetrics в этом случае используется для хранения метрик, Grafana для отображения и алертинга. Читать дальше.
How to find unused Prometheus metrics using mimirtool

Недавно перед автором этой статьи встала задача стабилизировать, отследить проблемы и значительно снизить потребление ресурсов системой Prometheus. В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать дальше.
Grafana Dashboard for Pgbouncer And Monitor With Percona PMM

Pgbouncer — приложение-пулер соединений, которое используется в среде PostgreSQL. Он легкий, при этом обрабатывает множество соединений. Pgbouncer имеет несколько встроенных таблиц (или представлений) для просмотра текущего состояния и исторических данных. Не совсем удобно выполнять запросы к этим данным через командную строку. Многие слышали об инструменте мониторинга Percona PMM. Это инструмент мониторинга с открытым исходным кодом для MySQL, PostgreSQL и MongoDB. У PMM, к сожалению, нет собственного агента для pgbouncer. В этой статье разобрано создание двух экспортеров Prometheus для pgbouncer. Читать дальше.

Расскажите какую систему мониторинга для PostgreSQL вы используете в вашем окружении. Можно тапнуть на кнопку или рассказать подробно в комментариях.
2624 упражнений и вопросов по DevOps

Этот репозиторий содержит вопросы и упражнения на различные технические темы, связанные с DevOps и SRE. Вы можете их использовать для подготовки к интервью. Репыч на Гитхабе.
Learn From Scratch Prometheus and Grafana for The Ultimate Monitoring and Visualization Experience

Эта статья даст базовые понятия о том, что из себя представляет Prometheus в связке с Grafana. Пойдёт, если вы только начинаете изучать эти два решения. Примерно половину статьи занимает воркшоп по настройке. Читать дальше.

Используете Prometheus в своём стеке мониторинга?
Loguru — это библиотека для логирования в Python

Можно рассмотреть в качестве замены print(). Расскажите в комментариях как решаете задачу логирования вашего кода.

Репыч на Гитхабе
Bad Observability

Антипаттерны построения системы Observability с забавными картинками и толковым описанием. Читать дальше.