Мониторим ИТ
7.66K subscribers
103 photos
2 files
1.39K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Improve Cluster Monitoring With Network Mapping in Grafana

Статья о топологических картах сети, IP-адресах и их связи с нагрузками на кластер Kubernetes, чтобы вы могли быстрее проводить отладку. Читать дальше.
Observing your API traffic with Tyk, Elasticsearch & Kibana

В этой статье вы узнаете как используя инструмент Tyk в качестве прокси-сервера, отправить API-аналитику ваших сервисов в ElasticSearch для просмотра результатов в Kibana. Читать дальше.

Репыч на Гитхабе.
Monitor your MariaDB or MySQL instances using Monika

В этой статье о том, как контролировать экземпляры MariaDB или MySQL с помощью Monika. Читать дальше.
Istio tracing and correlation with Jaeger and Grafana Loki

Из этой статьи вы узнаете как коррелировать трейсы Istio с Jaeger и Loki. Читать дальше.
How to use Kubernetes events for effective alerting and monitoring

События Kubernetes предоставляют богатый источник информации. Их можно использовать для мониторинга приложения и состояния кластера, реагирования на сбои и выполнения диагностики. События генерируются, когда ресурсы кластера, такие как модули, развертывания или узлы, изменяют состояние.

Всякий раз, когда что-то происходит внутри вашего кластера, создаются события, которые обеспечивает наблюдаемость кластера. Однако, события Kubernetes не сохраняются на протяжении всего жизненного цикла вашего кластера, так как нет механизма для сохранения. Они недолговечны, доступны только в течение одного часа после создания события. В этом посте будет показано, как получить полезную информацию об этих событиях с помощью Grafana. Читать дальше.
Grafana Loki: alerts from Ruler and labels from logs

Описание сервиса ruler, который создаёт алерты напрямую из логов. Читать дальше.
Визуальные карты сетей кластеров K8s для оценки их производительности

Основная часть инфраструктуры упорядочивается в виде сети систем, обменивающихся данными и разделяющих рабочие нагрузки. Очень удобна возможность визуального наблюдения за соединением систем и выявления влияющих на них факторов. Создание карты сети при помощи эффективного инструмента визуализации и контроля является обязательной задачей для мониторинга и поддержки сервисов. Читать дальше.
Делаем дашборды для Grafana из того, что отдает экспортер метрик Prometheus и автоматизируем это

Во время работы с конвеером данных, в результате работы которого у нас появлялись данные в Timescale, которые мы визуализировали в виде тепловых карт прошлой статье, у нас было задействовано много разных компонентов, каждый из которых норовил упасть или привнести свою лепту в задержку появления данных в базе и на фронт-энде. Читать дальше.
Основы мониторинга (обзор Prometheus и Grafana)

Мониторинг сегодня – фактически обязательная «часть программы» для компании любых размеров. В данной статье мы попробуем разобраться в многообразии программного обеспечения для мониторинга и рассмотрим подробнее одно из популярных решений – систему на основе Prometheus и Grafana. Читать дальше.
👍1
Grafana Alerting vs AlertManager: A Comparison of Two Leading Monitoring Tools

Возможности
Grafana Alerting продолжают улучшаться с каждым новым релизом. Особенно в связи с изменениями, внесенными в Grafana 8 и Grafana 9, возникло много вопросов относительно его использования, поддерживаемых возможностей и сравнения с альтернативами. Читать дальше.
A beginner's guide to Kubernetes application monitoring

Мониторинг
производительности приложений (APM) включает набор инструментов и методов для отслеживания определенных показателей производительности. Инженеры используют APM для мониторинга и поддержания работоспособности своих приложений и обеспечения лучшего взаимодействия с пользователем.

В этой статье вы узнаете, что такое Kubernetes APM, и какие ключевые показатели важно отслеживать. Вы также три способа мониторинга ваших приложений в Kubernetes. Читать дальше.
PostgreSQL — Extend Your Monitoring Infrastructure with Pgwatch2

В этой статье рассмотрен инструмент мониторинга pgwatch2 для баз данных PostgreSQL. Читать дальше.
Observability, Monitoring, Alerting

Пирамида мониторинга. Читать дальше.
How to write a webhook for Zabbix

Даже не смотря на то, что Zabbix из коробки имеет более 30 интеграций, связанных с оповещениями, иногда требуется написать собственную В этом посте в блоге Zabbix разбираются как это сделать. Читать дальше.
Kubernetes + ChatGPT Smart Alerting — Robusta

Что произойдет, если объединить Prometheus, работающий на Kubernetes, интеллектуальный движок, говорящий с ChatGPT, и Sink, подобный Slack? Вы получите платформу с открытым исходным кодом для устранения неполадок Kubernetes под названием Robusta.

В этом посте рассказывается об использовании Robusta в качестве верхнего слоя стека мониторинга Prometheus и показывается вам, почему возникают алерты и как их устранить. Читать дальше.
Get to know TraceQL: A powerful new query language for distributed tracing

Недавно состоялся релиз Tempo версии 2.0. В связи с этим релизом был представлен TraceQL - новый мощный язык запросов, разработанный для распределенной трассировки. В этой статье рассказывается о том, зачем был создан TraceQL, как он работает, как вы можете использовать и что планируется в будущих релизах. Читать дальше.
«Лента» успешно завершила пилотное внедрение observability платформы GMonit.

Интеграция продукта ИТ-мониторинга позволила ведущему ритейлеру настроить гибкие индивидуальные алерты, тем самым снизить уровень «шума» и упростить работу службы эксплуатации. Существенно сократилось время разбора инцидентов за счет доступа к глубокой аналитике всего в 2−3 клика. Кроме того, новый ИТ-продукт позволил получить детальное понимание производительности приложений на уровне конкретных транзакций и запросов в системе, а также взаимодействия с внешними сервисами.

Следующий этап проекта — масштабирование платформы.
https://gmonit.ru/press-reliz-lenta

Подписывайтесь на канал @gmonit
LLD Filtering with Macros

В этой статье я рассказано, как пользовательские макросы и регулярные выражения используются в LLD для фильтрации результатов обнаружения. В качестве примера я использован шаблон Network Generic Device by SNMP. Читать дальше.
Managing Grafana Dashboards With Terraform

Ручное управление дашбордами в Grafana имеет некоторые недостатки, например, случайное удаление графиков, люди "тестируют" изменения и забывают их убрать. В этой статье разобран подход Config as Code относительно Grafana. Читать дальше.
Logging Best Practices: Proven Techniques for Services

При правильном подходе логирование может дать ценные сведения о производительности и использовании приложения, что поможет повысить общую надежность и улучшить пользовательский опыт. В этой статье о подходах к логированию. Читать дальше.