Мониторим ИТ – Telegram

Мониторим ИТ

8.08K subscribers

203 photos

2 files

1.53K links

Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch

Download Telegram

About

Blog

Apps

Platform

Мониторим ИТ

8.08K subscribers

Мониторим ИТ

Shell-operator — это инструмент для запуска произвольных скриптов по событиям в кластерах Kubernetes. Частным случаем таких произвольных скриптов является подписка на события через Kubernetes API и запуск хуков по таким событиям. А частным случаем запуска хуков является экспорт произвольных метрики для их дальнейшего scraping'а Prometheus’ом.

В этой статье об обновлениях shell-оператора, там же в конце статьи ссылки на описание этого инструмента.

Простое создание Kubernetes-операторов с shell-operator: прогресс проекта за год

Kubernetes-операторы — удобный механизм для расширения возможностей этой контейнерной платформы, по праву снискавший широкое признание в среде инженеров эксплу...

1.36K views04:30

👍 7 👎👀

Открыть комментарии

Мониторим ИТ

SRE: Observability: Metric Namespaces and Structures

В этой статье о тайном оружии SRE — древовидном структурировании метрик в Prometheus. На заметку тем, кто не структурирует.

1.42K viewsedited 10:00

👍 11 👎👀

Открыть комментарии

Мониторим ИТ

Как бороться с дублями в Elasticsearch при использовании FluentD читайте в этой статье на Хабре.

Fluentd: почему важно настроить выходной буфер

В наше время невозможно представить проект на базе Kubernetes без стека ELK, с помощью которого сохраняются логи как приложений, так и системных компонентов кла...

2.4K views12:12

👍 3 👎👀 2

Открыть комментарии

Мониторим ИТ

Про Skydive — инструмент для визуализации сетевой топологии на основе netflow, я уже как-то писал. Сегодня на Хабре вышла статья о добавлении ноды в Skydive топологию вручную через Skydive client. Эта возможность появилась благодаря Node rule API, которая появилась начиная с версии 0.20

1.35K views14:01

👍 6 👎👀

Открыть комментарии

Мониторим ИТ

Kubernetes HPA with Custom Metrics from Prometheus

Статья о специфических метриках контроллера K8s HPA (Horizontal Pod Autoscaler).

2.68K views15:30

👍 6 👎 2 👀

Открыть комментарии

Мониторим ИТ

Для линукс-админов — An Introduction to File System Monitoring Tools.

В этой статье про утилиты inotifywait и iwatch

An Introduction to File System Monitoring Tools

All about inotifywait and iwatch utilities

1.52K views04:30

Мониторим ИТ

Centralize Your Docker Logging With FluentD

О том как взять FluentD и положить логи docker в одно место

1.4K views10:30

👍 8 👎👀 1

Открыть комментарии

Мониторим ИТ

Если хотите подробнее про FluentD — вот неплохая статья на том же Медиуме.

1.42K views10:35

Мониторим ИТ

Траблшутим микросервисы в k8s при помощи Istio

1.35K views15:30

👍 2 👎👀 1

Открыть комментарии

Мониторим ИТ

SRE: Performance Analysis: Tuning Methodology Using a Simple HTTP Webserver In Go

Методика работы SRE на примере тюнинга простого веб-сервера.

2.62K views04:30

👍 3 👎👀 1

Открыть комментарии

Мониторим ИТ

Логирование в Kubernetes: EFK против PLG

Elastic vs Grafana (Loki). Fight!

Логирование в Kubernetes: EFK против PLG

Мониторинг стал весьма важным компонентом растущих облачных решений с ростом сложности распределенных систем. Он необходим для понимания их поведения. Нужны мас...

1.51K viewsedited 14:06

👍 7 👎👀 1

Открыть комментарии

Мониторим ИТ

Tracing and Observability

Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.

1.44K views17:15

Мониторим ИТ

Для обеспечения высокой доступности мы используем два кластера K8s. Графики ниже показывают эти кластеры: region-1 и region-2. Это создает дополнительную сложность, когда речь идет об автомасштабировании, поскольку кластеры полностью разделены и не имеют общих метрик. Наш веб-сайт работает в режиме active-active и сбалансирован по нагрузке на оба региона.

Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.

В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.

Kubernetes Lessons in Alerting

Live issues are a great opportunity to learn and improve. Here’s what happened to us

2.38K views04:30

Мониторим ИТ

ElasticSearch On Steroids With Avro Schemas

https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30

1.43K views10:40

Мониторим ИТ

Увлекательная 4-серийная сага «Practical Monitoring with Prometheus & Grafana».

Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes

Часть 2: Using Prometheus blackbox exporter for free uptime checks

Часть 3: Applying simple statistics for anomaly detection using Prometheus

Часть 4: Securing Grafana with Identity-Award Proxy

3.52K viewsedited 12:00

👍 7 👎👀

Открыть комментарии

Мониторим ИТ

А в этом репозитории одна штука, чтобы генерить дашборды Grafana из Python-скриптов. Полезно? Не то слово!

1.65K views14:00

Мониторим ИТ

Lessons learned about monitoring the JVM in the era of containers

В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.

1.46K views06:00

Мониторим ИТ

How we scaled Graphite to 100,000 writes per second

В этой статье о вертикальном масштабировании вычислений до 100 000 операций записи в секунду.

А кто-то использует Graphite в своём стеке мониторинга?

👍 — использую

👎 — не использую

👀 — карандаши как-то не очень, обычно ручкой пользуюсь

1.4K views09:00

👍 7 👎 52 👀 3

Мониторим ИТ

Forwarded from /usr/bin

В этой статье несколько слов о мониторинге контейнеров Docker при помощи docker stats и cAdvisor.

590 views09:51

Мониторим ИТ

How the cortex and thanos projects collaborate to make scaling prometheus better for all

Коллаборация Cortex и Thanos для масштабирования Prometheus (в блоге Grafana)

А ещё есть запись выступления «Two Households, Both Alike in Dignity: Cortex and Thanos» с PromCon 2019 (выступают сооснователи Cortex и Thanos Tom Wilkie и Bartek Plotka соответственно)

How the Cortex and Thanos projects collaborate to make scaling Prometheus better for all | Grafana Labs

At PromCon Online, Marco Pracucci and Bartek Plotka talked about how Cortex and Thanos started to learn from and even influence each other – thanks to open source.

1.59K viewsedited 07:40

Мониторим ИТ

Monitoring Application Metrics With Nutanix Karbon

Пошаговое руководство по настройке кластера Karbon для мониторинга кластера и приложений и настройка представлений в Grafana.

1.57K views04:00