Мониторим ИТ
7.66K subscribers
103 photos
2 files
1.39K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
@golanglibrary - книги и статьи по Go.
Подключаем VictoriaMetrics в Deckhouse и настраиваем уведомления в Telegram

В статье рассмотрено, как в Kubernetes-кластере под управлением Deckhouse удобно и быстро настраивать мониторинг с уведомлениями в Telegram. VictoriaMetrics в этом случае используется для хранения метрик, Grafana для отображения и алертинга. Читать дальше.
How to find unused Prometheus metrics using mimirtool

Недавно перед автором этой статьи встала задача стабилизировать, отследить проблемы и значительно снизить потребление ресурсов системой Prometheus. В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать дальше.
Grafana Dashboard for Pgbouncer And Monitor With Percona PMM

Pgbouncer — приложение-пулер соединений, которое используется в среде PostgreSQL. Он легкий, при этом обрабатывает множество соединений. Pgbouncer имеет несколько встроенных таблиц (или представлений) для просмотра текущего состояния и исторических данных. Не совсем удобно выполнять запросы к этим данным через командную строку. Многие слышали об инструменте мониторинга Percona PMM. Это инструмент мониторинга с открытым исходным кодом для MySQL, PostgreSQL и MongoDB. У PMM, к сожалению, нет собственного агента для pgbouncer. В этой статье разобрано создание двух экспортеров Prometheus для pgbouncer. Читать дальше.

Расскажите какую систему мониторинга для PostgreSQL вы используете в вашем окружении. Можно тапнуть на кнопку или рассказать подробно в комментариях.
2624 упражнений и вопросов по DevOps

Этот репозиторий содержит вопросы и упражнения на различные технические темы, связанные с DevOps и SRE. Вы можете их использовать для подготовки к интервью. Репыч на Гитхабе.
Learn From Scratch Prometheus and Grafana for The Ultimate Monitoring and Visualization Experience

Эта статья даст базовые понятия о том, что из себя представляет Prometheus в связке с Grafana. Пойдёт, если вы только начинаете изучать эти два решения. Примерно половину статьи занимает воркшоп по настройке. Читать дальше.

Используете Prometheus в своём стеке мониторинга?
Loguru — это библиотека для логирования в Python

Можно рассмотреть в качестве замены print(). Расскажите в комментариях как решаете задачу логирования вашего кода.

Репыч на Гитхабе
Bad Observability

Антипаттерны построения системы Observability с забавными картинками и толковым описанием. Читать дальше.
Grafana agent operator

Grafana Agent Operator — это оператор Kubernetes, который упрощает развертывание Grafana Agent и сбор телеметрических данных с подов.

Grafana Agent Operator работает, отслеживая ресурсы Kubernetes, которые определяют, как собирать телеметрические данные с кластера Kubernetes и куда их отправлять. Agent Operator управляет соответствующими Grafana Agent в кластере, отслеживая изменения в ресурсах. Читать дальше.
Kubernetes Monitoring: Best Practices, Metrics and Tools

В этой статье перечислены основные метрики мониторинга Kubernetes, которые необходимо измерять, включая метрики кластера, метрики узлов, метрики подов, метрики деплоймента и метрики контейнеров. Читать дальше.
Ваша электронная почта занимает слишком много места на дисках, СХД или в другом хранилище?

Приглашаем вас на вебинар, где вы получите ответы на вопросы:

⚡️ как снизить занимаемое место архивом почты на 60%

⚡️ как моментально восстановить удаленное письмо из архива одним нажатием кнопки

⚡️ как выполнить быстрый поиск по письмам и вложенным документам (120 форматов)

⚡️ как предоставить пользователям удобный интерфейс для поиска по письмам и вложениям

⚡️ как встроить историю переписки с клиентом в вашу CRM-систему

На вебинаре речь пойдет об отечественной системе архивации электронной почты Архива.

Архив — это не резервная копия, поэтому в сравнении с системами резервного копирования (например, Veeam), Архива имеет множество преимуществ. Архива поддерживает работу с почтовыми сервисами Exchange, CommuniGatePro, GSuite, Office 365. Все хранящиеся письма зашифрованы стойким к взлому алгоритмом.

Вебинар состоится 14 апреля (пятница) в 11 часов по московскому времени на платформе Zoom.

Регистрация

P.S. На картинке приведен граф связей в Архива, который позволит обнаружить основные каналы общения.
Recruiting developers into Site Reliability Engineering (SRE)

В этой статье вы узнаете:

⚡️Почему разработчики являются отличными потенциальными SRE

⚡️Как изменится работа разработчика, когда он станет SRE

⚡️Как разработчики могут ознакомиться с практикой SRE, прежде чем подавать заявку на роль SRE

⚡️Как программы стажировки могут улучшить результаты для начинающих SRE

⚡️Советы по адаптации для плавного перехода от разработчика → SRE

Читать статью.
Golang Monitoring 102: Distributed Tracing with Opentelemetry

В этой статье рассказывается о реализации распределенной системы трассировки с помощью opentelemetry. В ней будут рассмотрены примеры использования, терминология и фрагменты кода. Читать дальше.

Используете OpenTelemetry в своём окружении?
Site Reliability Engineering (SRE) Culture Explained

Несколько слов о культуре SRE. Читать статью.
Observability Concept in Prometheus

В этой статье рассказано о компонентах Prometheus, которые полезны для понимания и в области DevOps и SRE. Эти термины часто встречаются в Prometheus, также эти темы обсуждаются в сертификации PCA. Читать дальше.
Alertmanager incident response automation with n8n

Стек мониторинга prometheus включает компонент диспетчеризации оповещений под названием alertmanager. Доступно множество интеграций для отправки оповещений на мессенджер, slack и т.д... т.е. в каналы уведомлений. Но как легко и эффективно доставлять автоматизированные ответы — вот вопрос, на который отвечают в этой статье.

Для автоматизации реагирования на инциденты будет использоваться инструмент автоматизации n8n. N8n — это low-code инструмент автоматизации, с удобным пользовательским интерфейсом при сохранении высокой степени кастомизации. Читать дальше.
PromQL Cheat Sheet

Список часто используемых выражений PromQL с описанием. Ознакомиться.
👍1
How to Monitor kube-controller-manager

Как с помощью Prmetheus эффективно наблюдать за kube-controller-manager. Читать дальше.
👍1
Best practices for observability

В этой статье вы узнаете о:

⚡️процессе разрешения инцидента,

⚡️обоснование необходимости использования методов, основанных на гипотезах,

⚡️вариантах реализации в организации.

Читать дальше.
PromQL Vendor Compatibility, Round Three

В этой статье представлен набор результатов тестирования совместимости PromQL для различных вендоров (PromsScale, Thanos, Sysdig, VictoriaMetrics и других). Читать дальше.