Мониторим ИТ
7.41K subscribers
52 photos
2 files
1.3K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Практическое руководство по реализации Observability в DevOps

В этой статье описан ход развертывания следующего стека инструментов Observability (наблюдаемости) Grafana:

⚡️Loki (логи);
⚡️Promtail (агент логов);
⚡️Tempo (трассировка);
⚡️Prometheus (метрики);
⚡️Cortex и Grafana Mimir (долгосрочное хранилище для данных Prometheus);
⚡️Alertmanager (обработка оповещений Prometheus);
⚡️Grafana (визуализация).

Читать дальше.
Как бесплатно мониторить массивы HP EVA с помощью Zabbix: два варианта решения

В данной статье рассмотрен процесс настройки мониторинга массивов семейства HP EVA (Enterprise Virtual Array) с помощью Zabbix, объясняется, как получать и обрабатывать данные с массива, показано, с какими проблемами можно столкнуться при настройке. Читать дальше.
Observability Solutions with Open Telemetry + OpenSearch

В этой статье описание использования OpenTelemetry и OpenSearch вместе с некоторыми зависимыми инструментами с открытым исходным кодом для создания решений для наблюдаемости. Читать дальше.
Introducing Grafana Faro, an open source project for frontend application observability

Grafana продолжает интегрировать всё новые и новые решения в свой стэк. На конференции ObservabilityCon 2022 был представлен преокт Grafana Faro.

Решение позволяет собирать метрики наблюдаемости с фронтэнд-приложений и имеет гибко настраиваемый веб-SDK. Затем эти телеметрические данные можно сопоставить с внутренними и инфраструктурными данными для беспрепятственного наблюдения за всем стеком. Читать дальше и смотреть видеозапись.
Grafana 9.3 release: что нового

Обновленная
навигация. Несколько основных моментов: страницы в Grafana теперь используют новые макеты, включающие хлебные крошки и боковую панель, что позволяет быстро переходить между страницами. Появился заголовок, который появляется на всех страницах в Grafana, что делает функцию поиска панели инструментов доступной с любой страницы.

Обновленные панели. В Geomap появился новый тип альфа-слоя, называемый фотослоем. Этот слой позволяет визуализировать фотографию в каждой точке данных.

Панель Canvas. Canvas — это новая панель, представленная в Grafana 9.2. Это расширяемые панели, построенные на основе форм, которые позволяют размещать элементы в статических и динамических макетах.

В Grafana 9.3 появилась поддержка сопоставления значений элементов на панели Canvas. Это позволяет динамически устанавливать элемент для отображения на основе ваших данных.

Улучшения в публичных дашбордах. В Grafana 9.3 представлен новый экран, на котором теперь вы можете управлять всеми своими публичными дашбордами в одном месте.

Отображение аннотаций на публичном дашборде. Аннотации теперь поддерживаются в публичных дашбордах, за исключением аннотаций запросов. По умолчанию они отключены, но их можно включить в настройках публичных панелей.

Новые трансформации: Partition by values. Эта новая трансформация может помочь устранить необходимость в нескольких запросах к одному и тому же источнику данных с разными предложениями WHERE при графическом отображении нескольких рядов.

LDAP: улучшение маппинга ролей. Если вы используете каталог LDAP для аутентификации в Grafana, но предпочитаете назначать организации и роли в пользовательском интерфейсе Grafana или через API, теперь вы можете пропустить синхронизацию ролей организации пользователей с вашим каталогом LDAP.

И другие улучшения.
Галс Софтвэр приглашает на вакантные должности специалистов по внедрению решений с открытым исходным кодом:

- ElasticSearch/OpenSearch (направления: логирование, безопасность, поиск, наблюдаемость)
- Zabbix/Grafana
- Prometheus/VictoriaMetrics/OpenTelemetry

У вас должен быть опыт внедрения/проектирования подобных систем в ролях инженера/архитектора. Мы предлагаем частичную занятость и удаленную работу. В перспективе возможны обучение и вендорская сертификация.

Можно откликнуться на hh.ru, либо прислать ваше резюме на hr@gals.software, либо написать нам в телеграм @galssoftware
Monitoring high cardinality jobs with Grafana, Grafana Loki, and Prometheus

В этой статье рассказывается об опыте использования Grafana, Prometheus, Grafana Loki и собственных экспортеров, созданных самостоятельно, и объясняется, как использовать глубокую синергию между Loki и Prometheus для мониторинга заданий с высокой частотой исполнения. Читать дальше.
Monitoring Made Easy: Odin’s Eye

Odin’s Eye обеспечивает оперативный и ретроспективный мониторинг ключевых метрик для 3 важных частей кластера Kubernetes — общих метрик кластера, метрик отдельных модулей и пространств имен и, что наиболее важно для этого приложения, метрик для баз данных MongoDB, развернутых в кластере Kubernetes. Читать дальше.
What’s Up, Home? – No More Blackouts with Zabbix HA Cluster

В этой статье в блоге Zabbix разбирается устройство высокой доступности кластера Zabbix. Читать дальше.
MongoDB Performance Guide

Чтобы оптимизировать производительность ваших запросов MongoDB, вам сначала нужно понять вашу текущую производительность. Для этого вы должны измерить или визуализировать выполнение запросов.

Подобно другим базам данных, MongoDB имеет функцию explain. Это позволяет глубже понять план выполнения и производительность запроса. Есть несколько инструментов, которые помогут. Читать дальше.
How we tried using VictoriaMetrics and Thanos at the same time

Долгое время компания использовала связку Prometheus + Thanos для мониторинга и хранения данных для метрик долгосрочного хранения. Для Thanos мы использовали sidecar-схему. Эта схема работала неплохо, но по мере роста проекта росло и потребление ресурсов. Со временем задачи выборки образцов уже потребляли значительные ресурсы. Когда один только Prometheus стал занимать более 30 ядер vCPU и 100 гигабайт оперативной памяти, мы начали искать способы оптимизации потребления ресурсов. Читать дальше.
10 DevOps Tools to Watch in 2023

Взгляд на некоторые инструменты DevOps, которые мы, возможно, будем использовать в следующем году, потому что они могут поднять производительность инженеров на новый уровень.

В статье о: Pulumi, SOPS, Trivy, Cluster API, Linkerd, GitHub Actions, Tekton, HashiCorp Harness, Thanos, HashiCorp Sentinel.

Читать дальше.
How metrics collection agents protect against data loss when working with the remote write protocol

Недавно я столкнулся с агентом Grafana во время работы. Я начал понимать, как это работает под капотом и чем оно отличается от того, с чем я работал раньше (vmagent, netdata и prometheus). И снова попалась на глаза статья о том, нужен ли WAL для TSDB? Родилась идея рассмотреть подходы, как агенты сбора метрик защищают себя от потери данных при работе с протоколом удаленной записи на примере агента Grafana/Prometheus и агента VictoriaMetrics (vmagent). Читать дальше.
A complete guide to managing Grafana as code: tools, tips, and tricks

В
этой статье представлены несколько инструментов, которые можно использовать для декларативного управления ресурсами Grafana, а также несколько советов и рекомендаций по их эффективному включению в варианты использования.

Инструменты, которые рассматриваются в этой статье, включают Grafana Terraform, коллекцию Grafana Ansible, Grafonnet для информационных панелей, Grizzly, API-интерфейсы Grafana с действиями GitHub и Crossplane. Читать дальше.
DORA metrics: automatically, for all your Kubernetes workloads

Получение этих сведений по метрикам DORA иногда может быть сложным и требовать большого объема ручной работы. Из этой статьи вы узнаете как более эффективно извлекать показатели DORA? Читать дальше.
Use Docker, Uptime Kuma, and Traefik To Monitor Your Website

В этой статье описано, как настроить мониторинг веб-сайтов с локального ПК или сервера с помощью Docker/Docker Swarm. Вместо использования сложных стеков мониторинга, таких как prometheus, node-exporter или graphana, можно использовать облегченную альтернативу под названием Uptime Kuma, написанную на NodeJs и Vue. Читать дальше.
k-boot/v2: A clean way of prometheus monitoring in Golang

Чтобы упростить использования стэка Prometheus+Grafana, мы разработали rk-boot/v2. Решение для оборачивания логики клиента prometheus в простые функции и вывода на дашборды Grafana. rk-boot/v2 помогает уменьшить сложность кода. Читать дальше.

Репыч на Гитхабе.
Prometheus: Kubernetes endpoints monitoring with blackbox-exporter

Что описано в этом посте:

с помощью Helm будет развернут стек kube-prometheus-stack в Minikube, развернут сам Blackbox Exporter, настроен мониторинг конечных точек с помощью Kubernetes ServiceMonitors, который будет создан через конфиг blackbox-exporter. Читать дальше.
Observability: Better CI for your prometheus alerts

Если ваша система мониторинга сильно разрастается, вам потребуется внедрить CI для оповещений. Первое, что приходит на ум, это promtool. Читать дальше.