Мониторим ИТ
7.49K subscribers
58 photos
2 files
1.33K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Как специалисту по безопасности повысить свою квалификацию?

Каждый день появляется примерно 70 новых уязвимостей. Поэтому специалистам по безопасности важно постоянно развиваться и учиться новому. Специально для Middle и Senior ИТ-специалистов, которые отвечают за цифровую безопасность компании и продуктов, команда Yandex Cloud разработала курсы:

— «Защита облачной инфраструктуры» поможет настроить и поддерживать необходимый уровень безопасности;

— «DevSecOps в облачном CI/CD» научит обеспечивать безопасность приложений, познакомит с методологией DevSecOps, которая поможет автоматизировать проверки безопасности и экономить ресурсы;

— «Аутентификация и управление доступом» поможет подготовиться к росту инфраструктуры и команды, научит настраивать и регулировать доступ в облаке.

Также скоро появятся курсы «Погружение в сетевую безопасность» и «Compliance».

Обучение бесплатное — уроки откроются сразу после регистрации ➡️
Label & Annotations in Kubernetes

Гайд о важности использования меток и аннотаций в Kubernetes. Читать дальше.
Open-Source Tracing Tools: Jaeger Vs. Zipkin Vs. Grafana Tempo

В этой статье рассматриваются три популярных инструмента трассировки с открытым исходным кодом: Jaeger, Zipkin и Grafana Tempo. Есть из чего выбрать. Читать дальше.
Kubernetes Logging Best Practices

В этой статье рассказывается о практиках ведения логов в среде Kubernetes. Читать дальше.
Provision Grafana Dashboards and Alerts Using Helm and Sidecars

В этой статье рассказано, как представить в виде кода дашборды и алерты Grafana в кластере k8s, используя новую систему оповещения Grafana 9. Конфигурирование дашбордов и алертов таким образом имеет много преимуществ, главное из которых — управление ими через систему контроля версий, например GitHub. Читать дальше.
OpenTelemetry: Sending Traces From Ingress-Nginx to Multi-Tenant Grafana Tempo

Автор статьи использует Grafana Tempo в качестве бэкенда для хранения трассировок вызовов. Это позволяет хранить информацию о трассировках в недорогом объектном хранилище вместо размещения их в ElasticSearch при использовании такого инструмента, как Jaeger.

Поскольку данные собираются с общих для команд разработчиков приложений кластеров Kubernetes, еще одной очень важной особенностью Grafana Tempo является многопользовательский доступ. Читать дальше.
OpenTelemetry Dynamic Integrations

В этой статье описано, как настроить OpenTelemetry в двух средах и показано, как OpenTelemetry может упростить переключение между этими двумя средами без необходимости изменения строк кода или конфигурации бэкендов систем наблюдаемости (источников данных и инструментов визуализации). Читать дальше.
Integrating Prometheus and Grafana for Metrics Monitoring in a Spring Boot Application

В этой статье показано как интегрировать Prometheus и Grafana для мониторинга метрик приложения на Spring Boot. Читать дальше.
Deploying Grafana, Prometheus, and Alertmanager on Kubernetes: A Quick and Easy Guide

Эта статья — краткое руководство по настройке grafana, prometheus и alertmanger с помощью kube-prometheus-stack helm chart. Читать.
В этом посте собраны три ссылки на репозитории Github, которые потенциально могут помочь при подготовке к собеседованию на позицию SRE. Приятного чтения!

Site Reliability Engineer (SRE) Interview Preparation Guide

SRE-Interviews

SRE Interviewing Questions
В сервисе Yandex Data Proc стало доступно создание управляемых кластеров Hive Metastore (Public Preview)

Hive Metastore связывает разнородные ETL-системы и инструменты для работы с общими данными и упрощает их развёртывание. Кластеры Metastore управляют табличными метаданными объектов, которые находятся в бакетах Object Storage.

Теперь решать задачи подготовки и очистки данных, создания хранилищ и предметно-ориентированных витрин данных стало проще.

➡️ Подробнее о новинке и о том, как первым получить доступ по ссылке
Autometrics - это микрофреймворк наблюдаемости, созданный для разработчиков

Он позволяет инструментировать любую функцию с помощью наиболее полезных метрик: частоты запросов, ошибок и задержек. Autometrics использует имена инструментированных функций для генерации запросов Prometheus, поэтому не нужно вручную писать сложные PromQL.

Репыч на Гитхабе.
OpenTelemetry Tracing: Everything you need to know

Из этой статьи вы узнаете о возможностях и архитектуре OpenTelemetry. Читать дальше.
5 tips for improving Grafana Loki query performance

Запись вебинара с советами по оптимизации производительности Grafana Loki. Смотреть.
On-call management on the go: Introducing the Grafana OnCall mobile app

Описание работы мобильного приложения для Grafana OnCall OSS или Grafana OnCall в Grafana Cloud. Читать статью в блоге Grafana.
Managing Grafana Dashboards With Terraform

Статья про использование Terraform для управления дашбордами в Grafana. Читать дальше.
Monitoring CPU/RAM/disk metrics with OpenTelemetry and Uptrace

В этой статье раасказано как при помощи мотка изоленты и интегральной микросхемы OpenTelemetry, hostmetricsreceiver и Uptrace собрать данные сервера по производительности. Читать статью.
🔥 Главная в России конференция про Kubernetes®

22 июня 2023 года состоится Kuber Conf — конференция для всех, кто работает с Kubernetes®. Вас ждёт 9 докладов, 12 спикеров, 180 минут техноконтента:

➡️ технические доклады, продуктовые обзоры, лучшие практики от разработчиков и экспертов по контейнерным технологиям;
➡️ создание сервисов и решение бизнес-задач с помощью Kubernetes в финтехе, e-commerce, HoReCa и не только;
➡️ неформальное общение с профессиональным сообществом, встреча старых друзей и новые знакомства.

Регистрируйтесь по ссылке, чтобы получить доступ к онлайн-трансляции Kuber Conf’2
Say Hello to Grafana OnCall

Практический гайд по использованию Grafana OnCall. Сохраните, чтобы не потерять. Читать статью.

Используете у себя этот полезный инструмент для управления алертами?
Relabeler

Песочница для проверки правил релейбелинга в Prometheus. Ссылка.