Мониторим ИТ
6.69K subscribers
40 photos
2 files
1.2K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Как ELK довел нас… до Vector.dev и Clickhouse

В этой статье, Дима Синявский SRE-инженер из Vi.Tech (IT-дочка ВсеИнструменты.ру) рассказывает о том как они развивали систему логирования. Зачем им понадобился стэк Vector.dev + Clickhouse для хранения и почем он оказался выгоднее EFK.

Был ли у кого-то аналогичный опыт перехода с Elasticsearch на Clickhouse? Расскажите в комментариях.
Измеряя качество: SLO и SLI для инфраструктурных команд

Автор рассказывает о собственном опыте внедрения SLI/SLO в команде, зоной ответственности которой являются Kubernetes-кластеры. Читать статью.
Sync Grafana OnCall with Google Calendar out-of-office events

В Grafana OnCall появилась новая интеграция — с календарем Google. Теперь инженеры поддержки смогут еще крепче спать в отпуске. Кхе-кхе.

Читать описание фичи в блоге Grafana
uptime-kuma

Легковесная утилита для мониторинга чего-то такого же легковесного: HTTP(s) / TCP / HTTP(s) Keyword / HTTP(s) Json Query / Ping / DNS Record / Push / Steam Game Server / Docker Containers.

Репыч на Гитхабе
Обучение Zabbix (ZCS/ZCP) на вендорских курсах — почему, зачем и когда

Zabbix используют многие компании, но не всегда он оптимально настроен. В небольших и средних организациях поддержкой Zabbix занимается системный администратор или группа администраторов. Часто, по остаточному принципу. Знания в области Zabbix, которыми обладает специалист, приобретены с опытом или путем урывочного изучения документации при возникновении нештатных ситуаций. Курс призван устранить такие пробелы и систематизировать знания.

Когда не работает мониторинг или в потоке событий никто не может найти полезные/правильные события, организация начинает терять деньги. Неважно, внутренние это сервисы или внешние. Работа любого сервиса внутри компании прямо или косвенно связана с извлечением прибыли.

Преимущества по итогам обучения на вендорских курсах Zabbix:

🚀 Моментальный буст компетенций сотрудников

🚀 Рост лояльности сотрудников за счет оплачиваемого полезного обучения

🚀 Повышение качества покрытия мониторингом ваших сервисов

🚀 Не нужно пускать подрядчиков в грязных сапогах в свою сеть

📅 Когда:

📖3-7 июня ZCS (Сертифицированный специалист Zabbix).

📖1-3 июля ZCP (Сертифицированный профессионал Zabbix).


❗️Действуют специальные условия при участии сразу в двух курсах. Каждый курс включает прохождение сертификации.

Вопросы можно задать @galssoftware или на почту welcome@gals.software.

❗️А еще можно подписаться на наш телеграм-канал @zabbix_ru, где мы пишем про Zabbix и ничего кроме Zabbix.
Grafana — прошлое, настоящее, будущее и альтернативы

В этом году приложению исполняется десять лет, инструмент по-прежнему востребован в России. В этой статье об истории Grafana, роли этого открытого решения в развитии open source сообщества в целом. Читать на Хабре.
Canvas panel in Grafana: create custom visualizations with all the latest features

В этой статье в блоге Grafana разъясняют как устроен редактор для Canvas-панелей. Читать статью.
2 популярных канала по информационной безопасности:

🔐 infosec — редкая литература, курсы и уникальные мануалы для ИБ специалистов любого уровня и направления. Читайте, развивайтесь, практикуйте.

👨‍💻 Вакансии в ИБ — актуальные предложения от самых крупных работодателей и лидеров рынка в сфере информационной безопасности.
Распределенная трассировка с Jaeger и Clickhouse

В этой статье Филипп Бочаров, руководитель центра мониторинга и наблюдаемости в МТС Digital, рассказывает как они делают распределённую трассировку, чтобы контролировать качество сервисов и предотвращать аварии. В статье разобрано, как добиться понятной и прозрачной работы от сложных распределённых систем. Читать на Хабре.
Grafana OnCall: Connect to Discord, Mattermost, and more with webhooks

Цель статьи — показать примеры подключения Grafana OnCall к стороннему API, устанавливая простую одностороннюю синхронизацию (OnCall -> внешний сервис), чтобы поддерживать актуальность информации о состоянии проблем без написания какого-либо кода. Рассмотрен процесс для каждого приложения ChatOps из заголовка статьи. Читать в блоге Grafana.
📆OPS Talk by Sber уже скоро — успей пройти регистрацию!
 
Встречаемся 30 мая в штаб-квартире Сбера! На митапе вместе с инженерами сопровождения и DevOps-инженерами обсудим тему вендорозамещения и импортозамещения ПО и технологий, а также сфокусируемся на вопросах их сопровождения.

Поговорим о надежности высоконагруженных систем, рассмотрим конкретные кейсы и обменяемся опытом со спикерами из Сбера, Wildberries и других компаний.

Приглашаем вас присоединиться к большому сообществу support-специалистов и пообщаться с коллегами из технологических компаний со всей страны.
 
Подробности и регистрация - на сайте! Количество мест ограничено.
Please open Telegram to view this post
VIEW IN TELEGRAM
Zero to Hero: Loki | Grafana

Если вы ищете простую систему логирования — почему бы не обратить внимание на Loki? В этой серии видео команда Grafana рассказывает начиная с самых азов.

Intro to Logging | Zero to Hero: Loki | Grafana
Structure of Logs (Part 1) | Zero to Hero: Loki | Grafana
Structure of Logs (Part 2) | Zero to Hero: Loki | Grafana
How to Get Started with Loki | Zero to Hero: Loki | Grafana
Introduction to Ingesting logs with Loki | Zero to Hero: Loki | Grafana
Как случайно написать систему мониторинга (еще одну)

Почему нет, если да?

Статья на Хабр

Репыч на Гитхабе
Dude, where's my error? How OpenTelemetry records errors

Некоторые языки, такие как Python и JavaScript, рассматривают ошибки и исключения как синонимы; другие, такие как PHP и Java, этого не делают. Понимание различия между ошибками и исключениями имеет решающее значение для эффективной обработки ошибок, т.к. оно позволяет использовать более тонкие стратегии обработки и восстановления после сбоев в приложениях.

Это важная статья для понимания того, как устроен OpenTelemetry и как собирает данные. Читать.
Zabbix 7.0 LTS

Трудно спорить с тем, что все очень долго ждали выхода новой мажорной версии Zabbix. Вчера объявили о выходе нового релиза, а там действительно много нововведений:

🟩 Веб-мониторинг на базе Selenium
🟩 Высокая доступность и распределение нагрузки для Zabbix-Proxy
🟩 Повышена производительность Zabbix-Proxy
🟩 Улучшена скорость сбора данных (асинхронные поллеры)
🟩 Централизованное управление таймаутами
🟩 Новые панели для визуализации данных
🟩 Динамический дашборд для навигации между узлами
🟩 Многофакторная аутентификация
🟩 Новые шаблоны и интеграции
🟩 Изменение лицензирования Zabbix на AGPLv3

Что нового
homer

Утилита операторского уровня для наблюдения за пакетами и событиями VoiP/RTC, основанная на протоколе HEP/EEP и готовая принимать большие объемы сигналов, событий RTC, логов и статистики с мгновенным и сквозным поиском.

Репыч на Гитхабе
gatus

Утилита мониторинга состояния, ориентированная на разработчиков, которая дает вам возможность отслеживать службы с помощью HTTP, ICMP, TCP и DNS-запросов, а также анализировать результат запросов, используя список условий для значений, таких как код и время ответа, срок действия сертификата, тело ответа и многие другие. Каждую из этих проверок работоспособности можно сочетать с оповещениями через Slack, Teams, PagerDuty, Discord, Twilio и другие.

Репыч на гитхабе
Дашборды на Apache Superset

Можно рассмотреть в качестве замены PowerBI. Superset отвечает следующим требованиям:

⚡️ Открытый исходный код

⚡️ Возможность добавления новых коннекторов

⚡️ SQL для выполнения запросов

⚡️ Мнопользовательская модель доступа к дашбордам

⚡️ Возможность параметризации дашбордов для гибкой настройки

⚡️ Многообразие визализаций

Репыч на Гитхабе (60К звезд — не хухры-мухры)

Статья с описанием на medium.com
Главная в России конференция про Kubernetes®

4 июля на Kuber Conf’24 разработчики и эксперты по контейнерным технологиям поделятся стратегиями решения бизнес-задач, обзорами инструментов и лучшими практиками. Подробная программа — на сайте!

Регистрируйтесь и присоединяйтесь к сообществу K8s-специалистов.

Место проведения — Москва, можно участвовать онлайн.
Гайд по настройке мониторинга PostgreSQL при помощи Prometheus и Grafana

В статье подобно разобрана настройка мониторинга БД PostgreSQL. Читать на medium.