Мониторим ИТ

Управление и мониторинг сервера через Telegram бота

Было решено, что нужна система мониторинга, которая будет оповещать меня и руководство о проблемах, для возможности их быстрого устранения. Кроме того хотелось бы иметь возможность оперативно устранить проблему, даже если «под рукой» нет ПК. Читать дальше на Хабре.

2.6K views08:40

Мониторим ИТ

Мониторинг начинается с метрик, или Как не сделать из алертов белый шум

Расскажем, какие метрики снимаем, каких методологий придерживаемся и какие алерты видим каждый день. Читать дальше на Хабре.

3.7K views11:00

Мониторим ИТ

Инструменты мониторинга ASP NET Core приложения в Azure: Event counters

"Event counters" это набор инструментов, которые позволяют публиковать данные мониторинга работающего приложения через стандартизированное API, чтобы различные обработчики могли потреблять эти данные в режиме реального времени. Обработчики могут потреблять эти данные как и изнутри приложения (с помощью класса EventListener) так и извне рабочего процесса (через EventPipe). Читать дальше.

2.7K views18:00

Мониторим ИТ

Использование InfluxDB для мониторинга систем хранения данных

⚡️Путешествие в стек мониторинга InfluxDB для мониторинга систем хранения ECS.

⚡️Как добавить High Availability в версию InfluxDB c открытым исходным кодом.

⚡️Как улучшить слой вычисления запроса, выделив его из InfluxDB и сделав его горизонтально масштабируемым.

⚡️Как развернуть стек InfluxDB на ресурсах со сравнительно небольшим объёмом памяти.

⚡️И, наконец, как включить стек мониторинга для хранилища ECS в несколько этапов.

Читать дальше.

3.4K views05:00

Мониторим ИТ

Creating a better dashboard with Python, Dash, and Plotly

A walkthrough to get you started with whipping up dashboards easily using Python. Читать дальше на Медиуме.

5.2K views08:08

Мониторим ИТ

How to monitor Docker Containers with Elasticsearch, Filebeat & Metricbeat

Having multiple containers spread across different nodes creates the challenge of tracking the health of the containers, storage, CPU, memory utilization and network load. Whilst you can use tools like Portainer to monitor and keep track of your dockers, in a production environment, the Elastic stack becomes the best tool (in my humble opinion) to monitor and maintain these. Читать дальше на Медиуме.

4.1K views09:09

Мониторим ИТ

Мониторинг веб-приложения на Rust с использованием Prometheus и Grafana

В статье показано как настроить мониторинг веб-приложения на Rust. Приложение выставляет наружу Prometheus метрики, которые визуализируются с помощью Grafana. Мониторинг осуществляется для проекта mongodb-redis demo. Читать дальше на Хабре.

4.3K views10:00

Мониторим ИТ

Grafana, InfluxDB, два тега и одна сумма. Или как посчитать сумму подгрупп?

Занимаюсь тестированием производительности. И очень люблю настраивать мониторинг и любоваться метриками в Grafana. А стандартом для хранения метрик в инструментах для подачи нагрузки является InfluxDB. В InfluxDB можно сохранять метрики из таких популярных инструментов, как:

⚡️Apache.JMeter
⚡️Gatling
⚡️LoadRunner Enterprise
⚡️Yandex.Tank

Читать дальше на Хабре.

2.5K views13:30

Мониторим ИТ

https://youtu.be/f2eyVfCTLi0

YouTube

My new Proxmox Monitoring Tools: InfluxDB2 + Grafana

I recently added some new Monitoring Tools for my Proxmox Server at Home! I installed InfluxDB2 in Docker and used it as an external Metrics Server for Proxmox. Grafana is used to visualize the data in a nice Dashboard. #Proxmox #Grafana #InfluxDB

Grafana…

2.6K views14:21

Мониторим ИТ

Full Tutorial: Monitoring and Troubleshooting stack with Prometheus, Grafana, Loki and Komodor

I like to provide “real-world” examples to showcase the value of tools such as Komodor. In this scenario, we are going to have our Monitoring Stack with Prometheus, Grafana, and Loki installed on our cluster. Next, we are going to deploy an application and a client. Читать дальше на Медиуме.

2.5K views08:00

Мониторим ИТ

[Prometheus] What is the difference between rate and irate

Here are the definitions from the official document for rate() and irate(). But if you still don’t quite understand, check the examples below. Читать дальше на Медиуме.

Medium

[Prometheus] What is the difference between rate and irate

Here are the definitions from the official document for rate() and irate(). But if you still don’t quite understand, check the examples…

4.0K views13:30

Мониторим ИТ

Integrate Graphana board into front-end application

Our microservices cluster consists of many business-purpose services, front-end applications, SQL and NoSQL storage, and different orchestration services that are the butter of this cluster. Obviously, to keep the cluster in a healthy state and react to dataflow issues we have a monitoring stack connected to this solution. Читать дальше на Медиуме.

2.7K views16:00

Мониторим ИТ

A day in the life of an SRE: updating a production-critical Redis cluster

In this article, I share best practices in how to fully capitalise on your migration efforts. I take you through the steps of our Redis cluster update, explain the challenges I faced and highlight potential pitfalls. After all, operating safely comes with experience. Читать дальше на Медиуме.

Medium

A day in the life of an SRE: updating a production-critical Redis cluster

Get best practice guidance for Redis updates and fully capitalise on your migration

3.0K views08:00

Мониторим ИТ

@devopslibrary - Канал с актуальными книгами, новостями и гайдами по теме DevOps и Site Reliability Engineering.

2.9K views08:49

Мониторим ИТ

Monitoring Airflow Metrics

Airflow — это продвинутый cron. А в этой статье как этот продвинутый cron мониторить. Читать дальше.

Medium

Monitoring Airflow Metrics

By Hiren Rupchandani & Mukesh Kumar

3.2K viewsedited 11:00

Мониторим ИТ

Pushing Logs to Loki Without Using Promtail

Promtail can only be configured to scrape logs from a file, pod, or journal. But what if you have a use case where your logs must be sent directly to Loki? For instance, imagine if we could send logs to Loki using Python’s built-in logging module directly from our program. It turns out I had that same exact need and this is how I was able to solve it. Читать дальше.

4.6K views18:00

Мониторим ИТ

Using OpenTelemetry auto-instrumentation/agents in Kubernetes

In this article, I would like to introduce OpenTelemetry Operator’s new feature that significantly simplifies instrumenting workloads deployed on Kubernetes. Читать дальше на Медиуме.

Medium

Using OpenTelemetry auto-instrumentation/agents in Kubernetes

In this article, we introduce a new feature for OpenTelemetry’s Operator which significantly simplifies installing instrumentation on k8s.

2.7K views10:56

Мониторим ИТ

Мониторинг как процесс, или Как перестать бояться алертов и начать спать по ночам

Думаю, многие были в такой ситуации, когда каналы данных разрываются от бешеного количества алертов, находя нас, где бы мы ни были — когда мы едим, спим, в дороге или в душе. Когда мы уже боимся любого звука, который исходит от телефона. Когда уведомления — это белый шум, который мешает, а не помогает находить проблемы в инфраструктуре. Читать дальше.

Хабр

Мониторинг как процесс, или Как перестать бояться алертов и начать спать по ночам

Думаю, многие были в такой ситуации, когда каналы данных разрываются от бешеного количества алертов, находя нас, где бы мы ни были — когда мы едим, спим, в дороге или в душе. Когда мы уже боимся...

4.5K views19:41

Мониторим ИТ

Зонтичная система мониторинга Broadcom DX Operations Intelligence — анонс вебинара

Приглашаем вас в эту пятницу (28 января) в 11 часов утра по московскому времени принять участие в вебинаре, на котором представители Broadcom в России расскажут о зонтичной системе мониторинга Digital Operational Intelligence (DX OI). Во время сессии вы узнаете об основных функциях системы и об основных разделах пользовательского интерфейса. Опираясь на функциональные возможности DX OI, вы сможете обеспечить значительную операционную эффективность IT-подразделений, что позволит принимать более быстрые и правильные решения для повышения качества ИТ-услуг и бизнес-сервисов за счет междоменного контекстного анализа. Регистрация.

3.7K views17:21

Мониторим ИТ

Развитие модуля анализа исторической нагрузки pg_profile/pgpro_pwr

Расширение pg_profile предназначено для анализа исторической нагрузки в базах данных Postgres. Его главной особенностью является экстремальная простота установки и использования - оно не требует для работы ничего кроме самой СУБД и любого планировщика заданий. Слайды выступления и видео здесь.

3.1K views12:29

About

Blog

Apps

Platform