Управление и мониторинг сервера через Telegram бота
Было решено, что нужна система мониторинга, которая будет оповещать меня и руководство о проблемах, для возможности их быстрого устранения. Кроме того хотелось бы иметь возможность оперативно устранить проблему, даже если «под рукой» нет ПК. Читать дальше на Хабре.
Было решено, что нужна система мониторинга, которая будет оповещать меня и руководство о проблемах, для возможности их быстрого устранения. Кроме того хотелось бы иметь возможность оперативно устранить проблему, даже если «под рукой» нет ПК. Читать дальше на Хабре.
Мониторинг начинается с метрик, или Как не сделать из алертов белый шум
Расскажем, какие метрики снимаем, каких методологий придерживаемся и какие алерты видим каждый день. Читать дальше на Хабре.
Расскажем, какие метрики снимаем, каких методологий придерживаемся и какие алерты видим каждый день. Читать дальше на Хабре.
Инструменты мониторинга ASP NET Core приложения в Azure: Event counters
"Event counters" это набор инструментов, которые позволяют публиковать данные мониторинга работающего приложения через стандартизированное API, чтобы различные обработчики могли потреблять эти данные в режиме реального времени. Обработчики могут потреблять эти данные как и изнутри приложения (с помощью класса EventListener) так и извне рабочего процесса (через EventPipe). Читать дальше.
"Event counters" это набор инструментов, которые позволяют публиковать данные мониторинга работающего приложения через стандартизированное API, чтобы различные обработчики могли потреблять эти данные в режиме реального времени. Обработчики могут потреблять эти данные как и изнутри приложения (с помощью класса EventListener) так и извне рабочего процесса (через EventPipe). Читать дальше.
Использование InfluxDB для мониторинга систем хранения данных
⚡️Путешествие в стек мониторинга InfluxDB для мониторинга систем хранения ECS.
⚡️Как добавить High Availability в версию InfluxDB c открытым исходным кодом.
⚡️Как улучшить слой вычисления запроса, выделив его из InfluxDB и сделав его горизонтально масштабируемым.
⚡️Как развернуть стек InfluxDB на ресурсах со сравнительно небольшим объёмом памяти.
⚡️И, наконец, как включить стек мониторинга для хранилища ECS в несколько этапов.
Читать дальше.
⚡️Путешествие в стек мониторинга InfluxDB для мониторинга систем хранения ECS.
⚡️Как добавить High Availability в версию InfluxDB c открытым исходным кодом.
⚡️Как улучшить слой вычисления запроса, выделив его из InfluxDB и сделав его горизонтально масштабируемым.
⚡️Как развернуть стек InfluxDB на ресурсах со сравнительно небольшим объёмом памяти.
⚡️И, наконец, как включить стек мониторинга для хранилища ECS в несколько этапов.
Читать дальше.
Creating a better dashboard with Python, Dash, and Plotly
A walkthrough to get you started with whipping up dashboards easily using Python. Читать дальше на Медиуме.
A walkthrough to get you started with whipping up dashboards easily using Python. Читать дальше на Медиуме.
How to monitor Docker Containers with Elasticsearch, Filebeat & Metricbeat
Having multiple containers spread across different nodes creates the challenge of tracking the health of the containers, storage, CPU, memory utilization and network load. Whilst you can use tools like Portainer to monitor and keep track of your dockers, in a production environment, the Elastic stack becomes the best tool (in my humble opinion) to monitor and maintain these. Читать дальше на Медиуме.
Having multiple containers spread across different nodes creates the challenge of tracking the health of the containers, storage, CPU, memory utilization and network load. Whilst you can use tools like Portainer to monitor and keep track of your dockers, in a production environment, the Elastic stack becomes the best tool (in my humble opinion) to monitor and maintain these. Читать дальше на Медиуме.
Мониторинг веб-приложения на Rust с использованием Prometheus и Grafana
В статье показано как настроить мониторинг веб-приложения на Rust. Приложение выставляет наружу Prometheus метрики, которые визуализируются с помощью Grafana. Мониторинг осуществляется для проекта mongodb-redis demo. Читать дальше на Хабре.
В статье показано как настроить мониторинг веб-приложения на Rust. Приложение выставляет наружу Prometheus метрики, которые визуализируются с помощью Grafana. Мониторинг осуществляется для проекта mongodb-redis demo. Читать дальше на Хабре.
Grafana, InfluxDB, два тега и одна сумма. Или как посчитать сумму подгрупп?
Занимаюсь тестированием производительности. И очень люблю настраивать мониторинг и любоваться метриками в Grafana. А стандартом для хранения метрик в инструментах для подачи нагрузки является InfluxDB. В InfluxDB можно сохранять метрики из таких популярных инструментов, как:
⚡️Apache.JMeter
⚡️Gatling
⚡️LoadRunner Enterprise
⚡️Yandex.Tank
Читать дальше на Хабре.
Занимаюсь тестированием производительности. И очень люблю настраивать мониторинг и любоваться метриками в Grafana. А стандартом для хранения метрик в инструментах для подачи нагрузки является InfluxDB. В InfluxDB можно сохранять метрики из таких популярных инструментов, как:
⚡️Apache.JMeter
⚡️Gatling
⚡️LoadRunner Enterprise
⚡️Yandex.Tank
Читать дальше на Хабре.
Full Tutorial: Monitoring and Troubleshooting stack with Prometheus, Grafana, Loki and Komodor
I like to provide “real-world” examples to showcase the value of tools such as Komodor. In this scenario, we are going to have our Monitoring Stack with Prometheus, Grafana, and Loki installed on our cluster. Next, we are going to deploy an application and a client. Читать дальше на Медиуме.
I like to provide “real-world” examples to showcase the value of tools such as Komodor. In this scenario, we are going to have our Monitoring Stack with Prometheus, Grafana, and Loki installed on our cluster. Next, we are going to deploy an application and a client. Читать дальше на Медиуме.
[Prometheus] What is the difference between rate and irate
Here are the definitions from the official document for rate() and irate(). But if you still don’t quite understand, check the examples below. Читать дальше на Медиуме.
Here are the definitions from the official document for rate() and irate(). But if you still don’t quite understand, check the examples below. Читать дальше на Медиуме.
Medium
[Prometheus] What is the difference between rate and irate
Here are the definitions from the official document for rate() and irate(). But if you still don’t quite understand, check the examples…
Integrate Graphana board into front-end application
Our microservices cluster consists of many business-purpose services, front-end applications, SQL and NoSQL storage, and different orchestration services that are the butter of this cluster. Obviously, to keep the cluster in a healthy state and react to dataflow issues we have a monitoring stack connected to this solution. Читать дальше на Медиуме.
Our microservices cluster consists of many business-purpose services, front-end applications, SQL and NoSQL storage, and different orchestration services that are the butter of this cluster. Obviously, to keep the cluster in a healthy state and react to dataflow issues we have a monitoring stack connected to this solution. Читать дальше на Медиуме.
A day in the life of an SRE: updating a production-critical Redis cluster
In this article, I share best practices in how to fully capitalise on your migration efforts. I take you through the steps of our Redis cluster update, explain the challenges I faced and highlight potential pitfalls. After all, operating safely comes with experience. Читать дальше на Медиуме.
In this article, I share best practices in how to fully capitalise on your migration efforts. I take you through the steps of our Redis cluster update, explain the challenges I faced and highlight potential pitfalls. After all, operating safely comes with experience. Читать дальше на Медиуме.
Medium
A day in the life of an SRE: updating a production-critical Redis cluster
Get best practice guidance for Redis updates and fully capitalise on your migration
@devopslibrary - Канал с актуальными книгами, новостями и гайдами по теме DevOps и Site Reliability Engineering.
Monitoring Airflow Metrics
Airflow — это продвинутый cron. А в этой статье как этот продвинутый cron мониторить. Читать дальше.
Airflow — это продвинутый cron. А в этой статье как этот продвинутый cron мониторить. Читать дальше.
Medium
Monitoring Airflow Metrics
By Hiren Rupchandani & Mukesh Kumar
Pushing Logs to Loki Without Using Promtail
Promtail can only be configured to scrape logs from a file, pod, or journal. But what if you have a use case where your logs must be sent directly to Loki? For instance, imagine if we could send logs to Loki using Python’s built-in logging module directly from our program. It turns out I had that same exact need and this is how I was able to solve it. Читать дальше.
Promtail can only be configured to scrape logs from a file, pod, or journal. But what if you have a use case where your logs must be sent directly to Loki? For instance, imagine if we could send logs to Loki using Python’s built-in logging module directly from our program. It turns out I had that same exact need and this is how I was able to solve it. Читать дальше.
Using OpenTelemetry auto-instrumentation/agents in Kubernetes
In this article, I would like to introduce OpenTelemetry Operator’s new feature that significantly simplifies instrumenting workloads deployed on Kubernetes. Читать дальше на Медиуме.
In this article, I would like to introduce OpenTelemetry Operator’s new feature that significantly simplifies instrumenting workloads deployed on Kubernetes. Читать дальше на Медиуме.
Medium
Using OpenTelemetry auto-instrumentation/agents in Kubernetes
In this article, we introduce a new feature for OpenTelemetry’s Operator which significantly simplifies installing instrumentation on k8s.
Мониторинг как процесс, или Как перестать бояться алертов и начать спать по ночам
Думаю, многие были в такой ситуации, когда каналы данных разрываются от бешеного количества алертов, находя нас, где бы мы ни были — когда мы едим, спим, в дороге или в душе. Когда мы уже боимся любого звука, который исходит от телефона. Когда уведомления — это белый шум, который мешает, а не помогает находить проблемы в инфраструктуре. Читать дальше.
Думаю, многие были в такой ситуации, когда каналы данных разрываются от бешеного количества алертов, находя нас, где бы мы ни были — когда мы едим, спим, в дороге или в душе. Когда мы уже боимся любого звука, который исходит от телефона. Когда уведомления — это белый шум, который мешает, а не помогает находить проблемы в инфраструктуре. Читать дальше.
Хабр
Мониторинг как процесс, или Как перестать бояться алертов и начать спать по ночам
Думаю, многие были в такой ситуации, когда каналы данных разрываются от бешеного количества алертов, находя нас, где бы мы ни были — когда мы едим, спим, в дороге или в душе. Когда мы уже боимся...
Зонтичная система мониторинга Broadcom DX Operations Intelligence — анонс вебинара
Приглашаем вас в эту пятницу (28 января) в 11 часов утра по московскому времени принять участие в вебинаре, на котором представители Broadcom в России расскажут о зонтичной системе мониторинга Digital Operational Intelligence (DX OI). Во время сессии вы узнаете об основных функциях системы и об основных разделах пользовательского интерфейса. Опираясь на функциональные возможности DX OI, вы сможете обеспечить значительную операционную эффективность IT-подразделений, что позволит принимать более быстрые и правильные решения для повышения качества ИТ-услуг и бизнес-сервисов за счет междоменного контекстного анализа. Регистрация.
Приглашаем вас в эту пятницу (28 января) в 11 часов утра по московскому времени принять участие в вебинаре, на котором представители Broadcom в России расскажут о зонтичной системе мониторинга Digital Operational Intelligence (DX OI). Во время сессии вы узнаете об основных функциях системы и об основных разделах пользовательского интерфейса. Опираясь на функциональные возможности DX OI, вы сможете обеспечить значительную операционную эффективность IT-подразделений, что позволит принимать более быстрые и правильные решения для повышения качества ИТ-услуг и бизнес-сервисов за счет междоменного контекстного анализа. Регистрация.
Развитие модуля анализа исторической нагрузки pg_profile/pgpro_pwr
Расширение pg_profile предназначено для анализа исторической нагрузки в базах данных Postgres. Его главной особенностью является экстремальная простота установки и использования - оно не требует для работы ничего кроме самой СУБД и любого планировщика заданий. Слайды выступления и видео здесь.
Расширение pg_profile предназначено для анализа исторической нагрузки в базах данных Postgres. Его главной особенностью является экстремальная простота установки и использования - оно не требует для работы ничего кроме самой СУБД и любого планировщика заданий. Слайды выступления и видео здесь.