А в этом репозитории одна штука, чтобы генерить дашборды Grafana из Python-скриптов. Полезно? Не то слово!
Lessons learned about monitoring the JVM in the era of containers
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.
How we scaled Graphite to 100,000 writes per second
В этой статье о вертикальном масштабировании вычислений до 100 000 операций записи в секунду.
А кто-то использует Graphite в своём стеке мониторинга?
👍 — использую
👎 — не использую
👀 — карандаши как-то не очень, обычно ручкой пользуюсь
В этой статье о вертикальном масштабировании вычислений до 100 000 операций записи в секунду.
А кто-то использует Graphite в своём стеке мониторинга?
👍 — использую
👎 — не использую
👀 — карандаши как-то не очень, обычно ручкой пользуюсь
Forwarded from /usr/bin
В этой статье несколько слов о мониторинге контейнеров Docker при помощи docker stats и cAdvisor.
How the cortex and thanos projects collaborate to make scaling prometheus better for all
Коллаборация Cortex и Thanos для масштабирования Prometheus (в блоге Grafana)
А ещё есть запись выступления «Two Households, Both Alike in Dignity: Cortex and Thanos» с PromCon 2019 (выступают сооснователи Cortex и Thanos Tom Wilkie и Bartek Plotka соответственно)
Коллаборация Cortex и Thanos для масштабирования Prometheus (в блоге Grafana)
А ещё есть запись выступления «Two Households, Both Alike in Dignity: Cortex and Thanos» с PromCon 2019 (выступают сооснователи Cortex и Thanos Tom Wilkie и Bartek Plotka соответственно)
Grafana Labs
How the Cortex and Thanos projects collaborate to make scaling Prometheus better for all | Grafana Labs
At PromCon Online, Marco Pracucci and Bartek Plotka talked about how Cortex and Thanos started to learn from and even influence each other – thanks to open source.
Monitoring Application Metrics With Nutanix Karbon
Пошаговое руководство по настройке кластера Karbon для мониторинга кластера и приложений и настройка представлений в Grafana.
Пошаговое руководство по настройке кластера Karbon для мониторинга кластера и приложений и настройка представлений в Grafana.
Instana сделала 6-минутный ролик с описанием работы их инструмента для APM-мониторинга распределённых приложений. Внимание! Внутри ролика мемасики.
Если вам интересно посмотреть Instana у себя — напишите в личку.
Если вам интересно посмотреть Instana у себя — напишите в личку.
Подписчик попросил разместить ролик с рассказом о предпосылках и внедрении APM-мониторинга Appdynamics в банке Санкт-Петербург (БСПБ). Рассказывает Алексей Тутуков — начальник управления мониторинга и реагирования БСПБ.
Забавно, что ребята взяли да и вставили в презентацию мою картинку с Мо шестилетней давности. Жаль, что даже лайков не отсыпали. А та картинка была в статье на Хабре о принципах мониторинга бизнес-приложений.
Забавно, что ребята взяли да и вставили в презентацию мою картинку с Мо шестилетней давности. Жаль, что даже лайков не отсыпали. А та картинка была в статье на Хабре о принципах мониторинга бизнес-приложений.
NetXMS — как Solarwinds для желающих получить кое-что бесплатно. Это бесплатная система мониторинга с автоматическим дискаверингом L2 и L3, собирает метрики ОС, Oracle, MySQL, PostgreSQL, MongoDB, DB2, Tuxedo и другие. Система вроде как развивается, последний релиз был 16 июня 2020 года.
Вот тут прошлогодняя статья на Хабре.
Вот тут прошлогодняя статья на Хабре.
SRE: Анализ производительности. Способ настройки с использованием простого вебсервера на Go
Анализ производительности можно применять для проверки узких мест в программе, применяя научный подход при проверке экспериментов по настройке. Эта статья определяет общий подход к анализу производительности и настройке с использованием в качестве примера вебсервера на Go. Читать дальше на Хабре
Анализ производительности можно применять для проверки узких мест в программе, применяя научный подход при проверке экспериментов по настройке. Эта статья определяет общий подход к анализу производительности и настройке с использованием в качестве примера вебсервера на Go. Читать дальше на Хабре
Интересно, Ozon как-то отслеживает такие проблемы на своём сайте? То есть ты готов уже оплатить, но что-то пошло не так. Главное, не пишут что именно. Перезагрузка страницы, переход в режим инкогнито или использование другого браузера не помогает. Не знаю есть ли среди подписчиков кто-то из Ozon, но если вы расскажете как у вас отрабатываются такие проблемы на сайте, думаю всем будет интересно. Пишите мне в личку.
Fluentd — Splitting Logs
В большинстве инсталляций Kubernetes у нас есть приложения с логированием в stdout различных типов журналов. Хорошим примером являются журналы приложений и журналы контроля доступа, оба содержат очень важную информацию, но мы должны анализировать их по-разному, чтобы сделать это, мы используем возможности fluentd и некоторых его плагинов.
В этом практическом посте мы объясним, как разделить эти журналы на параллельные потоки, чтобы вы могли в дальнейшем их обрабатывать.
В большинстве инсталляций Kubernetes у нас есть приложения с логированием в stdout различных типов журналов. Хорошим примером являются журналы приложений и журналы контроля доступа, оба содержат очень важную информацию, но мы должны анализировать их по-разному, чтобы сделать это, мы используем возможности fluentd и некоторых его плагинов.
В этом практическом посте мы объясним, как разделить эти журналы на параллельные потоки, чтобы вы могли в дальнейшем их обрабатывать.
Medium
Fluentd — Splitting Logs
In most kubernetes deployments we have applications logging into stdout different type of logs. A good example are application logs and…
Redesigning Observability Logging
Статья — попытка переосмыслить подход к журналированию. Вышла на Медиуме 5 августа.
Статья — попытка переосмыслить подход к журналированию. Вышла на Медиуме 5 августа.
Medium
Redesigning Observability Logging
Bringing Context and Environment back to Event Collection
Understanding Istio and TCP services
Используя реальный кейс, мы исследуем, как Istio направляет TCP-трафик и как избежать некоторых распространенных ошибок, с которыми мы столкнулись в самом начале пути.
Используя реальный кейс, мы исследуем, как Istio направляет TCP-трафик и как избежать некоторых распространенных ошибок, с которыми мы столкнулись в самом начале пути.
Medium
Understanding Istio and TCP services
See how Istio build the Envoy proxy configuration for TCP Services in Kubernetes and how some unrelated resources can induce issues
Отправка Nginx json логов с помощью Vector в Clickhouse и Elasticsearch
Будучи написанным на языке Rust, он отличается высокой производительностью и низким потреблением оперативной памяти по сравнению с аналогами. Кроме того, большое внимание уделено функциям, связанным с корректностью, в частности, возможностям сохранения неотправленных событий в буфер на диске и ротации файлов. Читать дальше…
Будучи написанным на языке Rust, он отличается высокой производительностью и низким потреблением оперативной памяти по сравнению с аналогами. Кроме того, большое внимание уделено функциям, связанным с корректностью, в частности, возможностям сохранения неотправленных событий в буфер на диске и ротации файлов. Читать дальше…
Systems Monitoring with Prometheus and Grafana (статья опубликована в блоге FlightAware — сервиса по отслеживанию полетов в реальном времени)
Hyperfeed — это основная система отслеживания полетов FlightAware. Её функционал используется в самых важных услугах компании: страницах с рейсами на веб-сайте, Firehose, FlightXML и предупреждениях о задержках рейсов. Так что если Hyperfeed перестает работать, то же самое происходит и с FlightAware. Читать дальше…
Hyperfeed — это основная система отслеживания полетов FlightAware. Её функционал используется в самых важных услугах компании: страницах с рейсами на веб-сайте, Firehose, FlightXML и предупреждениях о задержках рейсов. Так что если Hyperfeed перестает работать, то же самое происходит и с FlightAware. Читать дальше…
Forwarded from /usr/bin
The basics of deploying Logstash pipelines to Kubernetes
Когда я начинаю изучать что-то новое, я ставлю перед собой несколько небольших достижимых целей. Одна из задач, которые я написал, состояла в том, чтобы иметь полностью функциональный, работающий конвейер Logstash, работающий в Kubernetes, получая данные откуда-то, выполнять с ними какие-то действия, а затем отправлять их в ElasticSearch. Читать дальше…
Когда я начинаю изучать что-то новое, я ставлю перед собой несколько небольших достижимых целей. Одна из задач, которые я написал, состояла в том, чтобы иметь полностью функциональный, работающий конвейер Logstash, работающий в Kubernetes, получая данные откуда-то, выполнять с ними какие-то действия, а затем отправлять их в ElasticSearch. Читать дальше…
Друзья нашего канала, команда MONQ Digital lab ищет в свой штат Technical partner manager.
MONQ — это платформа умного управления процессами на основе анализа больших данных и ИИ.
Нужен человек, который сумеет погрузиться в сложный мир продукта и выстроить эффективную техническую коммуникацию с российскими и зарубежными партнерами и заказчиками.
Работа фулл тайм, удалёнка. Подробности вакансии на Хабр Карьере.
MONQ — это платформа умного управления процессами на основе анализа больших данных и ИИ.
Нужен человек, который сумеет погрузиться в сложный мир продукта и выстроить эффективную техническую коммуникацию с российскими и зарубежными партнерами и заказчиками.
Работа фулл тайм, удалёнка. Подробности вакансии на Хабр Карьере.
Loki 1.6.0 released: Metric query performance up to 10x faster, push logs from any client to Promtail, query language and LogCLI enhancements, and more!
С проектом Loki дела идут полным ходом! И снова мы слишком долго ждали между релизами, появилось так много нового, что я не смогу перечислить все изменения. Но это не остановит меня от попыток, так что перейдем к делу.
Я собираюсь обсудить компоненты Loki и упомянуть изменения в виде абзацев. Посмотрим, что получится. Читать дальше…
С проектом Loki дела идут полным ходом! И снова мы слишком долго ждали между релизами, появилось так много нового, что я не смогу перечислить все изменения. Но это не остановит меня от попыток, так что перейдем к делу.
Я собираюсь обсудить компоненты Loki и упомянуть изменения в виде абзацев. Посмотрим, что получится. Читать дальше…