Forwarded from Мониторим ИТ
How to optimize PromQL and MetricsQL queries
PromQL и MetricsQL — мощные языки запросов. Они позволяют писать простые запросы для построения красивых графиков по данным временных рядов. Также они позволяют писать сложные запросы для расчетов SLI/SLO и алертов. В этой статье про выявление медленных запросов PromQL, определение стоимость запросов и их оптимизации, чтобы они выполнялись быстрее и потребляли меньше ресурсов CPU и RAM. Читать дальше.
PromQL и MetricsQL — мощные языки запросов. Они позволяют писать простые запросы для построения красивых графиков по данным временных рядов. Также они позволяют писать сложные запросы для расчетов SLI/SLO и алертов. В этой статье про выявление медленных запросов PromQL, определение стоимость запросов и их оптимизации, чтобы они выполнялись быстрее и потребляли меньше ресурсов CPU и RAM. Читать дальше.
Medium
How to optimize PromQL and MetricsQL queries
The article explains how to detect and optimize slow PromQL queries in production
Forwarded from /usr/bin
Серия статей по траблшутингу производительности Linux. Если не знаете куда копать, то они должны помочь.
Linux troubleshooting: CPU analysis
Linux troubleshooting: Memory analysis
Linux troubleshooting: Disk analysis
Linux Memory: Buffer vs Cache
Linux — Disk I/O Deep Dive
Linux — How to Measure Network Performance
Linux — How To Troubleshoot DNS Issues
Linux troubleshooting: CPU analysis
Linux troubleshooting: Memory analysis
Linux troubleshooting: Disk analysis
Linux Memory: Buffer vs Cache
Linux — Disk I/O Deep Dive
Linux — How to Measure Network Performance
Linux — How To Troubleshoot DNS Issues
Forwarded from Мониторим ИТ
Что нового в Grafana 9 по части алертинга?
В июне Grafana Labs объявили о выходе новой 9 версии своего решения-хедлайнера — инструмента для визуализации Grafana. Как и полагается мажорной версии, появилось увесистое количество обновлений. И одно из ключевых обновлений — новые возможности алертинга. Ниже некоторые подробности этих обновлений.
⚡️ Инстансные оповещения
До Grafana 9 оповещения нужно было привязывать к панели или дашборду. Теперь алертами можно управлять как будто это регулярное выражение. Правила алертинга могут создавать несколько отдельных экземпляров алертов внутри каждого правила. Правило определяет, когда отправлять оповещения, но оповещать можно сразу по нескольким элементам. Пример из реальной жизни: представьте, что у вас есть умный дом и вы хотите знать, когда открыты окна. У вас может быть одно оповещение «Сообщите мне, открыты ли окна», и для каждого окна вы получите «Окно x открыто!» Не нужно создавать более одного правила.
⚡️ Группировка и маршрутизация оповещений
Когда возникает событийный шторм, сотни оповещений могут прийти одновременно. Политики алертинга решают такую проблему. Это набор правил, определяющих, в какой канал как направляются оповещения. Объединение политик алертинга с функцией группировки позволяет все оповещения, относящиеся к одному компоненту системы, объединить вместе, чтобы Grafana будет отправляла только одно уведомление, содержащее список затронутых сред для этого правила. Политики оповещений имеют древовидную структуру, в которой каждая политика может иметь одну или несколько дочерних политик. Каждая политика, кроме корневой политики, может соответствовать определенным меткам алертов. Каждый алерт оценивается корневой политикой, а затем каждой дочерней политикой, чтобы можно было алертить в определенные каналы. В результате один алерт улетит сразу в несколько каналов на основе определенных критериев метки.
⚡️ Молчание - золото
Бесшумный режим позволяет останавливать уведомления от одного или нескольких правил. С помощью этой новой функции можно частично приостановить оповещение на основе определенных критериев. Бесшумный режим только приостанавливает создание алертов. В пользовательском интерфейсе всё так же будут отображаться экземпляры алертов. Это сделано нарочно: вы можете видеть текущий статус экземпляра алерта, но не получите уведомления.
⚡️ Режим обслуживания на период времени
В Grafana 9 можно указать интервал времени, когда вы не хотите, чтобы новые уведомления генерировались или отправлялись. Например, можно установить время отключения генерации и отправки для нескольких или всех ваших маршрутов оповещений, чтобы вас не отрывали от шашлындоса или посиделок в баре.
Подробнее.
В июне Grafana Labs объявили о выходе новой 9 версии своего решения-хедлайнера — инструмента для визуализации Grafana. Как и полагается мажорной версии, появилось увесистое количество обновлений. И одно из ключевых обновлений — новые возможности алертинга. Ниже некоторые подробности этих обновлений.
⚡️ Инстансные оповещения
До Grafana 9 оповещения нужно было привязывать к панели или дашборду. Теперь алертами можно управлять как будто это регулярное выражение. Правила алертинга могут создавать несколько отдельных экземпляров алертов внутри каждого правила. Правило определяет, когда отправлять оповещения, но оповещать можно сразу по нескольким элементам. Пример из реальной жизни: представьте, что у вас есть умный дом и вы хотите знать, когда открыты окна. У вас может быть одно оповещение «Сообщите мне, открыты ли окна», и для каждого окна вы получите «Окно x открыто!» Не нужно создавать более одного правила.
⚡️ Группировка и маршрутизация оповещений
Когда возникает событийный шторм, сотни оповещений могут прийти одновременно. Политики алертинга решают такую проблему. Это набор правил, определяющих, в какой канал как направляются оповещения. Объединение политик алертинга с функцией группировки позволяет все оповещения, относящиеся к одному компоненту системы, объединить вместе, чтобы Grafana будет отправляла только одно уведомление, содержащее список затронутых сред для этого правила. Политики оповещений имеют древовидную структуру, в которой каждая политика может иметь одну или несколько дочерних политик. Каждая политика, кроме корневой политики, может соответствовать определенным меткам алертов. Каждый алерт оценивается корневой политикой, а затем каждой дочерней политикой, чтобы можно было алертить в определенные каналы. В результате один алерт улетит сразу в несколько каналов на основе определенных критериев метки.
⚡️ Молчание - золото
Бесшумный режим позволяет останавливать уведомления от одного или нескольких правил. С помощью этой новой функции можно частично приостановить оповещение на основе определенных критериев. Бесшумный режим только приостанавливает создание алертов. В пользовательском интерфейсе всё так же будут отображаться экземпляры алертов. Это сделано нарочно: вы можете видеть текущий статус экземпляра алерта, но не получите уведомления.
⚡️ Режим обслуживания на период времени
В Grafana 9 можно указать интервал времени, когда вы не хотите, чтобы новые уведомления генерировались или отправлялись. Например, можно установить время отключения генерации и отправки для нескольких или всех ваших маршрутов оповещений, чтобы вас не отрывали от шашлындоса или посиделок в баре.
Подробнее.
Forwarded from k8s (in)security (Дмитрий Евдокимов)
Большинство людей (до 85% населения Земли) являются визуалами (главным типом восприятия является именно зрительный контакт) и изучать таким людям что-то новое или сложное проще на картинках. У Ивана Величко есть замечательный блог с разделом Learning Series, где можно узнать много всего о
- Debunking Container Myths
- Mastering Container Networking
- Working with Kubernetes API
- Writing Kubernetes Controllers/Operators
- Implementing Container Manager
Данная серия будет очень полезна как новичкам, так и знатокам - лично я из каждого поста, картинки открываю для себя что-то новое
containers
и Kubernetes
именно в такой форме. Сейчас есть серии на темы:- Debunking Container Myths
- Mastering Container Networking
- Working with Kubernetes API
- Writing Kubernetes Controllers/Operators
- Implementing Container Manager
Данная серия будет очень полезна как новичкам, так и знатокам - лично я из каждого поста, картинки открываю для себя что-то новое
Kubernetes
. Могу это смело рекомендовать на ряду с изучением официальной документации Kubernetes
- просто MUST READ
!Iximiuz
Learning Series by Ivan Velichko
All learning series on Containers, Kubernetes, and Backend Development by Ivan Velichko
Forwarded from Записки админа
🐧 A journey into the Linux scheduler - объёмное, интересное чтиво, с кучей дополнительных полезных ссылок.
#scheduler #напочитать #фидбечат
#scheduler #напочитать #фидбечат
Forwarded from Yandex Cloud
Yandex Scale 2022 — регистрация открыта!
Каждый год мы проводим Yandex Scale — наше главное мероприятие. Мы встречаемся, чтобы открыто говорить о современных облачных технологиях и ваших задачах, которые они помогают решить. Вместе с вами ищем новые возможности для роста бизнеса и, конечно, обсуждаем новости платформы.
В этом году Yandex Scale пройдёт 23 сентября — офлайн в кинотеатре Октябрь и онлайн на сайте конференции.
Регистрируйтесь и добавляйте событие в календарь, чтобы ничего не пропустить →
А следить за новостями удобно в официальном канале конференции @yandexscale.
#yacloud_news
Каждый год мы проводим Yandex Scale — наше главное мероприятие. Мы встречаемся, чтобы открыто говорить о современных облачных технологиях и ваших задачах, которые они помогают решить. Вместе с вами ищем новые возможности для роста бизнеса и, конечно, обсуждаем новости платформы.
В этом году Yandex Scale пройдёт 23 сентября — офлайн в кинотеатре Октябрь и онлайн на сайте конференции.
Регистрируйтесь и добавляйте событие в календарь, чтобы ничего не пропустить →
А следить за новостями удобно в официальном канале конференции @yandexscale.
#yacloud_news
Разыскиваются опытные разработчики, чтобы обучиться профессии архитектора ПО на онлайн-курсе Skillbox.
Вы познакомитесь с инструментами и лучшими практиками построения архитектуры ПО. Научитесь выбирать архитектурный стиль под конкретную бизнес-задачу, сможете создавать масштабируемые отказоустойчивые приложения и повысите свой доход.
Формат:
— Онлайн-занятия.
— Отработка на практических примерах.
— Обратная связь от проверяющих экспертов и кураторов.
— Защита итогового проекта.
Первый месяц обучения бесплатно.
Вы сможете изучать материалы курса в удобном для вас режиме. Для обучения достаточно 3-5 часов в неделю.
Курс записан совместно с «Альфа-Банком».
Записаться на курс со скидкой или получить бесплатную консультацию: https://clc.to/f6740Q
Вы познакомитесь с инструментами и лучшими практиками построения архитектуры ПО. Научитесь выбирать архитектурный стиль под конкретную бизнес-задачу, сможете создавать масштабируемые отказоустойчивые приложения и повысите свой доход.
Формат:
— Онлайн-занятия.
— Отработка на практических примерах.
— Обратная связь от проверяющих экспертов и кураторов.
— Защита итогового проекта.
Первый месяц обучения бесплатно.
Вы сможете изучать материалы курса в удобном для вас режиме. Для обучения достаточно 3-5 часов в неделю.
Курс записан совместно с «Альфа-Банком».
Записаться на курс со скидкой или получить бесплатную консультацию: https://clc.to/f6740Q
Тинькофф приглашает SRE-инженеров с опытом от 2 лет на One Day Offer 💡
Встретимся онлайн 31 июля:
• вместе с вами разыграем ситуацию критического отказа системы;
• попросим написать несложный алгоритм на вашем любимом языке в онлайн-IDE;
• познакомим с будущей командой.
Если понравятся условия и задачи — сделаем оффер в тот же день.
Работа в нашей команде — это возможность стать частью большого SRE-комьюнити , прокачивать свои скиллы на внутренних митапах и курсах, обмениваться опытом на конференциях и участвовать в образовательных проектах.
Успейте подать заявку до 28 июля: https://l.tinkoff.ru/sre-one-day-offer
Встретимся онлайн 31 июля:
• вместе с вами разыграем ситуацию критического отказа системы;
• попросим написать несложный алгоритм на вашем любимом языке в онлайн-IDE;
• познакомим с будущей командой.
Если понравятся условия и задачи — сделаем оффер в тот же день.
Работа в нашей команде — это возможность стать частью большого SRE-комьюнити , прокачивать свои скиллы на внутренних митапах и курсах, обмениваться опытом на конференциях и участвовать в образовательных проектах.
Успейте подать заявку до 28 июля: https://l.tinkoff.ru/sre-one-day-offer
Forwarded from Mops DevOps
Six critical blindspots while securing Argo CD
🔹 Use a dedicated project for the control plane
🔹 Argo resources are for Argo admins only
🔹 Delete the “default” project
🔹 Block ClusterRoleBindings in (most) projects
🔹 Narrow roles on remote clusters
🔹 Have a CVE response plan ready
👉 https://bit.ly/3bTjh4V
#argocd #security
🔹 Use a dedicated project for the control plane
🔹 Argo resources are for Argo admins only
🔹 Delete the “default” project
🔹 Block ClusterRoleBindings in (most) projects
🔹 Narrow roles on remote clusters
🔹 Have a CVE response plan ready
👉 https://bit.ly/3bTjh4V
#argocd #security
Forwarded from DevOpsMinsk
Место встречи изменить нельзя!
13 июля в 18:00 (UTC +3) подключайтесь на YouTube-стрим: соберёмся на кухне DevOps Kitchen Talks!
Поиграем в настолки и обсудим:
1. Географию DevOps в 2022-ом году.
2. Kак работается в AWS по сравнению с EPAM и startup-ом.
3. Хобби ведущих.
В эфире:
Виктор Ведмич, Senior Developer Advocate в AWS
Максим Белицкий, DevOps Team Lead в EPAM
Александр Довнар, DevOps Team Lead в Naviteq
Будем рады всех видеть в комментариях: оставляйте вопросы и мы ответим на них в прямом эфире.
#devopskitchentalks
13 июля в 18:00 (UTC +3) подключайтесь на YouTube-стрим: соберёмся на кухне DevOps Kitchen Talks!
Поиграем в настолки и обсудим:
1. Географию DevOps в 2022-ом году.
2. Kак работается в AWS по сравнению с EPAM и startup-ом.
3. Хобби ведущих.
В эфире:
Виктор Ведмич, Senior Developer Advocate в AWS
Максим Белицкий, DevOps Team Lead в EPAM
Александр Довнар, DevOps Team Lead в Naviteq
Будем рады всех видеть в комментариях: оставляйте вопросы и мы ответим на них в прямом эфире.
#devopskitchentalks
Forwarded from Podlodka Podcast – анонсы и новости подкаста про IT (Eugene Katella)
Обычно самыми страшными считаются алгоритмические собесы. Вдруг придется деревья крутить!
Но на самом деле есть собесы, которые иногда могут быть еще более замороченными. Это собесы по System Design. Те самые, на которых вас за 45 минут просят спроектировать какой-нибудь YouTube или Twitter.
Мы решили приоткрыть завесу тайны и в преддверии нового сезона Backend Crew провести открытый публичный собес по System Design.
Хорошо известный вам Владимир Иванов из Bolt будет собеседовать Дмитрия Башинского из Parimatch, и вместе они попробуют спроектировать высоконагруженный сервис совместного редактирования.
Стрим начинается завтра, 13 июля, в 10:00 по московскому времени, ссылочка тут 👉https://www.youtube.com/watch?v=CPa8T78uT_A
Не пропустите!
Но на самом деле есть собесы, которые иногда могут быть еще более замороченными. Это собесы по System Design. Те самые, на которых вас за 45 минут просят спроектировать какой-нибудь YouTube или Twitter.
Мы решили приоткрыть завесу тайны и в преддверии нового сезона Backend Crew провести открытый публичный собес по System Design.
Хорошо известный вам Владимир Иванов из Bolt будет собеседовать Дмитрия Башинского из Parimatch, и вместе они попробуют спроектировать высоконагруженный сервис совместного редактирования.
Стрим начинается завтра, 13 июля, в 10:00 по московскому времени, ссылочка тут 👉https://www.youtube.com/watch?v=CPa8T78uT_A
Не пропустите!
YouTube
Публичное собеседование по System Design
Новый сезон Podlodka Backend Crew – "Делаем приложение быстрее"! Старт 18 июля, для участников этого стрима скидка по промокоду SYSTEM_DESIGN
http://bit.ly/becrew-system-design
На этой сессии Владимир Иванов (Bolt) проведет собеседование по System Design…
http://bit.ly/becrew-system-design
На этой сессии Владимир Иванов (Bolt) проведет собеседование по System Design…
💣 Хотите стать SRE-специалистом?
🔥 99% специалистов необходимо уметь работать с GIT. SRE-специалист - не исключение!
️️👉 Приходите на открытый урок 19 июля в 20:00 в OTUS, где мы поговорим про основы git, как и какой git выбрать, как начать работать. Рассмотрим командную работу в git, git flow, pull реквесты. Обсудим теги, релизы и сборку кода.
💻 Урок пройдет в рамках онлайн-курса «SRE практики и инструменты» OTUS»
❇️ Пройдите вступительный тест для регистрации на вебинар
🔥 99% специалистов необходимо уметь работать с GIT. SRE-специалист - не исключение!
️️👉 Приходите на открытый урок 19 июля в 20:00 в OTUS, где мы поговорим про основы git, как и какой git выбрать, как начать работать. Рассмотрим командную работу в git, git flow, pull реквесты. Обсудим теги, релизы и сборку кода.
💻 Урок пройдет в рамках онлайн-курса «SRE практики и инструменты» OTUS»
❇️ Пройдите вступительный тест для регистрации на вебинар
Forwarded from Yandex Cloud
Храните секреты безопасно
Секреты — это логины и пароли, ключи сертификатов, ключи сервисных аккаунтов и другие конфиденциальные данные.
С сегодняшнего дня мы открыли доступ к сервису для хранения секретов Yandex Lockbox для всех пользователей. При этом он всё ещё находится на стадии Preview и не тарифицируется.
Для тех, кто уже пользуется сервисом:
🔹 отлажена процедура удаления — теперь она чётко соответствует регламенту жизненного цикла секрета;
🔹 улучшены логирование, мониторинги, внутренний инструментарий поддержки работоспособности;
🔹 оптимизирована работа сервиса.
Сохранить секреты можно по ссылке →
#yacloudnews
Секреты — это логины и пароли, ключи сертификатов, ключи сервисных аккаунтов и другие конфиденциальные данные.
С сегодняшнего дня мы открыли доступ к сервису для хранения секретов Yandex Lockbox для всех пользователей. При этом он всё ещё находится на стадии Preview и не тарифицируется.
Для тех, кто уже пользуется сервисом:
🔹 отлажена процедура удаления — теперь она чётко соответствует регламенту жизненного цикла секрета;
🔹 улучшены логирование, мониторинги, внутренний инструментарий поддержки работоспособности;
🔹 оптимизирована работа сервиса.
Сохранить секреты можно по ссылке →
#yacloudnews
Тинькофф приглашает SRE-инженеров с опытом от 2 лет на One Day Offer 💡
Встретимся онлайн 31 июля:
• вместе с вами разыграем ситуацию критического отказа системы;
• попросим написать несложный алгоритм на вашем любимом языке в онлайн-IDE;
• познакомим с будущей командой.
Если понравятся условия и задачи — сделаем оффер в тот же день.
Работа в нашей команде — это возможность стать частью большого SRE-комьюнити , прокачивать свои скиллы на внутренних митапах и курсах, обмениваться опытом на конференциях и участвовать в образовательных проектах.
Успейте подать заявку до 28 июля: https://l.tinkoff.ru/sre-one-day-offer
Встретимся онлайн 31 июля:
• вместе с вами разыграем ситуацию критического отказа системы;
• попросим написать несложный алгоритм на вашем любимом языке в онлайн-IDE;
• познакомим с будущей командой.
Если понравятся условия и задачи — сделаем оффер в тот же день.
Работа в нашей команде — это возможность стать частью большого SRE-комьюнити , прокачивать свои скиллы на внутренних митапах и курсах, обмениваться опытом на конференциях и участвовать в образовательных проектах.
Успейте подать заявку до 28 июля: https://l.tinkoff.ru/sre-one-day-offer
Forwarded from Sysadmin Tools 🇺🇦
Videos from Monitorama PDX 2022
https://vimeo.com/channels/1798229
#monitoring #monitorama #ovservability
https://vimeo.com/channels/1798229
#monitoring #monitorama #ovservability
Forwarded from Мониторим ИТ
Что означает load average
Кто-то считает, что load average — это загрузка CPU в единицу времени, например, средняя загрузка: 0,51, 0,72, 0,86 означает, что загрузка CPU составляет 51% за последнюю 1 минуту. Но это не так. Средняя загрузка относится к среднему количеству процессов, находящихся в запущенном и непрерывном состоянии в единицу времени, то есть к среднему количеству активных процессов, которое не связано напрямую с использованием CPU. Читать дальше.
Кто-то считает, что load average — это загрузка CPU в единицу времени, например, средняя загрузка: 0,51, 0,72, 0,86 означает, что загрузка CPU составляет 51% за последнюю 1 минуту. Но это не так. Средняя загрузка относится к среднему количеству процессов, находящихся в запущенном и непрерывном состоянии в единицу времени, то есть к среднему количеству активных процессов, которое не связано напрямую с использованием CPU. Читать дальше.
gals.software
Что такое Load Average в Linux
Разберемся что из себя представляет понятие load average и чем оно отличается от загрузки процессора
Forwarded from /usr/bin
Пара статей про настройки безопасности Docker
Вы узнаете как:
- настроить nologin shell
- отключить возможность повышения привилегий
- отключить сетевую доступность между контейнерами
- ограничение использования ресурсов
и многое другое.
👉 Advanced Docker Security
👉 Advanced Docker Security Part II
Вы узнаете как:
- настроить nologin shell
- отключить возможность повышения привилегий
- отключить сетевую доступность между контейнерами
- ограничение использования ресурсов
и многое другое.
👉 Advanced Docker Security
👉 Advanced Docker Security Part II
Forwarded from Технологический Болт Генона
We are splitting our database into Main and CI
https://about.gitlab.com/blog/2022/06/02/splitting-database-into-main-and-ci/
https://about.gitlab.com/blog/2022/06/02/splitting-database-into-main-and-ci/
Forwarded from /usr/bin
Unix Commands, Pipes, and Processes
How to combine Unix commands with pipes and manage running programs. Читать дальше.
How to combine Unix commands with pipes and manage running programs. Читать дальше.
Forwarded from Mops DevOps
Чем отличаются инструменты Chaos-инжиниринга для рабочих нагрузок Kubernetes?
🔹Chaos Toolkit
🔹Pumba
🔹Litmus
🔹Chaos Mesh
Рассмотрим их сильные и слабые стороны 💪
👉 https://bit.ly/3Pjrv4C
#kubernetes
🔹Chaos Toolkit
🔹Pumba
🔹Litmus
🔹Chaos Mesh
Рассмотрим их сильные и слабые стороны 💪
👉 https://bit.ly/3Pjrv4C
#kubernetes