Forwarded from Sysadmin Tools 🇺🇦
How to set up HA VictoriaMetrics
https://medium.com/@haleygo/how-to-set-up-ha-victoriametrics-b0e047b5f63e
#observability #monitoring #helm #ha #victoriametrics
https://medium.com/@haleygo/how-to-set-up-ha-victoriametrics-b0e047b5f63e
#observability #monitoring #helm #ha #victoriametrics
Forwarded from GitHub'ненько
Docmost is an open-source collaborative wiki and documentation software. It is an open-source alternative to Confluence and Notion.
#doc #kb #notes
https://github.com/docmost/docmost
#doc #kb #notes
https://github.com/docmost/docmost
Forwarded from /usr/bin
10 Best Terraform Tools To Use In 2024
В этой статье был представлен подробный обзор инструментов Terraform и 10 лучших инструментов Terraform, которые помогут повысить эффективность использования этого инструмента. Читать статью.
❗️Статья на medium.com
В этой статье был представлен подробный обзор инструментов Terraform и 10 лучших инструментов Terraform, которые помогут повысить эффективность использования этого инструмента. Читать статью.
❗️Статья на medium.com
Forwarded from Кубернетичек
Думаю многие слышали от такой штуке как DRA. Основной целью которого было упростить шаринг ресурсов между разными подами. В том числе резервировать ресурсы в случае если один из подов заехал на ноду, а "зависимые" поды еще не успели, и чтобы соседи не успели их занять. Но вчера попалась реализация Nvidia DRA в контексте GPU. С фичами
* Контролируемое совместное использование GPU (как внутри одного пода, так и между подами)
* Поддержка нескольких моделей GPU на одном узле
* Указание произвольных ограничений для GPU (минимальная/максимальная память, модель устройства и т.д.)
* Естественная поддержка MPS (Multi-Process Service)
* Динамическое выделение MIG устройств (позволяет аппаратно разделить GPU на сеть экземпляров. Каждый имеет изолированную память, кэш, пропускную способность и вычислительные ядра)
* Динамическое перепрофилирование GPU с полного режима в MIG режим
* Динамическое перепрофилирование GPU для использования в режиме Passthrough (прямого доступа) или vGPU (виртуализированного GPU)
Если у вас LLM и ML много в кубе - такое может пригодиться. Правда чтобы заработало, нужно включать feature gate DynamicResourceAllocation
* Контролируемое совместное использование GPU (как внутри одного пода, так и между подами)
* Поддержка нескольких моделей GPU на одном узле
* Указание произвольных ограничений для GPU (минимальная/максимальная память, модель устройства и т.д.)
* Естественная поддержка MPS (Multi-Process Service)
* Динамическое выделение MIG устройств (позволяет аппаратно разделить GPU на сеть экземпляров. Каждый имеет изолированную память, кэш, пропускную способность и вычислительные ядра)
* Динамическое перепрофилирование GPU с полного режима в MIG режим
* Динамическое перепрофилирование GPU для использования в режиме Passthrough (прямого доступа) или vGPU (виртуализированного GPU)
Если у вас LLM и ML много в кубе - такое может пригодиться. Правда чтобы заработало, нужно включать feature gate DynamicResourceAllocation
GitHub
enhancements/keps/sig-node/3063-dynamic-resource-allocation at master · kubernetes/enhancements
Enhancements tracking repo for Kubernetes. Contribute to kubernetes/enhancements development by creating an account on GitHub.
Forwarded from DevOps&SRE Library
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from /usr/bin
Linux Crisis Tools
Когда у вас происходит сбой, вызванный проблемой производительности, вы не хотите терять драгоценное время на установку инструментов, необходимых для ее диагностики. В этой статье список «кризисных инструментов», которые рекомендуется установить на серверах Linux по умолчанию (если они еще не установлены), вместе с именами пакетов (Ubuntu), из которых они взяты. Узнать что за инструменты.
Когда у вас происходит сбой, вызванный проблемой производительности, вы не хотите терять драгоценное время на установку инструментов, необходимых для ее диагностики. В этой статье список «кризисных инструментов», которые рекомендуется установить на серверах Linux по умолчанию (если они еще не установлены), вместе с именами пакетов (Ubuntu), из которых они взяты. Узнать что за инструменты.
Forwarded from /usr/bin
The Kubernetes Troubleshooting Handbook
В этой статье рассмотрены различные методы и инструменты, помогающие устранять неполадки и отлаживать Kubernetes. Независимо от того, являетесь ли вы опытным пользователем Kubernetes или только начинаете, это руководство предоставит ценные сведения об эффективных методах отладки.
В статье рассмотрены следующие подходы и инструменты:
🔍 Анализ событий жизненного цикла Pod
🔍 События Kubernetes и журналы аудита
🔍 Панель управления Kubernetes
🔍 Мониторинг использования ресурсов
🔍 Использование логов kubectl
🔍 Использование kubectl exec для интерактивного устранения неполадок
🔍 Отладка на уровне узлов с помощью kubectl debug
🔍 Отладка на уровне приложения с помощью отладочных контейнеров
🔍 Эфемерные контейнеры для отладки
🔍 Решение проблем DNS и сети
🔍 Отладка приложений с отслеживанием состояния
🔍 Расширенные методы отладки (Jaeger, Mirrord и др.)
Читать статью и начиться траблшутить кубер
❗️Статья на medium.com
В этой статье рассмотрены различные методы и инструменты, помогающие устранять неполадки и отлаживать Kubernetes. Независимо от того, являетесь ли вы опытным пользователем Kubernetes или только начинаете, это руководство предоставит ценные сведения об эффективных методах отладки.
В статье рассмотрены следующие подходы и инструменты:
🔍 Анализ событий жизненного цикла Pod
🔍 События Kubernetes и журналы аудита
🔍 Панель управления Kubernetes
🔍 Мониторинг использования ресурсов
🔍 Использование логов kubectl
🔍 Использование kubectl exec для интерактивного устранения неполадок
🔍 Отладка на уровне узлов с помощью kubectl debug
🔍 Отладка на уровне приложения с помощью отладочных контейнеров
🔍 Эфемерные контейнеры для отладки
🔍 Решение проблем DNS и сети
🔍 Отладка приложений с отслеживанием состояния
🔍 Расширенные методы отладки (Jaeger, Mirrord и др.)
Читать статью и начиться траблшутить кубер
❗️Статья на medium.com
Forwarded from Мониторим ИТ
Python Logging: From Basics to Advanced Practices
Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.
❗️Статья на medium.com
Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.
❗️Статья на medium.com
Forwarded from Технологический Болт Генона
kubernetes-security-for-dummies.pdf
3.5 MB
Я бы назвал это неким чеклистом
Steve Kaelble. Kubernetes Security For Dummies. 2024.
Забрать можно тут, если не из телеги
Steve Kaelble. Kubernetes Security For Dummies. 2024.
Забрать можно тут, если не из телеги
https://www.datocms-assets.com/75231/1704995046-kubernetes-security-for-dummies_wiz_final.pdf
Forwarded from Мониторим ИТ
How to monitor Containerd
В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
Forwarded from DevOps Deflope News
На днях Red Hat анонсировала виртуального помощника на базе AI, который призван упростить работу инженеров и разработчиков с OpenShift. Инструмент называется OpenShift Lightspeed и использует интерфейс в виде чата.
Lightspeed интегрируется в консоль OpenShift и отвечает на технические вопросы о продукте. Он может помочь с устранением неполадок, развёртыванием кластеров и управлением ими. Его основная задача — снять рутинную нагрузку с пользователей и сократить время на поиски решения той или иной проблемы. Например, можно спросить у помощника, как установить аддон OpenShift Virtualization, и получить пошаговую инструкцию или обратиться за подсказками по настройке автоматического масштабирования подов.
https://e42.link/4djIRee
Lightspeed интегрируется в консоль OpenShift и отвечает на технические вопросы о продукте. Он может помочь с устранением неполадок, развёртыванием кластеров и управлением ими. Его основная задача — снять рутинную нагрузку с пользователей и сократить время на поиски решения той или иной проблемы. Например, можно спросить у помощника, как установить аддон OpenShift Virtualization, и получить пошаговую инструкцию или обратиться за подсказками по настройке автоматического масштабирования подов.
https://e42.link/4djIRee
Forwarded from Код и Капуста
Forwarded from Мониторим ИТ
What to Use When: OpenTelemetry vs. eBPF
OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.
❗️Статья на medium.com
OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.
❗️Статья на medium.com
Forwarded from /usr/bin
Защита от брутфорса и эксплоитов OpenSSH
В последних версиях OpenSSH появилась защита от брутфорса (перебора) паролей, а также от попыток эксплоита. Это очень ценные настройки, которыми разработчики рекомендуют воспользоваться всем.
Нужно отметить, что новая функция OpenSSH фундаментально отличается от fail2ban, sshguard и подобных инструментов, поскольку она не парсит логи и не изменяет правила файрвола, а применяет опции только внутри одной программы, не обращаясь никуда через ядро, что делает её гораздо безопаснее вышеупомянутых утилит.
В статье рассказывается про две новый опции конфигурации PerSourcePenalties и PerSourcePenaltyExemptList. Читать на Хабре.
В последних версиях OpenSSH появилась защита от брутфорса (перебора) паролей, а также от попыток эксплоита. Это очень ценные настройки, которыми разработчики рекомендуют воспользоваться всем.
Нужно отметить, что новая функция OpenSSH фундаментально отличается от fail2ban, sshguard и подобных инструментов, поскольку она не парсит логи и не изменяет правила файрвола, а применяет опции только внутри одной программы, не обращаясь никуда через ядро, что делает её гораздо безопаснее вышеупомянутых утилит.
В статье рассказывается про две новый опции конфигурации PerSourcePenalties и PerSourcePenaltyExemptList. Читать на Хабре.
Forwarded from DevOps Deflope News
Подробный разбор всех фичей Kubernetes 1.31
Сегодня ночью вышла новая версия K8s — 1.31. Среди главных нововведений — поле для контроля дополнительных групп, флаг для эмулирования возможностей предыдущих версий Kubernetes и возможность настраивать анонимный доступ к конкретным эндпоинтам.
https://e42.link/4dBWw0t
Сегодня ночью вышла новая версия K8s — 1.31. Среди главных нововведений — поле для контроля дополнительных групп, флаг для эмулирования возможностей предыдущих версий Kubernetes и возможность настраивать анонимный доступ к конкретным эндпоинтам.
https://e42.link/4dBWw0t
Forwarded from DevOps&SRE Library
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from /usr/bin
Запросы и лимиты в Kubernetes: разбираемся в деталях
Управление ресурсами в Kubernetes немного напоминает зефирный тест, который иногда выходит из-под контроля. Если тщательно не лимитировать, сколько ресурсов может потреблять контейнер, он пойдёт вразнос, примерно как малыш, способный слопать большую пачку Skittles за один присест.
В этой статье на Хабре подробно рассказано, как в Kubernetes организована работа с запросами и лимитами, как они используются для управления ресурсами.
Управление ресурсами в Kubernetes немного напоминает зефирный тест, который иногда выходит из-под контроля. Если тщательно не лимитировать, сколько ресурсов может потреблять контейнер, он пойдёт вразнос, примерно как малыш, способный слопать большую пачку Skittles за один присест.
В этой статье на Хабре подробно рассказано, как в Kubernetes организована работа с запросами и лимитами, как они используются для управления ресурсами.
Forwarded from DevOps&SRE Library
Decomposing Terraform into multiple layers
https://medium.com/@andrey.i.karpov/decomposing-terraform-into-multiple-layers-part-1-76b1ff1f4214
https://medium.com/@andrey.i.karpov/decomposing-terraform-into-multiple-layers-part-1-76b1ff1f4214
Forwarded from /usr/bin
Knee — A CLI for Ansible Playbooks
Knee —интерактивная CLI-утилита, созданная на основе Ansible, которая используется для автоматизации настройки инфраструктуры, что повышает эффективность и снижает количество человеческих ошибок.
Читать описание инструмента на medium.com
Репыч на Гитхабе
Knee —интерактивная CLI-утилита, созданная на основе Ansible, которая используется для автоматизации настройки инфраструктуры, что повышает эффективность и снижает количество человеческих ошибок.
Читать описание инструмента на medium.com
Репыч на Гитхабе
Forwarded from Кубертатный период (Pavel Klyuev)
Kubernetes Guru
Очень интересный сервис: выдает достаточно точные ответы с примерами на вопросы про Kubernetes с помощью AI.
Этот сервис работает на основе подхода RAG и по результатам тестирования иногда дает более точные ответы, чем другие популярные AI, например ChatGPT.
Подробнее -- https://medium.com/@PlanB./kubernetes-guru-a-new-ai-tool-for-mastering-k8s-challenges-69bab4e57c84
Очень интересный сервис: выдает достаточно точные ответы с примерами на вопросы про Kubernetes с помощью AI.
Этот сервис работает на основе подхода RAG и по результатам тестирования иногда дает более точные ответы, чем другие популярные AI, например ChatGPT.
Подробнее -- https://medium.com/@PlanB./kubernetes-guru-a-new-ai-tool-for-mastering-k8s-challenges-69bab4e57c84