Пятничный деплой
4.36K subscribers
1.27K photos
24 videos
163 files
7.54K links
Подборка ссылок, статей и постов из мира DevOps\SRE\разработки. Если вы хотите прислать фидбек, интересную статью или просто поболтать пишите @count0ru https://t.me/s/count0_digest
Download Telegram
Forwarded from GitHub'ненько
Docmost is an open-source collaborative wiki and documentation software. It is an open-source alternative to Confluence and Notion.
#doc #kb #notes
https://github.com/docmost/docmost
Forwarded from /usr/bin
10 Best Terraform Tools To Use In 2024

В этой статье был представлен подробный обзор инструментов Terraform и 10 лучших инструментов Terraform, которые помогут повысить эффективность использования этого инструмента. Читать статью.

❗️Статья на medium.com
Forwarded from Кубернетичек
Думаю многие слышали от такой штуке как DRA. Основной целью которого было упростить шаринг ресурсов между разными подами. В том числе резервировать ресурсы в случае если один из подов заехал на ноду, а "зависимые" поды еще не успели, и чтобы соседи не успели их занять. Но вчера попалась реализация Nvidia DRA в контексте GPU. С фичами
* Контролируемое совместное использование GPU (как внутри одного пода, так и между подами)
* Поддержка нескольких моделей GPU на одном узле
* Указание произвольных ограничений для GPU (минимальная/максимальная память, модель устройства и т.д.)
* Естественная поддержка MPS (Multi-Process Service)
* Динамическое выделение MIG устройств (позволяет аппаратно разделить GPU на сеть экземпляров. Каждый имеет изолированную память, кэш, пропускную способность и вычислительные ядра)
* Динамическое перепрофилирование GPU с полного режима в MIG режим
* Динамическое перепрофилирование GPU для использования в режиме Passthrough (прямого доступа) или vGPU (виртуализированного GPU)

Если у вас LLM и ML много в кубе - такое может пригодиться. Правда чтобы заработало, нужно включать feature gate DynamicResourceAllocation
Forwarded from DevOps&SRE Library
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from /usr/bin
Linux Crisis Tools

Когда у вас происходит сбой, вызванный проблемой производительности, вы не хотите терять драгоценное время на установку инструментов, необходимых для ее диагностики. В этой статье список «кризисных инструментов», которые рекомендуется установить на серверах Linux по умолчанию (если они еще не установлены), вместе с именами пакетов (Ubuntu), из которых они взяты. Узнать что за инструменты.
Forwarded from /usr/bin
The Kubernetes Troubleshooting Handbook

В этой статье рассмотрены различные методы и инструменты, помогающие устранять неполадки и отлаживать Kubernetes. Независимо от того, являетесь ли вы опытным пользователем Kubernetes или только начинаете, это руководство предоставит ценные сведения об эффективных методах отладки.

В статье рассмотрены следующие подходы и инструменты:

🔍 Анализ событий жизненного цикла Pod

🔍 События Kubernetes и журналы аудита

🔍 Панель управления Kubernetes

🔍 Мониторинг использования ресурсов

🔍 Использование логов kubectl

🔍 Использование kubectl exec для интерактивного устранения неполадок

🔍 Отладка на уровне узлов с помощью kubectl debug

🔍 Отладка на уровне приложения с помощью отладочных контейнеров

🔍 Эфемерные контейнеры для отладки

🔍 Решение проблем DNS и сети

🔍 Отладка приложений с отслеживанием состояния

🔍 Расширенные методы отладки (Jaeger, Mirrord и др.)

Читать статью и начиться траблшутить кубер

❗️Статья на medium.com
Forwarded from Мониторим ИТ
Python Logging: From Basics to Advanced Practices

Логирование в Python — это важный навык для разработчиков всех уровней и надежный и универсальный способ отслеживания событий, отладки проблем и понимания поведения приложения. Это не просто полезно, но и необходимо для разработки надежного и поддерживаемого программного обеспечения. В этой статье разобраны подходы к журналированию на базе модулей logging, structlog и loguru. Читать статью.

❗️Статья на medium.com
kubernetes-security-for-dummies.pdf
3.5 MB
Я бы назвал это неким чеклистом

Steve Kaelble. Kubernetes Security For Dummies. 2024.

Забрать можно тут, если не из телеги
https://www.datocms-assets.com/75231/1704995046-kubernetes-security-for-dummies_wiz_final.pdf
Forwarded from Мониторим ИТ
How to monitor Containerd

В статье рассказывается о подходах к мониторингу containerd. Узнаете про плагины containerd и методах сбора метрик, логов, трейсов и профилировании. Читать статью.
Forwarded from DevOps Deflope News
​​На днях Red Hat анонсировала виртуального помощника на базе AI, который призван упростить работу инженеров и разработчиков с OpenShift. Инструмент называется OpenShift Lightspeed и использует интерфейс в виде чата.

Lightspeed интегрируется в консоль OpenShift и отвечает на технические вопросы о продукте. Он может помочь с устранением неполадок, развёртыванием кластеров и управлением ими. Его основная задача — снять рутинную нагрузку с пользователей и сократить время на поиски решения той или иной проблемы. Например, можно спросить у помощника, как установить аддон OpenShift Virtualization, и получить пошаговую инструкцию или обратиться за подсказками по настройке автоматического масштабирования подов.

https://e42.link/4djIRee
Forwarded from Код и Капуста
100go.co - краткое содержание книги 100 Go Mistakes and How to Avoid Them в удобном формате

#golang

Спасибо за ссылку!
Forwarded from Мониторим ИТ
What to Use When: OpenTelemetry vs. eBPF

OpenTelemetry и eBPF имеют различные функции, они охватывают разные области мониторинга системы. Понимание их сильных сторон и того, когда их использовать, может значительно улучшить подход к наблюдаемости. В статье разобраны их отличия и кейсы использования.

❗️Статья на medium.com
Forwarded from /usr/bin
Защита от брутфорса и эксплоитов OpenSSH

В последних версиях OpenSSH появилась защита от брутфорса (перебора) паролей, а также от попыток эксплоита. Это очень ценные настройки, которыми разработчики рекомендуют воспользоваться всем.

Нужно отметить, что новая функция OpenSSH фундаментально отличается от fail2ban, sshguard и подобных инструментов, поскольку она не парсит логи и не изменяет правила файрвола, а применяет опции только внутри одной программы, не обращаясь никуда через ядро, что делает её гораздо безопаснее вышеупомянутых утилит.

В статье рассказывается про две новый опции конфигурации PerSourcePenalties и PerSourcePenaltyExemptList. Читать на Хабре.
Forwarded from DevOps Deflope News
Подробный разбор всех фичей Kubernetes 1.31

Сегодня ночью вышла новая версия K8s — 1.31. Среди главных нововведений — поле для контроля дополнительных групп, флаг для эмулирования возможностей предыдущих версий Kubernetes и возможность настраивать анонимный доступ к конкретным эндпоинтам.

https://e42.link/4dBWw0t
Forwarded from DevOps&SRE Library
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from /usr/bin
Запросы и лимиты в Kubernetes: разбираемся в деталях

Управление ресурсами в Kubernetes немного напоминает зефирный тест, который иногда выходит из-под контроля. Если тщательно не лимитировать, сколько ресурсов может потреблять контейнер, он пойдёт вразнос, примерно как малыш, способный слопать большую пачку Skittles за один присест.

В этой статье на Хабре подробно рассказано, как в Kubernetes организована работа с запросами и лимитами, как они используются для управления ресурсами.
Forwarded from /usr/bin
Knee — A CLI for Ansible Playbooks

Knee —интерактивная CLI-утилита, созданная на основе Ansible, которая используется для автоматизации настройки инфраструктуры, что повышает эффективность и снижает количество человеческих ошибок.

Читать описание инструмента на medium.com

Репыч на Гитхабе
Forwarded from Кубертатный период (Pavel Klyuev)
Kubernetes Guru

Очень интересный сервис: выдает достаточно точные ответы с примерами на вопросы про Kubernetes с помощью AI.

Этот сервис работает на основе подхода RAG и по результатам тестирования иногда дает более точные ответы, чем другие популярные AI, например ChatGPT.

Подробнее -- https://medium.com/@PlanB./kubernetes-guru-a-new-ai-tool-for-mastering-k8s-challenges-69bab4e57c84