DevOps&SRE Library
18.1K subscribers
463 photos
5 videos
2 files
4.89K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
Download Telegram
kube-composer

A modern, intuitive Kubernetes YAML generator that simplifies deployment configuration for developers and DevOps teams.


https://github.com/same7ammar/kube-composer
🎥 Вебинар по DevOps: Контейнеризация и безопасность: почему, зачем и как?

👉 На вебинаре вы узнаете:

- Как устроена безопасность контейнеров изнутри.
- Типичные ошибки команд, которые приводят к уязвимостям.
- Практики, которые действительно помогают: от политики прав до сканирования образов.
- Что делать, чтобы контейнеры не стали слабым звеном инфраструктуры.

💪 В результате вебинара вы:

- Понимание, где на самом деле ломаются процессы безопасности в контейнерах.
- Чек-лист практик, которые можно внедрить сразу.
- Навык смотреть на контейнеризацию не только через призму удобства, но и надёжности.

🎁 Все участники вебинара получат специальные условия на полное обучение.

👉 Для участия зарегистрируйтесь: https://vk.cc/cQxZV8

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqwrw8aa
What Is OTLP and Why It's the Future of Observability

You're probably reading this because you don't want to sink time or money into proprietary protocols and agents anymore. Why would you? They tie you to a single vendor, force you to adapt to their quirks, and make it painful to change direction later.

What you really need is an open, consistent way to instrument, collect, and move your telemetry without worrying about compatibility or lock-in. That's exactly what OpenTelemetry (OTel) gives you. And at the center of it all is the OpenTelemetry Protocol (OTLP), the common language that makes your services, collectors, and backends speak fluently with each other.

This guide will walk you through OTLP in detail: what it is, why it matters, and how to use it in real pipelines. By the end, you'll see how embracing OTLP and pairing it with an OTel-native backend helps you solve the challenges of modern observability while keeping your stack open, reliable, and free of lock-in.


https://www.dash0.com/knowledge/opentelemetry-protocol-otlp
Создаем и настраиваем выделенные серверы через Terraform

Если вы хотите автоматизировать управление IT-инфраструктурой и сократить время на ее развертывание, вы точно придете к использованию Terraform. Через него можно поднять сервер нужной конфигурации, прописать сетевую связность и внешние доступы, гибко настроить ОС и сеть на сервере.

И, кстати, через Terraform вы можете управлять не только облачными ресурсами. В Selectel эта фича теперь доступна и для «железной» инфраструктуры на базе выделенных серверов. Вы получаете изолированность и высокую производительность железа с гибким «облачным» управлением.

Единый Terraform-провайдер позволяет настроить гибридную инфраструктуру в Selectel. Добавляйте облачные серверы, подключайте сетевые диски, объединяйте и комбинируйте ресурсы между собой — все с помощью одного инструмента.

Попробовать Terraform в Selectel можно бесплатно — ловите 3 000 бонусов на тест. Для этого зарегистрируйтесь в панели, напишите в тикете кодовое слово «TERRAFORM» и ждите одобрения заявки.

Реклама. АО "Селектел". erid:2W5zFJPvsHJ
What are metrics in OpenTelemetry: A Complete Guide

A comprehensive guide to understanding metrics in OpenTelemetry. What they are, how they work, and how to implement them effectively with practical code examples.


https://oneuptime.com/blog/post/2025-08-26-what-are-metrics-in-opentelemetry/view
Cloudreve

Self-hosted file management system with multi-cloud support.


https://github.com/cloudreve/Cloudreve
Building a Unified OpenTelemetry Pipeline in Kubernetes

https://fatihkoc.net/posts/opentelemetry-kubernetes-pipeline
velld

A self-hosted database backup management tool. Schedule automated backups, monitor status, and manage multiple databases from one place.


https://github.com/dendianugerah/velld
1
PrivateCaptcha

Private Captcha is an independent, privacy-first, self-hostable Proof-of-Work CAPTCHA service made in EU.


https://github.com/PrivateCaptcha/PrivateCaptcha
flint

A single <11MB binary with a modern Web UI, CLI, and API for KVM.
No XML. No bloat. Just VMs.


https://github.com/volantvm/flint
cluster-bare-autoscaler

Cluster Bare Autoscaler (CBA) automatically adjusts the size of a bare-metal Kubernetes cluster by powering nodes off or on based on real-time resource usage, while safely cordoning and draining nodes before shutdown.


https://github.com/docent-net/cluster-bare-autoscaler
Если при слове ITSM у вас сразу всплывают бюрократия, отчёты и скучные таблицы — самое время пересмотреть подход.

SRE-команды, которые игнорируют ITSM, рано или поздно тонут в хаосе инцидентов, тикетов и бесконечных «костылей».

На открытом уроке вы узнаете, как ITSM может стать вашим союзником, а не помехой:

- Разберём, какие процессы реально помогают управлять инцидентами, изменениями и проблемами, а где стоит оставить место автоматизации.

- Покажем, как ITSM-практики делают инфраструктуру предсказуемой и прозрачной, не превращаясь в бюрократию.
- Вы поймёте, как выстроить процессы, которые работают на надёжность и скорость, а не мешают инженерам писать код.
- Увидите, как навести порядок в SRE-команде без перегиба — с пользой для бизнеса и удовольствием для инженеров.

📌30 октября в 20:00 МСК. Открытый вебинар проходит в преддверии старта курса «SRE практики и инструменты».

Регистрируйтесь и узнайте, как превратить ITSM из формальности в реальный инструмент стабильности: https://vk.cc/cQLvmL

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxDiN2a
Please open Telegram to view this post
VIEW IN TELEGRAM
volcano-vgpu-device-plugin

Volcano vgpu device-plugin can provide device-sharing mechanism for NVIDIA devices managed by volcano.


https://github.com/Project-HAMi/volcano-vgpu-device-plugin
KAI-Scheduler

KAI Scheduler is a robust, efficient, and scalable Kubernetes scheduler that optimizes GPU resource allocation for AI and machine learning workloads.


https://github.com/NVIDIA/KAI-Scheduler
Infrastructure as Code: новый курс OTUS

Инфраструктура как код перестала быть редким навыком — сегодня это must have для системных инженеров, админов, DevOps и разработчиков

OTUS запускает обновлённый курс «Infrastructure as a Code», где вы научитесь строить предсказуемую инфраструктуру, работать с Terraform, Ansible, GitLab, Jenkins и другими инструментами

На курсе вы:
— освоите IaC на уровне Middle+
— развернёте реальные пайплайны для управления инфраструктурой
— научитесь кастомизировать Ansible и работать с иммутабельными окружениями
— соберёте портфолио проектов под руководством практиков

📌 Формат: онлайн, 4 месяца, 2 вебинара в неделю
📅 Старт: 29 октября (вступительное тестирование)

Запишитесь на тест, чтобы попасть в группу курса «Infrastructure as a Code»

https://vk.cc/cQLN2H

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxiRYu5
kubezonnet

Monitor cross-zone network traffic in Kubernetes.


https://github.com/polarsignals/kubezonnet
k3k

K3k, Kubernetes in Kubernetes, is a tool that empowers you to create and manage isolated K3s clusters within your existing Kubernetes environment.


https://github.com/rancher/k3k
Media is too big
VIEW IN TELEGRAM
То, что будет на Infra DrinkUp, — останется там

Коллеги из Авито зовут на встречу 12 ноября. Обещают брейншторм об инструментах IaC, разработке в SRE, базах данных, Kubernetes и многом другом.

Самое главное — формат участия только офлайн, без повторов и записи. Кажется, план на 12-е число уже есть. Пойдёте?

Регистрация по ссылке, там же и подробности ивента.
Please open Telegram to view this post
VIEW IN TELEGRAM
ramalama

RamaLama is an open-source developer tool that simplifies the local serving of AI models from any source and facilitates their use for inference in production, all through the familiar language of containers.


https://github.com/containers/ramalama