notes_devops_engineer

Вышла первая версия helm чарта VictoriaLogs Collector - для сбора логов из контейнеров Kubernetes и отправки их в VictoriaLogs. Желаю развития проекту.

https://github.com/VictoriaMetrics/helm-charts/releases/tag/victoria-logs-collector-0.0.1

GitHub

Release victoria-logs-collector-0.0.1 · VictoriaMetrics/helm-charts

VictoriaLogs Collector - collects logs from Kubernetes containers and stores them to VictoriaLogs

273 views14:29

notes_devops_engineer

Forwarded from The Last of 9s

ConnectionProblems.png

72 KB

#кулстори #connectionpool

вводные:
представим, что есть у нас классный бэкенд, он готов обрабатывать много запросов, он стейтлесс, поэтому мы с вами ожидаем, что мы его легко можем замасштабировать горизонтально. для верности мы даже проведем нагрузочные тесты и по-прежнему все отлично, при пиковой нагрузке добавляем +1 инстанс и выдерживаем её.

проблема:
запускаем нашего красавчика в проде и дальше видим, что происходит ужасное, у нас в 100% cpu утилизирован 1 под. изучив логи, трейсы и другую телеметрию становится ясно - только этот под обрабатывает запросы, а остальные из ReplicaSet стоят, курят. скажите "виноват балансировщик"? смотрим дальше и выясняем, что запросы летят от соседнего сервиса (сервиса А) и ходит он по svc name, запросов довольно мало, то есть между вами никакого балансировщика нет.

что же происходит?
чтобы не тратить драгоценные миллисекунды и ресурсы на tcp-хендшейки, клиенты используют пулы соединений (connection pools). благодаря http keep-alive, однажды открытое соединение не закрывается, а кладётся в пул, чтобы его можно было быстро переиспользовать.
и вот что получается на практике:
1. наш сервис А (клиент) хочет сделать первый запрос. он обращается к dns: "дай айпишник для svc name".
2. dns честно отдаёт ему ip одного из подов сервиса Б.
3. клиент устанавливает с этим конкретным подом соединение (открывает сокет) и отправляет запрос.
4. получив ответ, он не рвёт коннект, а аккуратно возвращает его в свой пул.
когда прилетает второй, третий, сотый запрос. зачем клиенту снова идти в dns и создавать новый коннект, если есть готовенький коннек? он просто берёт его из пула. в итоге все запросы летят в один и тот же под сервиса Б, и вся наша красивая схема с горизонтальным масштабированием не работает.

как решить проблему?
например, можно пустить трафик через ингресс - через него идет, скорее всего, много трафика и поэтому пулы коннектов будут шире. в таком случае нжинкс или любой другой балансировщик будет держать свой набор сокетов и коннектов к сервису Б, за счёт чего размажется трафик. это добавляет латенси, но вот прям элегантные решения пока не нашел :)

знайте! ваши запросы не балансируются через service ip сущность кубрнетеса, через нее происходит только резолвинг, а сами коннекты в итоге устанавливаются pod2pod, и запросы летят тоже pod2pod

285 views00:43

notes_devops_engineer

Выложены доклады с DevOops 2024

Слайды доступны на сайте
https://devoops.ru/archive/2024/schedule/days/

YouTube - https://youtube.com/playlist?list=PL-ety8gh7rToGNJOxs1oZtpUXJfADb1mX
VK - https://vkvideo.ru/playlist/-149053226_19

DevOops 2024. Конференция по инженерным решениям и DevOps-культуре

DevOops 2024 | Расписание | Конференция, посвященная практикам DevOps

Расписание конференции DevOops 2024.

263 views00:58

notes_devops_engineer

В sentry kubernetes версии v27.3.0 добавили очистку старых данных в clickhouse https://github.com/sentry-kubernetes/charts/pull/1876

GitHub

feat(clickhouse): db cleanup by TartanLeGrand · Pull Request #1876 · sentry-kubernetes/charts

This pull request introduces a new automated cleanup process for ClickHouse tables in Snuba, configurable via Helm chart values. The main changes add a CronJob resource for periodic cleanup, enable...

351 views09:45

notes_devops_engineer

Зарелизился helm чарт для трейсов от VictoriaMetrics с версией 0.0.1 - аналог grafana tempo
https://github.com/VictoriaMetrics/helm-charts/releases/tag/victoria-traces-single-0.0.1
https://github.com/VictoriaMetrics/helm-charts/releases/tag/victoria-traces-cluster-0.0.1

VictoriaTraces использует в 3,7 раза меньше оперативной памяти и в 2,6 раза меньше процессора, чем другие решения, такие как Grafana Tempo.

GitHub

Release victoria-traces-single-0.0.1 · VictoriaMetrics/helm-charts

Release notes for version 0.0.1
Release date: 16 Sep 2025

253 viewsedited 15:30

notes_devops_engineer

Forwarded from Vadim Alekseev

Базовый алгоритм при выборе схемы должен быть следующим:

Помещаются ли все ваши логи на 1 сервер? Если да, то вам не нужен кластер, просто используйте VictoriaLogs без vmauth.
Если нужен HA 2, то разверните еще один экземпляр VictoriaLogs и реплицируйте логи в оба хранилища (например, через vlagent или vector); в такой схеме понадобится vmauth или любой другой балансировщик, чтобы балансировать нагрузку между кластерами.

Если логи не помещаются на 1 сервер, то вам нужен кластер из нескольких vlstorage. В такой схеме vlselect нужен для агрегирования результата при поиске и vlinsert для шардирования логов между vlstorage; vmauth может пригодиться, если у вас несколько vlselect, и вы хотите распределить нагрузку.
Если нужен HA 2, то разверните несколько таких кластеров с одинаковой конфигурацией; используйте vmauth для балансировки нагрузки между кластерами (между всеми vlselect что у вас есть).

См. также схему кластерной VictoriaLogs с HA=2. vlagent - это буфер, который реплицирует логи и является устойчивым к недоступности одного из кластеров.

240 views00:27

notes_devops_engineer

🚀 Flux 2.7.0 — новый релиз с важными обновлениями

### 🔑 Ключевые изменения:

* 📦 GA-релиз Image Automation APIs (ImagePolicy, ImageRepository, ImageUpdateAutomation)
* 🔄 Поддержка отслеживания изменений в ConfigMaps и Secrets
* 🔐 Аутентификация удалённых кластеров через Workload Identity
* ✅ Расширенная проверка готовности зависимостей (CEL expressions)
* 🔑 Поддержка глобальных SOPS Age ключей
* 🧩 Опциональные Kustomize components
* ♻️ Новый подход к управлению жизненным циклом — RetryOnFailure (HelmRelease)
* 🔒 Поддержка mTLS при отправке алертов и работе с GitHub App
* 📊 OpenTelemetry tracing для Kustomization и HelmRelease
* 🧩 Поддержка сторонних source-контроллеров и новых паттернов работы с артефактами

### ⚡️ Совместимость

* Kubernetes: поддерживаются версии 1.32, 1.33, 1.34
* OpenShift: установка через Flux Operator в OperatorHub с поддержкой multi-tenancy, sharding, scaling и синхронизации состояния кластера.

### ⚠️ Важно при апгрейде

* API v1beta1 и v2beta1 полностью удалены.
* Если вы не используете Flux Operator, необходимо запустить команду:

flux migrate

https://github.com/fluxcd/flux2/releases/tag/v2.7.0

GitHub

Release v2.7.0 · fluxcd/flux2

Highlights
Flux v2.7.0 is a feature release. Users are encouraged to upgrade for the best experience.
For a compressive overview of new features and API changes included in this release, please ref...

289 views09:23

notes_devops_engineer

Forwarded from John Doe

Perses теперь поддерживает VictoriaLogs

GitHub

[FEATURE]: introduce victorialogs plugin by AndrewChubatiuk · Pull Request #385 · perses/plugins

PR introduces VictoriaLogs datasource plugin for Perses. It has

datasource plugin
variable plugins: field names and field values

PR was heavily influenced by Prometheus and Loki plugins with API ...

218 views12:03

notes_devops_engineer

Яндекс облако выложил на GitHub Network Block & File Store https://github.com/ydb-platform/nbs - аналог NFS

GitHub

GitHub - ydb-platform/nbs: Network Block & File Store

Network Block & File Store. Contribute to ydb-platform/nbs development by creating an account on GitHub.

265 views14:43

notes_devops_engineer

Очень добротный доклад на тему "Логи под нагрузкой как выбрать хранилище и не пожалеть — разбираем ELK, Loki и VictoriaLogs"

+ Инструмент, который использовался для тестирования в докладе https://github.com/lHumaNl/DBLogsComparator

https://tube.pflb.ru/w/j4Tzu3pJw54sHqcNEVHaGU

Tube

1. Александр Карпушин. Логи под нагрузкой как выбрать хранилище и не пожалеть — разбираем ELK, Loki и VictoriaLogs

289 viewsedited 12:33

notes_devops_engineer

Разработка проекта Ingress NGINX будет полностью прекращена в марте 2026 года. После этой даты — никаких обновлений и исправлений уязвимостей. Подробнее https://kubernetes.io/blog/2025/11/11/ingress-nginx-retirement/

Kubernetes

Ingress NGINX Retirement: What You Need to Know

To prioritize the safety and security of the ecosystem, Kubernetes SIG Network and the Security Response Committee are announcing the upcoming retirement of Ingress NGINX. Best-effort maintenance will continue until March 2026. Afterward, there will be no…

499 views07:57

notes_devops_engineer

29 версия Docker повысило минимальную версия API до 1.44
Error response from daemon: client version 1.43 is too old.
Minimum supported API version is 1.44, please upgrade your client to a newer version
Подробнее https://www.docker.com/blog/docker-engine-version-29/

Docker

Docker Engine v29 Release | Docker

Learn about Docker Engine v29 and how this foundational release sets the stage for the future of the Docker platform.

101 views03:49

notes_devops_engineer

В self-hosted версию sentry добавили поддержку S3 NodeStore.
Подробнее https://github.com/getsentry/self-hosted/pull/3498

GitHub

feat: Use S3 node store with seaweedfs by BYK · Pull Request #3498 · getsentry/self-hosted

Enables S3 node store using SeaweedFS and sentry-nodestore-s3 by @stayallive
This should alleviate all the issues stemming from (ab)using PostgreSQL as the node store.

162 viewsedited 03:54

notes_devops_engineer

Проект Minio теперь распространяется только в виде исходного кода. Если вы хотите создавать контейнеры, вам придётся делать это самостоятельно. Подробнее: https://github.com/minio/minio/issues/21647

GitHub

Docker release? · Issue #21647 · minio/minio

Hello, I did not find a new image for the security release Security/CVE RELEASE.2025-10-15T17-29-55Z, on quay.io nor DockerHub. Is it expected? If it isn’t, can you please push a new release for th...

89 viewsedited 12:38

About

Blog

Apps

Platform