sysadmin.su
214 subscribers
278 photos
27 videos
223 files
2.08K links
Админам/sre/devops’ам будет интересно!
Download Telegram
Prometheus vs. OpenTelemetry Metrics: A Complete Guide

В этом посте рассматриваются основные отличия #prometheus и #opentelemetry, а также показано как можно переносить метрики из одной стстемы в другую.

https://www.timescale.com/blog/prometheus-vs-opentelemetry-metrics-a-complete-guide

#prometheus #openmetrics #opentelemetry #monitoring #metrics #напочитать
Make your backend more reliable using Nginx caching proxy

Про настройку кеширующего nginx

https://www.sheshbabu.com/posts/nginx-caching-proxy/

#nginx #cache #напочитать
Building a Successful SRE Team

Уроки которые, по мнению автора, помогут построить успешную SRE команду.

* Focus on Developer Training
* Focus on the Right Abstractions
* Focus on Self Service
* Automate Yourself out of a job

https://medium.com/@hans.knechtions/building-a-successful-sre-team-283232bc2694

#sre #team #напочитать
⚙️ Статья о размерах буферов в TCP, и ситуациях, когда их стоит увеличить.

https://madflojo.medium.com/maximizing-tcp-throughput-in-linux-understanding-and-tuning-send-and-receive-buffers-92df654c415f

#network #tcp #напочитать
Grafana Loki: performance optimization with Recording Rules, caching, and parallel queries

В статье рассказывается как автор смог оптимизировать скорость выполнение запроса с 5.35 секунд до 98 милисекунд.

https://itnext.io/grafana-loki-performance-optimization-with-recording-rules-caching-and-parallel-queries-28b6ebba40c4

#loki #performance #monitoring #kuber #k8s #memcache #bolddb #prometheus #напочитать
🔨 Inside Disney’s Site Reliability Engineering practice - SRE в Disney в качестве вечернего чтива для камрадов...

https://www.srepath.com/inside-disneys-site-reliability-engineering-practice/

#sre #напочитать
⌚️ Service Level Calculator - SLI калькулятор прямо в браузере. Автор презентовал его в отдельной статье - Introducing Service Level Calculator. PDF со статьёй закину в комментарии к сообщению.

#sla #sre #напочитать
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Linux Crisis Tools - утилиты, которые окажутся полезны, когда инцидент на сервере уже случился. Брендан Грегг в своей статье рекомендует установить их заранее...

https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html

#tools #sre #напочитать