Записки админа
12.8K subscribers
653 photos
29 videos
227 files
2.48K links
Пишу о Linux и администрировании серверов.

Связаться с автором: @servers

Заметки в браузере: https://sysadmin.pm/

Буст канала: https://t.me/sysadminnotes?boost
Download Telegram
📊 И вот ещё для чтения перед сном, объяснение использования метрик SLO, SLI, Toli и так называемого "Error Budget" - Don’t Get Lost in the Metrics Maze: A Practical Guide to SLOs, SLIs, Error Budgets, and Toil.

https://medium.com/@lokesh12/dont-get-lost-in-the-metrics-maze-a-practical-guide-to-slos-slis-error-budgets-and-toil-939ecd0181eb

#sre #metrics #напочитать
Why didn't you status? Занятный взгляд на организацию statuspage. Что стоит учитывать при организации страницы со статусами сервисов, и как не сделать хуже, создавая такой ресурс...

https://hross.substack.com/p/why-didnt-you-status

#statuspage #sre #напочитать
🔋 Занятный тред на Reddit, где участники сообщества накидали разных советов SRE инженеру, выложившему свою резюме для ревью и отзывов...

https://www.reddit.com/r/sre/comments/1dgwy5b/senior_sre_looking_for_a_resume_review_out_of/

#sre #hr #напочитать
💣 Почему бы в пятницу не грохнуть часть инфраструктуры своего прода и посмотреть как пойдут дела?

- Deploy on Friday? How About Destroy on Friday! A Chaos Engineering Experiment - Part 1;
- Destroy on Friday: The Big Day. A Chaos Engineering Experiment - Part 2.

#sre #напочитать
SERVICE-LEVEL-AGREEMENT-TEMPLATE.pdf
61.8 KB
📄 Service Level Agreement (SLA) - что такое SLA, каким оно бывает и что может в себя включать...

https://uptimerobot.com/blog/what-is-an-sla/

В pdf файле пример оформления SLA с клиентом.

#sre #sla #напочитать
This media is not supported in your browser
VIEW IN TELEGRAM
📞 Building On-call: Our observability strategy - материал, конечно, основан на работе самого incident.io, но всё равно интересно почитать о том, как они строят процесс наблюдения, сбора, отображения и обработки данных о системах, которые требуют внимания и для которых может потребоваться реагирование, в случае возникновения инцидента...

https://incident.io/hubs/building-on-call/building-on-call-our-observability-strategy

#sre #oncall #напочитать
📞 What I tell people new to on-call - автор статьи делится опытом и даёт советы тем, кому предстоит столкнуться с on-call дежурствами в своей работе...

https://ntietz.com/blog/what-i-tell-people-new-to-oncall/

#oncall #sre #напочитать
💭 What Platform Engineering Meant for Adidas’s SREs - рассказ о трансформации e-commerce в Adidas от монолита к микросервисам, и о том, с какими задачами в ходе этого процесса SRE инженерам компании пришлось столкнуться...

- Видео: https://www.youtube.com/watch?v=BBwMkC7a8Ko
- Текстом: https://thenewstack.io/what-platform-engineering-meant-for-adidass-sres/

#sre #видео