9️⃣ Rule of 10x per 9 - ещё раз о девятках в SLO, и о том, что каждая 9, конечно же, подразумевает увеличение надёжности и доступности системы, но в то же время, увеличивает стоимость всего происходящего в 10 раз.
#sre #slo #напочитать
#sre #slo #напочитать
👍6
🧷 4 Instructive Postmortems on Data Downtime and Loss - четыре разных истории и четыре разных postmortem для инцидентов (потеря данных, проблемы с доступностью и всё вот это вот). На странице по ссылке краткий пересказ каждого из случаев и там же ссылки на полные отчёты от компаний.
P. S. Ссылка на описание инцидента в Gitlab у меня возвращает 404 почему-то, так что закинул PDF с этой страницей в комментарии.
#sre #postmortem #напочитать
P. S. Ссылка на описание инцидента в Gitlab у меня возвращает 404 почему-то, так что закинул PDF с этой страницей в комментарии.
#sre #postmortem #напочитать
👍8😁1
⚙️ Linux Crisis Tools - утилиты, которые окажутся полезны, когда инцидент на сервере уже случился. Брендан Грегг в своей статье рекомендует установить их заранее...
https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html
#tools #sre #напочитать
https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html
#tools #sre #напочитать
👍22
📊 SLA vs SLO vs SLI: What’s the Difference? Чем эти ваши SL* друг от друга отличаются, когда каждая из метрик используется...
https://www.checklyhq.com/blog/sla-slo-sli/
#sre #sla #напочитать
https://www.checklyhq.com/blog/sla-slo-sli/
#sre #sla #напочитать
Checklyhq
SLA vs SLO vs SLI - What’s the Difference? Comparison with examples | Checkly
Avoid user‑reported outages with synthetic checks, anomaly detection, smart alerting, and rich failure traces for rapid detection.
👍7
📊 И вот ещё для чтения перед сном, объяснение использования метрик SLO, SLI, Toli и так называемого "Error Budget" - Don’t Get Lost in the Metrics Maze: A Practical Guide to SLOs, SLIs, Error Budgets, and Toil.
https://medium.com/@lokesh12/dont-get-lost-in-the-metrics-maze-a-practical-guide-to-slos-slis-error-budgets-and-toil-939ecd0181eb
#sre #metrics #напочитать
https://medium.com/@lokesh12/dont-get-lost-in-the-metrics-maze-a-practical-guide-to-slos-slis-error-budgets-and-toil-939ecd0181eb
#sre #metrics #напочитать
👍7❤1
⏳ Why didn't you status? Занятный взгляд на организацию statuspage. Что стоит учитывать при организации страницы со статусами сервисов, и как не сделать хуже, создавая такой ресурс...
https://hross.substack.com/p/why-didnt-you-status
#statuspage #sre #напочитать
https://hross.substack.com/p/why-didnt-you-status
#statuspage #sre #напочитать
👍5
Записки админа
📟 Хороший материал о том, как правильно построить рабочие процессы для человека или команды, выполняющих роль on-call дежурных. Что стоит учитывать, на какие вопросы нужно ответить заранее, к чему нужно быть готовым в этой роли и в роли лидера у которого в…
📟 Building On-Call Schedules for Humans - статья о том, что стоит учитывать при построении on-call смен и связанных с ними процессов...
https://rootly.com/guides/on-call
#sre #oncall #напочитать
https://rootly.com/guides/on-call
#sre #oncall #напочитать
👍3🔥1 1
🔋 Занятный тред на Reddit, где участники сообщества накидали разных советов SRE инженеру, выложившему свою резюме для ревью и отзывов...
https://www.reddit.com/r/sre/comments/1dgwy5b/senior_sre_looking_for_a_resume_review_out_of/
#sre #hr #напочитать
https://www.reddit.com/r/sre/comments/1dgwy5b/senior_sre_looking_for_a_resume_review_out_of/
#sre #hr #напочитать
💣 Почему бы в пятницу не грохнуть часть инфраструктуры своего прода и посмотреть как пойдут дела?
- Deploy on Friday? How About Destroy on Friday! A Chaos Engineering Experiment - Part 1;
- Destroy on Friday: The Big Day. A Chaos Engineering Experiment - Part 2.
#sre #напочитать
- Deploy on Friday? How About Destroy on Friday! A Chaos Engineering Experiment - Part 1;
- Destroy on Friday: The Big Day. A Chaos Engineering Experiment - Part 2.
#sre #напочитать
1🔥11👍3
SERVICE-LEVEL-AGREEMENT-TEMPLATE.pdf
61.8 KB
📄 Service Level Agreement (SLA) - что такое SLA, каким оно бывает и что может в себя включать...
https://uptimerobot.com/blog/what-is-an-sla/
В pdf файле пример оформления SLA с клиентом.
#sre #sla #напочитать
https://uptimerobot.com/blog/what-is-an-sla/
В pdf файле пример оформления SLA с клиентом.
#sre #sla #напочитать
👍8 2
This media is not supported in your browser
VIEW IN TELEGRAM
📞 Building On-call: Our observability strategy - материал, конечно, основан на работе самого incident.io, но всё равно интересно почитать о том, как они строят процесс наблюдения, сбора, отображения и обработки данных о системах, которые требуют внимания и для которых может потребоваться реагирование, в случае возникновения инцидента...
https://incident.io/hubs/building-on-call/building-on-call-our-observability-strategy
#sre #oncall #напочитать
https://incident.io/hubs/building-on-call/building-on-call-our-observability-strategy
#sre #oncall #напочитать
1👍5 4
📞 What I tell people new to on-call - автор статьи делится опытом и даёт советы тем, кому предстоит столкнуться с on-call дежурствами в своей работе...
https://ntietz.com/blog/what-i-tell-people-new-to-oncall/
#oncall #sre #напочитать
https://ntietz.com/blog/what-i-tell-people-new-to-oncall/
#oncall #sre #напочитать
👍5
YouTube
Andreia Otto & Ravikanth Mogulla - Navigating the Transition: SRE Challenges and Highlights
This talk delves into the transformative journey of transitioning adidas e-commerce from monolithic architectures to microservices, exploring the key challenges faced by Site Reliability Engineers (SREs) and highlighting crucial insights gained throughout…
💭 What Platform Engineering Meant for Adidas’s SREs - рассказ о трансформации e-commerce в Adidas от монолита к микросервисам, и о том, с какими задачами в ходе этого процесса SRE инженерам компании пришлось столкнуться...
- Видео: https://www.youtube.com/watch?v=BBwMkC7a8Ko
- Текстом: https://thenewstack.io/what-platform-engineering-meant-for-adidass-sres/
#sre #видео
- Видео: https://www.youtube.com/watch?v=BBwMkC7a8Ko
- Текстом: https://thenewstack.io/what-platform-engineering-meant-for-adidass-sres/
#sre #видео
👍2👀1