Site Reliability Engineering Glossary
https://www.srepath.com/site-reliability-engineering-glossary
#sre #напочитать
https://www.srepath.com/site-reliability-engineering-glossary
#sre #напочитать
SRE cheat sheet
Набор шпаргалок по следующим темам:
* Linux Performance Analysis
* System
* CPU
* Memory
* Disk
* Network
* Getting System Information
* Storage
* Postgres
* Configuration
* PSQL Tricks
* Postgres perfomance checklist
* Postgres Dump / Backup
* MySQL
* Configuration
* MySQL perfomance checklist
* MySQL dump / backup
* Redis
* Apache Kafka
* Consumers Troubleshooting
* Docker
* JVM
* Nginx
* Kubernetes
* Monitoring and Alerting
* Development
* Helpers
* Bash
* Post Mortem
* Perfomance benching
* Security
https://kubernetes7.medium.com/sre-cheat-sheet-10e62c3a4c63
#sre #cheatsheet
Набор шпаргалок по следующим темам:
* Linux Performance Analysis
* System
* CPU
* Memory
* Disk
* Network
* Getting System Information
* Storage
* Postgres
* Configuration
* PSQL Tricks
* Postgres perfomance checklist
* Postgres Dump / Backup
* MySQL
* Configuration
* MySQL perfomance checklist
* MySQL dump / backup
* Redis
* Apache Kafka
* Consumers Troubleshooting
* Docker
* JVM
* Nginx
* Kubernetes
* Monitoring and Alerting
* Development
* Helpers
* Bash
* Post Mortem
* Perfomance benching
* Security
https://kubernetes7.medium.com/sre-cheat-sheet-10e62c3a4c63
#sre #cheatsheet
Medium
SRE cheat sheet
*I am a medium author from Ukraine and need your support (medium does not work with Ukraine) *I am crowdfunding for laptop to do…
Обзор нескольких опенсорс альтернатив для pagerduty
https://jayaj.medium.com/top-10-yellowant-integrations-f2e528310ec4
#pagerduty #sre #oncall
https://jayaj.medium.com/top-10-yellowant-integrations-f2e528310ec4
#pagerduty #sre #oncall
Medium
A list of free and open-source Pagerduty alternatives you can explore
Looking for an open-source or free Pagerduty alternative? Here are some of the best alternatives that you can use instead of Pagerduty
44 Books for DevOps, Site Reliability, and Cloud Engineers
https://medium.com/spacelift/44-books-for-devops-site-reliability-and-cloud-engineers-ca12376bd8b6
#напочитать #books #devops #sre
https://medium.com/spacelift/44-books-for-devops-site-reliability-and-cloud-engineers-ca12376bd8b6
#напочитать #books #devops #sre
Medium
44 Books for DevOps, Site Reliability, and Cloud Engineers
This blog post showcases some books to advance your career to the next level. We will look into books relevant to DevOps, Site Reliability…
Материал о том, что стоит изучить чтоб стать девопсом/сре в 22 году.
https://medium.com/javarevisited/the-2018-devops-roadmap-31588d8670cb
#sre #devops #learn #напочитать
https://medium.com/javarevisited/the-2018-devops-roadmap-31588d8670cb
#sre #devops #learn #напочитать
Medium
The 2022 DevOps Engineer and SRE RoadMap [UPDATED]
An illustrated guide to becoming a DevOps Engineer in 2021 with links to courses
SRE vs. DevOps vs. Platform Engineering
Посто о том, что это за роли, чем они отличаются и как их собрать вместе.
https://thenewstack.io/sre-vs-devops-vs-platform-engineering/
#sre #devops #pe #напочитать
Посто о том, что это за роли, чем они отличаются и как их собрать вместе.
https://thenewstack.io/sre-vs-devops-vs-platform-engineering/
#sre #devops #pe #напочитать
The New Stack
SRE vs. DevOps vs. Platform Engineering
The article covers a broad level comparison between SRE, Platform Engineering and DevOps. Check out the key components of each of them.
SREcon23 Asia/Pacific
Записи докладов с SREcon23 Asia/Pacific
https://www.youtube.com/playlist?list=PLbRoZ5Rrl5ldnsuIyb3X-t6zG3IDcnaRn
#video #youtube #srecon #sre
Записи докладов с SREcon23 Asia/Pacific
https://www.youtube.com/playlist?list=PLbRoZ5Rrl5ldnsuIyb3X-t6zG3IDcnaRn
#video #youtube #srecon #sre
Building a Successful SRE Team
Уроки которые, по мнению автора, помогут построить успешную SRE команду.
* Focus on Developer Training
* Focus on the Right Abstractions
* Focus on Self Service
* Automate Yourself out of a job
https://medium.com/@hans.knechtions/building-a-successful-sre-team-283232bc2694
#sre #team #напочитать
Уроки которые, по мнению автора, помогут построить успешную SRE команду.
* Focus on Developer Training
* Focus on the Right Abstractions
* Focus on Self Service
* Automate Yourself out of a job
https://medium.com/@hans.knechtions/building-a-successful-sre-team-283232bc2694
#sre #team #напочитать
Medium
Building a Successful SRE Team
Successful techniques to ensure your SRE team delivers value
На сайте представленна карта действий которые нужно сделать чтоб чтобы пройти путь от 90 до 99.999 доступности при создании надежной системы.
p.s Список достаточно спорный.
https://r9y.dev/
#sre
p.s Список достаточно спорный.
https://r9y.dev/
#sre
r9y.dev
Putting the 9s into reliability
Forwarded from Записки админа
🔨 Inside Disney’s Site Reliability Engineering practice - SRE в Disney в качестве вечернего чтива для камрадов...
https://www.srepath.com/inside-disneys-site-reliability-engineering-practice/
#sre #напочитать
https://www.srepath.com/inside-disneys-site-reliability-engineering-practice/
#sre #напочитать
K8sGPT + LocalAI: Unlock Kubernetes superpowers for free!
Прикручиваем ИИ к «управлению» кубом.
https://itnext.io/k8sgpt-localai-unlock-kubernetes-superpowers-for-free-584790de9b65
#kuber #k8s #k8sGPT #localai #sre
Прикручиваем ИИ к «управлению» кубом.
https://itnext.io/k8sgpt-localai-unlock-kubernetes-superpowers-for-free-584790de9b65
#kuber #k8s #k8sGPT #localai #sre
Medium
K8sGPT + LocalAI: Unlock Kubernetes superpowers for free!
As we all know, LLMs are trending like crazy and the hype is not unjustified. Tons of cool projects leveraging LLM-based text generation…
Свежие доклады с SREcon 2023
https://www.youtube.com/playlist?list=PLbRoZ5Rrl5lcVOlNb_H1bmDL5y8DhOvHV
Накидайте в коменты, что на ваш взгляд наиболее интересно.
#sre #srecon #video
https://www.youtube.com/playlist?list=PLbRoZ5Rrl5lcVOlNb_H1bmDL5y8DhOvHV
Накидайте в коменты, что на ваш взгляд наиболее интересно.
#sre #srecon #video
Forwarded from Записки админа
⌚️ Service Level Calculator - SLI калькулятор прямо в браузере. Автор презентовал его в отдельной статье - Introducing Service Level Calculator. PDF со статьёй закину в комментарии к сообщению.
#sla #sre #напочитать
#sla #sre #напочитать
Forwarded from Записки админа
⚙️ Linux Crisis Tools - утилиты, которые окажутся полезны, когда инцидент на сервере уже случился. Брендан Грегг в своей статье рекомендует установить их заранее...
https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html
#tools #sre #напочитать
https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html
#tools #sre #напочитать
Forwarded from Книжный куб (Alexander Polomodov)
CNCF Platforms White Paper - I
Ну и в продолжение поста про Kubecon я решил рассказать про whitepaper от CNCF на тему платформ. Документ состоит из 7 пунктов
1. Why platforms?
Собственно документ начинается со списка преимуществ платформ и того, какие проблемы они решают:
- уменьшают когнитивную нагрузку на продуктовые команды
- улучшают надежность и устойчивость продуктов, развернутых поверх платформ
- ускоряют разработку и доставку продуктов за счет переиспользования платформенных инструментов
- уменьшают риски: безопасности, регуляторные, функциональных багов
- помогают использовать эффективно сервисы и мощности публичных облаков
2. What is a platform
Здесь дается определение платформы в виде коллекции возможностей, что определены и представлены в соотоветствии с потребностями пользователей платформы. Здесь важно, что все эти возможности интегрированы вместе и предоставляют возможность выполнять типичные сценарии пользователей платформы. Критически важно, что не все возможности платформенные команды должны реализовывать сами (их могут предоставлять облачные провайдеры или внутренние команды в организации). Так как эти платформе направлены на внутренних разработчиков, то их называют internal developer platform. Дальше авторы отдельно разбирают уровни зрелости платформ
Platform maturity
- продуктовые разработчики могут получать возможности платформы on-demand и сразу использовать их для запуска своих приложений
- продуктовые разработчики могут получать пространство для сервисов и сразу использовать их для запуска пайплайнов и задач для хранения артефактов, конфигурации и сбора телеметрии
- администраторы стороннего софта могут получать свои зависимости по требованию, например, баззы данных, а дальше использовать их в своих решениях
- продуктовые разработчики могут получать полное окружение с темплейтами вместе с run-time и development-time сервисами для специфичных сценарием (Web, ML, ...)
- продуктовые разработчики и менеджеры могут наблюдать за функциональностью, производительностью и костами развернутых сервисов через стандартные инструменты и дашборды
3. Attributes of successful platforms
В этом пункте авторы рассказывают про свойства платформ, которые
- platform as a product - к созданию платформ надо подходит как к созданию продукта
- user experience - надо ориентироваться на опыт разработчиков (DexEx, про него я недавно разбирал white paper)
- documentation and onboarding - здесь приводится пример того что могут предлагать платформы "the platform could offer a reusable supply chain workflow for building, scanning, testing, deploying, and observing a web application on Kubernetes. Such a workflow could be offered with an initial project template and documentation, a bundle often described as a golden path"
- self-service - возможность самостоятельно использовать сервисы
- reduced cognitive load for users - платформа должна уменьшать нагрузку
- optional and composable - продукты должны иметь возможность использовать нужные части платформ, а нехватающие части закрывать самостоятельно
- secure by default - безопасность должна быть встроена в платформы по умолчанию
4. Attributes of successful platform teams
Платформенные команды отвечают за следующие зоны
- исследование требований пользователей и создание роадмапа фичей
- маркетинг, евангелирование и адвокатство ценностей, которые предлагает платформы
- управление и разработка интерфейсов для использования и изучение возможностей и сервисов, включая портал, API, документацию, шаблоны и CI инструменты
Самое важное в том, что платформенные команды должны изучать потребности платформенных пользователей и дальше информировать и постоянно улучшать возможности и интерфейсы, что предоставляют платформы. Для этого можно использовать стандартные продуктовые инструменты, например, описанные в книге Мартина Кагана "Inspired", про которую я писал раньше.
Продолжение в постах 2 и 3.
#Kubernetes #SRE #DistributedSystems #PlatformEngineering #SoftwareDevelopment #Software #ProductManagement
Ну и в продолжение поста про Kubecon я решил рассказать про whitepaper от CNCF на тему платформ. Документ состоит из 7 пунктов
1. Why platforms?
Собственно документ начинается со списка преимуществ платформ и того, какие проблемы они решают:
- уменьшают когнитивную нагрузку на продуктовые команды
- улучшают надежность и устойчивость продуктов, развернутых поверх платформ
- ускоряют разработку и доставку продуктов за счет переиспользования платформенных инструментов
- уменьшают риски: безопасности, регуляторные, функциональных багов
- помогают использовать эффективно сервисы и мощности публичных облаков
2. What is a platform
Здесь дается определение платформы в виде коллекции возможностей, что определены и представлены в соотоветствии с потребностями пользователей платформы. Здесь важно, что все эти возможности интегрированы вместе и предоставляют возможность выполнять типичные сценарии пользователей платформы. Критически важно, что не все возможности платформенные команды должны реализовывать сами (их могут предоставлять облачные провайдеры или внутренние команды в организации). Так как эти платформе направлены на внутренних разработчиков, то их называют internal developer platform. Дальше авторы отдельно разбирают уровни зрелости платформ
Platform maturity
- продуктовые разработчики могут получать возможности платформы on-demand и сразу использовать их для запуска своих приложений
- продуктовые разработчики могут получать пространство для сервисов и сразу использовать их для запуска пайплайнов и задач для хранения артефактов, конфигурации и сбора телеметрии
- администраторы стороннего софта могут получать свои зависимости по требованию, например, баззы данных, а дальше использовать их в своих решениях
- продуктовые разработчики могут получать полное окружение с темплейтами вместе с run-time и development-time сервисами для специфичных сценарием (Web, ML, ...)
- продуктовые разработчики и менеджеры могут наблюдать за функциональностью, производительностью и костами развернутых сервисов через стандартные инструменты и дашборды
3. Attributes of successful platforms
В этом пункте авторы рассказывают про свойства платформ, которые
- platform as a product - к созданию платформ надо подходит как к созданию продукта
- user experience - надо ориентироваться на опыт разработчиков (DexEx, про него я недавно разбирал white paper)
- documentation and onboarding - здесь приводится пример того что могут предлагать платформы "the platform could offer a reusable supply chain workflow for building, scanning, testing, deploying, and observing a web application on Kubernetes. Such a workflow could be offered with an initial project template and documentation, a bundle often described as a golden path"
- self-service - возможность самостоятельно использовать сервисы
- reduced cognitive load for users - платформа должна уменьшать нагрузку
- optional and composable - продукты должны иметь возможность использовать нужные части платформ, а нехватающие части закрывать самостоятельно
- secure by default - безопасность должна быть встроена в платформы по умолчанию
4. Attributes of successful platform teams
Платформенные команды отвечают за следующие зоны
- исследование требований пользователей и создание роадмапа фичей
- маркетинг, евангелирование и адвокатство ценностей, которые предлагает платформы
- управление и разработка интерфейсов для использования и изучение возможностей и сервисов, включая портал, API, документацию, шаблоны и CI инструменты
Самое важное в том, что платформенные команды должны изучать потребности платформенных пользователей и дальше информировать и постоянно улучшать возможности и интерфейсы, что предоставляют платформы. Для этого можно использовать стандартные продуктовые инструменты, например, описанные в книге Мартина Кагана "Inspired", про которую я писал раньше.
Продолжение в постах 2 и 3.
#Kubernetes #SRE #DistributedSystems #PlatformEngineering #SoftwareDevelopment #Software #ProductManagement
tag-app-delivery.cncf.io
CNCF Platforms White Paper
This paper intends to support enterprise leaders, enterprise architects and platform team leaders to advocate for, investigate and plan internal platforms for cloud computing. We believe platforms significantly impact enterprises' actual value streams, but…
Forwarded from Книжный куб (Alexander Polomodov)
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Записки админа
💣 Почему бы в пятницу не грохнуть часть инфраструктуры своего прода и посмотреть как пойдут дела?
- Deploy on Friday? How About Destroy on Friday! A Chaos Engineering Experiment - Part 1;
- Destroy on Friday: The Big Day. A Chaos Engineering Experiment - Part 2.
#sre #напочитать
- Deploy on Friday? How About Destroy on Friday! A Chaos Engineering Experiment - Part 1;
- Destroy on Friday: The Big Day. A Chaos Engineering Experiment - Part 2.
#sre #напочитать