sysadmin.su
229 subscribers
282 photos
29 videos
225 files
2.11K links
Админам/sre/devops’ам будет интересно!
Download Telegram
Подкасты от SRE google

Для тех кто плохо воспринимает на слух, есть транскрипты.

https://sre.google/prodcast/
#sre
SRE cheat sheet

Набор шпаргалок по следующим темам:

* Linux Performance Analysis
* System
* CPU
* Memory
* Disk
* Network
* Getting System Information
* Storage
* Postgres
* Configuration
* PSQL Tricks
* Postgres perfomance checklist
* Postgres Dump / Backup
* MySQL
* Configuration
* MySQL perfomance checklist
* MySQL dump / backup
* Redis
* Apache Kafka
* Consumers Troubleshooting
* Docker
* JVM
* Nginx
* Kubernetes
* Monitoring and Alerting
* Development
* Helpers
* Bash
* Post Mortem
* Perfomance benching
* Security

https://kubernetes7.medium.com/sre-cheat-sheet-10e62c3a4c63

#sre #cheatsheet
SREcon23 Asia/Pacific

Записи докладов с SREcon23 Asia/Pacific

https://www.youtube.com/playlist?list=PLbRoZ5Rrl5ldnsuIyb3X-t6zG3IDcnaRn

#video #youtube #srecon #sre
Building a Successful SRE Team

Уроки которые, по мнению автора, помогут построить успешную SRE команду.

* Focus on Developer Training
* Focus on the Right Abstractions
* Focus on Self Service
* Automate Yourself out of a job

https://medium.com/@hans.knechtions/building-a-successful-sre-team-283232bc2694

#sre #team #напочитать
На сайте представленна карта действий которые нужно сделать чтоб чтобы пройти путь от 90 до 99.999 доступности при создании надежной системы.
p.s Список достаточно спорный.

https://r9y.dev/

#sre
🔨 Inside Disney’s Site Reliability Engineering practice - SRE в Disney в качестве вечернего чтива для камрадов...

https://www.srepath.com/inside-disneys-site-reliability-engineering-practice/

#sre #напочитать
Свежие доклады с SREcon 2023

https://www.youtube.com/playlist?list=PLbRoZ5Rrl5lcVOlNb_H1bmDL5y8DhOvHV

Накидайте в коменты, что на ваш взгляд наиболее интересно.

#sre #srecon #video
⌚️ Service Level Calculator - SLI калькулятор прямо в браузере. Автор презентовал его в отдельной статье - Introducing Service Level Calculator. PDF со статьёй закину в комментарии к сообщению.

#sla #sre #напочитать
⚙️ Linux Crisis Tools - утилиты, которые окажутся полезны, когда инцидент на сервере уже случился. Брендан Грегг в своей статье рекомендует установить их заранее...

https://www.brendangregg.com/blog/2024-03-24/linux-crisis-tools.html

#tools #sre #напочитать
Forwarded from Книжный куб (Alexander Polomodov)
CNCF Platforms White Paper - I

Ну и в продолжение поста про Kubecon я решил рассказать про whitepaper от CNCF на тему платформ. Документ состоит из 7 пунктов

1. Why platforms?
Собственно документ начинается со списка преимуществ платформ и того, какие проблемы они решают:
- уменьшают когнитивную нагрузку на продуктовые команды
- улучшают надежность и устойчивость продуктов, развернутых поверх платформ
- ускоряют разработку и доставку продуктов за счет переиспользования платформенных инструментов
- уменьшают риски: безопасности, регуляторные, функциональных багов
- помогают использовать эффективно сервисы и мощности публичных облаков

2. What is a platform
Здесь дается определение платформы в виде коллекции возможностей, что определены и представлены в соотоветствии с потребностями пользователей платформы. Здесь важно, что все эти возможности интегрированы вместе и предоставляют возможность выполнять типичные сценарии пользователей платформы. Критически важно, что не все возможности платформенные команды должны реализовывать сами (их могут предоставлять облачные провайдеры или внутренние команды в организации). Так как эти платформе направлены на внутренних разработчиков, то их называют internal developer platform. Дальше авторы отдельно разбирают уровни зрелости платформ
Platform maturity
- продуктовые разработчики могут получать возможности платформы on-demand и сразу использовать их для запуска своих приложений
- продуктовые разработчики могут получать пространство для сервисов и сразу использовать их для запуска пайплайнов и задач для хранения артефактов, конфигурации и сбора телеметрии
- администраторы стороннего софта могут получать свои зависимости по требованию, например, баззы данных, а дальше использовать их в своих решениях
- продуктовые разработчики могут получать полное окружение с темплейтами вместе с run-time и development-time сервисами для специфичных сценарием (Web, ML, ...)
- продуктовые разработчики и менеджеры могут наблюдать за функциональностью, производительностью и костами развернутых сервисов через стандартные инструменты и дашборды

3. Attributes of successful platforms
В этом пункте авторы рассказывают про свойства платформ, которые
- platform as a product - к созданию платформ надо подходит как к созданию продукта
- user experience - надо ориентироваться на опыт разработчиков (DexEx, про него я недавно разбирал white paper)
- documentation and onboarding - здесь приводится пример того что могут предлагать платформы "the platform could offer a reusable supply chain workflow for building, scanning, testing, deploying, and observing a web application on Kubernetes. Such a workflow could be offered with an initial project template and documentation, a bundle often described as a golden path"
- self-service - возможность самостоятельно использовать сервисы
- reduced cognitive load for users - платформа должна уменьшать нагрузку
- optional and composable - продукты должны иметь возможность использовать нужные части платформ, а нехватающие части закрывать самостоятельно
- secure by default - безопасность должна быть встроена в платформы по умолчанию

4. Attributes of successful platform teams
Платформенные команды отвечают за следующие зоны
- исследование требований пользователей и создание роадмапа фичей
- маркетинг, евангелирование и адвокатство ценностей, которые предлагает платформы
- управление и разработка интерфейсов для использования и изучение возможностей и сервисов, включая портал, API, документацию, шаблоны и CI инструменты
Самое важное в том, что платформенные команды должны изучать потребности платформенных пользователей и дальше информировать и постоянно улучшать возможности и интерфейсы, что предоставляют платформы. Для этого можно использовать стандартные продуктовые инструменты, например, описанные в книге Мартина Кагана "Inspired", про которую я писал раньше.

Продолжение в постах 2 и 3.

#Kubernetes #SRE #DistributedSystems #PlatformEngineering #SoftwareDevelopment #Software #ProductManagement