DevOps&SRE Library
17.8K subscribers
461 photos
4 videos
2 files
4.76K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3&registryType=bloggersPermission
Download Telegram
«PostgreSQL: replication, backup and observability» — курс от Слёрм.

Курс подойдёт тем, кому не хватает практических навыков для работы с PostgresSQL. А так же тем, кто хочет научиться грамотно действовать в критических ситуациях и принимать быстрые и взвешенные решения по обеспечению работоспособности кластера.

Программа курса основана на реальных задачах команд эксплуатации, а сам курс на 75% состоит из практики.

❗️На занятиях мы научим архитектурным решениям, вместе поднимем их в тестовой среде.

🎙Автор и спикер курса — Иван Чувашов | Ведущий инженер OKKO, Администратор баз данных Southbridge.

Даты проведения: 6-21 апреля, занятия будут проходить по вторникам и четвергам с 19:00 до 22:00 (мск).

Стоимость — 30 000 рублей.
Посмотреть программу и записаться: https://slurm.club/30a7Uwr
shell-operator & addon-operator news: hooks as admission webhooks, Helm 3, OpenAPI, Go hooks, and more!

https://blog.flant.com/shell-operator-addon-operator-v1-rc1-changes
RATE LIMITING IN CONTROLLER-RUNTIME AND CLIENT-GO

https://danielmangum.com/posts/controller-runtime-client-go-rate-limiting
Build and publish container images to any cloud with Infrastructure as Code

https://www.pulumi.com/blog/build-publish-containers-iac
Какие задачи решает Apache Kafka?

Apache Kafka - это отказоустойчивая распределенная стриминговая платформа с открытым исходным кодом.
Коллеги из Yandex.Cloud рассказали про то, как она создавалась и как устроена, какие задачи помогает решать и в чем её преимущество перед RabbitMQ.

Тестировать базу данных будет гораздо удобнее с сервисом Yandex Managed Service for Apache Kafka® – он поможет сфокусироваться на создании приложений, а не на управлении брокерами и обновлениях. К тому же всем новым пользователям Yandex.Cloud доступен грант на 4000 руб. 💎

Apache Kafka отлично подходит для решения задач аналитики в реальном времени. С её помощью можно поставлять данные напрямую в ClickHouse без дополнительной разработки. И ClickHouse быстро обработает запросы к большому объёму данных. А DataLens позволит эти данные визуализировать и построить отчёты. Подробнее смотрите в документации сервиса.
Engineering dependability and fault tolerance in a distributed system

https://ably.com/blog/engineering-dependability-and-fault-tolerance-in-a-distributed-system
Migrations: the sole scalable fix to tech debt

https://lethain.com/migrations
Scaling Celery workers with RabbitMQ on Kubernetes

https://learnk8s.io/scaling-celery-rabbitmq-kubernetes
Atlas: Our journey from a Python monolith to a managed platform

In this post, we’ll explain why and how we developed and deployed Atlas, a platform which provides the majority of benefits of a Service Oriented Architecture, while minimizing the operational cost that typically comes with owning a service. 

https://dropbox.tech/infrastructure/atlas--our-journey-from-a-python-monolith-to-a-managed-platform
cloudsplaining

Cloudsplaining is an AWS IAM Security Assessment tool that identifies violations of least privilege and generates a risk-prioritized HTML report.

https://github.com/salesforce/cloudsplaining
How they SRE

A curated collection of publicly available resources on how technology and tech-savvy organizations around the world practice Site Reliability Engineering (SRE)

https://github.com/upgundecha/howtheysre
4 Things you Need to Know about Writing Better Production Readiness Checklists

https://www.blameless.com/blog/4-things-you-need-to-know-about-writing-better-production-readiness-checklists
Evolving Schemaless into a Distributed SQL Database

https://eng.uber.com/schemaless-sql-database