Библиотека девопса | DevOps, SRE, Sysadmin
10.3K subscribers
1.38K photos
71 videos
4 files
2.58K links
Все самое полезное для девопсера в одном канале.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/25874ec4

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/6798b4e4509aba565
Download Telegram
Инцидент 2023:03:08: подробное описание реагирования на инциденты

Со 100 рабочими потоками и более 500 задействованными инженерами это был один из крупнейших ответов на инциденты за последние годы.

Читать статью
Как «3 столпа наблюдаемости» упускают из виду общую картину

Когда вы объединяете эти три «столпа» в единый целостный подход, также появляется новая способность понимать полное состояние вашей системы несколькими новыми способами.

Читать пост
Отключение Azure DevOps в Южной Бразилии

В этом отчете подробно описывается 10-часовое реагирование на инцидент после случайного удаления активных баз данных (а не их снапшотов, как предполагалось).

Читать отчет
👍1
Show HN: Keep — создавайте производственные оповещения на простом английском

Хитрый трюк: напишите свои оповещения на английском языке и заставьте GPT преобразовывать их в настоящие конфигурации оповещений.

Читать статью
Потенциальная проблема с невыполненными ограничениями запросов в вашем преобразователе DNS

Если ваш преобразователь DNS отвечает за обработку запросов как для внутренних, так и для внешних доменов, что произойдет, если внешние запросы DNS не будут выполнены? Внутренние еще могут продолжаться? Ответ в статье.

Читать статью
Как появилась наблюдаемость и что с этим делать

В этой статье объясняются потенциальные подводные камни и недостатки инструментов наблюдения, а также способы, с помощью которых поставщики могут заставить вас использовать их, а также советы о том, как избежать ловушек.

Читать статью
Отношение к неопределенности как к первостепенной проблеме

Слишком часто мы отмахиваемся от аномалии, с которой только что столкнулись в инциденте, как от странного, единичного случая. И хотя этот конкретный режим отказа, скорее всего, будет разовым, в будущем мы столкнемся с новыми аномалиями.

Читать статью
Как создавать программное обеспечение как SRE

За 5 лет работы в качестве SRE автор этой статьи собрал набор лучших практик разработки и эксплуатации программного обеспечения, которыми он делится с нами.

Читать статью
🔥1
💡11 заповедей Junior-разработчика

В этой статье дадим несколько дельных советов, которые помогут вам избежать распространенных ошибок на старте карьеры.

🔗 Основной сайт
🔗 Зеркало
👍2
Развертывание Argo в масштабе: автоматизация отката более 2100 сервисов в Monzo

Разработчики внедрили автоматические откаты в сложной инфраструктуре и в этой статье делятся уроками, которые они извлекли в процессе.

Читать статью
Много чего было изменено в Docker, чтобы снизить входной барьер для WASM. В этом репозитории собрано множество полезных ссылок для начала работы.

Открыть репозиторий
Еще один пост об архитектуре, управляемой событиями, в котором приводится полезная классификация различных подходов, управляемых событиями.

Читать пост
👍1
Стратегия оповещений для облака

Пост о разработке стратегии оповещения, рассмотрении отраслевых рамок, расстановке приоритетов, маршрутизации оповещений и многом другом.

Читать статью
👍1
Что такое маршрутизатор?

Маршрутизатор — это физическое или виртуальное устройство, которое передает информацию между двумя или более компьютерными сетями с коммутацией пакетов. Маршрутизатор проверяет адрес Интернет-протокола назначения данного пакета данных (IP-адрес), вычисляет наилучший способ его достижения и затем соответствующим образом пересылает его.
#вопросы_с_собеседований
👍7
🧒👾Тест-игра на выживание #2: как джуну получить повышение

Прошло какое-то время, вы возмужали и теперь думаете о повышении. Но с чего начать восхождение к вершине и как продвинуться набравшемуся опыта джуну по карьерной лестнице! Знаете, что делать дальше? Проверьте свои шансы на успех и пройдите вторую часть квеста.

🔗 Пройти тест
1
Какой последний сертификат вы получили?
Расскажите в комментариях ⬇️
#интерактив
Почему служба поддержки AWS снова не справилась с US-EAST-1?

У AWS был серьезный сбой Lambda в us-east-1, и он вывел из строя многие клиентские системы и довольно много других систем AWS, включая их портал поддержки.

Читать статью
👍2
Приведите основные типы DNS записей и расскажите, для чего они используются.

A — запись соответствия с IPv4 адресом;
AAAA — запись соответствия с IPv6 адресом;
CNAME — запись соответствия другому доменному имени;
MX — адресная запись, указывающая на почтовый сервер домена;
NS — адресная запись указывающая на DNS-резолверы, отвечающие за данный домен;
TXT — произвольная текстовая запись в домене, часто используется для верификации принадлежности домена.
#вопросы_с_собеседований
👍19
Как я прошел путь от операционного менеджера до инженера по надежности сайта за 6 месяцев

Этот человек проделал увлекательный путь к SRE, начав свою карьеру техником по ремонту генераторов и перейдя через devops к SRE.

Читать статью