Outlines Tech | IT-компания

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

429 views13:44

😁8❤5🤣5

Outlines Tech | IT-компания

Тигры, хватит работать. Давайте лучше похихикаем 🤪

Ещё больше юмора публикуем тут и тут.

Подписывайтесь!

Please open Telegram to view this post

VIEW IN TELEGRAM

😁53🔥2👀1

456 viewsedited 13:44

Outlines Tech | IT-компания

Нашему сммщику нужна перезагрузка. Поэтому на этой неделе посты публикует наш ведущий системный архитектор Иван.

Не судите строго, дайте зумеру отдохнуть 😴

🤣13😁8🤝72❤1

325 viewsedited 10:39

Outlines Tech | IT-компания

Отказоустойчивость Cloud Ready: как не уронить весь сервис

🐯

Если сервис завязан на внешние зависимости, очереди, базы данных и сеть — сбой неизбежен. Главное не дать ему уронить весь сервис.

ИТ-тигр Иван Кузьминов собрал подходы, которые помогают не уронить весь сервис из-за одного сбоя. Из карточек вы узнаете:
— Где ставить Circuit Breaker
— Какие режимы деградации предусмотреть заранее
— Как изолировать ресурсы, чтобы один сбой не бил по всем
— Как проверять отказоустойчивость через Chaos Engineering

🔗Полезное чтиво по теме:
— Паттерн Circuit Breaker от Martin Fowler: описание от гуру архитектуры
— Fault Tolerance patterns от Microsoft Architecture: каталог паттернов устойчивости
— Chaos Engineering: Principles of Chaos: принципы хаос-инженерии

🧭Для глубокого изучения:
— SRE: книга Google SRE Book, особенное внимание главе Handling Overload
— Распределенные транзакции и паттерн Saga: статья Saga distributed transactions
— Health Check API и Readiness/Liveness probes: Kubernetes Documentation

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👀54👨‍💻1🤪1

403 views10:40

Outlines Tech | IT-компания

Наблюдаемость Cloud Ready: как связать метрики, логи и трейсы

Если система состоит из десятков сервисов, мало знать, что случился сбой. По одному алерту нельзя быстро понять, где именно проблема, какой сервис тормозит и что из-за этого ломается у пользователя. Из-за этого затягивается поиск причины, починка инцидента и приходится дольше возвращать продукт в норму.

💁🏻‍♂️Я рассказал, как собрать наблюдаемость, в которой метрики, логи и трейсы работают вместе. Листайте карточки🖱

🔗 Полезное чтиво по теме:
— Micrometer.io Official Docs: как правильно инструментировать код
— Grafana LGTM Stack: концепция единого стека наблюдаемости
— Prometheus.io: база по метрикам
— Introduction to Grafana Loki: как выстроить логирование без лишних затрат

🧭 Для глубокого изучения:
— OpenTelemetr: стандарт сбора телеметрии
— JVM Profiling: как смотреть, что происходит внутри потоков Java
— Перцентили и гистограммы: почему среднее значение часто врёт

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥4👾31

456 viewsedited 14:34

About

Blog

Apps

Platform