DevOps News
1.61K subscribers
140 links
Реклама, вакансии и анонсы - НЕ РАЗМЕЩАЮТСЯ.

Новостной канал группы @devops_ru. Всё про DevOps, high availability, мониторинг, CI/CD, Docker и инфраструктуру

Есть чем поделиться? Пишите: @Civiloid
Download Telegram
Простое и в то же время элегантное решение использует GitHub для балансировки нагрузки по своим MySQL серверам - использование haproxy и проверок на базе xinetd. Особенность их решения в том, что они разделяют ситуации "жив", "умер" и "меня выключили", а также их скрипты очень хорошо ложатся в концепцию ChatOps. Подробности в их блоге: http://githubengineering.com/context-aware-mysql-pools-via-haproxy/
Интересно почему бинарники, собранные Go 1.7 меньше и насколько они меньше? Тогда милости просим в официальный блог за подробностями:
https://blog.golang.org/go1.7-binary-size
Начали выкладывать видео докладов с GopherCon 2016. Первые 7 уже доступны:
https://www.youtube.com/playlist?list=PL2ntRZ1ySWBdliXelGAItjzTMxy2WQh0P
Системный подход к масштабированию Ruby on Rails приложения, работающего на Heroku до 2000 запросов в секунду. В принципе подход может быть частично применен и к другим приложениям.
https://zeemee.engineering/scaling-rails-to-125-000-requests-per-minute-on-heroku-b4128a10a769#.ofmbhcg6e
Автор этой статьи проанализировал опыт ряда компаний, включая Netflix, Soundcloud, Spotify и других, добавил свой собственный опыт и оформил как список рекомендаций к постронию микросервисов.
http://www.vinaysahni.com/best-practices-for-building-a-microservice-architecture
Если вы хотели бы разобраться с NUMA и современной организацией работы с памятью - обязательно прочитайте эту серию статей. Там в подробностях описывается как история эволюции подсистемы работы с памятью, так и текущее состояние и причины, которые к нему привели. В серии планируется 7 частей, но на текущий момент опубликовано только 4.
http://frankdenneman.nl/2016/07/07/numa-deep-dive-part-1-uma-numa/
Принято считать, что Pull для сбора данных в мониторинге не масштабируется и слишком затратен по сравнению с Push. У авторов Prometheus иное мнение:
https://prometheus.io/blog/2016/07/23/pull-does-not-scale-or-does-it/
O'Reilly выложили в свободный доступ ряд книг по DevOps (Monitoring Distributed Systems, DevOps in practice, Docker in the Cloud и др.) и по Performance (Effective Performance Engineering, Optimizing Cloud Migration, и др).
Скачать можно по ссылке: http://www.oreilly.com/webops-perf/free/
#book #books #devops #oreilly
Блогпост по мотивам keynote доклада с GolangUK 2016 применимости принципов SOLID к проектированию приложений на Go. Хоть данные принципы и были сформулированы более 10 лет назад (Agile Software Development, Principles, Patterns and Practices, Robert Martin, 2002), но до сих пор не потерил своей актуальности и помогают писать переиспользуемый, поддерживаемый и более очевидный код. Тому как их можно использовать применительно к Go и посвещана данные статья.
http://dave.cheney.net/2016/08/20/solid-go-design
#go #golang #SOLID
Channel photo updated
DigitalOcean выложила на GitHub код своей системы мониторинга, совместимой с API Prometheus. Она позиционируется как замена, рассчитанная на длительное хранение метрик. Правда пока что она имеет статус эксперементальной.
https://github.com/digitalocean/vulcan

#prometheus #metrics #digitalocean #monitoring
Неофициальный список статей, которые Google рекомендует к прочтению новопришедшим SRE. Он не специфичен для Google, но весомая часть - ссылки на исследования самого гугла. Полезно ознакомится, если вы хотите лучше понять чем занимаются крупные компании, что такое SRE и так далее:
http://larrr.com/spisok-rekomenduemyh-k-prochteniyu-statej-ot-google/
В современном мире все большую и большую роль играет доступность сервисов. Если раньше хватало обычного fail over, то последние крупные сбои в информационных системах авиакомпаний показали, что этого становится мало. Эта статья о подходе, который Google называет native multihomed architecture, который позволит выдерживать даже полный выход из строя одного из дата центров.
http://highscalability.com/blog/2016/8/23/the-always-on-architecture-moving-beyond-legacy-disaster-rec.html

#architecture #failover #highavailability #ha
Тихо и незаметно, без лишнего шума, Яндекс выложил свой Mongo Sharing server под названием Mongoz. Заявляется, что в отличии от официального, Mongoz хорошо работает в условиях не идеальной сети ценой небольшого снижения гарантий консистентности.
https://github.com/yandex/mongoz

Анонс от автора: https://m.facebook.com/dmitry.prokoptsev/posts/565674550307006

#mongo #highavailability #ha #scalability #sharding
#facebook рассказал о том, как он готовит конфигурацию сети.
Система называется #Robotron, она генерирует конфиги для сетевых устройств из темплейтов Django, деплоит, в том числе инкрементально, сравнивает метрики после апдейта с референсными, мониторит и т.д.
По ссылке целый PDF
https://goo.gl/hnzU7Y
Аналог #AWS Lambda (платформы облачных вычислений), но OpenSource and Self-Hosted
Внутри #docker, #nginx, #python
http://www.open-lambda.org/doc.htm
Facebook скрестил ужа с ежом и получил MySQL совместимую базу с движком RocksDB и назвал ее MyRocks. Насколько это хорошо работает? Ответ в блог посте:
https://code.facebook.com/posts/190251048047090/myrocks-a-space-and-write-optimized-mysql-database/
#facebook #rocksdb #mysql #highload #highavailability #hl #ha
#netflix рассказал о архитектуре и кейсах использования своей open-source системы тестирования облачных систем хранения Netflix Data Benchmark
#cloud #aws #Benchmarking
http://techblog.netflix.com/2016/09/netflix-data-benchmark-benchmarking.html