DevOps News – Telegram

DevOps News

1.57K subscribers

140 links

Реклама, вакансии и анонсы - НЕ РАЗМЕЩАЮТСЯ.

Новостной канал группы @devops_ru. Всё про DevOps, high availability, мониторинг, CI/CD, Docker и инфраструктуру

Есть чем поделиться? Пишите: @Civiloid

Download Telegram

About

Blog

Apps

Platform

1.57K subscribers

Опубликованы видеозаписи докладов с LISA17, проходившей в конце октября в Сан Франциско.

Конференция посвящена масштабированию и эксплуатации распределенных систем и является одно из старейших в своем роде.

Playlist на youtube: https://www.youtube.com/playlist?list=PLbRoZ5Rrl5lfzbd-NnFFBOwZs2He4PBH7
Сайт конференции (с abstract докладов): https://www.usenix.org/conference/lisa17/conference-program

#videos #conferece #video #youtube #lisa17 #lisa #scaling #usenix

LISA17 - YouTube

3.6K views08:44

И аналогично про SRECon17 Europe.

Конференция посвящена SRE и DevOps практикам, архитектуре систем и всему с этим связанному.

Playlist: https://www.youtube.com/playlist?list=PLbRoZ5Rrl5lcIFf9w5z2s4csaS_nIs3_Z

#videos #conferece #video #youtube #srecon17eu #srecon17 #srecon #usenix

SREcon17 Europe/Middle East/Africa - YouTube

4.4K viewsedited 08:48

Amazon открыл public preview новых типов инстансов - i3.metal. Как можно догадаться из названия это bare metal, 2xE5-2686v4 (сумарно 36 ядер или 72 потока), 512GB Ram, 15.2TB Local NVMe SSD, 25 гбит сеть. Вся остальная инфраструктура, включая Auto Scaling продолжит работать с ними как будто это стандартные виртуалки в облаке.

Подробности: https://aws.amazon.com/blogs/aws/new-amazon-ec2-bare-metal-instances-with-direct-access-to-hardware/

#aws #baremetal #hosting #ec2

Amazon EC2 Bare Metal Instances with Direct Access to Hardware | Amazon Web Services

When customers come to us with new and unique requirements for AWS, we listen closely, ask lots of questions, and do our best to understand and address their needs. When we do this, we make the resulting service or feature generally available; we do not build…

6.1K views10:22

DataDog померяли влияние заплаток от Spectre и Meltdown на своем Redis кластере (в нем миллионы ядер) и опубликовали по этому поводу небольшую статью с графиками: https://www.datadoghq.com/blog/meltdown-spectre-cpu/

#datadog #meltdown #spectre #performance #impact #security

The Meltdown/Spectre saga: Measuring the impact on millions of cores

The Meltdown/Spectre saga: Measuring the impact on millions of cores | Datadog

Data from millions of cores monitored by Datadog shows widespread impacts of the security patches.

4.3K views09:08

После долгой разработки, выпущена Grafana 5.0.0

Главные изменения релиза:
- намного более гибкие дашборды.
- появление концепции команд и разделения прав доступа
- поддержка группировки дашбордов
- поддержка тэгов в графите и возможность автоматического получения списка доступных функций (поддерживается в graphite-web 1.1.0+ и carbonapi 0.9.2+)

Пакеты будут в ближайшее время. Официальный анонс ожидается завтра на GrafanaCon EU 2018.

Подробнее:
http://docs.grafana.org/guides/whats-new-in-v5/
https://github.com/grafana/grafana/releases/tag/v5.0.0

#grafana #monitoring

5.3K viewsedited 18:18

Сегодня начинается GrafanaCon EU.

Программа конференции: http://grafanacon.org
Официальная видео трансляция тоже в наличии: https://youtu.be/kHx8no2q3-Y

При этом я постараюсь делать заметки в свой телеграмм канал: @connotes

#grafanacon #grafana #talks #livestream

3.7K views08:25

Тихо и незаметно вышла ScyllaDB 2.1. Она позиционируется как drop in замена Cassandra 2.2 с избранными фичами из 3.x

Из главных изменений - поддержка time window compaction strategy. Одна из главных вещей которой не хватало большинству time series баз, использующих Кассандру.

Подробнее: https://www.scylladb.com/2018/02/22/scylla-release-2-1/

#scylladb #cassandra #release

ScyllaDB Release 2.1 - ScyllaDB

The ScyllaDB team is pleased to announce the release of ScyllaDB 2.1, a production-ready ScyllaDB Open Source minor release. Learn more about the recent changes for this release.

3.9K views12:43

У небезызвестного Brendan Gregg'а очередная статья про низкоуровневый дебаг в Linux'е. В этот раз про новую фичу Kernel 4.15 (которая расширилась в 4.16) - TCP Tracepoints. Они позволяют делать всякие разные интересные штуки - например следить за изменением состояния соединения, получать эвенты в момент ретрансмитов и так далее.

Подробнее по ссылке: http://www.brendangregg.com/blog/2018-03-22/tcp-tracepoints.html

#brendangregg #performance #tcp #linux #tracepoints

TCP Tracepoints

Linux TCP Tracepoints, and using them via bcc/eBPF.

4.1K views21:53

Хорошая статья о применимости разных алгоритмов хэширования в задаче балансировки нагрузки. Полезно будет понимать всем, кто пишет свои распределенные сервисы или балансировщики.

https://medium.com/@dgryski/consistent-hashing-algorithmic-tradeoffs-ef6b8e2fcae8

#hashing #balancing #distributes #highload

Consistent Hashing: Algorithmic Tradeoffs

Like this article? Buy me a coffee.

4.3K views19:41

Тем временем, amazon добавил возможность делать производные от уже имеющихся CloudWatch метрики. Функционал называется CloudWatch Metric Math и позволяет в том числе считать агрегаты от множества метрик.

https://aws.amazon.com/about-aws/whats-new/2018/04/amazon-cloudwatch-adds-metric-math-to-enable-custom-operations-on-metrics/

#aws #cloudwatch

Amazon CloudWatch Metric Math

4.2K viewsedited 07:26

почти реклама

17 мая (четверг) в дата центре селектел (Санкт-Петербург) пройдет митап посвященный мониторингу. Участие бесплатное. Есть онлайн трансляция (требуется предварительная регистрация).

https://eventuer.timepad.ru/event/702213/

#meetup #monitoring #spb

eventuer.timepad.ru

Big Monitoring Meetup #2: конференция по мониторингу / События на TimePad.ru

BIG MONITORING MEETUP #2 - уникальная возможность встретиться с экспертами и профессионалами в области мониторинга. Вас ждут живое общение, обсуждение лучших практик и нетрадиционных подходов, обзор новинок и тенденций в области мониторинга и смежных технологий…

4.4K views09:57

В рамках USENIX Symposium on Networked Systems Design and Implementation 2018, проходившей в середине апреля, опубликованы некоторые подробности об устройстве сети в Google Cloud Platform. Может будет интересно просто посмотреть на подход к разработке изолированных высокопроизводительных сетей для облаков.

https://www.usenix.org/node/211244

Остальные доклады (без видео) также можно найти на сайте конференции: https://www.usenix.org/conference/nsdi18/glance

#usenix #network #cloud #andromeda

NSDI '18 Program at a Glance

4.6K viewsedited 07:11

В блоге Dropbox'а опубликована статья про текущую архитектуру их хранилища (Magic Pocket). В процессе перехода от стандартных PMR[1] дисков к SMR[2] часть кода была переписана с Go на Rust, что позволило увеличить плотность сохранив потребление CPU и памяти на том же уровне.

Подробности по ссылке: https://blogs.dropbox.com/tech/2018/06/extending-magic-pocket-innovation-with-the-first-petabyte-scale-smr-drive-deployment/

#dropbox #storage #architecture

[1] https://en.wikipedia.org/wiki/Perpendicular_recording
[2] https://en.wikipedia.org/wiki/Shingled_magnetic_recording - например 10-14ТБ HGST

Extending Magic Pocket Innovation with the first petabyte scale SMR drive deployment

5.0K views20:22

О том как GitHub строит свои отказоустойчивые кластера MySQL рассказывают в своем последнем блог посте: https://githubengineering.com/mysql-high-availability-at-github/

#github #mysql #ha

5.3K views06:20

Slack и Atlassian заключили "партнерское" соглашение. По его условиям Atlassian закроет Hipchat и Stride и предоставит способы миграции в Slack. Также Slack'у достается (конечно за деньги) вся интеллектуальная собственность касающаяся Hipchat'а и Strdie'а. А в самом Slack'е улучшится интеграция с Jira (Hosted и Cloud), Trello, Bitbucket и появится с Confluence.

Подробнее: https://slackhq.com/atlassian-and-slack-partnership

#slack #atlassian #hipchat

Atlassian + Slack

Announcing an exciting new partnership and welcoming Hipchat and Stride users to Slack. We’re glad you’re here!

5.6K views21:20

Для тех, кто считает что от всевозможных Spectre и Meltdown не нужно защищаться - исследователи из Graz University of Technology опубликовали пару страниц счастья с Proof Of Concept *remote* атакой на уязвимые к Spectre системы. Атака позволяет читать произвольные участки памяти, но к счастью, скорость чтения памяти очень низкая (единицы байт в час).

Подробности: https://misc0110.net/web/files/netspectre.pdf

#spectre #security #brokenbydesign

5.8K views09:36

Uber анонсировал свою time-series базу данных m3db, а также выложил в opensource read/write адаптер для Prometheus. Впрочем сам m3db лежал на гитхабе больше года, но с полным отсутствием документации (сейчас это исправлено).

Кластер m3db в убере содержит миллиарды уникальных серий и пишет десятки миллионов уникальных точек в секунду.

Подробности: https://eng.uber.com/m3/

#m3db #timeseries #tsdb #uber

7.2K views06:53

GitHub опубликовал postmortem про недавний (21 октября) инцидент из-за которогой pull request'ы и issues были фактически недоступны более 24-х часов. Очень поучительная история про консесус, mysql и репликацию.

Ссылка: https://blog.github.com/2018-10-30-oct21-post-incident-analysis/

#github #postmortem

The GitHub Blog

October 21 post-incident analysis

In-depth analysis of the incident that impacted GitHub services on October 21 and 22.

8.8K views21:25

Dropbox опубликовал доклад о том, как они меряли пропускную способность Кафки. В статье описывается подход к автоматическому тестированию, к построению модели эксперимента и т.п.

https://blogs.dropbox.com/tech/2019/01/finding-kafkas-throughput-limit-in-dropbox-infrastructure/

#Dropbox #kafka #performance

Finding Kafka’s throughput limit in Dropbox infrastructure

11.6K views21:45

Пересказ исследования о том, почему использовать файловую систему как backend для распределенного хранилища - не очень хорошая идея (на примере ceph).

В целом после SOSP'19 колличество интересных статей значительно увеличилось.

https://blog.acolyer.org/2019/11/06/ceph-evolution/

#research #ceph #performance

11.4K views13:07

Свежая и достаточно объемная статья от Google о их текущей TSDB "Monarch".

12 страниц текста. 2 страницы "Related work". Много информации о языке запросов, схеме записей, храненнии, модели данных и т.п. Инетересно в первую очередь тем, кто строит с нуля свои системы хранения метрик.

http://www.vldb.org/pvldb/vol13/p3181-adams.pdf

#tsdb #google #monitoring #metrics

8.3K views20:43