ITSumma
245 subscribers
118 photos
107 links
Это канал, где мы делимся своим опытом и экспертизой в облачных технологиях, DevOps, BigData и DataOps.

Для связи: @its_site_bot

Сайт — www.itsumma.ru
Habr — https://habr.com/ru/companies/itsumma/articles/
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖Если вы только заинтересовались Data и ML Ops и (например) подумываете сменить профессию, изучите наши карточки. В них вы найдете основную инфу о том, что это такое, чем занимаются эти инженеры, какими навыками, инструментами и технологиями нужно обладать и что нужно знать, чтобы освоить их ремесло.
Приглашаем на вебинар «Управление базами данных в Greenplum: мониторинг и удаление мусора»

🗓 8 февраля, 11:00 МСК

🧑‍💻 Спикеры:

Алексей Пономаревский, ведущий администратор БД ITSumma
Иван Хозяинов, руководитель направления больших данных ITSumma

🔎 О чём:

Вакуумирование данных и для чего оно нужно
Инструменты и специфика вакуумирования в Greenplum
Мониторинг раздутых таблиц и стратегии вакуумирования
Решения и практики, которые минимизируют возможные проблемы

👥 Для кого:

Администраторов БД
DataOps-инженеров
Всем, кто работает с большими данными

Регистрация: https://clck.ru/38NWH7
ITSumma pinned a photo
В ожидании нашего вебинара по работе с Greenplum, мы продолжаем изучать лучшие мировые практики в больших данных.

Сегодня у нас перевод статьи с Medium о том, как оценивают качество данных в Airbnb.

В тексте пойдет речь об инновационном подходе к оценке качества данных — Airbnb's Data Quality Score («DQ Score»). Ведущий дата-аналитик Airbnb Кларк Райт расскажет о том, как велась разработка DQ Score, как он используется сегодня и как этот метод станет основой следующего этапа повышения качества данных в Airbnb.

👉🏻Читайте с удовольствием!👈🏻
Вряд ли кого-то интересует, как организована служба технической поддержки веб-проектов — ровно до того момента, когда в ней возникает необходимость. Но все-таки как она устроена и чем должна заниматься?

Ответы на эти (и не только) вопросы про техсаппорт сайтов мы собрали в несколько карточек, которые объяснят базовые принципы👆🏻

Уже организованный отдел техподдержки с опытом работы в 15 лет и SLA меньше 15 минут здесь
У СУБД Greenplum множество достоинств, но она подвержена “раздутию” и фрагментации таблиц, из-за чего падает скорость работы. Избежать этого помогает вакуумирование (Vacuum) — процедура сбора и удаления мусора в табличных пространствах.

Работать с вакуумированием нужно деликатно, иначе велик риск надолго нарушить работу всей системы. Как раз тому, как этого избежать, правильно мониторить и очищать таблицы, был посвящен наш вебинар, прошедший 8 февраля. Эта статья — выжимка из доклада, прочитанного на мероприятии: https://habr.com/ru/companies/itsumma/articles/795279/
YAML – это язык, обладающий человекочитаемым кодом. Он оптимально подходит для приложений с большим объемом данных, которые основаны на DevOps-процессах или используют виртуальные машины. Чаще всего его используют, чтобы формировать конфигурационные файлы в рамках подхода «Инфраструктура как Код» (IaC).

Повышенная читаемость данных оказывается особенно полезной в командах, где разработчики регулярно взаимодействуют с этими данными. Но на практике все бывает не так гладко — создавать и редактировать yml-файлы иногда сложно и попросту трудоемко. Упростить работу с YAML поможет наш сборник советов.