DevOps + Data: Синергия двух миров = DataOps
#БлогкомпанииOTUS #DevOps #dataops #opinion #datamanagement #cloud IV
https://habr.com/ru/post/648683/
#БлогкомпанииOTUS #DevOps #dataops #opinion #datamanagement #cloud IV
https://habr.com/ru/post/648683/
Хабр
DevOps + Data: Синергия двух миров = DataOps
Дисклеймер:Эта заметка будет полезна для людей незнакомых с направлением DataOps, для новичков, кто слышал об этом подходе и захотел узнать о чем это. Тут не будет глубоких технических...
Как обрабатывать объекты Avro с помощью датасетов Spark 3.2 & Scala 2.12
#БлогкомпанииOTUS #Scala #BigData #DataEngineering #Spark #dataops IV
https://habr.com/ru/post/650125/
#БлогкомпанииOTUS #Scala #BigData #DataEngineering #Spark #dataops IV
https://habr.com/ru/post/650125/
Хабр
Как обрабатывать объекты Avro с помощью датасетов Spark 3.2 & Scala 2.12
Привет!В этом посте разберем, как обрабатывать объекты JVM, сгенерированные из схем Avro, в датасетах Spark. Вместе с этим рассмотрим, как организовать код при помощи шаблона функционального...
Проектирование Data Pipelines в Apache Airflow
#БлогкомпанииOTUS #Хранениеданных #apacheairflow #dataops #datapipelines #mapreduce #обработкабольшихданных IV
https://habr.com/ru/post/679104/
#БлогкомпанииOTUS #Хранениеданных #apacheairflow #dataops #datapipelines #mapreduce #обработкабольшихданных IV
https://habr.com/ru/post/679104/
Хабр
Проектирование Data Pipelines в Apache Airflow
Привет, Хабр! Меня зовут Рустем, являюсь Senior DevOps Engineer в компании IBM. Сегодня я хотел бы познакомить вас с важным инструментом в методологии DataOps, а именно Apache Airflow и...
Проектирование ETL-пайплайна в Apache Airflow
#БлогкомпанииOTUS #Хранениеданных #dataops #ETLпайплайн #mapreduce #обработкаданных IV
https://habr.com/ru/post/679402/
#БлогкомпанииOTUS #Хранениеданных #dataops #ETLпайплайн #mapreduce #обработкаданных IV
https://habr.com/ru/post/679402/
Хабр
Проектирование ETL-пайплайна в Apache Airflow
Привет, Хабр! На связи Рустем, IBM Senior DevOps Engineer и сегодня я хотел бы продолжить наше знакомство с инструментом в DataOps инженирии — Apache Airflow. Сегодня мы спроектируем ETL-пайплайн. Не...
Куда приводят Ops'ы: размышления о развитии ландшафта *Ops-специализаций
#БлогкомпанииITSumma #ITстандарты #BigData #Машинноеобучение #DevOps #ITSumma #DataOps IV
https://habr.com/ru/post/691636/
#БлогкомпанииITSumma #ITстандарты #BigData #Машинноеобучение #DevOps #ITSumma #DataOps IV
https://habr.com/ru/post/691636/
Хабр
Куда приводят Ops'ы: размышления о развитии ландшафта *Ops-специализаций
Разнообразные и разнонаправленные изменения, на которые 2022-й оказался более чем щедр, натолкнули на размышления о том, каков текущий Ops-ландшафт и как он (потенциально) будет изменяться в...
Кластер ElasticSearch на 1Ptb+
#BigData #DevOps #elasticsearch #bigdata #devops #dataops IV
https://habr.com/ru/post/716430/
#BigData #DevOps #elasticsearch #bigdata #devops #dataops IV
https://habr.com/ru/post/716430/
Хабр
Кластер ElasticSearch на 1Ptb+
Черновик статьи был написан еще год назад, когда я работал на крупном международном проекте, но из-за разных событий прошлого года он остался неопубликованным. На проекте в моем ведении находилось...
Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение
#БлогкомпанииCloudMTS #БлогкомпанииМТС #Администрированиебазданных #Хранениеданных #Хранилищаданных #DataOps #data IV
https://habr.com/ru/companies/cloud_mts/articles/781724/
#БлогкомпанииCloudMTS #БлогкомпанииМТС #Администрированиебазданных #Хранениеданных #Хранилищаданных #DataOps #data IV
https://habr.com/ru/companies/cloud_mts/articles/781724/
Хабр
Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение
По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от...
Соединяя лучшее из двух миров: как мы построили мост между Spark и Greenplum в ITSumma
#БлогкомпанииITSumma #BigData #DataEngineering #bigdata #dataops #dataengineering #apachespark
https://habr.com/ru/companies/itsumma/articles/821377/
#БлогкомпанииITSumma #BigData #DataEngineering #bigdata #dataops #dataengineering #apachespark
https://habr.com/ru/companies/itsumma/articles/821377/
Хабр
Соединяя лучшее из двух миров: как мы построили мост между Spark и Greenplum в ITSumma
В этой статье ведущий администратор баз данных ITSumma Алексей Пономаревский расскажет о том, как мы интегрировали популярный фреймворк для распределенной обработки данных Apache Spark с мощной...