Спиливаем spill-ы
#Блогкомпаниибилайн #Высокаяпроизводительность #Scala #BigData #DevOps #spark #bigdata IV
https://habr.com/ru/companies/beeline_tech/articles/743292/
#Блогкомпаниибилайн #Высокаяпроизводительность #Scala #BigData #DevOps #spark #bigdata IV
https://habr.com/ru/companies/beeline_tech/articles/743292/
Хабр
Спиливаем spill-ы
Привет! Меня зовут Александр Маркачев, я 3,5 года работаю на позиции Data Engineer в билайне и люблю открывать для себя что-то новое и интересное в работе. Так случилось и с темой, которой я...
ClickHouse в ритейловом проекте
#БлогкомпанииX5Tech #ITинфраструктура #BigData #ITкомпании #DataEngineering #clickhouse #spark IV
https://habr.com/ru/companies/X5Tech/articles/743696/
#БлогкомпанииX5Tech #ITинфраструктура #BigData #ITкомпании #DataEngineering #clickhouse #spark IV
https://habr.com/ru/companies/X5Tech/articles/743696/
Хабр
ClickHouse в ритейловом проекте
Всем привет! Всегда интересно узнавать, как устроено IT в различных сферах и компаниях: какие задачи ставятся и как находятся решения. Да и в целом, делиться опытом полезно! Меня зовут Илья Панов , я...
[Перевод] Гарантии доставки и этика телепортации
#БлогкомпанииOTUS #Распределённыесистемы #spark #телепортация #распределенныесистемы #однократнаядоставка IV
https://habr.com/ru/companies/otus/articles/745774/
#БлогкомпанииOTUS #Распределённыесистемы #spark #телепортация #распределенныесистемы #однократнаядоставка IV
https://habr.com/ru/companies/otus/articles/745774/
Хабр
Гарантии доставки и этика телепортации
Гарантии доставки и этика телепортации Распределенным системам приходится решать вопрос о том, какие именно гарантии доставки поддерживать. У нас есть различные варианты, начиная от отсутствия...
[Перевод] Стайлгайд PySpark: как сделать код элегантным
#БлогкомпанииVK #Apache #DevOps #Kubernetes #Облачныевычисления #vkcloud #Spark IV
https://habr.com/ru/companies/vk/articles/759310/
#БлогкомпанииVK #Apache #DevOps #Kubernetes #Облачныевычисления #vkcloud #Spark IV
https://habr.com/ru/companies/vk/articles/759310/
Хабр
Стайлгайд PySpark: как сделать код элегантным
Команда VK Cloud перевела статью о правилах оформления кода в PySpark. Они не обязательны для исполнения, но помогут сделать ваш код более читабельным и удобным для последующих проверок и изменений....
[Перевод] Стайлгайд PySpark: как сделать код элегантным
#БлогкомпанииVK #Python #Облачныевычисления #Apache #DevOps #vkcloud #Spark IV
https://habr.com/ru/companies/vk/articles/760416/
#БлогкомпанииVK #Python #Облачныевычисления #Apache #DevOps #vkcloud #Spark IV
https://habr.com/ru/companies/vk/articles/760416/
Хабр
Стайлгайд PySpark: как сделать код элегантным
Команда VK Cloud перевела статью о правилах оформления кода в PySpark. Они не обязательны для исполнения, но помогут сделать ваш код более читабельным и удобным для последующих проверок и изменений....
[Перевод] Пять подходов к созданию ad-hoc-датафреймов в PySpark
#БлогкомпанииVK #Облачныевычисления #Apache #DataEngineering #vkcloud #Spark #PySpark IV
https://habr.com/ru/companies/vk/articles/760796/
#БлогкомпанииVK #Облачныевычисления #Apache #DataEngineering #vkcloud #Spark #PySpark IV
https://habr.com/ru/companies/vk/articles/760796/
Хабр
Пять подходов к созданию ad-hoc-датафреймов в PySpark
Дата-инженеры, работающие с PySpark, часто сталкиваются с задачей создать логику обработки данных. Обычно речь идет о тестировании набора классов и функций. Современные платформы данных на основе...
Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/764996/
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/764996/
Хабр
Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI
Привет! Меня зовут Александр Ледовский, я тимлид команды аналитики и DS в Авито. Нередко я вижу ситуацию, когда аналитик работает над задачей и упирается в проблему производительности. Причём она...
Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди
#БлогкомпанииАльфаБанк #Apache #BigData #DevOps #DataEngineering #spark #configs IV
https://habr.com/ru/companies/alfa/articles/772224/
#БлогкомпанииАльфаБанк #Apache #BigData #DevOps #DataEngineering #spark #configs IV
https://habr.com/ru/companies/alfa/articles/772224/
Хабр
Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди
Бывало у вас так, что некоторые аналитики запрашивают побольше вычислительных ядер и оперативной памяти для своих Jupyter-ноутбуков, а у вас в это время ничего не работает? У меня бывало, ведь...
[Перевод] Дежурный data-инженер: рабочие хроники
#БлогкомпанииVK #BigData #Хранилищаданных #vkcloud #датаинжиниринг #spark IV
https://habr.com/ru/companies/vk/articles/772468/
#БлогкомпанииVK #BigData #Хранилищаданных #vkcloud #датаинжиниринг #spark IV
https://habr.com/ru/companies/vk/articles/772468/
Хабр
Дежурный data-инженер: рабочие хроники
Команда VK Cloud перевела серию статей о том, как data-инженер принимает вызовы технической команды по работе с платформой данных. Он рассказывает о реальных неисправностях, которые возникают в...
Spark не для чайников: где?
#BigData #УчебныйпроцессвIT #КарьеравITиндустрии #DataEngineering #spark #seniorengineer #education IV
https://habr.com/ru/articles/784848/
#BigData #УчебныйпроцессвIT #КарьеравITиндустрии #DataEngineering #spark #seniorengineer #education IV
https://habr.com/ru/articles/784848/
Хабр
Spark не для чайников: где?
Обложка известной серии книг. Disclaimer : В статье речь идет о личном мнении, которое может не совпадать с позицией компании, где трудоустроен автор :) Apache Spark уже давно перестал быть просто...