Pyspark. Анализ больших данных, когда Pandas не достаточно
#Python #BigData #Hadoop #pandas #pyspark #bigdata #hadoop IV
https://habr.com/ru/post/708468/
#Python #BigData #Hadoop #pandas #pyspark #bigdata #hadoop IV
https://habr.com/ru/post/708468/
Хабр
Pyspark. Анализ больших данных, когда Pandas не достаточно
Pandas - одна из наиболее используемых библиотек Python с открытым исходным кодом для работы со структурированными табличными данными для анализа. Однако он не поддерживает распределенную обработку,...
[Перевод] Паттерны проектирования для систем машинного обучения. Часть 1
#БлогкомпанииOTUS #Машинноеобучение #mlops #машинноеобучение #dataframeapi #PySpark #dask IV
https://habr.com/ru/companies/otus/articles/735170/
#БлогкомпанииOTUS #Машинноеобучение #mlops #машинноеобучение #dataframeapi #PySpark #dask IV
https://habr.com/ru/companies/otus/articles/735170/
Хабр
Паттерны проектирования для систем машинного обучения. Часть 1
Эта серия статей представляет собой исчерпывающий обзор системных паттернов проектирования для обучения, обслуживания и эксплуатации систем машинного обучения в производственной среде. Цели Главная...
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/740232/
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/740232/
Хабр
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив
Привет! Меня зовут Александр Ледовский. Я тимлид команды аналитики и DS, строю рекламные аукционы в Авито. В работе мы активно используем Apache Spark. Одна из типовых задач аналитика — посчитать...
[Перевод] Пять подходов к созданию ad-hoc-датафреймов в PySpark
#БлогкомпанииVK #Облачныевычисления #Apache #DataEngineering #vkcloud #Spark #PySpark IV
https://habr.com/ru/companies/vk/articles/760796/
#БлогкомпанииVK #Облачныевычисления #Apache #DataEngineering #vkcloud #Spark #PySpark IV
https://habr.com/ru/companies/vk/articles/760796/
Хабр
Пять подходов к созданию ad-hoc-датафреймов в PySpark
Дата-инженеры, работающие с PySpark, часто сталкиваются с задачей создать логику обработки данных. Обычно речь идет о тестировании набора классов и функций. Современные платформы данных на основе...
Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/764996/
#БлогкомпанииAvitoTech #Python #DataMining #BigData #apachespark #pyspark #spark IV
https://habr.com/ru/companies/avito/articles/764996/
Хабр
Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI
Привет! Меня зовут Александр Ледовский, я тимлид команды аналитики и DS в Авито. Нередко я вижу ситуацию, когда аналитик работает над задачей и упирается в проблему производительности. Причём она...
Как перезапускать PySpark-приложение и зачем это может понадобиться
#БлогкомпанииСбер #Высокаяпроизводительность #Python #Apache #pyspark #перезапускприложения
https://habr.com/ru/companies/sberbank/articles/805285/
#БлогкомпанииСбер #Высокаяпроизводительность #Python #Apache #pyspark #перезапускприложения
https://habr.com/ru/companies/sberbank/articles/805285/
Хабр
Как перезапускать PySpark-приложение и зачем это может понадобиться
Сегодня все крупные компании сохраняют и обрабатывают большие объёмы информации, причём стремятся делать это максимально эффективным для бизнеса способом. Меня зовут Мазаев Роман и я работаю в проекте...
Spark. План запросов на примерах
#SQL #Apache #BigData #Хранениеданных #DataEngineering #apachespark #pyspark
https://habr.com/ru/articles/807421/
#SQL #Apache #BigData #Хранениеданных #DataEngineering #apachespark #pyspark
https://habr.com/ru/articles/807421/
Хабр
Spark. План запросов на примерах
Всем привет! В этой статье возьмем за основу пару таблиц и пройдемся по планам запросов по нарастающей: от обычного селекта до джойнов, оконок и репартиционирования. Посмотрим, чем отличаются виды...
Бутстрап в PySpark
#Python #статистикавit #bigdata #dataengineering #pyspark #bootstrap #абтесты
https://habr.com/ru/companies/X5Tech/articles/849322/
#Python #статистикавit #bigdata #dataengineering #pyspark #bootstrap #абтесты
https://habr.com/ru/companies/X5Tech/articles/849322/
Хабр
Бутстрап в PySpark
Всем привет! Меня зовут Илья Черников, я аналитик больших данных в X5 Tech, сейчас занимаюсь аналитикой и оценкой активностей CVM маркетинга экспресс-доставки “Пятёрочки”. В статье я расскажу о том,...