📖 Расширенная аналитика с PySpark: Практические примеры анализа больших наборов данных с использованием Python и Spark
Автор: Акаш Тандон, Сэнди Райза, Ури Ласерсон, 2023
Описание: Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения.
• Скачать книгу из архива
• Стоимость в магазине
📚 Полка Разработчика | #PySpark #Python #Spark
Автор: Акаш Тандон, Сэнди Райза, Ури Ласерсон, 2023
Описание: Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения.
• Скачать книгу из архива
• Стоимость в магазине
📚 Полка Разработчика | #PySpark #Python #Spark
Applied Data Science Using PySpark
Автор: Ramcharan Kakarla
Описание:
Это всеобъемлющее руководство, содержащее отобранные вручную примеры повседневного использования, проведет вас через весь цикл построения прогностической модели с использованием новейших технологий и отраслевых хитростей. В главах 1, 2 и 3 мы начнем с настройки среды и рассмотрим основы PySpark, уделяя особое внимание манипулированию данными. Глава 4 посвящена искусству выбора переменных и демонстрации различных методов, доступных в PySpark. В главах 5, 6 и 7 мы рассмотрим алгоритмы машинного обучения, их реализацию и методы тонкой настройки. В главах 8 и 9 вы познакомитесь с конвейерами машинного обучения и различными методами внедрения и обслуживания моделей с использованием Docker/API. В главе 10 будет показано, как использовать возможности прогнозных моделей для оказания значимого влияния на ваш бизнес. В главе 11 представлены некоторые из наиболее широко используемых и мощных платформ моделирования, позволяющих извлекать реальную пользу из данных.
• Скачать книгу из архива
• Стоимость в магазине
📚 Полка Разработчика | #ENG #PySpark
Автор: Ramcharan Kakarla
Описание:
Это всеобъемлющее руководство, содержащее отобранные вручную примеры повседневного использования, проведет вас через весь цикл построения прогностической модели с использованием новейших технологий и отраслевых хитростей. В главах 1, 2 и 3 мы начнем с настройки среды и рассмотрим основы PySpark, уделяя особое внимание манипулированию данными. Глава 4 посвящена искусству выбора переменных и демонстрации различных методов, доступных в PySpark. В главах 5, 6 и 7 мы рассмотрим алгоритмы машинного обучения, их реализацию и методы тонкой настройки. В главах 8 и 9 вы познакомитесь с конвейерами машинного обучения и различными методами внедрения и обслуживания моделей с использованием Docker/API. В главе 10 будет показано, как использовать возможности прогнозных моделей для оказания значимого влияния на ваш бизнес. В главе 11 представлены некоторые из наиболее широко используемых и мощных платформ моделирования, позволяющих извлекать реальную пользу из данных.
• Скачать книгу из архива
• Стоимость в магазине
📚 Полка Разработчика | #ENG #PySpark