📕Distributed Machine Learning with PySpark
Перейдите с Pandas и Scikit-learn на PySpark, чтобы обрабатывать огромные объемы данных и сократить время. В этой книге вы узнаете, как осуществить этот переход, адаптировав свои навыки и используя сходство в синтаксисе, функциональности и совместимости между этими инструментами.
Распределенное машинное обучение с помощью PySpark предлагает дорожную карту специалистам по обработке данных, рассматривающим переход от небольших библиотек данных (pandas/scikit-learn) к обработке больших данных и машинному обучению с помощью PySpark. Вы научитесь переводить код на Python из Pandas/Scikit-научитесь использовать PySpark для предварительной обработки больших объемов данных и создания, обучения, тестирования и оценки популярных алгоритмов машинного обучения, таких как линейная и логистическая регрессия, деревья решений, случайные леса, машины опорных векторов, наивный Байес и нейронные сети.
Прочитав эту книгу, вы поймете основополагающие концепции подготовки данных и машинного обучения и приобретете навыки, необходимые для применения этих методов с использованием PySpark, отраслевого стандарта для построения масштабируемых конвейеров данных ML.
🧷Скачать бесплатно.
2023 #ENG #PySpark
CodeMode | Программирование | ChatGPT
Перейдите с Pandas и Scikit-learn на PySpark, чтобы обрабатывать огромные объемы данных и сократить время. В этой книге вы узнаете, как осуществить этот переход, адаптировав свои навыки и используя сходство в синтаксисе, функциональности и совместимости между этими инструментами.
Распределенное машинное обучение с помощью PySpark предлагает дорожную карту специалистам по обработке данных, рассматривающим переход от небольших библиотек данных (pandas/scikit-learn) к обработке больших данных и машинному обучению с помощью PySpark. Вы научитесь переводить код на Python из Pandas/Scikit-научитесь использовать PySpark для предварительной обработки больших объемов данных и создания, обучения, тестирования и оценки популярных алгоритмов машинного обучения, таких как линейная и логистическая регрессия, деревья решений, случайные леса, машины опорных векторов, наивный Байес и нейронные сети.
Прочитав эту книгу, вы поймете основополагающие концепции подготовки данных и машинного обучения и приобретете навыки, необходимые для применения этих методов с использованием PySpark, отраслевого стандарта для построения масштабируемых конвейеров данных ML.
🧷Скачать бесплатно.
2023 #ENG #PySpark
CodeMode | Программирование | ChatGPT
📕Data Analysis with Python and PySpark
Анализ данных с помощью Python и PySpark поможет вам решать повседневные задачи в области обработки данных с помощью PySpark. Вы узнаете, как масштабировать свои возможности обработки на нескольких компьютерах, получая данные из любого источника — будь то кластеры Hadoop, облачные хранилища данных или локальные файлы данных. Ознакомившись с основами, вы сможете оценить всю универсальность PySpark, создав конвейеры машинного обучения и объединив код на Python, pandas и PySpark.
🧷Скачать бесплатно.
2022 #ENG #PySpark
CodeMode | Программирование | ChatGPT
Анализ данных с помощью Python и PySpark поможет вам решать повседневные задачи в области обработки данных с помощью PySpark. Вы узнаете, как масштабировать свои возможности обработки на нескольких компьютерах, получая данные из любого источника — будь то кластеры Hadoop, облачные хранилища данных или локальные файлы данных. Ознакомившись с основами, вы сможете оценить всю универсальность PySpark, создав конвейеры машинного обучения и объединив код на Python, pandas и PySpark.
🧷Скачать бесплатно.
2022 #ENG #PySpark
CodeMode | Программирование | ChatGPT