Расширенная аналитика с PySpark | Advanced Analytics with PySpark
By Ури Ласерсон, Шон Оуэн, Сэнди Райза, Акаш Тандон, Джош Уиллс
Расширенная аналитика с PySpark
Ури Ласерсон, Шон Оуэн, Сэнди Райза, Акаш Тандон, Джош Уиллс, 2023
Обзор
Эта книга предлагает практические методы для анализа больших объемов данных с использованием Python и фреймворка Spark. Она знакомит с моделью программирования Spark и основами PySpark. Каждая глава посвящена отдельному аспекту анализа данных, демонстрируя очистку и предварительную обработку данных с помощью PySpark и Python.
Подробно рассматривается машинное обучение с использованием Spark, а также весь конвейер PySpark для комплексной аналитики — от исследования данных до оценки моделей. Особое внимание уделяется производственным приложениям, обработке изображений и библиотеке Spark NLP.
Кому подойдёт
- Специалисты по обработке данных
- Специалисты по машинному обучению
- Разработчики, работающие с большими данными
Ключевые особенности
- Язык: русский
- Год издания: 2023
- Издательство: БХВ–Петербург
- Объем: 224 страницы
- ISBN: 9785977517706
Advanced Analytics with PySpark
Uri Laserson, Sean Owen, Sandy Ryza, Akash Tandon, Josh Wills, 2023
Overview
This book focuses on practical methods for analyzing large datasets using Python and the Spark framework, introducing the Spark programming model and the PySpark open-source system. Each chapter explores a distinct aspect of data analysis, demonstrating data cleaning and preprocessing with PySpark and Python.
It delves into machine learning with Spark and the complete PySpark pipeline for comprehensive big data analytics, from data exploration to model evaluation. Emphasis is placed on production applications, image processing, and the Spark NLP library.
Who it's for
- Data scientists
- Machine learning engineers
- Developers working with big data
Key features
- Language: Russian
- Publication Year: 2023
- Publisher: BHV-Petersburg
- Pages: 224
- ISBN: 9785977517706