用微信扫描二维码

Spark快速大数据分析(第2版)

Spark快速大数据分析(第2版)

作者:[美] 朱尔斯·S.达米吉

2021.11.1 出版

可语音朗读

开通电子书VIP
59.90得到贝

主编推荐语

涵盖Spark 3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。

内容简介

本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。 随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。

出版方

人民邮电出版社