Scala机器学习

作者：[美]亚历克斯·科兹洛夫

2017.7.1 出版

可语音朗读

开通电子书VIP

36.42得到贝

主编推荐语

这是一本关于机器学习的书，它以Scala为重点，介绍了函数式编程方法以及如何在Spark上处理大数据。

内容简介

这是一本关于机器学习的书，它以Scala为重点，介绍了函数式编程方法以及如何在Spark上处理大数据。本书后面将介绍关于Hadoop的内容。最初它能在廉价硬件上处理大量的信息，因为当时传统的关系数据库不能处理这样的信息（或能处理，但是代价过高）。大数据这个话题太大了，而Spark才是本书的重点，它是Hadoop MapReduce的另一个实现，Spark提高了磁盘上持久化保存数据的效率。通常认为使用Spark有点贵，因为它消耗更多的内存，要求硬件必须更可靠，但它也更具交互性。此外，Spark使用Scala工作（也可以使用Java和Python等），但Scala是主要的API语言。因此Spark用Scala在数据管道的表达方面有一定的协同性。

出版方

机械工业出版社有限公司