针对常见问题的快速指南,囊括60多种Spark开发技巧
Key Features
- 针对常见问题的快速指南
- 囊括60多种Spark开发技巧
Book Description
Spark是一个基于内存计算的开源集群计算系统,它非常小巧玲珑,让数据分析更加快速,已逐渐成为新一代大数据处理平台中的佼佼者。本书内容分为12章,从认识Apache Spark开始讲解,陆续介绍了Spark的使用、外部数据源、Spark SQL、Spark Streaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。
本书适合大数据领域的技术人员,可以帮助他们更好地洞悉大数据,本书也适合想要学习Spark进行大数据处理的人员,它将是一本绝佳的参考教程。
What you will learn
- Spark的使用
- 外部数据源
- Spark SQL
- Spark Streaming
- 机器学习
- 监督学习中的回归和分类
- 无监督学习
- 推荐系统
- 图像处理
- 优化及调优
Who this book is for
大数据领域的技术人员、想要学习Spark进行大数据处理的人员。
Table of Contents
- 开始使用Apache spark
- 使用spark开发应用
- 外部数据源
- Sspark sQL
- spark Streaming
- 机器学习--MLlib
- 监督学习之回归--MLlib
- 监督学习之分类--MLlib
- 无监督学习--MLIib
- 推荐系统
- 图像处理--GraphX
- 优化及调优
Loading...
Loading...
Loading...

