Have a personal or library account? Click to login
Spark Cookbook (中文版) Cover

Spark Cookbook (中文版)

Chinese Edition

Paid access
|Jun 2024
Product purchase options

针对常见问题的快速指南,囊括60多种Spark开发技巧

Key Features

  • 针对常见问题的快速指南
  • 囊括60多种Spark开发技巧

Book Description

Spark是一个基于内存计算的开源集群计算系统,它非常小巧玲珑,让数据分析更加快速,已逐渐成为新一代大数据处理平台中的佼佼者。
本书内容分为12章,从认识Apache Spark开始讲解,陆续介绍了Spark的使用、外部数据源、Spark SQL、Spark Streaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。
本书适合大数据领域的技术人员,可以帮助他们更好地洞悉大数据,本书也适合想要学习Spark进行大数据处理的人员,它将是一本绝佳的参考教程。

What you will learn

  • Spark的使用
  • 外部数据源
  • Spark SQL
  • Spark Streaming
  • 机器学习
  • 监督学习中的回归和分类
  • 无监督学习
  • 推荐系统
  • 图像处理
  • 优化及调优

Who this book is for

大数据领域的技术人员、想要学习Spark进行大数据处理的人员。

Table of Contents

  1. 开始使用Apache spark
  2. 使用spark开发应用
  3. 外部数据源
  4. Sspark sQL
  5. spark Streaming
  6. 机器学习--MLlib
  7. 监督学习之回归--MLlib
  8. 监督学习之分类--MLlib
  9. 无监督学习--MLIib
  10. 推荐系统
  11. 图像处理--GraphX
  12. 优化及调优
PDF ISBN: 978-1-83620-468-8
Publisher: Packt Publishing Limited
Copyright owner: © 2024 Packt Publishing Limited
Publication date: 2024
Language: English
Pages: 209