Have a personal or library account? Click to login
Spark机器学习实战 Cover

Spark机器学习实战

Chinese Edition

Paid access
|Jun 2024
Product purchase options

学习实用的机器学习算法,并用Spark快速动手实践

Key Features

  • 步骤清晰,讲解细致,适合读者边学边做
  • 提供Apache Spark机器学习API的全面解决方案

Book Description

机器学习是一门多领域交叉学科,可以通过模拟来让计算机获取新的知识或技能。Apache Spark是一种通用大数据框架,也是一种近实时弹性分布式计算和数据虚拟化技术,Spark使人们可以大规模使用机器学习技术,而无须在专用数据中心或硬件上进行大量投资。
本书提供了Apache Spark机器学习API的全面解决方案,不仅介绍了用Spark完成机器学习任务所需的基础知识,也涉及一些Spark机器学习的高级技能。全书共有13章,从环境配置讲起,陆续介绍了线性代数库、数据处理机制、构建机器学习系统的常见攻略、回归和分类、用Spark实现推荐引擎、无监督学习、梯度下降算法、决策树和集成模型、数据降维、文本分析和Spark Steaming的使用。
本书是为那些掌握了机器学习技术的Scala开发人员准备的,尤其适合缺乏Spark实践经验的读者。本书假定读者已经掌握机器学习算法的基础知识,并且具有使用Scala实现机器学习算法的一些实践经验。但不要求读者提前了解Spark ML库及其生态系统。

What you will learn

  • Spark环境配置
  • 线性代数库
  • 数据处理机制
  • 构建机器学习系统的常见攻略
  • 回归和分类
  • 用Spark实现推荐引擎
  • 无监督学习
  • 梯度下降算法
  • 决策树和集成模型
  • 数据降维
  • 文本分析
  • Spark Steaming的使用

Who this book is for

本书是为那些已经掌握了机器学习技术的Scala开发人员准备的,面向缺乏Spark实践经验的读者。本书假定读者已经掌握机器学习算法的基础知识,并且具有使用Scala实现机器学习算法的一些实践经验。但是,读者无须了解Spark ML库和相关的生态系统。

Table of Contents

  1. scala和Spark的机器学习实战
  2. spark机器学习中的线性代数库
  3. $park机器学习的三剑客
  4. 构建一个稳健的机器学习系统的常用攻略
  5. 使用Spark 2.0实践机器学习中的回归和分类--第一部分
  6. 用Spark 2.0实践机器学习中的回归和分类--第二部分
  7. 使用Spark实现大规模的推荐引擎
  8. $park 2.0的无监督聚类算法
  9. 最优化--用梯度下降法寻找最小值
  10. 使用决策树和集成模型构建机器学习系统
  11. 大数据中的高维灾难
  12. 使用Spark 2.0 ML库实现文本分析
  13. Spark Streaming和机器学习库
https://github.com/packtpublishing/apache-spark-2x-machine-learning-cookbook
PDF ISBN: 978-1-83620-182-3
Publisher: Packt Publishing Limited
Copyright owner: © 2024 Packt Publishing Limited
Publication date: 2024
Language: English
Pages: 549