学习实用的机器学习算法,并用Spark快速动手实践
Key Features
- 步骤清晰,讲解细致,适合读者边学边做
- 提供Apache Spark机器学习API的全面解决方案
Book Description
机器学习是一门多领域交叉学科,可以通过模拟来让计算机获取新的知识或技能。Apache Spark是一种通用大数据框架,也是一种近实时弹性分布式计算和数据虚拟化技术,Spark使人们可以大规模使用机器学习技术,而无须在专用数据中心或硬件上进行大量投资。本书提供了Apache Spark机器学习API的全面解决方案,不仅介绍了用Spark完成机器学习任务所需的基础知识,也涉及一些Spark机器学习的高级技能。全书共有13章,从环境配置讲起,陆续介绍了线性代数库、数据处理机制、构建机器学习系统的常见攻略、回归和分类、用Spark实现推荐引擎、无监督学习、梯度下降算法、决策树和集成模型、数据降维、文本分析和Spark Steaming的使用。
本书是为那些掌握了机器学习技术的Scala开发人员准备的,尤其适合缺乏Spark实践经验的读者。本书假定读者已经掌握机器学习算法的基础知识,并且具有使用Scala实现机器学习算法的一些实践经验。但不要求读者提前了解Spark ML库及其生态系统。
What you will learn
- Spark环境配置
- 线性代数库
- 数据处理机制
- 构建机器学习系统的常见攻略
- 回归和分类
- 用Spark实现推荐引擎
- 无监督学习
- 梯度下降算法
- 决策树和集成模型
- 数据降维
- 文本分析
- Spark Steaming的使用
Who this book is for
本书是为那些已经掌握了机器学习技术的Scala开发人员准备的,面向缺乏Spark实践经验的读者。本书假定读者已经掌握机器学习算法的基础知识,并且具有使用Scala实现机器学习算法的一些实践经验。但是,读者无须了解Spark ML库和相关的生态系统。
Table of Contents
- scala和Spark的机器学习实战
- spark机器学习中的线性代数库
- $park机器学习的三剑客
- 构建一个稳健的机器学习系统的常用攻略
- 使用Spark 2.0实践机器学习中的回归和分类--第一部分
- 用Spark 2.0实践机器学习中的回归和分类--第二部分
- 使用Spark实现大规模的推荐引擎
- $park 2.0的无监督聚类算法
- 最优化--用梯度下降法寻找最小值
- 使用决策树和集成模型构建机器学习系统
- 大数据中的高维灾难
- 使用Spark 2.0 ML库实现文本分析
- Spark Streaming和机器学习库
Loading...
Loading...
Loading...
Loading...

