一本介绍实时大数据计算领域的相关技巧和经验(包括Flink、Spark和Storm等流处理框架技术)的指南。
Key Features
- 全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用组件协同应用来解决实际问题。
Book Description
本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。
在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。
What you will learn
- 搭建基础设施
- Storm实时计算
- 使用Spark实现实时计算
- 使用Flink实现实时分析
Who this book is for
本书适合想对实时数据处理和分析的各个方面有深入了解,并想将其以最佳方式部署在生产环境中的人阅读。
Table of Contents
- 实时分析简介
- 实时应用的基本组件
- 了解和跟踪数据流
- 安装和配置Storm
- 配置Apache Spark和Flink
- 集成Storm与数据源
- 从Storm到Sink
- Storm Trident
- 运用Spark引擎
- 运用Spark操作
- spark Streaming
- 运用Apache Flink
- 用例研究
Loading...
Loading...
Loading...

