快速解决诸多Hadoop相关技术问题的实用技术手册
Key Features
- 文字简洁,易于读者理解
- 精挑细选,关注最重要的任务和问题
- 细心组织,提供高效的问题解决方案
- 讲解透彻,清晰解读每个操作步骤
- 举一反三,将解决方案应用到其他场景中
Book Description
这是一本 Hadoop 实用手册,主要针对实际问题给出相应的解决方案。本书特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS 的概述、Pig 与 Hive 的使用、ETL 和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍 Hadoop 的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。
本书适合各个层次的Hadoop技术人员阅读。通过阅读本书,Hadoop初学者可以使用Hadoop 来进行数据处理,Hadoop 工程师或者数据挖掘工程师可以解决复杂的业务分析, Hadoop系统管理员可以更好地进行日常运维。本书也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。
What you will learn
- Hadoop数据的导入导出
- HDFS概述
- Pig与Hive的使用
- ETL和简单的数据处理
- MapReduce的调试方式
- 高级聚合
- 大数据分析
- Hadoop的各种部署模式
- 为Hadoop添加新节点、退役节点、快速恢复
- MapReduce调优
Who this book is for
本书适合各个层次的Hadoop技术人员阅读,通过阅读本书,Hadoop初学者可以使用Hadoop来进行数据处理,Hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,Hadoop系统管理员可以更好地进行日常运维。本书也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。
Table of Contents
- Hadoop分布式文件系统--导入和导出数据
- HDFS
- 抽取和转换数据
- 使用Hive、Pig和MapReduce处理常见的任务
- 高级连接操作
- 大数据分析
- 高级大数据分析
- 调试
- 系统管理
- 使用Apache Accumulo进行持久化
Loading...
Loading...
Loading...

