Have a personal or library account? Click to login
Hadoop实际解决方案手册 Cover

Hadoop实际解决方案手册

Chinese Edition

Paid access
|May 2024
Product purchase options

快速解决诸多Hadoop相关技术问题的实用技术手册

Key Features

  • 文字简洁,易于读者理解
  • 精挑细选,关注最重要的任务和问题
  • 细心组织,提供高效的问题解决方案
  • 讲解透彻,清晰解读每个操作步骤
  • 举一反三,将解决方案应用到其他场景中

Book Description

这是一本 Hadoop 实用手册,主要针对实际问题给出相应的解决方案。本书特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。
全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS 的概述、Pig 与 Hive 的使用、ETL 和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍 Hadoop 的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。
本书适合各个层次的Hadoop技术人员阅读。通过阅读本书,Hadoop初学者可以使用Hadoop 来进行数据处理,Hadoop 工程师或者数据挖掘工程师可以解决复杂的业务分析, Hadoop系统管理员可以更好地进行日常运维。本书也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。

What you will learn

  • Hadoop数据的导入导出
  • HDFS概述
  • Pig与Hive的使用
  • ETL和简单的数据处理
  • MapReduce的调试方式
  • 高级聚合
  • 大数据分析
  • Hadoop的各种部署模式
  • 为Hadoop添加新节点、退役节点、快速恢复
  • MapReduce调优

Who this book is for

本书适合各个层次的Hadoop技术人员阅读,通过阅读本书,Hadoop初学者可以使用Hadoop来进行数据处理,Hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,Hadoop系统管理员可以更好地进行日常运维。本书也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。

Table of Contents

  1. Hadoop分布式文件系统--导入和导出数据
  2. HDFS
  3. 抽取和转换数据
  4. 使用Hive、Pig和MapReduce处理常见的任务
  5. 高级连接操作
  6. 大数据分析
  7. 高级大数据分析
  8. 调试
  9. 系统管理
  10. 使用Apache Accumulo进行持久化
PDF ISBN: 978-1-83620-560-9
Publisher: Packt Publishing Limited
Copyright owner: © 2024 Packt Publishing Limited
Publication date: 2024
Language: English
Pages: 242