了解R的核心功能及第三方软件包,掌握大数据处理的重要秘诀
Key Features
- 本书挑战了关于R语言不支持大数据流程和分析的偏见
- 从数据导入和管理到高级分析和预测建模的大数据产品周期的所有阶段中亲身体验各种工具与R的整合
Book Description
R是一个强大的、开源的、函数式编程语言,可以用于广泛的编程任务。一般来讲,R语言的应用主要在数据统计与分析、机器学习、高性能计算等方面。R语言已经在多个领域赢得了认可,同时也基于其开源、免费的特点不断地发展壮大。本书通过9章内容,循序渐进地揭示了大数据的概念,介绍了如何使用R进行数据处理,如何创建Hadoop虚拟机,如何建立和部署SQL数据库,同时还介绍了MongoDB、HBase、Spark、Hive相关的内容,并在本书的最后介绍了R的潜在应用场景。
本书适合中级数据分析师、数据工程师、统计学家、研究人员和数据科学家阅读,需要读者具备数据分析、数据管理和大数据算法的基本知识。
What you will learn
- 如何使用R进行数据处理
- 如何创建Hadoop虚拟机
- 如何建立和部署SQL数据库
- MongoDB、HBase、Spark、Hive的相关内容
- R的潜在应用场景
Who this book is for
本书适合中级数据分析师、数据工程师、统计学家、研究人员和数据科学家,希望并计划将当前或未来的大数据分析流程与R编程语言相结合。
本书假定读者已有一些数据分析、数据管理和大数据算法的经验,有可能只是欠缺一些与R相关的开源大数据工具的使用技能。
Table of Contents
- 大数据时代
- R编程语言与统计环境的介绍
- 由内而外释放R的力量
- R相关的Hadoop和MapReduce框架
- R与关系型数据库管理系统(RDBMS)
- R与非关系型数据库
- 比Hadoop更快--使用R编写Spark
- R语言大数据机器学习
- R语言的未来--大数据、快数据、智能数据
Loading...
Loading...
Loading...
Loading...

