Hadoop大数据开发实战 作者:杨力

Hadoop大数据开发实战 作者:杨力

Hadoop大数据开发实战 出版社:人民邮电出版社

Hadoop大数据开发实战 内容简介

Hadoop大数据开发实战 目录

本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(Hadoop Distributed File System)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运行机制、Hadoop I/O流操作;第7~10章是初识MapReduce编程模型、MapReduce应用编程开发、MapReduce编程案例、MapReduce运行机制与YARN平台;第11章是汽车销售数据统计分析项目实战。本书将理论与实践相结合,介绍了大数据的核心技术,并通过介绍一个企业的开发项目,深入讲解大数据技术在实际工作中的应用。本书是为所有热爱大数据、打算从事大数据相关工作的读者而编写的,适合有Java编程基础的学习者参考使用,也适合作为高等院校、培训机构的大数据技术教材。前言第1章 大数据概论1.1 大数据的学习基础1.2 大数据的背景1.3 对大数据的不同认识1.4 大数据的行业案例1.5 大数据的基本概念1.6 大数据技术生态圈本章总结本章习题第2章 搭建Hadoop分布式集群2.1 云平台2.2 安装CentOS 62.3 Linux系统配置2.4 Hadoop的配置部署本章总结本章习题第3章 HDFS入门3.1 Hadoop分布式文件系统HDFS3.2 HDFS核心设计3.3 HDFS体系结构本章总结本章习题第4章 HDFS接口4.1 HDFS命令行接口4.2 HDFS Java接口本章总结本章习题第5章 HDFS的运行机制5.1 HDFS中数据流的读写5.2 HA机制5.3 Federation机制本章总结本章习题第6章 Hadoop I/O流操作6.1 数据完整性6.2 压缩6.3 序列化6.4 基于文件的数据结构SequenceFile本章总结本章习题第7章 初识MapReduce编程模型7.1 MapReduce编程框架7.2 WordCount编程实例7.3 Hadoop MapReduce架构本章总结本章习题第8章 MapReduce应用编程开发8.1 MapReduce编程开发8.2 MapReduce在集群上的运作8.3 MapReduce的类型与格式本章总结本章习题第9章 MapReduce编程案例9.1 数据去重9.2 数据排序9.3 平均成绩9.4 多表关联9.5 二次排序本章总结本章习题第10章 MapReduce运行机制与YARN平台10.1 剖析MapReduce作业运行机制10.2 Shuffle和排序10.3 任务的执行10.4 作业的调度10.5 YARN平台简介10.6 YARN平台架构本章总结本章习题第11章 汽车销售数据统计分析项目11.1 数据概况11.2 项目实战本章总结本章习题

类似文章

发表评论

您的电子邮箱地址不会被公开。