Cloudera Hadoop大数据平台实战指南

Cloudera Hadoop大数据平台实战指南

作者
宋立桓,陈建平
语言
中文
出版社
清华大学出版社
ISBN
9787302517535
页数
240
格式
pdf

内容简介

对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。
本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,最后给出两个综合实操案例,以巩固前面所学的知识点。
本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据相关课程的培训用书。

作者简介

宋立桓,连续十届微软有价值专家MVP、系统集成高级项目经理、大数据与云计算培训讲师、微软技术大会动手实验讲师,有20年的工作经验,曾服务于微软担任合作伙伴技术顾问。目前在腾讯,担任腾讯云解决方案架构师。

陈建平,曾担任IBM(上海)高级数据分析经理,资深技术讲师,10年相关项目经历,长期从事大数据相关研究分析工作。

前言/序言

前 言
大数据这个词也许几年前你听着还有点陌生,但我相信你现在听到Hadoop这个词时会觉得“熟悉”!你会发现身边从事Hadoop开发或者正在学习Hadoop的人越来越多。
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。互联网技术发展到现今阶段,大量日常、工作等事务产生的数据比以前有了爆炸式的增长,以前的传统数据处理技术已经无法胜任,需求催生技术——一套用来处理海量数据的软件技术框架Hadoop应运而生!
我本人一直从事云计算、大数据方面的咨询和培训工作。大数据产业高速发展促使Hadoop人才的需求井喷式增长,但Hadoop大数据工程师培养数量远远无法满足市场的需求。为了不被淹没在大数据技术的浪潮中,我们只有坚持学习,通过增加知识来实现对自我价值的挖掘和体现。
关于本书
Hadoop的发行版除了社区的Apache Hadoop外,Cloudera、Hortonworks、华为等公司都提供了自己的商业版本。因为企业通常使用的是Hadoop商业版本,所以本书实操的运行环境采用Cloudera的CDH。本书定位是大数据从入门到应用的简明系统教程,特色是理论联系实践、实战实用为主、内容全面系统、讲解深入浅出,是大数据技术爱好者入门的最佳图书。
相关文件下载地址

该资源需登录后下载

去登录
温馨提示:本站所有内容及下载按钮仅作站点演示用,并不提供真实下载链接。

评分及评论

无用户评分

来评个分数吧

  • 5 分
    0
  • 4 分
    0
  • 3 分
    0
  • 2 分
    0
  • 1 分
    0

Comments