JavaEE鸿蒙应用开发HTML&JS+前端Python+大数据开发人工智能开发AI+设计软件测试新媒体+短视频直播运营产品经理集成电路应用开发(含嵌入式)Linux云计算+运维开发C/C++拍摄剪辑+短视频制作PMP项目管理认证电商运营Go语言与区块链大数据PHP工程师Android+物联网iOS.NET

大数据Hadoop生态之分布式存储HDFS入门到精通中级教程

更新日期:2021.05.04

大数据Hadoop生态之分布式存储HDFS入门到精通

全套视频教程及资料

视频教程技术解析配套源码学习工具学习笔记

一键免费下载

扫码关注,回复关键词,马上领取全套视频资源!

1. 微信扫描二维码,
    关注“黑马程序员”公众号(itheima666)

2. 回复关键词“领取资源01”,

即可在小程序的【Python+大数据开发】学科中领取全部资源

课程须知

Hadoop是一种分析和处理大数据的平台。HDFS是Hadoop分布式文件系统的简称。HDFS是Hadoop核心组件之一,作为最底层的分布式存储服务而存在。随着数据量越来越大,一个操作系统存不下所有的...

  1. 课程介绍
  2. 课程目录
  3. 课程评论


       1.课程简介

      Hadoop是一种分析和处理大数据的平台。HDFS是Hadoop分布式文件系统的简称。HDFS是Hadoop核心组件之一,作为最底层的分布式存储服务而存在。随着数据量越来越大,一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是管理和维护极不方便,于是迫切需要一种系统来管理多台机器上的文件,这就是分布式文件系统。HDFS具有高容错性,数据自动保存多个副本,通过增加副本的方式,提高容错性,若某一个副本丢失后,它可以自动分配到其它节点作为新的副本。能够处理的数据规模可以达到GB,TB,甚至PB级别的数据。能够处理百万规模以上的文件数量,数量相当之大,可构建在廉价的机器上,通过多副本机制,提高可靠性。HDFS分布式文件系统在大数据时代有着广泛的应用前景,它们为存储和处理超大规模数据提供所需的扩展能力。


      2.适应人群

有一定的Java基础,并且要有一定的web开发基础。


3.课程亮点

在本套课程中,我们将系统全面的学习HDFS分布式文件系统,从环境的部署到HDFS的使用再到HDFS的原理,以及HDFS的HA和HDFS Federation+HA的配置,让我们可以掌握大数据中最常用的文件存储技术。

l 分布式文件系统介绍

l HDFS入门

l HDFS集群环境搭建

l 客户端操作HDFS

l HDFS原理

l HDFS HA高可用

l HDFS Federation联邦

l 综合练习-实现海量数据分布式存储和展示


4.课程内容

第一章 分布式文件系统介绍

1.   分布式文件系统应用场景

2.   了解什么是分布式文件系统

3.   了解常见的分布式文件系统

第二章 HDFS入门

1.   HDFS概念和作用

2.   HDFS重要特性

第三章 HDFS集群环境搭建

1.   搭建集群-三台CentOS服务器

2.   CentOS安装和配置Hadoop

第四章 shell操作HDFS

第五章 客户端操作HDFS

1.   搭建开发环境

2.   Java API操作HDFS

3.   I/O流操作HDFS

第六章 Spring Boot+Echarts+HDFS实现海量数据分布式存储和展示

1.   ECharts-快速入门

2.   ECharts-折线图

3.   ECharts-柱状图

4.   ECharts-饼图

5.   ECharts-雷达图

6.   ECharts-异步加载

7.   实现海量数据分布式存储和展示

第七章 HDFS原理

1.   了解NameNode和DataNode

2.   HDFS写数据流程

3.   HDFS读数据流程

4.   HDFS元数据管理机制

第八章 HDFS HA高可用

1.   了解HDFS HA的工作机制

2.   配置HDFS HA

第九章 HDFS Federation

1.   了解HDFS Federation的原理

2.   配置HDFS Federation+HA


更多章节请下载完整视频观看 >>
综合评分5.0

0人已评分

我也要评分

评论打分
你觉得老师讲的怎么样?

评论字数不能超过100字,还剩个字符

发表评价