讲解方式:
本课程采用由浅入深,层递进的讲解方式,内容丰富, 让你轻松的一站式入门大数据。
课程亮点:
1,课程由浅到深,由原理到实践,适合零基础入门学习。
2,结合实际案例,培养解决实际问题的能力。
课程内容:
1. 大数据概论和职业规划
2. Linux服务器系统
3. HDFS分布式文件系统
4. Hive数据仓库
5. Zeppelin框架
6. Sqoop框架
7. Superset框架
8. Hive数仓实战项目之滴滴出行
适用人群:
1、零基础小白,有计算机基础即可。
2、目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、大数据行业有持续兴趣的人员。
基础课程主讲内容包括:
阶段一:
1.大数据概论
2.大数据应用场景
3.大数据特点
4.大数据分析业务步骤
5.大数据职业规划
6.大数据学习路线
阶段二: Linux服务器系统
1-计算机入门知识
2-Linux的基本介绍
3-虚拟机介绍
4-VMWare和CentOS安装
5-Linux的初体验
6-Linux系统的网络配置
7-Linux远程连接工具使用
8-Linux的目录结构
9-Linux的常用命令
10-vi编辑器
阶段三. HDFS分布式文件系统
1. 分布式和集群的概念
2. Hadoop概论
3. Hadoop集群操作
4. HDFS的概述
5. HDFS的特点
6. HDFS的架构
7. HDFS的副本机制
8. HDFS的Shell命令
9. HDFS的基准测试
阶段四. Hive实战和Zeppelin框架
1. 数据仓库的基本概念
2. 数据库和数据仓库的区别
3. 数据仓库分层
4. Hive的介绍
5. Hive的基本架构
6. Hive的计算引擎
7. Hive的安装和启动
8. Hive的数据库和表
9. Hive的数据库操作
10.Hive的内部表操作
11.Hive的外部表操作
12.Hive的分区表操作
13.Zeppelin框架使用
14.Hive的基本查询操作
15.Hive的多表查询操作
16.Hive的子查询操作
17.Hive的内置函数
阶段五:数仓实战之滴滴出行
1. 项目业务背景
2. 项目日志数据集介绍
3. 项目数据仓库构建
4. 项目数据分区表构建
5. 项目数据预处理
6. 项目订单指标分析
7. Sqoop数据导出
8. Superset数据可视化