课程简介
从零开始讲解大数据调度系统构成,集成大数据计算任务构建大数据工作流,基于Azkaban构建实现企业级自动化任务开发
课程亮点
1,知识体系完备,从小白到大神各阶段读者均能学有所获。
2,生动形象,化繁为简,讲解通俗易懂。
3,结合工作实践及分析应用,培养解决实际问题的能力。
4,每一块知识点, 都有配套案例, 学习不再迷茫。
适用人群
1、对大数据感兴趣的在校生及应届毕业生。
2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、对大数据行业感兴趣的相关人员。
课程内容
第一章:工作流任务调度
1.大数据调度系统概论
2.企业级工作流
3.工作流依赖调度
4.工作流定时调度
5.常用工作流调度工具
第二章:Azkaban工作流调度系统
1.Azkaban的起源及其发展
2.Azkaban分布式架构原理
3.Azkaban中的工作流概念详解
第三章:Azkaban企业级多模式部署
1.Azkaban版本及三种部署模式
2.Azkaban编译
3.solo本地模式
4.Two-Server单节点模式
5.Multiple-Executor分布式模式
第四章:Azkaban开发实战
1.Azkaban工作流开发规则
2.Azkaban调度Shell脚本实战
3.Azkaban调度HDFS实战
4.Azkaban调度MapReduce实战
5.Azkaban调度Hive实战
6.Azkaban子流的实战
7.Azkaban复杂调度实战
8.Azkaban定时调度实战
0人已评分
我也要评分