课程简介
从零开始讲解大数据业务及数据采集和迁移需求,以案例驱动的方式讲解基于Flume构建高容错高可靠的分布式数据采集平台。
课程亮点
1,知识体系完备,从小白到大神各阶段读者均能学有所获。
2,生动形象,化繁为简,讲解通俗易懂。
3,结合工作实践及分析应用,培养解决实际问题的能力。
4,每一块知识点, 都有配套案例, 学习不再迷茫。
适用人群
1、对大数据感兴趣的在校生及应届毕业生。
2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、对大数据行业感兴趣的相关人员。
课程内容
第一章:企业级需求
1.大数据迁移及采集问题概述
2.分布式解决方案Flume
3.Flume运行原理及架构详解
第二章:Flume一站式快速部署方案
1.Flume企业级版本选型
2.Flume部署环境选型
3.Flume快速部署方案
第三章:Flume企业级全场景业务案例
1.单日志动态监控采集方案
2.分时日志实时监控采集
3.多数据源动态采集方案
4.内存式高性能缓存方案
5.实时采集存储HDFS
6.多目标存储架构
7.Flume多层采集架构
第四章:一招解决Flume数据容错
1.Flume高级组件:SinkProcess
2.Flume故障转移
3.Flume负载均衡
第五章:半小时搞定Flume最难组件
1.拦截器功能及应用场景
2.Timestamp Interceptor
3.Host Interceptor
4.Static Interceptor
5.RegexFilter Interceptor
6.拦截器开发实战
第六章:Flume面试核心要点全讲解
1.Source功能及原理
2.Channel功能及原理
3.Sink功能及原理
4.Source开发实战
5.Sink开发实战
0人已评分
我也要评分