课程简介
从零开始讲解大数据分布式计算的发展及Impala的应用场景,对比Hive、MapReduce、Spark等类似框架讲解内存式计算原理,基于Impala构建高性能交互式SQL分析平台
课程亮点
1,知识体系完备,从小白到大神各阶段读者均能学有所获。
2,生动形象,化繁为简,讲解通俗易懂。
3,结合工作实践及分析应用,培养解决实际问题的能力。
4,每一块知识点, 都有配套案例, 学习不再迷茫。
适用人群
1、对大数据感兴趣的在校生及应届毕业生。
2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、对大数据行业感兴趣的相关人员。
课程内容
第一章:内存式计算发展
1.分布式计算的发展
2.大数据分布式计算分类
3.Impala内存式计算诞生
第二章:Impala原理初探
1.Impala的设计思想
2.Impala与Hive之间的联系
3.Impala的分布式架构详解
4.Impala角色概念详解
第三章:基于Cloudera镜像部署分布式Impala
1.基于CDH5.14构建本地Yum镜像
2.企业级分布式Impala部署
3.企业级配置与Hadoop集成
4.企业级配置与Hive集成
5.主从架构及元数据服务管理
第四章:Impala企业实战开发案例
1.基于企业案例实现Impala集群管理
2.Impala最全SQL语法详解
3.实战开发Impala数据库与表管理
4.基于分析案例实现Impala数据管理
5.Impala与应用系统集成JDBC
第五章:Impala原理深入
1.Impala各角色功能详解
2.Impala任务提交原理
3.Impala元数据同步原理