- 课程须知
Apache Hudi 是非常流行的数据湖框架,基于Flink/Spark + Hudi的新的流批一体架构,通过Spark/Flink将上游数据同步到数据湖的Raw Tables中,并可对Raw Ta
- 课程涉及知识要点
1. 数据仓库/数据湖/仓湖一体化2. 深度剖析Hudi中COW表和ROM表3. Hudi集成SparkSQL即席查询分析4. Hudi支持Flink SQL Connector构建流式实
8189人已学习
下载完整视频直播时间:2021.12.09
Apache Hudi 是非常流行的数据湖框架,基于Flink/Spark + Hudi的新的流批一体架构,通过Spark/Flink将上游数据同步到数据湖的Raw Tables中,并可对Raw Ta
1. 数据仓库/数据湖/仓湖一体化2. 深度剖析Hudi中COW表和ROM表3. Hudi集成SparkSQL即席查询分析4. Hudi支持Flink SQL Connector构建流式实
8189人已学习
下载完整视频我们会在开课前10分钟,以手机短信的形式为您发送直播间地址~
扫码关注【黑马程序员】公众号
获取更多IT免费学习资源
提取码:b3yy
【课程简介】
Apache Hudi 是非常流行的数据湖框架,基于Flink/Spark + Hudi的新的流批一体架构,通过Spark/Flink将上游数据同步到数据湖的Raw Tables中,并可对Raw Tables进行增删改查。Hudi中提供2种类型表,用户能有更多的读取方式选择,增量查询也让算法可以实现分钟级别的模型更新。本次课会基于新版本Hudi 0.9.0,剖析新特性功能。
【主讲内容】
1. 数据仓库/数据湖/仓湖一体化
2. 深度剖析Hudi中COW表和ROM表
3. Hudi集成SparkSQL即席查询分析
4. Hudi支持Flink SQL Connector构建流式实时存储
5. 传智教育基于Hudi构建数据湖平台案例
【主讲教师】
黑马讲师:陈老师
10年IT从业经验,大数据技术实战派,先后在驴妈妈、一号店等担任过大数据工程师、项目经理、大数据架构师,曾主导企业级大数据平台建设和多项大数据项目研发,先后利用相关技术为政府交通、太平洋保险、南京银行等领域的企业构建企业内部大数据平台,参与基于Flink的实时反欺诈风控、实时地铁故障预警等流式计算平台的设计和研发。
点击链接加入群聊【黑马大数据交流群】:https://jq.qq.com/?_wv=1027&k=8KtzMwEB
QQ群:628763225 播妞QQ:3402104872
0人已评分
我也要评分