找回密码
 会员注册
查看: 18|回复: 0

Hudi在vivo湖仓一体的落地实践

[复制链接]

4

主题

0

回帖

13

积分

新手上路

积分
13
发表于 2024-10-4 18:39:22 | 显示全部楼层 |阅读模式
互联网大数据团队 - Xu Yu在增效降本的大背景下,vivo大数据基础团队引入Hudi组件为公司业务部门湖仓加速的场景进行赋能。主要应用在流批同源、实时链路优化及宽表拼接等业务场景。一、Hudi 基础能力及相关概念介绍1.1 流批同源能力与Hive不同,Hudi数据在Spark/Flink写入后,下游可以继续使用Spark/Flink引擎以流读的形式实时读取数据。同一份Hudi数据源既可以批读也支持流读。Flink、Hive、Spark的流转批架构:
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-12 05:56 , Processed in 0.570715 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表