数据湖格式对比:Iceberg/Delta/Hudi与演进策略 对比三种主流数据湖表格式的事务/元数据与更新能力,制定演进策略以支撑批流一体与服务化查询。 数据科学与AI 2026年02月13日 0 点赞 0 评论 6 浏览
Apache Hudi 增量与流批一体实践(2025) Apache Hudi 增量与流批一体实践(2025)Hudi 提供 Copy-On-Write(COW)与 Merge-On-Read(MOR)两种存储方式支持增量与近实时查询。一、写入与更新Upsert:按主键增量更新,保证幂等与一致性。批量写入:控制批大小与并发,避免小文件风暴。二、存储与查询 工程实践 2026年02月14日 0 点赞 0 评论 10 浏览