# Apache Hudi 增量与流批一体实践(2025) Hudi 提供 Copy-On-Write(COW)与 Merge-On-Read(MOR)两种存储方式支持增量与近实时查询。 ## 一、写入与更新 - Upsert:按主键增量更新,保证幂等与一致性。 - 批量写入:控制批大小与并发,避免小文件风暴。 ## 二、存储与查询 - COW:写入即合并,读取性能稳定;适合离线分析。 - MOR:写增量日志,查询时合并,适合近实时。 ## 三、维护与治理 - Compaction:合并增量日志,平衡读取与写入成本。 - 清理与留存:控制版本与保留期,降低存储。 ## 注意事项 - 关键词、分类与描述与正文一致;术语与能力为通用与可验证。 - 与计算引擎与数据质量治理协同。

发表评论 取消回复