RAG Chunking/Sliding Window 与检索重排治理(2025)一、分块与窗口Chunking(Chunking):按语义或固定长度分块;质量影响召回与相关性。Sliding Window(Sliding Window):对长文档使用滑窗覆盖边界信息。二、检索与过滤向量检索(向量检索):选择 HNSW/IVF 等索引;设定 Top-K 与度量。过滤:按标签/时间/数值过滤,减少无效候选。三、重排与融合Rerank(Rerank):使用重排模型提升首屏质量;控制延迟与成本。融合:将相似度与业务权重融合;避免单因子主导(相关性)。四、观测与回滚指标:召回率、NDCG、延迟;A/B 实验形成基线。回滚:异常时回滚索引或参数;保障稳定。注意事项关键词(Chunking、Sliding Window、Rerank、向量检索、相关性)与正文一致。分类为“AI/RAG/检索”,不超过三级。参数需在评估集与线上观测中验证。

发表评论 取消回复