检索

Sliding Window 与检索重排治理(2025)

RAG Chunking/Sliding Window 与检索重排治理(2025)一、分块与窗口Chunking(Chunking):按语义或固定长度分块;质量影响召回与相关性。Sliding Window(Sliding Window):对长文档使用滑窗覆盖边界信息。二、检索与过滤向量检索(向量检

IVF-PQ 索引与混合检索策略(2025)

Milvus HNSW/IVF-PQ 索引与混合检索策略(2025)一、索引类型与度量索引:`HNSW` 适合在线更新与低延迟;`IVF-PQ` 通过分桶与乘积量化压缩向量,加速检索与节约存储。度量:`cosine`/`L2`/`IP` 按语义选择;统一归一化策略保障得分可比较。二、HNSW 参数图

索引参数与过滤检索治理(2025)

Pinecone Pods/索引参数与过滤检索治理(2025)一、索引与度量Metric:选择 `cosine/L2/IP`;按业务语义校准。Pods:设置 `pods/replicas` 与分片;保证可用性与吞吐。二、查询与过滤过滤:使用 Metadata 过滤缩小候选;提高精准度。Top-K:设

Content Index API 离线内容索引与检索实践

`title: Content Index API 离线内容索引与检索实践``categories: Web 开发/前端/数据管理``keywords: Content Index API,PWA,离线,索引,检索``description: 在支持的平台使用 Content Index API 为

全文融合检索(2025)

RedisSearch 与 RedisJSON 向量/全文融合检索(2025)一、数据与索引JSON 存储:以 RedisJSON 存储结构化/半结构化文档。索引:RediSearch 定义 TEXT/TAG/NUMERIC 与 VECTOR 字段。二、查询与融合全文与向量:term/phrase

RAG 检索增强生成最佳实践

RAG 检索增强生成最佳实践RAG(Retrieval-Augmented Generation)通过在生成前引入检索阶段,使模型具备“查阅资料”的能力,更适合需要事实性与可追溯性的业务场景(知识问答、文档助手、客服等)。本文从架构、数据、检索、生成与评估五个方面给出落地实践指南。一、系统架构分层设