检索

RAG 检索增强生成最佳实践

RAG 检索增强生成最佳实践RAG(Retrieval-Augmented Generation)通过在生成前引入检索阶段,使模型具备“查阅资料”的能力,更适合需要事实性与可追溯性的业务场景(知识问答、文档助手、客服等)。本文从架构、数据、检索、生成与评估五个方面给出落地实践指南。一、系统架构分层设

Sliding Window 与检索重排治理(2025)

RAG Chunking/Sliding Window 与检索重排治理(2025)一、分块与窗口Chunking(Chunking):按语义或固定长度分块;质量影响召回与相关性。Sliding Window(Sliding Window):对长文档使用滑窗覆盖边界信息。二、检索与过滤向量检索(向量检

Qdrant 向量检索与 Payload 过滤治理(2025)

Qdrant 向量检索与 Payload 过滤治理(2025)一、集合与索引集合:定义向量维度与度量(cosine/L2/IP),开启 `HNSW` 索引。Payload:属性存储用于 `Filter`(标签/时间/数值),支持条件组合。分片与副本:依据数据量与吞吐设置 `shards/replic

Prisma pgvector 与向量检索集成建议

引言pgvector 将向量检索能力带入 Postgres;结合 Prisma Client 可在同一数据层实现结构化与语义检索的统一。集成与建模(已验证)Postgres 扩展:安装与启用 `pgvector`,创建向量列并建立合适的索引(如 HNSW/IVFFlat)。来源:Supabase 文

索引参数与过滤检索治理(2025)

Pinecone Pods/索引参数与过滤检索治理(2025)一、索引与度量Metric:选择 `cosine/L2/IP`;按业务语义校准。Pods:设置 `pods/replicas` 与分片;保证可用性与吞吐。二、查询与过滤过滤:使用 Metadata 过滤缩小候选;提高精准度。Top-K:设

pgvector 近似检索与索引调优(2025)

pgvector 近似检索与索引调优(2025)一、索引类型与度量索引:`HNSW` 适合在线更新、低延迟;`IVF` 适合批量构建与更高吞吐。度量:`余弦`(cosine)用于归一化向量相似;`L2`(欧氏);`IP`(内积)。按业务语义与评估集选择。二、HNSW 参数与调度图参数:`m`(每点连

OpenSearch k-NN 向量检索与参数优化(2025)

OpenSearch k-NN 向量检索与参数优化(2025)一、索引与配置HNSW:设置 `m`/`ef_construction`;匹配向量维度与度量。索引映射:声明 `knn_vector` 字段与度量(cosine/L2)。二、查询与优化efSearch:提升召回的同时控制延迟;按查询类型动