检索

RAG 检索增强生成最佳实践

RAG 检索增强生成最佳实践RAG(Retrieval-Augmented Generation)通过在生成前引入检索阶段,使模型具备“查阅资料”的能力,更适合需要事实性与可追溯性的业务场景(知识问答、文档助手、客服等)。本文从架构、数据、检索、生成与评估五个方面给出落地实践指南。一、系统架构分层设

OpenSearch k-NN 向量检索与参数优化(2025)

OpenSearch k-NN 向量检索与参数优化(2025)一、索引与配置HNSW:设置 `m`/`ef_construction`;匹配向量维度与度量。索引映射:声明 `knn_vector` 字段与度量(cosine/L2)。二、查询与优化efSearch:提升召回的同时控制延迟;按查询类型动

全文融合检索(2025)

RedisSearch 与 RedisJSON 向量/全文融合检索(2025)一、数据与索引JSON 存储:以 RedisJSON 存储结构化/半结构化文档。索引:RediSearch 定义 TEXT/TAG/NUMERIC 与 VECTOR 字段。二、查询与融合全文与向量:term/phrase

Prisma pgvector 与向量检索集成建议

引言pgvector 将向量检索能力带入 Postgres;结合 Prisma Client 可在同一数据层实现结构化与语义检索的统一。集成与建模(已验证)Postgres 扩展:安装与启用 `pgvector`,创建向量列并建立合适的索引(如 HNSW/IVFFlat)。来源:Supabase 文

Content Index API 离线内容索引与检索实践

`title: Content Index API 离线内容索引与检索实践``categories: Web 开发/前端/数据管理``keywords: Content Index API,PWA,离线,索引,检索``description: 在支持的平台使用 Content Index API 为