检索

Sliding Window 与检索重排治理(2025)

RAG Chunking/Sliding Window 与检索重排治理(2025)一、分块与窗口Chunking(Chunking):按语义或固定长度分块;质量影响召回与相关性。Sliding Window(Sliding Window):对长文档使用滑窗覆盖边界信息。二、检索与过滤向量检索(向量检

IVF-PQ 索引与混合检索策略(2025)

Milvus HNSW/IVF-PQ 索引与混合检索策略(2025)一、索引类型与度量索引:`HNSW` 适合在线更新与低延迟;`IVF-PQ` 通过分桶与乘积量化压缩向量,加速检索与节约存储。度量:`cosine`/`L2`/`IP` 按语义选择;统一归一化策略保障得分可比较。二、HNSW 参数图

OpenSearch k-NN 向量检索与参数优化(2025)

OpenSearch k-NN 向量检索与参数优化(2025)一、索引与配置HNSW:设置 `m`/`ef_construction`;匹配向量维度与度量。索引映射:声明 `knn_vector` 字段与度量(cosine/L2)。二、查询与优化efSearch:提升召回的同时控制延迟;按查询类型动

Prisma pgvector 与向量检索集成建议

引言pgvector 将向量检索能力带入 Postgres;结合 Prisma Client 可在同一数据层实现结构化与语义检索的统一。集成与建模(已验证)Postgres 扩展:安装与启用 `pgvector`,创建向量列并建立合适的索引(如 HNSW/IVFFlat)。来源:Supabase 文

索引参数与过滤检索治理(2025)

Pinecone Pods/索引参数与过滤检索治理(2025)一、索引与度量Metric:选择 `cosine/L2/IP`;按业务语义校准。Pods:设置 `pods/replicas` 与分片;保证可用性与吞吐。二、查询与过滤过滤:使用 Metadata 过滤缩小候选;提高精准度。Top-K:设

Content Index API 离线内容索引与检索实践

`title: Content Index API 离线内容索引与检索实践``categories: Web 开发/前端/数据管理``keywords: Content Index API,PWA,离线,索引,检索``description: 在支持的平台使用 Content Index API 为