检索 - 叶斌兵

RAG 检索增强生成最佳实践：分块、召回与重排序

"系统化阐述 RAG 的分块策略、召回参数与重排序方案，并给出可验证的参数范围与评估方法。"

数据科学与AI 2026年02月13日 0 点赞 0 评论 12 浏览

RAG 检索增强生成最佳实践

RAG 检索增强生成最佳实践RAG（Retrieval-Augmented Generation）通过在生成前引入检索阶段，使模型具备“查阅资料”的能力，更适合需要事实性与可追溯性的业务场景（知识问答、文档助手、客服等）。本文从架构、数据、检索、生成与评估五个方面给出落地实践指南。一、系统架构分层设

数据科学与AI 2026年02月13日 0 点赞 0 评论 12 浏览

Sliding Window 与检索重排治理（2025）

RAG Chunking/Sliding Window 与检索重排治理（2025）一、分块与窗口Chunking（Chunking）：按语义或固定长度分块；质量影响召回与相关性。Sliding Window（Sliding Window）：对长文档使用滑窗覆盖边界信息。二、检索与过滤向量检索（向量检

性能优化 2026年02月13日 0 点赞 0 评论 8 浏览

Qdrant 向量检索与 Payload 过滤治理（2025）

Qdrant 向量检索与 Payload 过滤治理（2025）一、集合与索引集合：定义向量维度与度量（cosine/L2/IP），开启 `HNSW` 索引。Payload：属性存储用于 `Filter`（标签/时间/数值），支持条件组合。分片与副本：依据数据量与吞吐设置 `shards/replic

软件 2026年02月13日 0 点赞 0 评论 15 浏览

Prisma pgvector 与向量检索集成建议

引言pgvector 将向量检索能力带入 Postgres；结合 Prisma Client 可在同一数据层实现结构化与语义检索的统一。集成与建模（已验证）Postgres 扩展：安装与启用 `pgvector`，创建向量列并建立合适的索引（如 HNSW/IVFFlat）。来源：Supabase 文

软件 2026年02月13日 0 点赞 0 评论 11 浏览

Postgres全文检索：tsvector/tsquery与排名治理

使用内置全文检索构建文本搜索，规范向量与查询与排名，提升相关性与性能。

数据库 2026年02月13日 0 点赞 0 评论 9 浏览

索引参数与过滤检索治理（2025）

Pinecone Pods/索引参数与过滤检索治理（2025）一、索引与度量Metric：选择 `cosine/L2/IP`；按业务语义校准。Pods：设置 `pods/replicas` 与分片；保证可用性与吞吐。二、查询与过滤过滤：使用 Metadata 过滤缩小候选；提高精准度。Top-K：设

软件 2026年02月13日 0 点赞 0 评论 10 浏览

pgvector 近似检索与索引调优（2025）

pgvector 近似检索与索引调优（2025）一、索引类型与度量索引：`HNSW` 适合在线更新、低延迟；`IVF` 适合批量构建与更高吞吐。度量：`余弦`（cosine）用于归一化向量相似；`L2`（欧氏）；`IP`（内积）。按业务语义与评估集选择。二、HNSW 参数与调度图参数：`m`（每点连

软件 2026年02月13日 0 点赞 0 评论 16 浏览

OpenSearch k-NN 向量检索索引与查询实战

"创建 k-NN 索引并进行向量相似度查询，提供 HNSW 配置与 knn 查询示例。"

软件 2026年02月13日 0 点赞 0 评论 14 浏览

OpenSearch k-NN 向量检索与参数优化（2025）

OpenSearch k-NN 向量检索与参数优化（2025）一、索引与配置HNSW：设置 `m`/`ef_construction`；匹配向量维度与度量。索引映射：声明 `knn_vector` 字段与度量（cosine/L2）。二、查询与优化efSearch：提升召回的同时控制延迟；按查询类型动

性能优化 2026年02月13日 0 点赞 0 评论 12 浏览

检索

首页

检索

列表

默认

浏览次数

发布日期