AI技术

OpenSearch k-NN 向量检索与参数优化(2025)

# OpenSearch k-NN 向量检索与参数优化(2025) ## 一、索引与配置 - HNSW:设置 `m`/`ef_construction`;匹配向量维度与度量。 - 索引映射:声明 `knn_vector` 字段与度量(cosine/L2)。 ## 二、查询与优化 - efSearch:提升召回的同时控制延迟;按查询类型动态调整。 - 过滤与缓存:结构化过滤结合结果缓存,降低重复

LLM输出防护:提示注入、敏感信息与事实核查

--- title: LLM输出防护:提示注入、敏感信息与事实核查 keywords: ["提示注入", "敏感信息", "事实核查", "上下文隔离", "引用证据"] description: 通过上下文隔离、输入/输出过滤与引用证据,实现对提示注入与敏感信息泄露的防护,并进行事实核查。 categories: - 应用软件 - 系统工具 --- # LLM输出防护:提示注入、敏感信...

Cloudflare Workers AI 与 Vectorize 实战

引言 - Workers AI 将模型推理能力带到 Cloudflare 边缘;Vectorize 提供托管向量索引,便于在边缘实现检索增强与个性化服务。 能力与实践(已验证) - Workers AI:支持在边缘调用模型进行推理,兼容 Web 标准与 Workers 环境。来源:Cloudflare Docs(Workers AI)。 - Vectorize:托管向量索引存储,与 Work

LLM 函数调用与工具编排实践(2025)

# LLM 函数调用与工具编排实践(2025) 函数调用与工具编排让模型与系统协作,提升可控性与可复现性。 ## 一、接口与模式 - JSON Schema:定义函数参数与返回,校验输入输出。 - 安全边界:限制可调用能力与资源,遵循最小权限。 ## 二、计划与执行 - 计划执行:将多步任务拆分为计划与步骤,控制顺序与依赖。 - 观察与回路:记录每次调用的观察与结果,便于回溯与调试。 ##