API设计与开发

KServe 模型部署与弹性推理实践(2025)

# KServe 模型部署与弹性推理实践(2025) ## 一、部署与接口 - InferenceService:统一模型入口与协议(REST/gRPC)。 - 模型格式:支持 ONNX/TensorFlow/PMML 等多格式。 ## 二、弹性与发布 - Autoscaling:按 QPS/并发与延迟指标伸缩副本。 - Canary:按权重分流验证新版本,异常快速回退。 ## 三、观测与治

Next.js App Router 数据获取模式与缓存协作(2025)

# Next.js App Router 数据获取模式与缓存协作(2025) ## 一、模式与职责 - Server Components:在服务端拉取数据,减少客户端负担(Server Components)。 - Route Handlers:对接 API 路由与边缘;统一鉴权与缓存。 ## 二、fetch 与缓存 - fetch:设置 `cache: force-cache/no-sto