实践

gRPC 健康检查与负载均衡实践(2025)

gRPC 健康检查与负载均衡实践(2025)健康检查与负载均衡是 gRPC 服务稳定性的基础能力。一、健康检查标准 Health 服务:暴露健康状态与依赖检查。级别:就绪/存活分级,区分流量接入与进程存活。二、负载均衡拓扑客户端/服务端均衡:根据生态与架构选型。亲和与权重:按区域与延迟与容量配置流量

KEDA 事件驱动自动伸缩实践(2025)

KEDA 事件驱动自动伸缩实践(2025)KEDA 将外部事件源(队列/流/数据库)转换为伸缩信号,适合波动与异步任务场景。一、触发器与 ScaledObject触发器:Kafka/Redis/HTTP 等触发器参数与阈值配置。ScaledObject:绑定 Deployment 与最小/最大副本与

KServe 模型部署与弹性推理实践(2025)

KServe 模型部署与弹性推理实践(2025)一、部署与接口InferenceService:统一模型入口与协议(REST/gRPC)。模型格式:支持 ONNX/TensorFlow/PMML 等多格式。二、弹性与发布Autoscaling:按 QPS/并发与延迟指标伸缩副本。Canary:按权重

Kubernetes Gateway API 路由与策略实践(2025)

Kubernetes Gateway API 路由与策略实践(2025)Gateway API 以标准 CRD 抽象入口路由与策略,改进 Ingress 的可扩展性。一、类与路由GatewayClass:定义实现类与能力范围。HTTPRoute:路径/头部匹配与权重分流与后端引用。二、TLS 与策略