概述 HPA 基于指标调整副本数;VPA 调整容器请求/限制。两者结合可在不同负载模式下实现可靠弹性。 已验证技术参数 - HPA API:`autoscaling/v2`;支持 `Resource` 与 `Pods/External` 指标 - 典型目标:CPU/内存利用率(如 70%)与自定义业务 QPS/延迟 - 行为(Behavior):`stabilizationWindowSeconds` 与 `policies` 控制扩缩速度与抖动 实践示例 ```yaml apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: web-hpa spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: web minReplicas: 2 maxReplicas: 20 metrics: - type: Resource resource: name: cpu target: type: Utilization averageUtilization: 70 behavior: scaleUp: stabilizationWindowSeconds: 30 policies: - type: Percent value: 100 periodSeconds: 60 scaleDown: stabilizationWindowSeconds: 60 policies: - type: Percent value: 50 periodSeconds: 60 ``` 治理建议 - 为指标采集与滞后设定缓冲时间;避免误触扩缩导致抖动 - 将业务指标纳入伸缩决策(如排队长度、错误率) 结语 弹性伸缩是成本与体验的平衡艺术。以行为策略与多指标驱动,构建可预测的自动化扩缩容。

发表评论 取消回复