概述HPA 基于指标调整副本数;VPA 调整容器请求/限制。两者结合可在不同负载模式下实现可靠弹性。已验证技术参数HPA API:`autoscaling/v2`;支持 `Resource` 与 `Pods/External` 指标典型目标:CPU/内存利用率(如 70%)与自定义业务 QPS/延迟行为(Behavior):`stabilizationWindowSeconds` 与 `policies` 控制扩缩速度与抖动实践示例apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: web-hpa spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: web minReplicas: 2 maxReplicas: 20 metrics: - type: Resource resource: name: cpu target: type: Utilization averageUtilization: 70 behavior: scaleUp: stabilizationWindowSeconds: 30 policies: - type: Percent value: 100 periodSeconds: 60 scaleDown: stabilizationWindowSeconds: 60 policies: - type: Percent value: 50 periodSeconds: 60 治理建议为指标采集与滞后设定缓冲时间;避免误触扩缩导致抖动将业务指标纳入伸缩决策(如排队长度、错误率)结语弹性伸缩是成本与体验的平衡艺术。以行为策略与多指标驱动,构建可预测的自动化扩缩容。

发表评论 取消回复