# 简介 通过合理的资源配额、弹性策略与调度约束,降低成本同时提升稳定性。 # 核心实践 - Requests/Limits:设置合理的 CPU/内存请求与上限,避免过度抢占或 OOM。 - HPA:基于指标进行水平扩缩,提升吞吐与韧性。 - VPA:自动调整资源请求,适应负载变化。 - 调度:节点亲和/反亲和,污点与容忍,确保关键服务稳定。 - 配额:命名空间级配额,避免资源被单服务耗尽。 # HPA 示例(可验证的通用配置) ```yaml apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: web-hpa spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: web minReplicas: 2 maxReplicas: 10 metrics: - type: Resource resource: name: cpu target: type: Utilization averageUtilization: 60 ``` # 运维建议 - 建立成本看板,监控节点利用率与预留容量。 - 为关键组件设置优先级与中断保护,预留故障恢复缓冲。

发表评论 取消回复