Kubernetes Requests Limits 与 HPA 配置指南

58 阅读 0 评论 0 点赞

title: Kubernetes Requests Limits 与 HPA 配置指南

keywords:

requests
limits
HPA
metrics-server
资源度量

description: 理解并正确设置容器的资源请求与限制，结合 HPA 进行弹性伸缩，实现稳定与高效的资源利用。

date: 2025-11-25

draft: false

categories:

文章资讯
技术教程

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

CPU 以核为单位，使用毫核标记（如 500m 表示 0.5 核）。
内存以字节为单位，常用 Mi/Gi（如 512Mi）。
requests 决定调度与保障下限；limits 约束上限并可能触发限制或 OOM。

资源与探针示例（Deployment 节选）


resources:
  requests:
    cpu: "500m"
    memory: "512Mi"
  limits:
    cpu: "1"
    memory: "1Gi"


readinessProbe:
  httpGet:
    path: /healthz
    port: 8080
  initialDelaySeconds: 5
  periodSeconds: 10

livenessProbe:
  httpGet:
    path: /livez
    port: 8080
  initialDelaySeconds: 10
  periodSeconds: 20

HPA v2 示例（基于 CPU 利用率）


apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 2
  maxReplicas: 10
  metrics:
    - type: Resource
      resource:
        name: cpu
        target:
          type: Utilization
          averageUtilization: 60

验证清单

确认 metrics-server 正常工作：kubectl get deployment -n kube-system metrics-server。
使用 kubectl top pods 与 HPA 状态（kubectl describe hpa）观察伸缩行为。

点赞(0) 打赏

本文分类：Web开发
本文标签：无
浏览次数：58 次浏览
发布日期：2026-04-30 13:33:00
本文链接：https://ybb.press/webdev/926.html

上一篇 > Kubernetes PriorityClass与抢占治理
下一篇 > Kubernetes ResourceQuota 与 LimitRange（命名空间资源治理与验证）

Kubernetes Requests Limits 与 HPA 配置指南

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

资源与探针示例（Deployment 节选）

HPA v2 示例（基于 CPU 利用率）

验证清单

评论列表共有 0 条评论

发表评论取消回复

Kubernetes Requests Limits 与 HPA 配置指南

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

资源与探针示例（Deployment 节选）

HPA v2 示例（基于 CPU 利用率）

验证清单

Popover API 实战：锚定弹出层的无障碍与性能

Popover API 原生弹层：无框架交互与可访问性

Payment Request API 实战：支付流程与兼容回退

OpenTelemetry 全栈可观测性落地指南（2025）

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复