Kubernetes Requests Limits 与 HPA 配置指南

YBB 8 阅读 0 评论 0 点赞

---

title: Kubernetes Requests Limits 与 HPA 配置指南

keywords:

requests
limits
HPA
metrics-server
资源度量

description: 理解并正确设置容器的资源请求与限制，结合 HPA 进行弹性伸缩，实现稳定与高效的资源利用。

date: 2025-11-25

draft: false

categories:

文章资讯
技术教程

---

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

CPU 以核为单位，使用毫核标记（如 500m 表示 0.5 核）。
内存以字节为单位，常用 Mi/Gi（如 512Mi）。
requests 决定调度与保障下限；limits 约束上限并可能触发限制或 OOM。

资源与探针示例（Deployment 节选）

resources:
  requests:
    cpu: "500m"
    memory: "512Mi"
  limits:
    cpu: "1"
    memory: "1Gi"

readinessProbe:
  httpGet:
    path: /healthz
    port: 8080
  initialDelaySeconds: 5
  periodSeconds: 10

livenessProbe:
  httpGet:
    path: /livez
    port: 8080
  initialDelaySeconds: 10
  periodSeconds: 20

HPA v2 示例（基于 CPU 利用率）

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 2
  maxReplicas: 10
  metrics:
    - type: Resource
      resource:
        name: cpu
        target:
          type: Utilization
          averageUtilization: 60

验证清单

确认 metrics-server 正常工作：kubectl get deployment -n kube-system metrics-server。
使用 kubectl top pods 与 HPA 状态（kubectl describe hpa）观察伸缩行为。

点赞(0) 打赏

本文分类：技术教程
本文标签：无
浏览次数：8 次浏览
发布日期：2026-03-19 01:30:01
本文链接：https://www.ybb.press/tech-tutorial/837.html

上一篇 > Istio JWT 鉴权与路径授权策略实践
下一篇 > Elasticsearch向量字段dense_vector与knn_search治理

Kubernetes Requests Limits 与 HPA 配置指南

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

资源与探针示例（Deployment 节选）

HPA v2 示例（基于 CPU 利用率）

验证清单

评论列表共有 0 条评论

发表评论取消回复

Kubernetes Requests Limits 与 HPA 配置指南

Kubernetes Requests/Limits 与 HPA 配置指南

基本概念

资源与探针示例（Deployment 节选）

HPA v2 示例（基于 CPU 利用率）

验证清单

自动化部署流程实践指南

前端性能优化实战指南

InfluxDB 与 Windows：完整指南

CMS 内容发布系统使用指南

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复