治理

KServe 推理服务自动伸缩与 GPU 调度治理(2025)

KServe 推理服务自动伸缩与 GPU 调度治理(2025)一、架构与部署模型服务:`InferenceService` 定义接口与路由;支持 REST/gRPC。资源:为 `GPU` 设置 requests/limits 与节点选择器;隔离不同模型的资源。存储:模型拉取与缓存策略,减少启动时延。

NetworkPolicy 零信任隔离治理(2025)

Kubernetes PodSecurity/NetworkPolicy 零信任隔离治理(2025)一、策略与范围PodSecurity:按 namespace 设置等级(Restricted/Baseline);限制特权与主机路径(PodSecurity)。NetworkPolicy:定义入口/出

Kubernetes StatefulSet 存储扩容与滚动升级治理(2025)

Kubernetes StatefulSet 存储扩容与滚动升级治理(2025)一、有序与版本有序(有序):按照序号逐个升级 Pod;控制最小可用数。版本:使用 `partition` 与 `maxUnavailable` 管理滚动窗口。二、存储与扩容PVC:通过存储类与动态卷支持在线扩容(PVC)

Kyverno 准入策略与资源合规治理(2025)

Kyverno 准入策略与资源合规治理(2025)Kyverno 用声明式规则校验与修改 Kubernetes 资源,降低自研复杂度。一、策略与规则校验:命名/标签/镜像来源/资源限制统一校验。修改:默认注入标签与限制,提升一致性。二、发布与灰度灰度发布:新策略先在部分命名空间试运行。回滚:策略导致