治理

Kubernetes 事件与告警治理(2025)

Kubernetes 事件与告警治理(2025)Kubernetes 的事件与指标是集群健康的信号,需要统一治理与响应流程。一、事件与指标Events:采集 Pod/Node/Controller 的关键事件。指标:CPU/内存/网络与自定义业务指标联合监控。二、阈值与抑制阈值:基于 SLO 与窗口

Function Calling 工具编排与可靠性治理(2025)

LangGraph/Function Calling 工具编排与可靠性治理(2025)一、流程与节点使用 LangGraph 定义有向流程(DAG),节点封装工具链(工具链)调用,输入输出以 schema 约束。Function Calling 标准化函数签名,防止提示注入与越权调用。二、可靠性策略