运维
SLO与错误预算治理:SLI定义、阈值与发布门禁
建立以 SLO/SLI 为核心的错误预算治理,定义阈值与门禁策略,在超标时收紧发布并进行回滚与修复。
Sentry与OpenTelemetry集成:错误分组与Trace关联
结合 OTel 追踪与 Sentry 错误监控,实现错误事件与 Trace 关联分析,提升定位与修复效率。
Sentry与OpenTelemetry整合:错误与事务追踪
将 Sentry 的错误监控与 OTel 追踪/指标整合,建立跨前后端的统一观测与定位能力。
S3 Transfer Acceleration与Multipart Upload:全球加速与分段上传
通过 S3 的全球加速与分段上传在跨区域与弱网场景提升上传性能与可靠性,优化带宽与重试策略。
Policy-as-Code:OPA与Rego策略落地
以 OPA 与 Rego 实现策略即代码,将安全与合规嵌入到服务与集群的决策路径中。
Prometheus relabel_configs与目标发现治理
使用 relabel_configs 清洗与重写标签,统一目标发现与采集策略,提升指标质量与采集效率。
