运维
Prometheus远端写与多租治理
使用远端写将指标上送至多租后端(Cortex/Mimir),规范租户隔离、标签策略与成本治理,提升可用性与扩展性。
OTLP传输治理:HTTP与gRPC、批处理与重试策略
在 OTLP 传输层选择 HTTP/gRPC 与批处理/重试策略,平衡成本与可靠性,保障高并发采集稳定。
Sentry与OpenTelemetry集成:错误分组与Trace关联
结合 OTel 追踪与 Sentry 错误监控,实现错误事件与 Trace 关联分析,提升定位与修复效率。
可观测性实践:OpenTelemetry日志、指标与链路追踪
基于 OpenTelemetry 的三大观测维度构建统一采集与上报链路,提升问题定位与回归速度。
OpenTelemetry日志语义约定:结构化字段与错误关联
统一日志的结构化字段与语义约定,关联 Trace/Span,提升跨服务诊断与可视化能力。
eBPF可观测性:网络与系统调用采集治理
以 eBPF 在内核态采集网络与系统调用事件,构建低开销的可观测与安全治理能力,规范部署与风险控制。
