测试与可靠性

首页

硬件

测试与可靠性

列表

默认

浏览次数

发布时间

混沌工程与故障演练（Steady-State、注入策略与验证）

混沌工程与故障演练（Steady-State、注入策略与验证）

基于 Steady-State 假设设计混沌实验，实施网络/资源/依赖故障注入并验证恢复能力，建立稳定性改进闭环。

测试与可靠性 2026年02月13日 0 点赞 0 评论 20 浏览

SRE 事件响应与 Runbook 治理（2025）

SRE 事件响应与 Runbook 治理（2025）

SRE 事件响应与 Runbook 治理（2025）事件响应聚焦快速定位与恢复，Runbook 提供可执行指南。一、分级与联系人分级：P1/P2/P3 响应时间与职责明确。通讯录：值班与升级路径与责任人清晰。二、Runbook 与执行Runbook：具体步骤/命令/检查点与回滚预案。演练：定期演练与

测试与可靠性 2026年02月13日 0 点赞 0 评论 20 浏览

SLO与错误预算治理：SLI定义、阈值与发布门禁

SLO与错误预算治理：SLI定义、阈值与发布门禁

建立以 SLO/SLI 为核心的错误预算治理，定义阈值与门禁策略，在超标时收紧发布并进行回滚与修复。

测试与可靠性 2026年02月13日 0 点赞 0 评论 21 浏览

SRE 可用性与容量规划（2025）

SRE 可用性与容量规划（2025）

SRE 可用性与容量规划（2025）SRE 通过明确 SLO 与错误预算管理变化与风险，并以容量规划匹配增长与峰值。一、SLO 与错误预算指标选择：面向用户体验的延迟、可用性与正确性指标。错误预算：在变更速度与稳定性之间取得平衡，超预算时收敛发布。二、容量与供给需求预测：基于历史负载与业务计划进行容

测试与可靠性 2026年02月13日 0 点赞 0 评论 21 浏览

尾延迟治理与 SLO 守门（队列隔离、优先级与慢请求切断）

尾延迟治理与 SLO 守门（队列隔离、优先级与慢请求切断）

针对 p95/p99 尾延迟设计治理策略，通过队列隔离、优先级调度与慢请求切断实现 SLO 守门，并提供验证方法。

测试与可靠性 2026年02月13日 0 点赞 0 评论 22 浏览

API 限流策略：令牌桶与漏桶的原理与工程取舍

API 限流策略：令牌桶与漏桶的原理与工程取舍

对令牌桶与漏桶算法进行对比，给出突发能力与平滑限流的取舍，结合本地与分布式实现（Guava/Redis/Nginx）提供工程实践建议与参考来源。

测试与可靠性 2026年02月20日 0 点赞 0 评论 24 浏览

ClickHouse Kafka引擎与流式摄取实践

ClickHouse Kafka引擎与流式摄取实践

使用Kafka引擎与物化视图将Kafka流数据落地到MergeTree表，提供可验证的DDL与运行命令，支撑实时分析。

测试与可靠性 2026年02月20日 0 点赞 0 评论 25 浏览

Badging API 应用角标与未读计数：系统集成与体验治理

Badging API 应用角标与未读计数：系统集成与体验治理

使用 Badging API 为 PWA 设置系统级应用角标，展示未读计数并治理提示频率与隐私，提供经验证的成功率与体验指标。

测试与可靠性 2026年02月20日 0 点赞 0 评论 26 浏览

SRE度量：SLO、错误预算与发布策略协同

SRE度量：SLO、错误预算与发布策略协同

通过 SLO 与错误预算衡量服务健康，并与发布与回滚策略协同提升可靠性与迭代速度。

测试与可靠性 2026年02月13日 0 点赞 0 评论 28 浏览

HDMI 2.1a 新特性：源端基础色调映射（SBTM）与 QMS

HDMI 2.1a 新特性：源端基础色调映射（SBTM）与 QMS

概述 HDMI 2.1a 的 SBTM 与 QMS 机制，解释其与 HDR/VRR 的关系与设备支持要求，帮助评估显示链路的体验提升与兼容性。

环境与老化测试 2026年02月20日 0 点赞 0 评论 29 浏览

微信公众账号

微信扫一扫加关注