CompressionStream 流式上传管道与服务端协作实践 使用 CompressionStream 将文件流式压缩后上传,结合 Content-Encoding 与服务端解析协作。 Recovered Channel 1887 2026年02月13日 0 点赞 0 评论 0 浏览
"Web Push 与 VAPID:浏览器推送订阅与服务端发送" "总结 Push API 的订阅与接收流程,解释 VAPID 的应用服务器标识与发送机制,给出安全注意与工程实践参考。" Recovered Channel 1273 2026年02月13日 0 点赞 0 评论 0 浏览
Rust高性能服务开发与异步Tokio实践 使用 Rust + Tokio 构建高性能服务,合理配置运行时与并发模型,结合 Hyper/Actix、度量与优化方法,提供可验证的实践清单。 Recovered Channel 1273 2026年02月13日 0 点赞 0 评论 0 浏览
AI 推理服务的可伸缩架构与成本优化 总结 AI 推理服务的吞吐与时延优化手段,覆盖并发批处理、模型并行与量化,以及自动扩缩与成本治理策略。 Recovered Channel 1273 2026年02月14日 0 点赞 0 评论 0 浏览
Feature Flags 服务架构(评估、分群、回滚与审计) 构建可扩展的 Feature Flags 服务,支持规则评估、用户分群、快速回滚与审计治理,并提供验证方法。 Recovered Channel 1273 2026年02月14日 0 点赞 0 评论 0 浏览
LLM 服务端流式传输与断点续传(SSE/WebSocket、分片与验证) 使用SSE或WebSocket提供LLM流式输出,并通过分片与游标实现断点续传与重试安全,给出服务端与客户端实现与验证方法。 Recovered Channel 1273 2026年02月13日 0 点赞 0 评论 0 浏览
Istio Egress Gateway 与外部服务访问控制(TLS Origination、SNI 与出口策略) 通过 Istio Egress Gateway 管控外部访问,配置 TLS Origination 与 SNI、出口策略与审计,确保合规与稳定并提供验证方法。 Recovered Channel 1273 2026年02月12日 0 点赞 0 评论 0 浏览
KServe 模型推理服务(Autoscaling、Canary 与性能验证) 基于 KServe 构建模型推理服务,配置自动伸缩与金丝雀发布,并通过压测与观测验证性能与稳定性。 Recovered Channel 1273 2026年02月12日 0 点赞 0 评论 0 浏览
KServe 推理服务自动伸缩与 GPU 调度治理(2025) KServe 推理服务自动伸缩与 GPU 调度治理(2025)一、架构与部署模型服务:`InferenceService` 定义接口与路由;支持 REST/gRPC。资源:为 `GPU` 设置 requests/limits 与节点选择器;隔离不同模型的资源。存储:模型拉取与缓存策略,减少启动时延。 Recovered Channel 1273 2026年02月12日 0 点赞 0 评论 0 浏览