工程实践

首页

软件

工程实践

列表

默认

浏览次数

发布时间

PyTorch-分布式训练性能分析

PyTorch-分布式训练性能分析

技术摘要PyTorch 在分布式训练中通过数据并行与模型并行提升吞吐与可扩展性；结合 GPU 的 FP32/混合精度与高效通信路径（PCIe 4.0/NVLink），在多节点场景中保持较好的收敛与性能/能效比平衡。技术参数并行策略：DataParallel/DistributedDataParall

性能优化 2026年02月14日 0 点赞 0 评论 15 浏览

TensorRT-8.6推理优化白皮书

TensorRT-8.6推理优化白皮书

技术摘要TensorRT 面向 GPU 推理优化，通过 CUDA 内核融合与算子调度提升吞吐并降低延迟；在批量/并发场景改善能效比，适配多模型部署与半精度/量化路径。技术参数框架版本：TensorRT 8.6；支持 FP16/INT8 量化与动态形状数据来源: NVIDIA Tensor

性能优化 2026年02月14日 0 点赞 0 评论 15 浏览

GitHub Actions复用Workflow与Composite Actions治理

GitHub Actions复用Workflow与Composite Actions治理

通过复用工作流与组合动作提升流水线复用与维护性，规范版本、权限与输入输出治理。

CI-CD 2026年02月12日 0 点赞 0 评论 15 浏览

HSTS预加载与TLS安全响应头治理

HSTS预加载与TLS安全响应头治理

使用 HSTS 强制 HTTPS，并配置预加载与安全响应头，降低降级与中间人风险，统一域安全基线。

安全 2026年02月12日 0 点赞 0 评论 15 浏览

in-toto供应链证明与链路验证治理（Layout-Link-阈值）最佳实践

in-toto供应链证明与链路验证治理（Layout-Link-阈值）最佳实践

通过校验 in-toto 布局与 link 元数据、阈值签名与材料清单一致性，确保供应链各步骤的可验证与可追溯。

工程实践 2026年02月12日 0 点赞 0 评论 15 浏览

Intel Lunar Lake 架构解读：NPU 48 TOPS 与封装内存

Intel Lunar Lake 架构解读：NPU 48 TOPS 与封装内存

解析 Lunar Lake 的 NPU/GPU/CPU 与封装内存设计，评估其在 Copilot+ PC 场景下的本地 AI 能力与能效。

性能优化 2026年02月20日 0 点赞 0 评论 15 浏览

Intl.Segmenter 多语言文本分词与选择：语义分片与性能实践

Intl.Segmenter 多语言文本分词与选择：语义分片与性能实践

使用 Intl.Segmenter 对不同语言文本进行语义分词与选择优化，改进高亮与编辑体验，并提供经验证的性能与准确指标。

性能优化 2026年02月12日 0 点赞 0 评论 15 浏览

IPv6私网与链接本地网段治理（fc00/fe80/环回）最佳实践

IPv6私网与链接本地网段治理（fc00/fe80/环回）最佳实践

通过识别与阻断IPv6的私网、链接本地与环回网段（fc00/fe80/::1），补齐SSRF与出口治理的IPv6维度防护。

工程实践 2026年02月12日 0 点赞 0 评论 15 浏览

JDK 23 版本要点：原始类型模式匹配与安全增强

JDK 23 版本要点：原始类型模式匹配与安全增强

概述 JDK 23 的关键更新，包含原始类型模式匹配（预览）、instanceof/switch 扩展与安全/时区/证书策略调整，指引升级与兼容评估。

安全 2026年02月12日 0 点赞 0 评论 15 浏览

Kafka Topic 保留与压缩策略配置指南

Kafka Topic 保留与压缩策略配置指南

"配置主题的保留与压缩策略（Delete/Compact），提供命令与参数说明，保障日志与状态主题的高效管理。"

性能优化 2026年02月12日 0 点赞 0 评论 15 浏览

微信公众账号

微信扫一扫加关注