计算机软件-AI框架-TensorRT推理优化技术分析 计算机软件-AI框架-TensorRT推理优化技术分析技术摘要TensorRT是NVIDIA推出的高性能深度学习推理引擎,通过图优化、算子融合、混合精度和INT8量化等技术,显著提升神经网络推理性能。该推理引擎支持张量核心和CUDA核心并行计算,实现内存优化和计算图重构,在自动驾驶、视频分析等领域提 性能优化 2026年02月14日 0 点赞 0 评论 8 浏览
大语言模型训练优化与分布式训练实践 深入解析大语言模型训练优化技术,涵盖分布式训练策略、内存优化、梯度累积、混合精度训练等核心技术,提供完整的生产级训练方案 性能优化 2026年02月13日 0 点赞 0 评论 8 浏览