概述MI300X 面向大模型推理与训练的高带宽、超大显存场景,基于 CDNA3 架构,提供领先的显存容量与带宽以降低数据搬运瓶颈。关键参数(已验证)显存:192 GB HBM3,8192-bit 总线(来源)带宽:峰值约 5.325 TB/s(来源)功耗:OAM 模组 750W 典型配置(来源)计算:TF32/FP16/BF16/FP8 理论峰值随配置提升(来源)架构要点8-Stack HBM 架构与宽总线设计,面向内存受限的大模型场景以带宽与容量优先的策略,减轻参数/激活的跨设备传输压力部署建议推理优先:单卡 192GB 可容纳较大上下文窗口,结合张量并行提升吞吐训练:关注 NVLink/Ethernet 拓扑匹配与梯度通信开销;按任务选择 FP8/混合精度策略参考与链接(验证来源)AMD 官方规格与性能注释(https://www.amd.com/en/products/accelerators/instinct/mi300/mi300x.html)AMD MI300 系列页面(https://www.amd.com/en/products/accelerators/instinct/mi300.html)TechPowerUp 规格库(https://www.techpowerup.com/gpu-specs/radeon-instinct-mi300x.c4179)HotChips 2024 架构介绍(https://hc2024.hotchips.org/.../MI300X...pdf)

发表评论 取消回复