据 meiguo.com 于 2025 年 6 月 12 日收到的消息 ‣ AMD日前推出ROCm 7软件开发平台,该版本在多个关键领域实现显著提升,进一步缩小与NVIDIA CUDA的差距。ROCm 7全面支持新一代Instinct MI350系列AI加速卡,涵盖新模型、新算法、新硬件及企业级特性。
训练方面,ROCm 7引入多项增强功能,包括AMD开源模型、增强的AI框架、内核与算法优化,以及新的数据类型如BF16/FP8等。官方数据显示,多个模型的性能提升普遍达到3倍以上,最高甚至超过3倍。
推理方面同样进展显著,支持高级数据类型如FP8/FP6/FP4及混合精度。实测显示,Llama 3.1、千问2、DeepSeek R1等模型的性能提升平均达3.5倍,最高可达3.8倍。在DeepSeek R1 FP8吞吐量测试中,MI355X表现优于NVIDIA B200。
ROCm 7还拓展了对Linux系统的支持,新增Red Hat EPEL、Ubuntu、OpenSUSE等发行版。Windows平台则新增PyTorch、ONNX-EP框架的支持,分别在第三季度和7月开放预览。
AMD还展示了消费级AI解决方案,包括锐龙AI 300系列和Max 300系列,分别支持高达240亿和700亿参数的本地运行。新一代线程撕裂者处理器与Radeon AI显卡组合最高可支持1280亿参数模型。
综合自网络