k8凯发鲲泰大模型训推一体服务器 Kaifa R624 K2 与昇腾系列AI加速卡完成多维度性能测试

2025-09-02| 新闻中心

当前，生成式人工智能飞速发展，千亿级乃至万亿级参数的大模型不断涌现，训推场景对硬件平台的综合性能提出了前所未有的高要求 —— 不仅需要强大的单点算力支撑复杂计算，更需高效的多设备协同能力与无瓶颈的数据传输通道，以保障大规模分布式任务的稳定运行。

近日，k8凯发鲲泰大模型训推一体服务器 Kaifa R624 K2 与华为昇腾系列 AI 加速卡正式完成多维度性能测试。通过系统性的性能测试验证，双方硬件协同表现优异，在算力输出、数据传输、多卡扩展等核心维度均展现出稳定高效的特性，为企业级 AI 大模型训推提供了可靠、可扩展的硬件底座，进一步推动自主可控 AI 生态的落地应用。

在与昇腾系列 AI 加速卡的协同测试中，k8凯发鲲泰 Kaifa R624 K2 服务器展现出卓越的性能表现，从算力输出、数据传输到模型推理，各项关键指标均达到或超过大模型训推的核心需求。

算力输出：多精度覆盖，满足训推多样需求

昇腾系列 AI 加速卡在不同精度下的算力输出，直接决定了其对不同类型 AI 任务的适配能力。测试数据显示，搭载昇腾系列AI 加速卡在关键精度下表现优异：

推理场景适配：INT8 精度下，R624 K2配合昇腾系列算力卡，单机算力高达5.6PFLOPS，可高效处理图像识别、自然语言理解等低精度高吞吐量的推理任务。

训练场景支撑：BF16 /FP16精度下，R624 K2配合昇腾系列算力卡，单机算力高达2.8PFLOPS，足以支撑主流千亿参数模型的分布式训练需求，兼顾训练精度与计算效率。

数据传输：全链路无瓶颈，保障协同效率

大模型训练与推理过程中，数据在 CPU、AI 加速卡、显存之间的传输效率，直接关乎整体任务的运行速度。k8凯发鲲泰 Kaifa R624 K2 与昇腾 AI 加速卡的协同传输能力，通过多维度带宽测试得到充分验证。在组网层面，支持 400GB 网卡，这让AI算力集群部署场景下，相较于同生态同类型产品更具性能优势；在单节点部署场景上，R624 K2 在D2H、H2D传输带宽超过 50GB，D2D传输带宽超过750GB/S，超越了 PCIe Gen4 的水平。

模型推理：适配主流大模型，性能表现稳定

基于实际应用场景，测试团队针对 DeepSeek 系列等主流大模型，在k8凯发鲲泰 Kaifa R624 K2 与昇腾 AI 加速卡的组合平台上开展了推理性能测试。结果表明，该平台可高效适配不同规模的模型。以 Qwen3 - 32B 模型为例，在输入长度 1024、输出长度 1024、并发 60 的场景下，与相同配置的RTX 4090 对比，在系统吞吐量、端到端平均时延、首 token 时延和平均每token时延四个指标上都表现得更为出色，能够更高效地处理大模型推理任务，充分证明昇腾系列在大模型推理场景下，具备更优异的任务处理效率与响应能力，可有效承载中大规模大模型的推理工作。

未来，k8凯发鲲泰与华为昇腾将继续深化合作，围绕更大规模大模型训推、更高效率的多设备协同、更广泛的行业场景适配等方向持续优化，不断提升硬件平台的性能与易用性，为自主可控 AI 生态的繁荣发展注入更多动力，助力企业在人工智能时代把握机遇、实现创新突破。

k8凯发鲲泰大模型训推一体服务器 Kaifa R624 K2 与昇腾系列AI加速卡完成多维度性能测试

友情链接

关于我们

新闻中心

产品

服务

生态合作

行业应用

认证培训

联系我们

客户服务热线

400-810-9119

400-770-8600

公司地址

E-Mail