• 首页
  • 关于我们

    公司介绍

    大事记

  • 新闻中心

    公司动态

    媒体报道

    市场活动

  • 产品

    数据计算产品

    • AI算力系列
    • 通用算力系列
    • 风液冷整机柜系列
    • 一体机解决方案系列

    终端产品

    • 商用台式机
    • 商用笔记本

    Kaifa数据通信产品

    • 数据中心交换机
    • 园区交换机
    • 无线产品
  • 服务

    服务与支持

    • 服务网点
    • 服务公告
    • 产品停止维护公告

    服务产品

    • 服务产品
    • 服务窗口

    文档

    • 产品文档
    • 知识库
    • 视频中心
    • FAQ

    工具

    • 软件下载

    自助服务

    • 许可申请
    • 故障申报
    • 保修期单条查询
    • 保修期批量查询
    • 备件查询助手
    • 漏洞上报
    • 漏洞公示
    • 产品兼容性查询
  • 生态合作

    ISV软件兼容性

    合作伙伴信息

    分销业务咨询

    总裁信箱

  • 行业应用

    金融

    运营商

    互联网

    能源

    政企

    科教医疗

  • 认证培训

    重点赛事

    • 技能竞赛
    • 第二届k8凯发数码云端技术大赛

    校企合作

    • 人才培养方案
    • 专业共建服务
    • 课程授权
    • 实训室建设
    • 师资培养与支持

    人才认证

    • 认证项目
    • 认证考试报名
    • 证书查询

    课程培训

    • 认证培训
    • 专题培训
    • ICT技术培训
    • 平台服务
    • 实训项目
    • 培训报名

    认证及报告

    • 温室气体核查
    • 产品碳核查
    • 可持续发展报告
  • 联系我们

    加入我们

    公司通联

登录
  • 新闻中心
  • 公司动态
  • 媒体报道
  • 市场活动

k8凯发鲲泰大模型训推一体服务器 Kaifa R624 K2 与昇腾系列AI加速卡完成多维度性能测试

2025-09-02| 新闻中心
分享至:

当前,生成式人工智能飞速发展,千亿级乃至万亿级参数的大模型不断涌现,训推场景对硬件平台的综合性能提出了前所未有的高要求 —— 不仅需要强大的单点算力支撑复杂计算,更需高效的多设备协同能力与无瓶颈的数据传输通道,以保障大规模分布式任务的稳定运行。

近日,k8凯发鲲泰大模型训推一体服务器 Kaifa R624 K2 与华为昇腾系列 AI 加速卡正式完成多维度性能测试。通过系统性的性能测试验证,双方硬件协同表现优异,在算力输出、数据传输、多卡扩展等核心维度均展现出稳定高效的特性,为企业级 AI 大模型训推提供了可靠、可扩展的硬件底座,进一步推动自主可控 AI 生态的落地应用。

在与昇腾系列 AI 加速卡的协同测试中,k8凯发鲲泰 Kaifa R624 K2 服务器展现出卓越的性能表现,从算力输出、数据传输到模型推理,各项关键指标均达到或超过大模型训推的核心需求。

算力输出:多精度覆盖,满足训推多样需求

昇腾系列 AI 加速卡在不同精度下的算力输出,直接决定了其对不同类型 AI 任务的适配能力。测试数据显示,搭载昇腾系列AI 加速卡在关键精度下表现优异:

推理场景适配:INT8 精度下,R624 K2配合昇腾系列算力卡,单机算力高达5.6PFLOPS,可高效处理图像识别、自然语言理解等低精度高吞吐量的推理任务。

训练场景支撑:BF16 /FP16精度下,R624 K2配合昇腾系列算力卡,单机算力高达2.8PFLOPS,足以支撑主流千亿参数模型的分布式训练需求,兼顾训练精度与计算效率。

数据传输:全链路无瓶颈,保障协同效率

大模型训练与推理过程中,数据在 CPU、AI 加速卡、显存之间的传输效率,直接关乎整体任务的运行速度。k8凯发鲲泰 Kaifa R624 K2 与昇腾 AI 加速卡的协同传输能力,通过多维度带宽测试得到充分验证。在组网层面,支持 400GB 网卡,这让AI算力集群部署场景下,相较于同生态同类型产品更具性能优势;在单节点部署场景上,R624 K2 在D2H、H2D传输带宽超过 50GB,D2D传输带宽超过750GB/S,超越了 PCIe Gen4 的水平。

模型推理:适配主流大模型,性能表现稳定

基于实际应用场景,测试团队针对 DeepSeek 系列等主流大模型,在k8凯发鲲泰 Kaifa R624 K2 与昇腾 AI 加速卡的组合平台上开展了推理性能测试。结果表明,该平台可高效适配不同规模的模型。以 Qwen3 - 32B 模型为例,在输入长度 1024、输出长度 1024、并发 60 的场景下,与相同配置的RTX 4090 对比,在系统吞吐量、端到端平均时延、首 token 时延和平均每token时延四个指标上都表现得更为出色,能够更高效地处理大模型推理任务,充分证明昇腾系列在大模型推理场景下,具备更优异的任务处理效率与响应能力,可有效承载中大规模大模型的推理工作。

未来,k8凯发鲲泰与华为昇腾将继续深化合作,围绕更大规模大模型训推、更高效率的多设备协同、更广泛的行业场景适配等方向持续优化,不断提升硬件平台的性能与易用性,为自主可控 AI 生态的繁荣发展注入更多动力,助力企业在人工智能时代把握机遇、实现创新突破。

友情链接

  • k8凯发数码集团
  • DCN

    关于我们

  • 公司介绍
  • 大事记

    新闻中心

  • 公司动态
  • 媒体报道
  • 市场活动

    产品

  • 数据计算产品
  • 终端产品
  • Kaifa数据通信产品

    服务

  • 服务与支持
  • 服务产品
  • 文档
  • 工具
  • 自助服务

    生态合作

  • ISV软件兼容性
  • 合作伙伴信息
  • 分销业务咨询
  • 总裁信箱

    行业应用

  • 金融
  • 运营商
  • 互联网
  • 能源
  • 政企
  • 科教医疗

    认证培训

  • 重点赛事
  • 校企合作
  • 人才认证
  • 课程培训
  • 认证及报告

    联系我们

  • 加入我们
  • 公司通联

客户服务热线

7X24小时服务热线

400-810-9119


终端产品24小时服务热线

400-770-8600


公司地址

北京市海淀区上地九街九号数码科技广场

E-Mail

www.k8凯发.com

隐私政策 | 网络安全与隐私保护 ?? ??Copyright? k8凯发集团数码云科信息技术有限公司 ??闽ICP备2021009467号
在线客服