NVIDIA 朝向公司级服务器全新发布的 A30 和 A10 GPU 两云数据中心推理新产品,今日进行性能首次亮相,并创出推理新记录。
在业内认可的 AI 性能考量基准——MLPerf 基准测试中,NVIDIA GPU 在全部类型刷新记录。
绝大部分参加大数据中心及边沿推理测试的系统软件均选用 NVIDIA GPU 做为 AI 网络加速器,极少数则选用高通芯片、赛灵思、Neuchips、Centaur、Arm 等别的集成ic商的网络加速器。
NVIDIA 的2款新 GPU 集高性能与功耗于一身,可变成公司在 AI 推理、训炼、图型和传统式公司级测算工作中负荷等诸多方面的流行挑选。思科交换机、Dell高新科技、慧与、的浪潮和想到预估会从2020年夏天逐渐将这2款 GPU 集成化到其最大容积的网络服务器中。
连接:https://mlcommons.org/en/inference-datacenter-10/
一、NVIDIA 在六类优化算法测试均刷新记录
MLPerf 基准测试由图灵奖获得者 David Patterson 协同科技有限公司和全世界顶尖高等院校于 2018 年进行,是业内首套房考量深度学习硬件软件性能的通用性基准,能展现不一样 CPU、GPU、网络加速器组成做展现出的不一样性能主要表现,现如今 MLPerf 已变成业内测评 AI 性能的最流行规范之一。
“伴随着 AI 不断为各个领域产生转型,MLPerf 也变成公司的一项关键专用工具,可以助推其在IT基础设施建设项目投资层面作出聪明的管理决策。”NVIDIA 加快测算单位经理兼高级副总裁 Ian Buck 说,“现如今,全部关键 OEM 生产商都递交了 MLPerf 测试結果。”
除 NVIDIA 企业递交的测试結果外,阿里云服务器、Dell高新科技、富士通、技嘉科技、慧与、的浪潮、想到和超微等好几家 NVIDIA 合作方也递交了共 360 多种根据 NVIDIA GPU 的测试結果。
全新发布的测试数据显示,NVIDIA 是唯一一家对于大数据中心和边沿类型中的每一项测试都递交結果的企业,并在全部 MLPerf 工作中负荷中都展示出领跑的性能。
比如,在大数据中心基准测试中,NVIDIA A100 的性能主要表现相较 CPU 提升 17-314 倍,最新发布的 A10 和 A30 也展示出非常好的测试結果。
对比高通芯片 Cloud AI 100,NVIDIA A100 在 ResNet-50 和 SSD-Large 优化算法中都展示出高些的性能。
NVIDIA A100、Jetson 系列产品在边沿基准测试中展现了所有六类优化算法测试的結果。
除此之外,NVIDIA 还开拓性地应用 NVIDIA Ampere 构架的多案例 GPU 性能,在单一 GPU 上应用 7 个 MIG 案例,另外运作全部 7 项 MLPerf 线下测试。该配备完成了与单一 MIG 案例单独运作基本上同样(98%)的性能。
这种递交結果展现了 MIG 的性能和实用性。基础设施建设主管能够对于特殊运用,配备适度总数的 GPU 测算,进而让每一个大数据中心 GPU 都能充分发挥较大 的效应。
多种递交結果还根据 NVIDIA Triton 推理网络服务器。该推理网络服务器适用来源于全部关键架构的实体模型,可在 GPU 及 CPU 上运作,并对于批处理命令、即时和推流传送等不一样的查看种类开展了提升,能简单化在运用中布署 AI 的多元性,另外确保领跑的性能。
在配备非常的状况下,选用 Triton 的递交結果所做到的性能贴近于最优控制的 GPU 完成及 CPU 完成可以做到的性能。
二、A30 和 A10 今年夏天商业
NVIDIA 可以获得这般优异成绩,归功于 NVIDIA AI 服务平台的深度广度。
该 AI 服务平台包括各种类型的 GPU 及其经提升后能完成 AI 加快的全栈开发 NVIDIA 手机软件,包含 TensorRT 和 NVIDIA Triton 推理网络服务器。微软公司、Pinterest、Postmates、T-Mobile、USPS、手机微信等公司都布署了 NVIDIA AI 服务平台。
A30 和 A10 GPU 是 NVIDIA AI 服务平台中的全新组员。
A30 可以为国家标准网络服务器出示通用性的性能,适用普遍的 AI 推理和流行公司级测算工作中负荷,如推荐算法、会话式 AI 和人工智能算法。
A10 可加快深度神经网络推理、互动式3D渲染、辅助设计设计方案和云游戏平台,使公司可以根据通用性基础设施建设,为复合型 AI 和图型工作中负荷出示适用。根据选用 NVIDIA 虚似 GPU 手机软件,可改善管理方法,为室内设计师、技术工程师、艺术大师和生物学家常用的虚拟桌面提升使用率并健全配备。
NVIDIA Jetson 服务平台根据 NVIDIA Xavier 系统软件级控制模块,可在边沿出示网络服务器级的 AI 性能,助推智能机器人、健康医疗、零售等行业完成大量的自主创新运用。Jetson 根据 NVIDIA 的统一构架和 CUDA-X 手机软件局部变量,是唯一选用紧凑设计方案、可以运作全部边沿工作中负荷且功能损耗小于 30W 的服务平台。
以往 6 个月,NVIDIA 端到端 AI 服务平台在 MLPerf 的性能提高达 45%。
NVIDIA A100 GPU 配用于领跑网络服务器生产商的网络服务器、全部关键云服务供应商的云空间,及其 NVIDIA DGX 系统软件产品组合策略(包含 NVIDIA DGX Station A100、NVIDIA DGX A100 和 NVIDIA DGX SuperPOD)。
A30 和 A10(功能损耗各自为 165W 和 150W)预估将从今年夏天起用以各种网络服务器中,包含经严苛测试以保证在各种工作中负荷下均可完成高性能的 NVIDIA 认证管理系统。
NVIDIA Jetson AGX Xavier 和 Jetson Xavier NX 系统软件级控制模块已根据全世界代理商供应。
NVIDIA Triton 和 NVIDIA TensorRT 均可根据 NVIDIA 的手机软件文件目录 NGC 获得。
总结:MLPerf 参加者集中化于集成ic大型厂
整体看来,参加 MLPerf 基准测试的 AI 网络加速器关键来源于 NVIDIA、高通芯片、赛灵思等集成ic大佬,尤其是 NVIDIA GPU 基本上霸屏大数据中心及边沿的网络加速器一列,相对来说,大家甚少看到 AI 硬件配置新成立公司的影子。
NVIDIA 加快测算单位经理兼高级副总裁 Ian Buck 说:“NVIDIA 及合作方的侧重点不但取决于完成全世界领跑的 AI 性能,另外还重视根据将要投入市场的一系列配用 A30 和 A10 GPU 的公司级服务器来完成 AI 全民化。”
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com