本篇文章给各位网友带来的资讯是:寒武纪发布新款 AI 训练卡 MLU370-X8:7nm 工艺,48GB LPDDR5 内存 详情请欣赏下文
IT大王 3 月 21 日消息,据寒武纪官方消息,寒武纪今天正式发布新款训练加速卡 MLU370-X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU-Link 多芯互联技术,主要面向训练任务。
寒武纪表示,在业界应用广泛的 YOLOv3、Transformer 等训练任务中,8 卡计算系统的并行性能平均达到 350W RTX GPU 的 155%。
IT大王了解到,MLU370-X8 采用了 7nm 工艺,配备 48GB LPDDR5 内存,FP32 单精度浮点性能达到 24 TFLOPS。
据介绍,MLU370-X8 智能加速卡提供 250W 最大训练功耗,可充分发挥 AI 训练加速中常见的 FP32、FP16 或 BF16 计算性能。寒武纪首次将双芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,提供了两倍于标准思元 370 加速卡的内存、编解码资源,同时搭载 MLU-Link™多芯互联技术。
MLU370-X8 智能加速卡支持 MLU-Link™多芯互联技术,提供卡内及卡间互联功能。寒武纪为多卡系统专门设计了 MLU-Link 桥接卡,可实现 4 张加速卡为一组的 8 颗思元 370 芯片全互联,每张加速卡可获得 200GB / s 的通讯吞吐性能,带宽为 PCIe 4.0 的 3.1 倍,可高效执行多芯多卡训练和分布式推理任务。
▲ MLU370-X8 单机 8 卡部署配置
© 版权声明
文章版权归作者所有,未经允许请勿转载。
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com