训炼利用率超 80%:IBM 推 “全球首款”高能效 AI 芯片,7nm 制程

2 月 18 日报导,这届集成电路设计方案行业顶会 “国际性固体电源电路大会(ISSCC 2021)”已经进行中(2021 年 2 月 13 日到 22 日)。做为已有近 70 年历史时间的集成电路产学届盛典,ISSCC 2021 亦被很多生产商视作公布其领跑半导体技术的权威性演出舞台。

这届大会上,IBM 发布了据悉是 “全世界第一款”的高能效 AI 集成ic,该集成ic选用 7nm 工艺加工工艺可做到 80% 之上的训炼利用率和 60% 之上的逻辑推理利用率,而一般状况下,GPU 的利用率在 30% 下列。

训炼利用率超 80%:IBM 推 “全球首款”高能效 AI 芯片,7nm 制程

技术参数层面,IBM 新产品的计算相对密度高过一样选用 7nm 加工工艺的 NVIDIA A100 GPU;其在多种多样精密度下的整数金额计算特性,还好于MTK 7nm 专用型 AI 集成ic等商品。

据 IBM 官方网站共享,其最新款 7nm 高能效 AI 集成ic这款集成ic在多种多样情景中都有不错的应用前景,例如,可用以云计算平台自然环境中的节能型 AI 训炼、或用以完成更贴近边沿的云空间训炼等。

一、IBM 最新款高能效 AI 集成ic:能效比较高过 NVIDIA A100

比照数据显示,IBM 最新款 7nm 高能效 AI 集成ic的特性和能效,不一样水平地超过了 IBM 先前发布的 14nm 集成ic、韩研究院(KAIST)发布的 65nm 集成ic、阿里巴巴网集团旗下芯片公司平头哥发布的 12nm 集成ic含光 800、NVIDIA 发布的 7nm 集成ic A100、MTK发布的 7nm 集成ic。

IBM 最新款 7nm 高能效 AI 集成ic适用 fp8、fp16、fp32、int4、int2 混和精密度。

在 fp32 和 fp8 精密度下,IBM 最新款高能效 AI 集成ic的每秒钟浮点运算频次,各自做到 16TFLOPS 和 25.6TFLOPS;计算相对密度各自为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比各自为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精密度下,IBM 最新款高能效 AI 集成ic的计算相对密度各自为 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比各自为 16.5TOPS/W 和 8.9TOPS/W。

比照下,IBM 先前发布的 14nm 集成ic在 fp32 和 fp8 精密度下的每秒钟浮点运算频次,各自为 2TFLOPS 和 3TFLOPS;在在 fp32 精密度下的能效比为 1.4TFLOPS/W。

此外,在 7nm 集成ic势力中,NVIDIA A100 GPU 在 fp16 精密度下的能效比为 0.78TFLOPS/W,在 int4 精密度下的能效比为 3.12TOPS/W,均小于 IBM 最新款高能效 AI 集成ic。

训炼利用率超 80%:IBM 推 “全球首款”高能效 AI 芯片,7nm 制程

▲ IBM 最新款高能效 AI 集成ic与同行业的特性参数对比

二、选用 IBM 自研极低精密度训炼 / 逻辑推理设计方案

IBM 官方网站文章内容写到,其最新款 AI 集成ic往往可以兼具能效和特性,是由于该集成ic适用极低精密度混和 8 位浮点文件格式((HFP8,hybrid FP8)。它是 IBM 于 2019 年公布的一种高宽比可靠性设计,容许 AI 集成ic在低精密度下进行训练科目和不一样 AI 实体模型的逻辑推理每日任务,另外防止一切品质损害。

据了解,现阶段 IBM 将极低精密度混和 8 位浮点文件格式用以训炼、极低精密度混和 4 位浮点文件格式用以逻辑推理,并开发设计了数据通讯协议书,以提高多关键 AI 集成ic上不一样关键间的数据传输高效率。

据 IBM 官方网站文章内容,自 2015 年起,该企业每一年将集成ic的功能损耗特性提高 2.5 倍。这身后,IBM 着眼于完成优化算法、构架、手机软件局部变量等各层面的自主创新。

训炼利用率超 80%:IBM 推 “全球首款”高能效 AI 芯片,7nm 制程

▲ IBM 在低精密度 AI 训炼、逻辑推理层面的科学研究过程

除开选用极低精密度混和 8 位浮点文件格式外,IBM 最新款高能效 AI 集成ic加上了电池管理功能。IBM 科学研究表明,在同样输出功率的状况下,根据缓解测算环节的输出功率耗费,能够最大限度地提高集成ic特性。

总结:AI 发展趋势对集成ic耗能明确提出高些规定

伴随着智能化系统的浪潮风靡各行各业,AI 实体模型的多元性日趋提升 。相对地,AI 运用的能耗水准亦节节攀升。这一情况下,怎样最大限度提高能效,变成 AI ic设计游戏玩家们遭遇的关键出题。

IBM 根据选用极低精密度混和 8 位浮点文件格式和内嵌电池管理作用,为其最新款 AI 集成ic完成了业内领跑的高能效。可是,这一集成ic并未完成产业化批量生产,仍尚需销售市场检测。

© 版权声明
好牛新坐标
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com

相关文章