行业资讯-手机报

阿里发布全球性能最高AI推理芯片,比传统GPU算力,性价比提升100%

手机报在线 2019-09-25 14:57
阿里巴巴 2019云栖大会 AI推理芯片 含光800AI芯片 阅读(11159)
导语目前,含光800已应用在阿里巴巴内部核心业务中,在杭州城市大脑中实时处理杭州主城区交通视频需要40颗传统GPU,延时为300ms,而使用含光800仅需4颗,延时降至150ms。
   9月25日上午消息,“2019云栖大会”在杭州开幕。阿里巴巴集团CTO兼阿里云智能总裁张建锋在演讲中表示,在阿里巴巴看来,数字化升级需要具备四大关键技术:可靠易用的云、全局智能的大数据、云端一体的智联网和随时随地的移动协同。同时,阿里巴巴发布含光800AI芯片,称系全球最高性能AI推理芯片。
 
阿里发布全球性能最高AI推理芯片
 
  “这是互联网公司研发的第一款芯片,这是万里长征第一步”,张建锋称,阿里巴巴有足够的能力去做传统公司的事情,“我们用一年半时间,就完成了芯片的制作。所以,阿里巴巴将成为软硬件一体化协同发展的公司”。
 
  张建锋称,含光800芯片在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,“一个含光800的算力相当于10个GPU”。
阿里发布全球性能最高AI推理芯片
  目前,含光800已应用在阿里巴巴内部核心业务中,在杭州城市大脑中实时处理杭州主城区交通视频需要40颗传统GPU,延时为300ms,而使用含光800仅需4颗,延时降至150ms。
 
  在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。在硬件层面含光800采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
 
  含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
 
  含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。
分享到
下一篇:性能旗舰标配UFS 3.0 iQOO Pro写入速度提升110%