“这是互联网公司研发的第一款芯片,这是万里长征第一步”,张建锋称,阿里巴巴有足够的能力去做传统公司的事情,“我们用一年半时间,就完成了芯片的制作。所以,阿里巴巴将成为软硬件一体化协同发展的公司”。
张建锋称,含光800芯片在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,“一个含光800的算力相当于10个GPU”。
目前,含光800已应用在阿里巴巴内部核心业务中,在杭州城市大脑中实时处理杭州主城区交通视频需要40颗传统GPU,延时为300ms,而使用含光800仅需4颗,延时降至150ms。
在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。在硬件层面含光800采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。