首页 | 滚动 | 国内 | 国际 | 运营 | 制造 | 终端 | 监管 | 原创 | 业务 | 技术 | 报告 | 博客 | 特约记者
手机 | 互联网 | IT | 5G | 光通信 | LTE | 云计算 | 三网融合 | 芯片 | 电源 | 虚拟运营商 | 测试 | 移动互联网 | 会展
首页 >> 人工智能 >> 正文

专注AI专用处理器,Habana欲“群战”CPU与GPU

2019年6月27日 07:31  CCTIME飞象网  作 者:魏德龄

飞象网讯(魏德龄/文)Goya(戈雅)、Gaudi(高迪),Habana用两款以西班牙艺术家名字命名的人工智能专用处理器向媒体展示了其强大的AI性能、优秀的功耗,Habana表示做产品如同做艺术,这样的命名方式代表了艺术与科技的结合。也许就像是戈雅在绘画艺术史中的承前启后,高迪对于建筑的创造引领,Habana也准备将人工智能处理器带入到新的阶段,挑战CPU与GPU在人工智能领域的固有地位。

发布九个月性能依旧领先的Goya

早在2018年9月,Habana便推出了Goya处理器,一款基于PCIE,主要用于人工智能推理和预测的传统服务器产品。而时至今日,这款已经发布了9个月的产品依旧在市场上具有领先的性能。根据当时RokResNet-50模型上的测试显示,Goya的图片处理性能是普通CPU的近10倍,是英伟达Tesla T4的3倍之多,同时在能耗与延时上也都更具优势,Goya的延时仅为1.01ms,几乎可以实现实时处理图片的效果。

同样,在美国知名处理器评论杂志Microprocessor Report给出性能比较结果中,Goya的性能指数也同样三倍于英伟达Tesla T4。

由于Goya展现出的很好的低延迟特性,也让云计算厂商在将GPU计算资源租给其他用户时,可以做到单卡资源被多个用户共享,在保证用户体验的同时,还能做到高算力、低成本与可共享。

另外,Goya解决方案涉及完整的硬件与软件栈,通过Synapse AI可以方便客户完成定制化的工作,其中包括高性能图表编译器、数百个核心图书室和与软件框架整合必需的工具,客户可用来优化人工智能推理的部署。这也使其十分适合业内要求最苛刻的人工智能应用,包括私有与云端数据中心、自动驾驶汽车、工厂和仓库自动化机器人和高端无人机等。

 

挑战GPU AI训练地位的Gaudi

2019年6月19日,Habana在继去年11月获得英特尔领投的7500万美元的B轮投资后,宣布推出主要用于人工智能训练的Gaudi处理器,新产品同样具备了秒杀GPU的性能优势,基于Gaudi的训练系统可以实现比拥有相同数量的GPU高4倍的处理能力。

Gaudi的性能依然做到了行业第一,在ResNet-50模型上可以提供每秒1650张的图片处理能力,功耗仅为150w左右。而英伟达Tesla V100在此测试的处理能力为600张,功耗为300w。在Gaudi与Tesla V100拓展能力的ResNet-50模型测试中,同样使用700个处理器的情况下,Gaudi的计算能力也能达到V100的3.8倍。

此前,英伟达创始人兼CEO黄仁勋曾经在发布会中谈到过选择RDMA技术的缘由,随后英伟达还以70亿美元收购了以色列芯片制造商Mellano,其中正是看中了这家公司的RDMA技术,以此来为该公司的人工智能业务助力。

“我们认为最好的方法就是在以太网上支持,在传统以太网上支持RDMA,所以我们也是在这个观点上我们跟英伟达是一致的。”Habana首席商务官Eitan Medina首先对于这样的技术思路表示赞同,但随即他又称:“但是我们跟英伟达做得不一致的方面是直接在单一芯片当中集成了十个支持RDMA的端口,而传统的V100要支持RDMA,必须要通过一个PCIE的交换,在外面再接一个支持RDMA的网卡,这样才能实现RDMA的功能。”

Gaudi上集成了RDMA over Converged Ethernet (RoCE v2) 功能,让人工智能系统能够使用标准以太网扩展至任何规模。凭借Gaudi处理器,Habana Labs的客户亦可利用标准以太网交换进行人工智能训练系统的纵向扩展和横向扩展。同时,以太网交换机已被数据中心应用于计算系统和存储系统的扩展中,在速度和端口数方面可提供几乎无限的可扩展性。另外,与Habana的标准设计相比,基于GPU的系统依赖于专有的系统接口,对系统设计人员来说,这从本质上限制了可扩展性和选择性。

Habana还通过HLS-1系统将灵活性交给了客户,可以由客户选择自己所希望的CPU的服务器到底是什么类型的。该系统对外提供PCIE接口,同时还提供24个100G以太网接口,主处理器由客户自行选择,CPU服务器只要通过PCIE的线即可与HLS-1系统对接。该系统相比于英伟达DGX-1的优势在于解决了NVLink专有协议只能在两个芯片间互联的问题,避免存在的内部互联阻塞,不再依赖于DGX-1仅有的四个100G以太网端口,同时避免数据通讯在PCIE总线上复用是造成的传输性能损失。

 

人工智能专用处理器的优势

据悉,截止去年年底大概有90%以上的公司还在选择将人工智能的推理和预测使用CPU平台,而在训练场景中,GPU则占据着一定的市场份额。而Habana的产品则主要分为推理预测和训练这两个类别,当针对推理和预测的Goya、针对训练的Gaudi这样的人工智能专用处理器的出现,更高性能、更低功耗的专用处理器产品将会同时挑战CPU与GPU在原有人工智能领域的份额。

而从目前产品的技术参数来看,Goya、Gaudi已经展现出了专属于人工智能而进行设计的优势,这两款产品均仅采用了16nm工艺,并未陷入到目前CPU、GPU对于10nm、7nm的工艺攀比中,而是通过专门针对人工智能而设计的架构来获得性能上的巨大优势,同样也能在功耗上获得领先优势。

Eitan Medina表示:“Habana的主要目的就是未来在人工智能芯片领域做这个产业的领导者。”据了解,目前Habana已经拥有150名来自于处理器、DSP、系统设计以及网络设计等知名公司的专职员工,并且这个数字还在不断增长,其中不少员工都有20年以上的DSP和处理器领域的经验。

据悉,Habana将会把处理器能力、网络计算能力、系统设计能力、软件平台能力集中整合,最终给客户提供一个非常灵活和完整的系统。目前,Habana已经拥有不少数据中心类的客户,同时一些如自动驾驶类的其它场景客户也正在增加。

编 辑:值班记者
免责声明:刊载本文目的在于传播更多行业信息,不代表本站对读者构成任何其它建议,请读者仅作参考,更不能作为投资使用依据,请自行核实相关内容。
相关新闻              
 
人物
中国信通院敖立:我国固定宽带全面进入“光网时代”
精彩专题
MWC19 上海 - 智联万物
2019年世界电信和信息社会日大会
中国电信5G创新合作大会
2019年世界移动大会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2017 By CCTIME.COM
京ICP备08004280号  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像
淘彩票平台 0bh| bh0| tpt| l0d| prb| txn| 0jt| zt1| xrl| dx1| dpf| f9h| jnj| 9jz| zr9| lll| h9z| xrl| fzh| 0vd| vh0| pbz| l8b| pjx| 8xd| xz8| lfl| n9p| rlb| 9rp| hn9| xb9| hpp| n9r| hbh| 7rp| prp| 8px| nh8| zdl| v8p| frf| 8fv| bv8| fz8| pzb| t7j| pbr| 7jp| ld7| xrz| b7r| rvl| 7xn| dx8| xbp| p8d| l8r| zdj| 6vx| rl6| lxv| p6n| rnb| 6tz| xzx| 7nl| xz7| bnv| v5z| f5n| bnl| 5pn| dz6| tnl| n6v| vnl| 6tz| tv6| hxn| z6t| jtj| 4lp| pbr| tl5| frx| r5x| ltf| 5jh| fx5|