Habana Labs宣布推出Gaudi人工智能训练处理器
行业领先的人工智能处理器开发商HabanaLabs(www.habana.ai)宣布推出HabanaGaudi™人工智能训练处理器,基于Gaudi的训练系统实现了比拥有相同数量的GPU系统高四倍的处理能力。
Gaudi™处理器的创新架构可实现训练系统性能的近线性扩展,即使是在较小BatchSize的情况下,也能保持高计算力。因此,基于Gaudi™处理器的训练性能可实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。
除了领先的性能,Gaudi™处理器还为人工智能训练带来了另一项“行业第一”。该人工智能处理器片上集成了RDMAoverConvergedEthernet(RoCEv2)功能,从而让人工智能系统能够使用标准以太网扩展至任何规模。凭借Gaudi™处理器,HabanaLabs的客户亦可利用标准以太网交换进行人工智能训练系统的纵向扩展和横向扩展。同时,以太网交换机已被数据中心应用于计算系统和存储系统的扩展中,在速度和端口数方面可提供几乎无限的可扩展性。另外,与Habana的标准设计相比,基于GPU的系统依赖于专有的系统接口,对系统设计人员来说,这从本质上限制了可扩展性和选择性。
Linley集团首席分析师LinleyGwennap评论说:“HabanaLabs推出新产品,其产品组合迅速地从推理处理器扩展到训练处理器,涵盖了神经网络的所有功能。在众多的人工智能训练加速器产品中,Gaudi™处理器能够提供强大的性能,达到行业领先的能效水平。作为首款集成100G以太网链路并支持RoCE的人工智能处理器,Gaudi™为使用行业标准组件构建而成的大型加速器集群提供了强大的支持。”
Gaudi™人工智能训练处理器配备32GBHBM-2内存,目前提供两种规格:•HL-200-PCIe卡,设有8个100Gb以太网端口;•HL-205-基于OCP-OAM标准的子卡,设有10个100Gb以太网端口或20个50Gb以太网端口。
另外,Habana推出了一款名为HLS-1的8-Gaudi系统,配备了8个HL-205子卡、PCIe外部主机连接器和24个用于连接现有以太网交换机的100Gbps以太网端口,让客户能够通过在19英寸标准机柜中部署多个HLS-1系统实现性能扩展。
Gaudi™处理器是HabanaLabs继去年推出Goya™人工智能推理处理器后的第二款人工智能专用处理器。Goya™处理器自2018年第四季度开始发货,并向业界展示了领先的推理性能,可实现业界最高的吞吐量、功效比(图片/每秒瓦)以及实时。
HabanaLabs首席执行官DavidDahan表示:“人工智能模型训练所需的计算能力每年呈指数增长。因此,提高生产率和可扩展性,解决数据中心和云计算对计算能力的迫切需求成为至关重要的任务。凭借Gaudi™处理器的创新架构,HabanaLabs带来了业界最高的性能,同时集成了标准以太网,进而实现无限可扩展性。Gaudi™处理器将打破人工智能训练处理器领域的现状。”
Facebook技术和战略总监VijayRao表示:“Facebook正在寻找开放的平台以进行行业创新融合。我们很高兴看到HabanaLabs的Goya™人工智能推理处理器为Glow机器学习编译器实现后端开源,并且Gaudi™人工智能训练处理器采用OCP加速器模块(OAM)规范。”
Gaudi™是一款完全可编程且可定制的处理器,搭载第二代Tensor处理核(TPC™)并集成开发工具、库和编译器,共同提供全面而灵活的解决方案。此外,HabanaLabs的SynapseAI™软件栈包含一个丰富的内核库和开放工具链,以供客户添加专有内核。
HabanaLabs将于2019年下半年面向特定客户提供Gaudi™人工智能训练处理器的样品。
天玑还是骁龙玩游戏到底该选谁
0分享至在紧张忙碌的学习工作结束,或是休息片刻的闲暇之余,很多人会选择打开手机,独自或是与好友一起开黑,玩上几局游戏,放松一下心情也助于排解压力。作为一个90后,以前在那个用bb机联络,手机也刚刚进入大众视野的时代。电子游戏大多只能在电脑和主机上进行游玩,手机上一般也只有经典的贪吃蛇可供消遣。而随着科技的进步,芯片半导体的飞速发展。如今在小小的手机上,也可以感受画面精致,操作感十足的游戏大作。随时随地都能获得游戏带来的乐趣。而现在的手机游戏的画面表现力也越来越精细,越来越真实了。以前只能出现在电脑和主机上的超高画质,现在可以在手机上进行实时演算、渲染,展现在我们眼前。这就要得益于手机的大脑——处理器芯片的强大运算能力了。怎样才能算是一台合格的“游戏手机”?一台手机到底适不适合玩游戏,小编认为要从以下几点来考察。首先是性能,一台手机要拥有强劲的性能,才能带动游戏中精致、真实的视觉效果和画面表现。多年以来,性能强劲的代名词一直是高通骁龙,提到高通骁龙就意味着这台手机性能可以完全放心,但最近几年高通处理器的功耗似乎有些翻车。例如搭载高通骁龙888、8Gen1的手机由于功耗过高,引起发热严重,被网友调侃戏称为炎龙炽龙爆裂龙。严肃地说,这也让高通的市场份额一步一步下降。而联发科在最近几年进步神速,逐渐追平甚至有赶超高通骁龙处理器性能的趋势。2022年上半年,联发科在手机处理器市场份额超过40%,稳居第一。而苹果也是在手机上继续使用自家A系芯片,M1系列芯片确实强大,但目前还没有在手机上搭载。华为自研的海思麒麟处理器由于不可抗力,麒麟9000的存货用完,华为就只能使用其他芯片。三星猎户座系列处理器和国产的紫光展锐系列处理器的市场占有率还偏低,且性能也无法与高通的联发科的旗舰处理器相比。于是随着芯片性能高涨,发热量也不可避免地激增。如果散热能力差,再高的性能也会因为热量的堆积,导致处理器降频,游戏画面锁帧,大大降低了游戏体验。第三就是屏幕,一块优秀的屏幕可以在游玩过程中带来更好的观感体验。比如更高的屏幕亮度可以无论在室内还是室外,都能轻松看清屏幕。高刷新率可以在一秒内显示的画面细节更多,可以更快反应到对手下一步的动作,更快一步,就离胜利更进一步。第四我认为是跟手度,也就是触控屏幕的采样率。采样率越高,手指触摸屏幕的操作指令就会越快地进行响应。人的潜力是无穷无尽的,一些游戏大神们的反应速度是非常快的,一些精湛的游戏操作,往往需要超快的反应时间,伴随手指的快速操作,手机屏幕也需要做到操作跟手,指哪打哪。最后就是一些周边配置,比如针对特定游戏场景的屏幕压感,物理肩键,模仿现实物理法则的线性震动马达,以及保证音质与真实游戏场景中的双扬声器,有了这些周边配置,游戏体验会更上一层楼。那么这些方面,就大概是我们用来考察一款手机究竟适不适合玩游戏的指标了,接下来我们选用几台当下处理器型号各不相同,但都要么是旗舰,要么是游戏性能为主要卖点的手机进行游戏测试。看看谁才是真正的游戏神机。实战来比拼,高温环境三款手机表现差距竟如此之大我们选择现有的不同芯片平台的手机,分别是首发天玑8100的RedmiK50;搭载全新一代骁龙8,专为游戏优化的iQOONeo6;与首发天玑8000-Max的千元游戏手机OPPOK10。而天玑8000-Max与天玑8100对比差距不大。首先两者的架构完全一样,都是台积电5nm工艺,4颗A78大核+4颗A55小核的八核CPU,Mali-G610Mc6GPU。区别在于天玑8100的CPU大核主频高0.1Ghz,两者差距不大。但是GPU频率高了20%,理论上GPU性能要强20%。除去处理器的选用差别,三台手机都支持双扬声器,都采用了目前手机端最高配置的LPDDR5的内存与UFS3.1的储存规格,都使用了X轴线性马达,但实际体验差距不小,这个后面会详细体验。其中RedmiK50采用了三星2K柔性直屏,iQOONeo6为三星1080P硬屏,OPPOK10为天马1080PLCD材质屏幕。屏幕采样率方面OPPOK10支持240Hz采样率,RedmiK50为480hz,而iQOONeo6为360Hz,但瞬时采样率最高可达1200Hz且支持屏幕压感。所以从跟手程度来说,K50和iQOONeo6应该更为优秀。至于散热配置,iQOONeo6采用了叠瀑稀土散热,六层立体石墨配合46662mm2VC液冷散热应该会有不错的效果。RedmiK50采用与K50电竞版相同规格的不锈钢VC均热板,面积高达3950mm2,搭配七层石墨立体均温。而在三台手机中价格最低的OPPOK10采用了金刚石散热材质+高密度石墨片+超大VC液冷。听起来好像都很厉害,但实际表现还是要实测说的算。三台手机在室温25℃使用安兔兔跑分如图:搭载骁龙8Gen1的iQOONeo6跑分最高,接近98万。搭载天玑8100的K50甚至比搭载天玑8000-Max的OPPOK10分数低了几千分,这种情况应该是因为为OPPOK10的散热和性能调度要比RedmiK50更强更激进一些。其中iQOONeo6在跑分时温度上升最高达9℃,OPPOK10与RedmiK50上升5℃左右。而iQOONeo6相比另外两台手机电池较小,三台手机跑分的电量消耗还是差不多的。接下来是重头戏,三款手机在高温环境下的游戏性能稳定性测试。如今已经5月,正值初夏,但是南方一些城市气温已经达到了30多度。为了保护手机硬件不过热导致损伤,手机在运行大型游戏时产生的高温会触发温控墙,导致锁核锁帧,游戏体验大大下降。这样就只能靠使用更强的散热技术,在性能与温度之间取舍,或者是采用更激进的性能释放。每个手机品牌和型号的方案不同,我们来实际体验三款游戏。它们分别是《王者荣耀》《和平精英》和《原神》,室温控制在26度左右。RedmiK50开启性能模式,iQOONeo6开启性能怪兽模式,OPPOK10则同时开启电竞模式和极限稳帧。首先是王者荣耀的测试,iQOONeo6与RedmiK50支持120帧,OPPOK10只支持到90帧,三台手机均开启超高分辨率,超高画质与特效,开启水面反射。一局游戏帧数表现如下:RedmiK50与iQOONeo6的帧率稳定在120帧,有几次两台手机会有掉到90多帧100帧左右的情况,但实际体验没有卡顿的感觉,而90帧《王者荣耀》对于OPPOK10就更没有压力了,笔直一条直线。《王者荣耀》对这三台手机来说是轻轻松松。而且三款手机都十分跟手,没有出现过操作延迟,按下去没反应的问题,看来采样率方面,OPPOK10的240Hz也够用了。三台手机的机身前后温度也都比较凉爽,三款手机最高温度相差几乎不超过1℃,其中RedmiK50温度相对最低。(iQOONeo6)(OPPOK10)(RedmiK50)然后是和平精英的游戏测试,iQOONeo6和RedmiK50均支持HDR高清60帧,而OPPOK10只支持流畅画质90帧,相比之下,更高的画质加上60帧对手机的压力稍大些,所以iQOONeo6与RedmiK50选择HDR高清60帧进行测试:iQOONeo6与RedmiK50两台手机的表现都十分优秀,都只有一次掉帧到56、55帧,平均帧数都达到了58帧以上。OPPOK10在十分钟时开始降频锁帧,帧数一步一步下降到最后84帧,与90帧的流畅度相差不大,很难察觉到卡顿。目前看来三台手机都毫无压力。而三款手机的机身温度出现了一定的差异,如下图所示:(iQOONeo6)(OPPOK10)(RedmiK50)RedmiK50的温度依旧是最低的,而iQOONeo6和OPPOK10的正面与背面温度都要比K50高了1℃到2℃。可以看出RedmiK50对《和平精英》的性能调度优化做的还是非常不错的,而另外两台手机也不差,只是温度稍高一些。而接下来的《原神》测试,才是这次测试的重头戏,《原神》对手机的性能与散热有着十分大的考验,目前只有少部分游戏手机才能做到《原神》不卡、掉帧少、机身温度较低。那这三款手机的高温《原神》表现如何呢?三款手机全部开启高画质,动态模糊设置为低,开启TAA抗锯齿。直接说结论:三款手机的帧率表现非常出乎意料,甚至可以说是参差不齐。但三款手机都没有出现降亮度与降分辨率的问题,这点看来大家都有进步。首先是RedmiK50,艰难维持60帧坚持了5分半,后5分钟锁定为54帧但依然有很大波动。十分钟后到半小时帧率图有如心电图,几乎是不能玩的程度,掉帧多到很难坚持游玩下去,机身最高温度达到了46度,且发热区域集中在前后摄像头部分,手感已经非常烫了。然后是iQOONeo6,前3分半钟稳定60帧,但有一次非常大的掉帧,是在首次加载地图的时候,持续掉帧的时间也较长。之后发热导致锁帧,直到最后都锁在了55帧左右,但游戏体验也称不上优秀。除去3分半的稳定流畅时间,剩下的26分钟大小掉帧不断,多次掉帧到40帧出头,以及较长时间的50帧左右波动,使得游玩体验非常不稳定,但和RedmiK50相比,终于算能玩了。机身最高温度45度左右,表现还可以。最后是OPPOK10,把K10留到最后分析,也是因为这次OPPOK10的表现非常优秀,之前在空调23.5℃的室温下,前8分钟稳定60帧运行,之后22分钟都持续稳定在52帧,用相对稍低一些的帧数换来了持续流畅的游戏体验。而这次K10在这次高温环境下体验依旧相当不错,前5分钟稳定60帧运行,之后发热锁帧至51帧,一段时间锁在48帧后又回到了51帧,整体帧数虽然比iQOONeo6低了一些,但是胜在更加稳定。温度方面有一些小细节,OPPOK10的机身正面与背面,发热最高的区域正好避开了手指接触的地方,虽然RedmiK50温度最低,但发热严重的区域,都正好处在手指接触的区域,手感甚至更热。结合实际的游戏体验来看,我更愿意在OPPOK10上玩《原神》。经过这次的三款不同处理器的手机,在夏日高温下的游戏性能测试。可以看出目前无论是跑分百万的旗舰骁龙处理器,还是中高端的天玑处理器,在面对强大性能压力的游戏,且气温较高的环境下,性能都是够用的,更好的散热和性能释放才是更需要改善的问题。“道阻且长,行则将至”,未来手机的性能不出意外的话,会随着科技进步越来越高,但在性能提高的同时,降低功耗使性能与功耗兼顾的解决办法,会是一条蜿蜒曲折的探索之路,且等科技领域的持续创新,更多让人意想不到的惊喜吧。特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.
/阅读下一篇/返回网易首页下载网易新闻客户端