被美国禁售的A100和H100,MI250人工智能芯片能干啥
在我们熟悉的自动驾驶方面,打个比方,现在我们不是常说自动驾驶算法重要,算法重要的的核心地方是数据量重要,因为海量数据的训练才能让算法更加精准;那么海量数据的快速准确处理学习的时候,这种超算的GPU就能大显身手了。开个玩笑,假如这个时候国内哪家跳出来这个禁令严重影响自己的自动驾驶开发,说明他家自动驾驶就是领先的。
另外我们常说的车路协同,其中路端需要使用就是这些数据处理中心,路端传感器接收到的海量数据,需要数据中心的处理才能有明确的信息,才能指挥路段的协作。
最后现在比较流行的说法“数字孪生(digitaltwin)”,也就是说所有的现实数据,传输到数据中心进行处理,虚拟仿真,进行预测和优化。打个最流行的比方吧,当前的新冠疫情,假设所有的疫情数据例如感染时间,地点,病情,治疗情况,医院情况等等信息进入超算中心,超算中心可以模拟出疫情发展,那么可以测算出各种疫情处理的方法,而不是各种砖家,领导瞎逼逼了。当然在疫情刚开始的时候我的文章《受新冠疫情影响-全球汽车厂暂时关闭工厂潮涌现》中借用的图片就是美国著名霍普金斯大学的大数据图,所以有可能美国人已经数字孪生一遍了。
当然随着万物互联,各方数据的集合处理都离不开数据超算中心,例如医疗诊断设备的片子可以大数据处理用来AI诊疗等等,所以这些超算芯片与我们生活息息相关,而不是停留在科学世界里面。
人工智能芯片明明是硬件,和软件又有什么关系
对于人工智能芯片产业来说,仅有好的硬基础是不够的,在硬基础上再做出好的软件,才能做得更好。”在日前举行的“2019中国AI芯片创新者大会”上,中国信息通信研究院云计算与大数据研究所人工智能部副主任王蕴韬强调说。
记者随后采访了中科院半导体所类脑计算研究中心副主任龚国良,他也表示,人工智能芯片产业的发展确实应该注重软硬件协同。
软件是人工智能芯片的灵魂
“国内人工智能芯片的硬件设计水平与国外接近,但软件生态却是薄弱环节。”龚国良告诉记者。
人工智能芯片明明是硬件,和软件又有什么关系?
龚国良介绍,人工智能芯片本身只起到加速的作用。除了少量定制化人工智能芯片具备一定功能外,大多数人工智能芯片本身并不具备功能,它们的功能必须结合相关软件来实现。
算法是软件的重要组成部分,它相当于人工智能芯片的灵魂。除了算法本身,软件层面还包括算法的移植、芯片驱动程序、配套软件工具、人机交互界面等等。这就像电脑不仅仅需要好的处理器,还需要好的操作系统一样。
龚国良介绍,在人工智能芯片涉及的软件领域,国内的算法开发平台仍比较少,一些已有算法开发平台,在人机交互与资源管理方面,与国外相比仍有一定差距。另外,一些前瞻性人工智能芯片的核心算法、核心架构,还有待提升。
“软件和使用侧结合得更多。人工智能芯片的硬件固然重要,但是如果软件做得好,可能更胜一筹。”王蕴韬介绍,一些非常厉害的算法团队和软件团队,甚至可以在十分普通的芯片上,实现神经网络加速芯片的加速效果。
软硬结合才能避免尴尬局面
对于国内人工智能芯片产业而言,软硬件匹配度不够好的情况并不罕见。
“很多人工智能芯片在设计之初的想法是很好的,但是上市后却发现用户不太买账,软件环节做得不够好可能是原因之一。”龚国良告诉科技日报记者。
以算法为例,用户的“美好理想”一般是,利用算法开发平台把算法训练出来后,只需进行傻瓜式移植,就能将其应用在人工智能芯片上,产品随之迅速出炉。但实际情况是,算法移植到人工智能芯片时需要进行硬件化改造,让它适应芯片的硬件。
“这个环节需要花费很大的精力,要么应用方来做,要么芯片的设计方来做。”龚国良说,目前芯片研发团队大多是硬件出身,在软件支持方面花费的精力相对较少,重视程度依然不足。
在王蕴韬看来,把真正好的算法,落地到人工智能芯片硬件中,需要进一步实现软硬件协同发展,而这一领域还存在非常大的市场空间。
科技日报记者了解到,在人工智能芯片软硬件协同方面,国内的大公司一般做得比较好。因为软件方面例如算法的移植和人工智能芯片的驱动,实现起来有一定难度,需要专门的团队去研发。
对于提升人工智能芯片的软硬件协同发展,龚国良认为,应结合人工智能芯片产品的定位选择不同策略。
“如果人工智能芯片面向的应用场景比较窄,那么在硬件做好的基础上,设计一些软件工具就可以实现应用。但如果是通用型人工智能芯片,支撑的算法范围非常宽泛的话,就需要很好的软件团队与之匹配,否则就会导致芯片的硬件很强大,用户却不买账的尴尬局面。”龚国良建议。