智能时代的三要素——数据、算法和算力
近几年,人工智能技术和应用飞速发展,在我们生活和工作中都得到大量的普及应用,归功于推动人工智能发展的三大要素:数据、算法和算力。
这三个要素缺一不可,相互促进、相互支撑,是智能技术创造价值和取得成功的必备条件。
数据
在人类发明史上,很多发明都是从模仿
动物开始的,比如,模仿鸟类来实现人类的飞行梦想。历史上记载有各种关于模仿鸟类飞行的故事,当然,结果是可想而知的,肯定都以失败告终。我们把使用这种方法论的人统称为“飞鸟派”。
早期研究人工智能的基本上都是“飞鸟派”,因为他们认为计算机要获得智能必须模仿人的思维模式。比如说当时的语音识别研究,几乎所有的专家都把精力投入到教会计算机理解人类的语言上,研究也是进展缓慢。
上世纪70年代初,美国康奈尔大学贾里尼克教授在做语音识别研究时另辟蹊径,换了个角度思考问题:他将大量的数据输入计算机里,让计算机进行快速的匹配,通过大数据来提高语音识别率。于是复杂的智能问题转换成了简单的统计问题,处理统计数据正是计算机的强项。
从此,学术界开始意识到,让计算机获得智能的钥匙其实是大数据。
数据对于人工智能,就如食材对于美味菜肴,人工智能的智能都蕴含在大数据中。因为人工智能的根基是训练,就如同人类如果要获取一定的技能,必须经过不断地训练才能获得,而且有“熟能生巧、巧能生仙”之说。
人工智能也是如此。只有经过大量的训练,才能总结出规律,应用到新的样本上。如果现实中出现了训练集中从未有过的场景,人工智能则会基本处于瞎猜状态,正确率可想而知。对于人工智能而言,大量的数据太重要了,而且需要覆盖各种可能的场景,这样才能得到一个表现得更智能的模型。
当前的时代,无时无刻不在产生大数据。人手一部的手机、无处不在的摄像头和传感器等设备都在产生和积累着数据,这些数据形式多样化,大部分都是非结构化数据。
这些大数据需要进行大量的预处理过程(特征化、标量化、向量化),处理后的数据才能为人工智能算法所用。
算法
传统的对象识别模式是由研究人员事先将对象抽象成一个模型,再用算法把模型表达出来并输入计算机。这种人工抽象的方法具有非常大的局限性,识别率也很低。
幸运的是,科学家从婴儿身上得到了启发。没有人教过婴儿怎么“看”,都是孩子自己从真实世界自学的。如果把孩子的眼睛当作是一台生物照相机的话,那这台相机平均每200毫秒就拍一张照——这是眼球转动一次的平均时间。到孩子3岁的时候,这台生物相机已经拍摄过上亿张真实世界照片。
这给科学家很好的启发:能不能给计算机看非常非常多猫的图片,让计算机自己抽象出猫的特征,自己去理解什么是猫。
这种方法被称为机器学习。谷歌就采用这种机器学习方法开发出了猫脸识别系统,而且准确度非常高。
机器学习除了在对象识别领域外,在其他领域也得到了广泛使用,并取得了令人刮目相看的诸多成果。在机器学习算法的推动下,搜索引擎、语音识别、自然语言处理、图像识别、推荐系统、专家系统和无人驾驶等领域取得了长足进步,机器智能水平有了极大的提升。
当前,机器学习算法是主流算法,是一类从数据分析中获得规律,并利用规律对未知数据进行预测的算法。机器学习算法主要分为传统的机器学习算法和神经网络算法,神经网络算法快速发展,其中最热门的分支当属深度学习,近年来深度学习的发展达到了高潮。
算法对于人工智能,就是厨师(烹饪的方法)与美味菜肴的关系。算法是实现人工智能的根本途径,是挖掘数据智能的有效方法。
算力
算力也就是计算能力,算力对于人工智能,如同厨房的煤气/电力/柴火对于美味佳肴一样。有了大数据和算法之后,需要进行训练,不断地训练,算力为人工智能提供了基本的计算能力的支撑,本质是一种基础设施的支撑。
AI中有一个术语叫Epoch,一个Epoch就是所有训练样本在神经网络中都进行一次正向传播和一次反向传播,再通俗一点,一个Epoch就是将所有训练样本训练一次的过程。
只把训练集从头到尾训练一遍神经网络是学不好的,而是要将完整的数据集在同样的神经网络中传递多次,把训练集翻过来、调过去训练多少轮。就像和小孩讲一个道理,一遍肯定学不会,必须一遍一遍反复地教,一遍就会那就是神童了。
有了大数据和先进的算法,还得有处理大数据和执行先进算法的计算能力。每个智能系统背后都有一套强大的硬件或者软件计算系统。
超级计算机是一个国家科技发展水平和综合国力的反映。没有超级计算机,天气预报不可能预报15天,中国的大飞机研制不可能进展如此之快。另外,核武器的爆炸模拟、地震预警、抗击新冠肺炎药物研发等领域也离不开超级计算机。
目前世界运算速度排第三位的超级计算机是中国的神威太湖之光,峰值性能达每秒12.5亿亿次,运算速度相当于普通家用电脑的200万倍,神威太湖之光一分钟的运算量需要全球72亿人用计算器不间断运算32年。
人工智能的发展对算力提出了更高的要求。除了训练,人工智能算法实际需要运行在硬件上,也需要推理,这些都需要算力的支撑。然而,能提供超强计算能力的超级计算机,价格也是超级昂贵,不是一般人都能使用得到的。
目前的人工智能算力主要是由专有的AI硬件芯片,以及提供超级计算能力的公有云计算服务来提供。其中GPU领先其他芯片在人工智能领域中用的最广泛,GPU有更高的并行度、更高的单机计算峰值、更高的计算效率。
一般来说,GPU浮点计算的能力是CPU的10倍左右。另外,深度学习加速框架通过在GPU之上进行优化,再次提升了GPU的计算性能,有利于加速神经网络的计算。
云计算是计算能力的放大器。云计算是一种基于互联网的分布式超级计算模式。在远程的数据中心里,成千上万台服务器等计算设备连接起来组成一个云,协同计算。云中的单个计算机性能可能非常一般,甚至就是普通电脑,但是很多一般加在一起的计算能力却不容小觑。
将GPU和FPGA的计算能力部署在云端对外提供云服务意味着优势的进一步放大。云计算甚至可以让你体验每秒10万亿次的运算速度,计算能力堪比超级计算机。俗话说得好,三个臭皮匠顶个诸葛亮、聚沙成塔、集腋成裘。
当前,随着人工智能算法模型的复杂度和精度愈来愈高,互联网和物联网产生的数据呈几何倍数增长,在数据规模和算法模型的双层叠加下,人工智能对算力的需求越来越大。
毫无疑问,人工智能走向深度学习,计算力已成为评价人工智能研究成本的重要指标。可以说,计算力即是生产力。
从智能时代的三个要素来看,我们也可以进一步解析出云计算、大数据和人工智能之间的关系。为了简化和帮助理解,以炒菜这个应用场景为例来说明它们之间的关系:
大数据相当于炒菜需要的食材,也就是生产原料。云计算等算力就相当于炒菜需要的煤气/电力/柴火,人工智能算法就相当于烹饪的方法,算法和算力也就是产生动力的生产引擎。有了生产原料和生产引擎,就可以在不同的应用场景下生产出我们所需要的不同东西。
2006年Hinton教授等人提出了深度学习算法,实现了人工智能算法理论的创新突破;随着移动互联网的生活化普及,促进了AI发展的“大数据”产生;大数据和深度学习等算法的双剑合璧,再配合摩尔定律下的算力快速提升---大数据、算力、算法作为输入,从技术角度推动了人工智能的发展。只有在实际的场景中进行输出,才能体现出人工智能的实际价值。
人工智能的常见应用场景包括:自动驾驶、虚拟助理、金融服务、医疗和诊断、设计和艺术创作、合同诉讼等法律实务、社交陪伴、服务业和工业。应用场景的不同决定了人工智能的应用落地和效果。同样是物流分拣中心,规模不同、信息化基础不同、企业数据不同、人员素质不同,对人工智能的要求和所发挥的效益也自然不同了。
人工智能发展到如今还是一个被大数据喂养起来的小怪兽,而且在深度学习算法没有明显突破的情况下,人工智能实现自我学习能力看起来还遥遥无期。因此,AI对人类的替代性以及威胁,还远没有达到让人类担忧的地步,当前大家探讨最多的还是人工智能在各个领域的应用。
(本文作者系纽约大学计算机博士,对外经济贸易大学产业经济博士后,中国电子学会云计算专家委员会委员,中国通信学会云计算专家委员会委员,教育部战略研究中心云计算首席科学家,武汉纺织大学云计算与大数据研究中心主任。主要从事云计算技术、基于云计算的物联网、移动互联网、大数据等技术及应用、软件安全与云安全等新一代信息技术研究。)
人工智能的三大要素:算法、硬件、数据缺一不可
“2019全球创投峰会”于2019年8月28-30日在西安召开,盛邀全球创投头部力量,解析政策趋势、聚焦投资策略、探索价值发现、前瞻市场未来。这场汇集万亿资本的行业盛宴,为全球资本共享中国机遇,为推动全球创投行业的发展皆带来深远的影响。
会上,联想创投董事总经理梁颖,华软资本副总裁路广兆,元禾厚望成长基金高级合伙人孙文海,沸点资本创始合伙人姚亚平,中兴众投总经理闫足,戈壁创投管理合伙人朱璘关于《人工智能商业场景的落地应用》进行了行业讨论,由云启资本创始合伙人黄榆镔主持。以下为讨论内容实录:
黄榆镔:今天主要探讨的是在各行各业,如制造业、企业服务、物联网、无人驾驶、机器人等各个领域,AI会带给我们怎么样的改变,首先各位嘉宾先简单地介绍自己。
梁颖:我是来自联想创投的梁颖,联想创投作为联想旗下的全球科技产业基金,我们专注于面向未来的科技产业投资,当前投资方向主要为:IoT、边缘计算、云、大数据、人工智能,特别关注智能+行业领域的突破。我们关注的赛道包括智能制造、智慧医疗、智慧出行、智慧城市、智能生活、智慧教育等等。同时作为CVC,企业战投,我们对内孵化,对外投资,同时开放联想的资源,帮助被投企业快速成长。
路广兆:我是华软资本的路广兆,我们是一家投资先进制造、信息技术、高端装备制造的投资机构,目前在国内管理资产约300亿,主要投资VC、PE阶段。我主要负责信息技术、金融科技等行业的收购兼并业务。
孙文海:我是孙文海,来自元禾厚望成长基金,主要投资的方向包括已经完成的部分投资基本上围绕着互联网、硬科技包括人工智能,再加新经济三大方面。主要投资的阶段是在B轮。在人工智能这方面,去年到今年已经开始有所涉及,也投了少数几个。
姚亚平:我是沸点资本姚亚平。沸点资本是很新的基金,前身是高原资本中国的团队,在投资上有几十年的经验积累。沸点是专注于互联网新科技领域的风险投资公司,也关注消费升级、教育、人工智能、企业服务等领域,主要投资A、B轮,我们投资的项目会合伙人亲力亲为给到各种支持,根据以往的投资经历,退的项目差不多一半能IPO。
闫足:我是来自中兴众投的闫足。中兴众投是中兴通讯的一级全资子公司,也是西安市近年的重大招商项目。作为中兴通讯的全球科技创新平台,中兴众投同时也是中兴通讯与外部进行创新资源交互的中台。中兴众投聚焦新一代通信网络及人工智能领域的科技创新投资。中兴众投希望能够进行真正有意义的投资、进而发挥投资应有价值。
朱璘:我是戈壁创投的朱璘,我们2002年开始在中国做创投,从美元基金到人民币基金,最近一段时间在看企业服务方向,戈壁创投在东南沿海也有些运营,所以现在是一个比较偏泛亚洲的平台。在深度技术方面,也在看AI方向。
黄榆镔:我是云启资本黄榆镔,我们也是一家早期的风险投资公司,主要投资方向以硬科技为主,管理的基金既有美金、也有人民币,现在还没有西安项目,不过希望在最近这一年里面能够改变这个状况。
今天讨论的问题会分成不同的领域。先从梁总开始,你是怎么找到旷世的,你怎么会看到这个趋势,你觉得在制造业里面除了CV以外还有什么其它的机会?
梁颖:旷视现在讲起来比较敏感,因为刚发布了招股书,准备上市。作为AI*股,大家都非常关注他们。我可以大概简单介绍一下,我们是旷视的天使投资人,2011年投的,投资逻辑非常简单,投人和计算机视觉科技的未来。创始人印奇,唐文斌等都是清华姚班毕业的,也是国际奥林匹克数学竞赛的冠军团队。同时,我们也看好计算机视觉未来的商业落地的前景。当时我们自己也建立了一个联想计算机视觉研究室,同时也投资了旷视。
旷视最早想做的是游戏,用人脸技术做游戏。从产业界这个角度来说,视觉在人脸开机这个领域会更加落地。联想的业务,包括笔记本电脑、手机都跟旷视合作了很久,在人脸开机上做了很多研究,所以旷视是从人脸开始切入的。
联想在2014年建立了一个数据智能的研究院,我们在选下一个赛道的时候会思考人工智能怎么落地商业。选赛道时看了很多行业,包括金融、智能制造、医疗、智慧城市等等。
从2014年做智能制造开始,我们和工信部推进了并成立了中国的工业大数据产业联盟。围绕这块,我们大概投了30多家企业。
智能制造能应用的领域很多,还包括基于整个智能制造数据智能平台,基于上面去做产品开发的管理、工厂的管理,比如说基于它去做销量预测,产量预测、故障检测、故障预测等等。这个领域非常大,也是我们非常看好的一个赛道。
黄榆镔:路总从你的角度来看,AI在制造业里面能带来什么新的玩法?
路广兆:制造业是国之重器,我们国家在制造业上提升的力度非常大。过去的制造业是以依靠厂房、机器、人力的消耗而带来了生产力提升、带来销量提升。而AI在制造业,甚至延伸企业服务业之间的应用在哪个点?我想把复杂问题简单化,即AI从哪里来?到哪里去?
AI的基础离不开两个问题:数据和算法,如果这个产业过往没有大量数据,人工智能是无源之木,如果没有新的算法就代表它没有未来。如果人工智能纯粹为智能而智能,不是一个成熟的商业模式,这个智能一定要带来新的产业革命甚至新的技术革命,而产业革命和技术革命的目的是要让企业运行的更有效率,或者为企业带来更大的市场订单,如果没有这些,就纯粹是一个伪人工智能。
制造业里面,中国在围绕着轨道交通、传统精密生产制造领域里会有较大的提升空间,通过人工智能技术的应用,改善一些薄弱的基础研发和设计环节,改变传统的生产制造模式,为产业的升级发展补上缺口。
另外,如今各行业面临的竞争压力越来越大,要么靠市场规模扩大,要么靠技术*来获得新的市场。华软在金融科技、企业服务、智慧城市等领域的人工智能技术企业进行了一些投资,希望人工智能帮助行业里卡脖子的一些技术环节能有一些突破,主要考虑围绕三个方面来解决:1、如何通过人工智能帮助企业扩大销售、流通环节;2、如何帮助企业解决内部运营、管理效率的提升;3、如何帮助企业优化外部生态环境,如通过金融科技的技术优化融资服务环境,通过公用事业的技术优化政务服务环境。
黄榆镔:听听闫总对制造业+AI的看法,机会在哪里?
闫足:中兴通讯是全球*的综合通信解决方案提供商,是中国*的通信设备上市公司。中兴通讯具备完整的的通信端到端解决方案能力。其中“端到端”可以简单理解为基站设备到各位正在使用的手机。中兴通讯在陕西政府的支持下于西安设立了终端智能工厂。
终端智能工厂引入了智能制造的相关技术,比如将AOI(自动光学检测)技术用在SMT(表面帖装技术)检测中,以解决人工目检时因人类生理限制导致的可能出现的检测结果不准。再回到智能制造,实际这是一个非常广的概念,并不仅仅是常规认为的机械臂空间抓取。
中兴通讯2018年3月,在南京动工建设智能制造基地。该智能制造基地基于工业4.0框架,在生产中将实现全程可视化、智能化;原材料入库到成品出库实现物流智能仓储与配送;生产车间实现生产状态自动感知、生产数据自动收集、产品数据实时等。
智能制造的未来,我个人认为必须结合“数字孪生”技术。数字孪生技术是超现实技术,它将物理世界映射为数字世界,通过传感器实现与两个世界的状态同步。各位可适当关注该技术。以上是我对智能制造的一点看法。
黄榆镔:在制造业*有自动化,然后是自动化的提升。同时怎么把一个工厂联网,放感应器,把它数字化,变成更好的柔性生产,也是一个大的方向。
当然还有很多缺口,比如说在一些精密制造上,例如机床、减速机,还有很多的核心零部件是靠进口的,这些都是非常好的创业方向。
第二个话题是关于企业服务。孙总,我知道你投了很多语音识别、语义识别loT的公司,请谈谈吧。
孙文海:首先我们关注人工智能对所有产业的结合和产业转变的途径,形成了这样一套逻辑:人工智能需要几个基本的元素,其中一定要有算法,这是核心;还有一个实的就是类似人实质性的大脑,你得有那么多的神经网络在这里,就是神经元搭在这里,这个东西就是个硬件的东西,这一块涉及到芯片,这也是寒武纪等公司在做的事情。
第三块需要的是什么呢?需要的是数据,你没有数据光有脑子、算法,有硬件,还是无源之水,人工智能还是做不起来。所以做人工智能一定是数据先行。
最早出现数据化的是什么行业呢?把纯互联网的东西排除开,传统的垂直行业中金融行业肯定是数字化程度比较高的,其次是零售业。接下来,哪个行业数字化程度达到20%就可以进行人工智能改造。
我们判断接下来可能是安防、物流和制造。制造要排在安防和物流的后面,因为制造业的发展是从手工生产到机械化、到自动化、到数字化,最后才到智能化。中国的制造业大部分还是处于从机械化和自动化的阶段,目前还没有大规模迈向智能化。
回到刚才我说的逻辑、数字化,即拥有大量的数据是一个行业整体迈向智能化的前置条件,在这一点上哪些行业做的好,就首先在这里会发现机会。
黄榆镔:我知道姚总以前也投了360、也有企业版的360,现在在企业服务里面,哪一个方向你特别看好,是企业服务+AI的哪些方向?
姚亚平:我看好的方向比较多,可以从几个方向论证一下:
*,互联网发展一定要经历在线化、数据化、智能化这几个阶段。在新闻内容角度,目前已经经历了在线化、数据化、智能化三个方向。
第二,CBF。卖东西给你的叫B,F是生产。在过去20年我们解决了怎么让B端的东西被消费者知道并卖给C端,而现在随着世界的发展,变成了怎么让B卖得更有效率,甚至绕过B,直接CtoF。
过去20年很好的服务了C,B也服务的差不多了,能不能把F服务好,也符合我们国家的大战略。能不能给今天的C,更挑剔的、更有个性化需求的这波人,生产不一样的货物,能不能从批量化生产成长为定制化生产。
第三,这个世界是由科技创造生产力,一定是由科技来推动的,而不是由资本推动的。
科技进步一是代替人用脑子,二是代替人用肌肉,世界发展就变成C、B到F。会思考怎么代替人脑、人的力气、肌肉,所以会出现机器人,会出现需要人判断的方向,这也是我们现在投资的方向。
黄榆镔:朱璘你在AI+Fintech领域有什么新的看法?
朱璘:我们做基金本质就是让大家赚钱,看离钱比较近的地方,金融总体来说是很符合这个趋势。中国大陆和海外还有很大区别,海外有很大的机会就是开放式银行,包括欧洲就有十几家金融独角兽,基本上都是做开放式银行,只做银行核心的部分,核心的风控掌握在手里,基于核心风控以外的数据共享,增值服务几乎都是由其它服务商来做。
国内比较像的企业有蚂蚁金服、支付宝这些。我觉得这块在国内慢慢正在打开,包括保险业也在不断打开,只是速度不可能很快,因为风控这方面是很大的问题。
相对来说,在国内还是以大数据服务比较多一些,包括刚才路总也聊大数据。其实AI还是分深度AI和浅AI,自动驾驶肯定是深度AI,这基本上做不出来就是死路一条,或者差百分之一都是死路一条,像其它的赛道用些大数据的做法其实也能覆盖。我们现在看的还是商业模式明确的赛道,同时对AI切入又有很好的效率提升的行业方向,再去做布局。金融科技是一块,生命科学我们也在持续关注,看的比较多的是癌症检测,当然,不同的投资人会有不同的角度和切入点。
黄榆镔:现在由于时间关系讨论一下自动驾驶,这是公认的在AI里比较难实现的一个领域。梁总说说你对自动驾驶的看法,什么时候在西安可以坐上无人驾驶的车?
梁颖:自动驾驶我觉得是一个很有趣的赛道,过去两年自动驾驶公司出来特别多,故事也特别多。但我个人对技术真正能够实现自动驾驶的态度偏悲观一些,我会认为10年之后。
为什么呢?因为自动驾驶是非常复杂的系统,这个复杂的系统对团队技术要求非常高,首先需要懂自动驾驶,要有视觉、激光,然后算法,然后要懂车,机械设计等等一套东西,这样具备所有能力的团队是很少的。另外这个赛道还很远,如何去走,未来什么样的商业模式最容易落地,大家还没有共识,导致团队出了很多问题。
自动驾驶公司或多或少都会有一些问题,抛开这些问题来说,我喜欢把它分成四个象限,大家过去看的比较多的是高速载人、高速载物,低速载人、低速载物,短期内,我看好低速载物,低速载物在未来1-2年就会在身边出现,像物流园区、工厂、码头,我觉得这块是最快落地的。
还有未来落地比较快的是高速公路上的货车,高速公路也是场景相对比较简单的赛道,技术实现上会稍微容易一些,而且刚需明显,解决货柜车司机长期疲劳驾驶的问题。至于高速载人,我个人认为可能是在10年之后实现。
黄榆镔:闫总对无人驾驶领域如何看待,10年内可以坐上无人驾驶的车吗?
闫足:我个人观点,无人驾驶是一定会实现的。我们现在需要做的是,期待天才的出现。目前无人/自动驾驶的车辆上至少会配激光雷达、毫米波雷达、视觉设备。虽然目前看来搭载的设备成本高,但我们要相信科技,科技的发展会消除上述成本问题。期待天才出现的原因之一是,目前无人驾驶核心算法仍没有取得大的突破,无法保障无人驾驶的安全性。
举个例子,大雨或者大雾天,由于激光雷达/毫米波雷达发出的电磁波受水滴影响,无法直线传播,进而无法给出足够准确的定位;而诸如摄像头等图像采集设备,虽然已经有新材料镜头可实现不沾水、尘,达到视力优秀的人眼视觉效果,但计算机视觉、图像处理技术却存在难题。
这种高端、前沿技术的彻底突破,需要天才,像牛顿、麦克斯韦这种奇才。当然,从宇宙的发展轨迹来看,天才一定会在特定阶段出现。因此我相信无人驾驶一定会实现,虽然届时的无人驾驶技术或使用的传感器可能与现在不尽相同。让我们一同期待划时代天才人物的出现。
黄榆镔:闫总如果10年之后无人驾驶才可能成功,你会投吗?
闫足:10年之后我应该还是很年轻的。无人驾驶如刚刚所述,至少15年内我认为是会实现的,也一定会有天才级的人物引领时代的变革。对应无人驾驶领域的伦理、法律法规也会逐步完善、健全。中兴通讯及我本人,不是短视的企业或个人。10年、15年,中兴及我个人都会坚持对有价值的领域和技术进行持续不断的创新探索和投入。
黄榆镔:智能驾驶其实也是非常难投的领域,我也投了自动驾驶领域中高速的、低速的,载人的、载货的。看起来在我们有生之年,有可能是10年,甚至15年,这个东西是能被解决的。谷歌已经开始在跑一些车子了,但比较小规模。
最后一个问题留给各位,假如我不是清华的、不是姚班的,但我对人工智能有兴趣,我应该怎么参与,哪个方面是最适合我参与的?
路广兆:参与人工智能应该分层次,应鼓励教育机构、科研院所加大对人工智能的基础研究,加大研究成果的共享及发布;鼓励企业多应用人工智能等新技术与产业服务、业务发展有效整合;普通人可多参与人工智能产品的应用和体验,人工智能技术的应用最终要让企业服务更便捷,要让人生活更美好。
孙文海:我觉得要先从小事做起。其实人工智能是非常宽泛的概念,里面最高深的部分,不需要人人都会。其实这是很大的生意,因为除了芯片和算法这样比较高精尖的内容外还有很多领域可以做。比如收集数据所需要的各种传感器,这属于是AI体系的感知层。它的门槛没有那么高,从这个角度来说可能更容易获得一个入场券。
姚亚平:刚才我讲科技是改变世界的*生产力,但是科技一定要掌握在企业家手里组织资源,用来改变世界。科学家发明了一个锤子,用这个锤子到处在找钉子。他发明了一个技术,去找这个技术的应用场景,找应用场景不是他擅长的,但做出这个锤子是他擅长的,这是科学家做的。企业家就是先发现钉钉子的机会再找锤子,更多的是找到应用场景和需求再去想怎么解决问题,然后才会发现忽然在很多锤子里找到一个更合适的锤子。这个世界有很多不同的维度,可能会给到在座各位更多的机会。
黄榆镔:朱璘*次来西安,给点建议吧。
朱璘:像姚总说的除了找钉子还要找人,我觉得人工智能你得自己能做,自己做不了找人做。无论是哪个时代,发掘人才还是非常关键的,互联网、无线互联网到现在AI,甚至AI以后的时代,企业家在发掘人上都会有机会。
梁颖:科技落地其实周期很长,这个过程中科技怎么跟产业结合,怎么落地,有很多的学问在里面。核心问题是你到底想不想创业,你到底想不想做这件事情,想清楚方向,组团队最重要。缺什么可以补什么,你如果市场能力强,你可以找一个技术牛人;你如果是技术牛人,你可以找一个强的市场人员。你可以不是从姚班毕业的,也可以成为像马云这样,创造出一个独角兽来。
闫足:不同于其他嘉宾的回答角度,我将自己身份从论坛嘉宾转换成台下的各位来宾。我想听到这个问题,台下的来宾一定有相当比例的人在想“怎样从零开始了解学习人工智能”。虽然我是人工智能博士毕业,也算是科班出生。不过最近,我还是打算从新开始学习人工智能。我的计划很很简单,从初中数学教材开始学起,一直学到大学数学系的教材。这不会花太长时间,大概三至五年年就可以。三至五年内算法不会有大的突破,所以趁现在打好基础、进入人工智能领域,也许我们还有赶超的机会。
以上是从个人角度。从企业、创业的角度,即使如台上嘉宾提到的找到专业能力强的团队或者合伙人,我认为若想做好、做强,还是需要自己了解一些人工智能算法和技术。所以,我个人建议,可以从循序渐进的数学学习入手。以上是个人的拙见。
黄榆镔:感觉人人都可以参与人工智能,就像唐僧取经。唐僧说我能成功因为我有理念,我相信这个东西能够起来;虽然孙悟空武功好,但打不过的时候还要找外援;还有猪八戒,功夫不太好没有关系,有师兄带;连沙和尚也能成功,你叫我往东我就往东,你让我往西我就往西。最后感谢大家一个半小时的热情分享,谢谢大家!
“2019全球创投峰会”由中共西安市委、西安市人民政府主办,西安市金融工作局、西安市科学技术局、西安市投资合作局、西安高新技术产业开发区管理委员会、清科集团承办的2019全球创投峰会在西安高新国际会议中心召开。峰会盛邀全球创投*力量与独角兽企业汇聚,通过组织“闭门研讨、专题培训、主题论坛、项目对接、展览展示”等环节助推产业与资本的高效融合。这场汇集万亿资本的行业盛宴,为全球资本共享中国机遇,为推动全球创投行业的发展皆带来深远的影响。
【本文由投资界合作伙伴投资界-西安创业授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。
人工智能的三次浪潮与三种模式
■史爱武
谈到人工智能,人工智能的定义到底是什么?
达特茅斯会议上对人工智能的定义是:使一部机器的反应方式就像是一个人在行动时所依据的智能。
百度百科上对人工智能的定义是:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
尽管人工智能现在还没有非常严格准确或者所有人都接受的定义,但是有一些约定俗成的说法。通常人工智能是指机器智能,让机器达到人智能所实现的一些功能。人工智能既然是机器智能,就不是机械智能,那么这个机器是指什么呢?是指计算机,用计算机仿真出来的人的智能行为就可以叫作人工智能。
2017年7月,国务院印发了《新一代人工智能发展规划》。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。这一国家级战略和社会流行趋势标志着,人工智能发展进入了新阶段,我国要抢抓人工智能发展的重大战略机遇,构筑人工智能发展的先发优势,加快建设创新型国家和世界科技强国。
人工智能的三次浪潮
自1956年开始,人工智能经历了三起三落,出现了几次浪潮,现在人工智能已经是处于第三次浪潮了。
第一次浪潮(1956-1976年,20年),最核心的是逻辑主义
逻辑主义主要是用机器证明的办法去证明和推理一些知识,比如用机器证明一个数学定理。要想证明这些问题,需要把原来的条件和定义从形式化变成逻辑表达,然后用逻辑的方法去证明最后的结论是对的还是错的,也叫做逻辑证明。
早期的计算机人工智能实际上都是沿着这条路在走。当时很多专家系统,比如医学专家系统,用语言文字输入一些症状,在机器里面变换成逻辑表达,用符号演算的办法推理出大概得了什么病。所以当时的主要研究都集中在逻辑抽象、逻辑运算和逻辑表达等方面。
在第一次浪潮中,数学定理证明实际上是实现效果最好的,当时有很多数学家用定理思路证明了数学定理。为了更好地完成定理证明工作,当时出了很多和逻辑证明相关的逻辑程序语言,比如很有名的Prolog。
虽然当时的成果已经能够解开拼图或实现简单的游戏,却几乎无法解决任何实用的问题。
第二次浪潮(1976—2006年,30年),联结主义盛行
在第一次浪潮期间,逻辑主义和以人工神经网络为代表的联结主义相比,逻辑主义是完全占上风的,联结主义那时候不太吃香。然而逻辑主义最后无法解决实用的问题,达不到人们对它的期望,引起了大家的反思,这时候人工神经网络(也就是联结主义)就慢慢占了上风。
在70年代末,整个神经元联结网络、模型都有突飞猛进的进步,最重要的是BP前馈神经网络。1986年BP前馈神经网络刚出来的时候解决了不少问题,后来大家往更大的领域应用,实现了比较大的成果。在很多模式识别的领域、手写文字的识别、字符识别、简单的人脸识别也开始用起来,这个领域一下子就热起来,一时之间,人们感觉人工智能大有可为。随后十几年人们发现神经网络可以解决一些单一问题,解决复杂问题却有些力不从心。训练学习的时候,数据量太大,有很多结果到一定程度就不再往上升了。
这时期所进行的研究,是以灌输“专家知识”作为规则,来协助解决特定问题的“专家系统”为主。虽然有一些实际的商业应用案例,应用范畴却很有限,第二次热潮也就慢慢趋于消退。
第三次浪潮(2006—现在),基于互联网大数据的深度学习的突破
如果按照技术分类来讲,第二次和第三次浪潮都是神经网络技术的发展,不同的是,第三次浪潮是多层神经网络的成功,也就是深度学习取得突破。这里既有硬件的进步,也有卷积神经网络模型与参数训练技巧的进步。
若观察脑的内部,会发现有大量称为“神经元”的神经细胞彼此相连。一个神经元从其他神经元那里接收的电气信号量达某一定值以上,就会兴奋(神经冲动);在某一定值以下,就不会兴奋。兴奋起来的神经元,会将电气信号传送给下一个相连的神经元。下一个神经元同样会因此兴奋或不兴奋。简单来说,彼此相连的神经元,会形成联合传递行为。我们透过将这种相连的结构来数学模型化,便形成了人工神经网络。
经模型化的人工神经网络,是由“输入层”“隐藏层”及“输出层”等三层构成。深度学习往往意味着有多个隐藏层,也就是多层神经网络。另外,学习数据则是由输入数据以及相对应的正确解答来组成。
为了让输出层的值跟各个输入数据所对应的正解数据相等,会对各个神经元的输入计算出适当的“权重”值。通过神经网络,深度学习便成为了“只要将数据输入神经网络,它就能自行抽出特征”的人工智能。
伴随着高性能计算机、云计算、大数据、传感器的普及,以及计算成本的下降,“深度学习”随之兴起。它通过模仿人脑的“神经网络”来学习大量数据的方法,使它可以像人类一样辨识声音及影像,或是针对问题做出合适的判断。在第三次浪潮中,人工智能技术及应用有了很大的提高,深度学习算法的突破居功至伟。
深度学习最擅长的是能辨识图像数据或波形数据这类无法符号化的数据。自2010年以来,Apple、Microsoft及Google等国际知名IT企业,都投入大量人力物力财力开展深度学习的研究。例如AppleSiri的语音识别,Microsoft搜索引擎Bing的影像搜寻等等,而Google的深度学习项目也已超过1500项。
深度学习如此快速的成长和应用,也要归功于硬件设备的提升。图形处理器(GPU)大厂英伟达(NVIDIA)利用该公司的图形适配器、连接库(Library)和框架(Frame⁃work)产品来提升深度学习的性能,并积极开设研讨课程。另外,Google也公开了框架TensorFlow,可以将深度学习应用于大数据分析。
人工智能的3种模式
人工智能的概念很宽泛,根据人工智能的实力可以分成3大类,也称为3种模式。
(1)弱人工智能:擅长于单个方面的人工智能,也叫专业人工智能。比如战胜世界围棋冠军的人工智能AlphaGo,它只会下围棋,如果让它下国际象棋或分辨一下人脸,它可能就会犯迷糊,就不知道怎么做了。当前我们实现的几乎全是弱人工智能。
(2)强人工智能:是指在各方面都能和人类比肩的人工智能,这是类似人类级别的人工智能,也叫通用人工智能。人类能干的脑力活,它都能干,创造强人工智能比创造弱人工智能难得多,目前我们还做不到。
(3)超人工智能:知名人工智能思想家NickBostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能”。超人工智能可以是各方面都比人类强点,也可以是各方面都比人类强很多倍。超人工智能现在还不存在,很多人也希望它永远不要存在。否则,可能像好莱坞大片里面的超级智能机器一样,对人类也会带来一些威胁或者颠覆。
我们现在处于一个充满弱人工智能的世界。比如,垃圾邮件分类系统是个帮助我们筛选垃圾邮件的弱人工智能;Google翻译是可以帮助我们翻译英文的弱人工智能等等。这些弱人工智能算法不断地加强创新,每一个弱人工智能的创新,都是迈向强人工智能和超人工智能的进步。正如人工智能科学家AaronSaenz所说,现在的弱人工智能就像地球早期软泥中的氨基酸,可能突然之间就形成了生命。如世界发展的规律看来,超人工智能也是未来可期的!
陈宏:人工智能的快速发展,离不开三个要素
2018年8月8-9日,品途集团举办的2018·NBI夏季创新峰会在北京召开,本次峰会主题是“与创新节律同步”,旨在探讨商业领域的发展规划和创新趋势,并持续关注科技前沿、零售消费、泛文娱、大健康、教育、旅游等10大领域,品途集团希望通过峰会的交流与合作,让创新“更有价值”、“更易触达”、“更有用”。
在8日主会场中,中国电商委主任兼秘书长苏军、微软中国CTO韦青、阿里巴巴集团新零售研究中心主任崔瀚文等嘉宾,就产业创新等发表主题演讲。
分会场中,场景实验室创始人吴声、全时创始人兼CEO陈学军、Boss直聘创始人兼CEO赵鹏、《吐槽大会》卡司、笑友文化CEO史炎等嘉宾,分别发表了关于消费零售、企业服务、消费、文娱创新等领域的主题演讲。
在8日关于《人工智能商业应用的黄金比例》的人工智能专场中,汉能投资集团董事长兼首席执行官陈宏发表了关于《人工智能中场战事——AI投资新趋势与新机会》的主题演讲,他认为:人工智能的快速崛起是由三方面基础因素决定:一是大数据的获取;二是新算法的出现;三是计算能力的加倍发展。
陈宏指出知名投资机构持续加码人工智能独角兽,行业头部效应凸显。同时,热点细分领域受追捧,芯片、视觉与语音算法、无人驾驶受关注度提升。此外,人工智能全行业已经整体进入商业化落地阶段,资本更关注企业实际成果。
人工智能这两年的确是蛮热的,很多创业公司在过去的几年中,在资本的助力下,从非常非常小变得非常非常大,很多独角兽企业已经逐渐起来了。但是我们还是看到的一拨一拨AI领域新的互联网创业公司也在蓬勃发展。每个VC基金,无论是对AI熟悉的还是不太熟悉的,都在持续关注AI领域的变化。
美国在各个方面都比中国做的稍微领先一点,我们互联网公司很多的模式都是从美国学习的。但是在AI领域,在最近的两三年中,中国的VC和PE所投入的资金已经超过了美国,这也可能跟我们国家的主体政策有关。
另外很重要的一点是整个中国移动互联网的发展已经全球领先。前两天大家说,关键词已经变成了CopyfromChina。中国移动互联网的蓬勃发展会导致应用场景的产生,应用场景的丰富又产生了大数据。我想起很多年前在美国毕业的时候,做了半天人工智能也没有什么特别大的进展。那为什么人工智能能在现在崛起?有几个很重要的观点和因素:
1、大数据。中国移动互联网的发展导致每个手机都是一个数据收集器,数据收集以后就可以进行大数据分析、人工智能等。
2、算法。各种各样算法的出现。
3、算力。摩尔定律逐渐的增长,现在还是每18个月计算能力就能够加倍,但技术还在继续向前发展,虽然大家对摩尔定律未来的持续性表示怀疑,但是今天摩尔定律仍然有效。
我们现在可以用各种各样的大数据进行模拟,进行各种各样的分析,所以我们现在可以做一些过去做不了的事情,这就是为什么现在人工智能在围棋等领域打败人类的原因。
在医疗领域,以前我们要做一个基因测序估计要做十年,花费十亿美金以上,才能把一个人的基因记录下来。而今天1000美元以下就够,未来价钱还会更加便宜。有了人的大数据,医疗方面的数据分析也会产生很多的机会。
所以我感觉到各种各样的应用机会很多,导致我们创业者非常有激情,也导致投资人也非常有激情。这就是为什么在这个领域,AI投资量增长非常快的原因,每年以73%的速度在增长。
在场景方面,我们可以看到在智能医疗、智能驾驶等领域都在发生创新。像无人驾驶是一个非常热门的领域,里面出现了各种各样的公司。中国其实很多方面已经追上了国际领先水平。
在芯片方面,以前中国人是不太做芯片的,因为我们再怎么做芯片,和国外依然相差甚远。这个产业里边有很多深层的技术和产业链,所以实际上挑战是非常大的。
整体来讲,这的确是一个好的行业、好的赛道,但是除了创业公司以外,其实全球各大公司与巨头们也在通过内部研发或孵化出来一个团队,像亚马逊、谷歌、国内的百度,实际上这些公司在整个AI行业当中的推动力度还是蛮大的。
智能语言处理各家都在探索,自然语言处理和语音处理几十年前就开始发展。那时候缺少大数据,没有这么高的精确度。亚马逊在开发自己的语言工具,谷歌和百度也在开发自己的语音项目,所以智能语音识别系统各大巨头也在布局。
无人驾驶基本上大家都在参与,谷歌已经测试了800万英里,百度的阿波罗计划雄心勃勃通过收购来介入这个行业。
国内最有名的一家人工智能公司是今日头条。在新闻客户端热门的时候,他们就利用人工智能和大数据分析来寻找你的爱好,推荐给你个性化的信息。短短几年之内,它就要成为上千亿美金市值的公司。
我个人感觉人工智能还处在早场,但是有些领域的确已经进入中场。举几个企业融资的例子,在图像识别领域里面有Face++这样非常年轻的公司,也有很多存在很多年的公司,随着最近人工智能基础平台的知名度整体提高以后,加上资本,有些以前根本不知道的企业,一下子变成行业中的领导者,他们市值已经是几十亿美金了,我觉得他们已经进入中场了,但是还有很多早场的企业,对他们来说才刚刚开始。
另外,感觉到知名投资机构还是比较喜欢跟风,因为这个行业太复杂,不是每个投资人都能看的特别清楚。一旦有好的公司跑出来,很多投资机构投了以后,其余的投资机构都跟风,像寒武纪这些公司,很多投资人在排队。
人工智能行业从以前纯粹的概念,已经开始进入商业化阶段。看到了营业额,看到了商业化的一些结果,基金才会跟进来,他们不可能投一个营业额永远为零的公司,前两年可以,未来可能已经不行了。
知名机构还在追加投资人工智能的头部企业,像云之声这种企业,已经获得了13亿人民币的投资,这些企业过去几年一直在研发语言技术,后来也成功开发了芯片。前几年AI没那么热的时候,其实大家还是看营业额,但是最近随着机器人的企业、消费企业越来越多,人工智能的技术提供商和芯片提供商就有了产品渠道,这种头部企业估值增长特别快。
大家公认未来AI会是一个巨大的市场,这些企业的年限都不是特别长,商汤科技,2014年开始A轮融资,到现在也就四年时间,融了几十亿美金。这些优质的企业,在巨大的资本之下,拿到资金就可以抓到更好的人才来竞争,我认为这是一个头部效应。
无人驾驶这个行业,在2021-2031期间,我们预测无人驾驶的车辆数每年以70%的速度递增。这里面有很多的创业机会。车厂和用户之间的关系已经产生了巨大的变化,渠道也产生了巨大的变化。无人驾驶里面还有很多技术,环境感知技术、智能决策技术、控制执行技术,一个汽车要跟各种各样的设备进行通讯,又需要云计算和大数据平台支持,还有信息安全技术等,这里面有很多的机会,这就是VC和PE对这个行业倍感兴奋的原因之一。
2020年我们互联网的终端设备可能达到200多亿,如果你能给这些200多亿的设备赋予某种能力,芯片等,这个市场就是巨大的。如果你有能力去连接这些设备,产生运营的环境,我认为这个环境里面的机会还是很大的。整个芯片产业的复合年增长率为41%,投资人也是不会错过的。
语音识别是发展比较早的技术,现在随着大数据的产生变得越来越成熟。语音识别里面还有语义识别,举个例子,中国足球队谁也打不过,中国乒乓球队谁也打不过,这两个意思表达的刚好是相反的。我们最近又看到了很多新的公司,在语义分析里边进行更多的投入,大数据变得更加重要。
随着5G的产生又产生很多新的机会,网络速度变得越来越快,大量的数据可以在云端进行处理,终端设备会变得更加智能。随着5G的产生,新的技术产生,新的商业模式也就产生了。
在影像处理领域,医学影像进行癌症筛选,人工智能有时候做的比人类还要精准。在医学行业里面,人工智能是最容易被应用的,因为只要我的系统比99%的人聪明就可以了。如果人工智能能辅助我们医生变得越来越聪明,这里面有很多机会。
在人脸识别领域,人脸模仿与人脸识别的企业之间技术竞争,这里面产生了投资机会和创业机会,在传统的征信体系里面也有各种各样的机会。
人工智能现在已经开始进入一个新阶段,对于创业者来讲,除了它的技术能力之外,一定要有优秀的具有落地能力的团队,否则就很有可能变成一个被收购的对象。当然从投资并购这个角度来讲,被收购也不一定是坏事。但是不管怎么样,真正想做到一个垂直行业的领导者,不但要把自己技术做的过硬,落地方面要远超竞争对手,还要学会如何跟投资人沟通,在资本上得到大力的支持。有了好的技术,大方向是对的,又有了好的落地能力,又有资本的支持,就非常有可能做成一个独角兽公司。