天津:迈向人工智能先锋城市
新华社天津5月16日电题:天津:迈向人工智能先锋城市
新华社记者周润健、郭方达
16日,第三届世界智能大会在天津开幕。自2017年举办首届以来,乘着世界智能大会这股“东风”,天津立足新一轮科技革命和产业变革的制高点,提前布局、政策引领、人才创新,大力发展智能科技产业。
积极布局,打造经济发展新引擎
在天津飞腾信息技术有限公司展厅,市场拓展部副总监柯冠岩向记者展示其最新研发的FT-2000+芯片。“这款芯片在单核计算能力、访存带宽等指标上均处于国际先进水平,主要应用于高性能计算等领域。目前基于飞腾产品的整机系统已经在云计算平台、企业服务器等多个领域推广应用。”
这家公司2014年落户天津,是天津高新区以智能科技驱动产业向高端迈进的缩影。
人脸识别、水下智能机器人、视觉防火系统、无人机、量子通信……近年来,天津加快科技创新步伐,积极布局智能科技产业,打造经济发展新引擎。
“作为国家自主创新示范区和全国双创示范基地,天津高新区目前形成了新能源和新一代信息技术等优势产业集群。在智能制造产业领域,集聚了以飞腾、麒麟、深之蓝等为代表的智能制造企业近200家。”天津滨海高新区工委书记、管委会主任单泽峰说。
夯发展之基,蓄腾飞之势。这两年来,为促进智能科技产业发展,天津市、区两级联动,密集出台《关于大力发展智能科技产业推动智能经济发展建设智能社会的实施意见》《加快推进智能科技产业发展的总体行动计划》等110余项政策措施,密度、力度前所未有。
在相关政策的带动下,天津迅速聚集了一大批科技型企业和科研院所,智能化浪潮正在涌来。截至目前,天津初步形成了自主可控信息、智能安防、大数据、先进通信等7条产业链,共聚集近300家高新技术企业,2017年实现主营业务收入超过1000亿元。
“招才引智”助力智能科技产业
发展智能科技产业,人才是关键。在2018年举行的第二届世界智能大会上,天津出台了“海河英才”计划,重点聚焦人工智能、新一代信息技术、新能源新材料、生物医药、数字创意等新兴产业的人才需求。
记者了解到,“海河英才”计划推出以来,截至今年4月底,天津共引进各类人才16.25万名,平均年龄31.8岁。
天津市人社局副局长陈晖介绍说,新引进的人才都与天津市重点产业发展紧密相关,其中人工智能、生物医药等战略性新兴产业领域引进的人才占比约19%。人才引进的模式也由过去单纯引进一个人才,转变为引进一个人才、带进一个团队、促进一个产业的方式,以形成人才与产业的深度融合。
“‘海河英才’行动计划给予人才的各种优惠政策,使公司在人才吸引、引进和招聘上更具竞争力。截至目前,我们已引进十几位新同事。”天津忆云共享经济信息咨询有限公司创始人兼CEO杨晖向记者介绍说。
人才是第一资源。天津提出,到2020年,将引育10个智能科技产业的顶尖人才和团队、1000名人工智能领域高端研发人才和高技能人才。
天津市工信局相关负责人表示,目前天津正处于智能产业转型的关键时期,制造业结构调整、智能制造支撑产业同步、相关人才的持续引进将是接下来一段时间的重点工作,天津已经为此做好准备。
扶优挖潜并举,打造北方人工智能产业新高地
在一汽大众华北基地,数以千计的机器人在车间里作业,不到1分钟就有一辆新车下线,基地年产能可达30万辆,这座“智慧工厂”有望给天津带来千亿级的汽车产业集群。
在天津,这样的智慧工厂越来越多。2018年,天津共启动了29个工业企业智能化改造咨询诊断项目,引导企业对标对表、补短板、找差距,系统规划企业智能化转型实施路径。实现“机器换人”的企业涵盖了汽车零部件、机械、环保等多个行业,企业的生产、人力、信息化等管理全面转向“智造”。
抓创新就是抓发展,谋创新就是谋未来。2018年9月,天津出台《天津市加快工业互联网创新应用推动工业企业“上云上平台”行动计划(2018-2020年)》,支持云平台发展,鼓励企业“上云”。目前,天津已有腾讯、华为、华录、太平洋电信四个大数据中心落地,滨海工业云、清华紫光云、卓朗科技云等一批云平台助力产业智能化升级。
沃德(天津)智能技术有限公司董事长胡炜表示,公司依托工业互联网平台采集生产设备的制造工艺、运行工况和状态数据等信息,开发部署生产设备运维和管控相关的工业App及系统解决方案,为制造业服务化转型探索新路径,可带来经济效益近亿元。
“天津将集中力量坚持扶优挖潜并举,打好支持智能科技产业发展的组合拳,逐步使天津成为北方人工智能产业新高地。”天津市副市长金湘军说。
【智能语音】什么是第三代人工智能
自1956年达特茅斯会议以来,人工智能经历了60多年的风风雨雨。在《中国科学》70周年纪念专刊上,清华大学张钹院士等撰文《迈向第三代人工智能》,提出了第三代人工智能的概念[1]。
按张钹老师的观点,人工智能语音技术的发展总体可以分为两个阶段:基于知识驱动的方法和基于数据的方法,分别称为第一代人工智能语音和第二代人工智能语音。
在第一代人工智能中,人类的知识具有核心地位。人们将定理、概念、经验等知识形式化为符号,并设计合理的推理方法来获取问题的答案。这些知识有人类总结出来,具有明确的意义,且具有可组合性,因此“和人类理性智能一样具有可解释性”。这一方法的局限在于对知识进行形式化比较困难,且“只能解决完全信息和结构化环境下的确定性问题”。如何引入常识,如何处理不确定性,如何对原始数据进行结构化,都是具有挑战性的问题。
图1:第一代人工智能语音距离:MyCin诊疗专家系统[3]
在第二代人工智能语音中,数据具有核心地位,人们不在系那个机器灌输知识,而是设计算法让机器从数据中自动学习知识。人工神经网络模块是典型的代表,这一模型具有强大的学习能力,可以从原始数据中抽取出知识并存储在网络参数中。近年来,随着数据的不断积累和计算机性能的提高,这一方法取得了巨大成功,在某些方面(如图像识别)甚至超过了人类水平,然而,这种纯数据驱动的方法具有明显的“黑箱”热性,人们很难理解学习过程和学习结果,系统的行为也很难控制。
图2:第二代人工智能举例:基于深度神经网络的人脸识别系统[2]
第三代人工智能的基本思路是融合知识驱动和数据驱动的优点,“建立鲁棒与可解释的AI理论与方法,发展安全、可信、可靠与可扩展的AI技术”。换句话说,新一代人工智能会全面利用知识和数据,让AI系统不仅可以为我们服务,而且可以明明白白地为我们服务,更强大,更安全,更可靠。
图3:第三代人工智能:知识与数据的结合
语音之家助力AI语音开发者的社区
张钹院士:探索第三代人工智能,需要勇闯无人区的人才
整理|夕颜
出品| AI科技大本营(ID:rgznai100)
【导读】7月3-4日,由CSDN主办的第三届AI开发者大会(AIProCon2020)在线上举行。本次大会有超万人报名参与,参与人群覆盖50+领域、4000家企业。其中有来自行业内70+顶尖企业、开源社区与科研高校的近100位行业领袖、技术大咖与研究学者。
他们用更新鲜、更有趣、更年轻的方式,聚焦智能时代AI技术的发展曲线以及AI与社会各行业结合的最新应用进展,深入解析热门AI技术在行业中的实践与落地经验,揭示技术与行业发展面临的机遇与挑战。
在7月3日的主论坛上,清华大学人工智能研究院院长、中国科学院院士张钹带来了《人工智能的发展现状与人才培养》的主题演讲。
核心观点:人工智能经历了两种发展范式:符号主义和连接主义,我们分别称之为第一代和第二代人工智能,这两种范式发展至今都遇到瓶颈,从而触及天花板。今后发展的方向是第三代人工智能,这是一条前人没有走过,需要大家去探索的道路,将对科学研究、产业化和人才培养产生重大影响。
以下内容为演讲实录,由CSDN(ID:CSDNnews)整理:
我是清华大学人工智能研究院的张钹。大家知道,人工智能的发展历经两种发展方式,一个是符号主义,另一个是连接主义,我们把符号主义叫做第一代人工智能,把连接主义叫做第二代人工智能。但是这两种发展模式/发展方式今天都遇到了瓶颈,触及了天花板。今后发展的方向是第三代人工智能,而这是一条前人没有走过的,需要大家去探索的道路。
第三代人工智能的发展将对科学研究产业化和人才培养有什么影响呢?下面我们来具体说明。
第一代人工智能-符号主义
第一代人工智能就是大家所说的符号主义,实际上它是建立了一个知识和推理的模型,来模拟人类的理性的智能。在具体应用上,就是利用了知识和推理,构造化学结构分析系统、计算机硬件组合系统、血液传染病诊断处方等系统。
我们回过头来看,会发现建立MYCIN医疗诊断专家系统,其实就是把传染病专家的知识和经验放在知识库中,把医生看病的过程,如何从症状推断疾病,再推理出处方的推理机制放在计算机中。这样,内科医生通过与计算机的交互,就可以通过计算机帮助他/她来诊断血液传染病。
这种用知识和推理建立的模型,主要是用来模拟人类的理性智能,它的代表性成果是国际象棋。国际象棋是完全信息博弈,实际上与决策、规划、诊断、设计和调度等,都属于理性智能/理性分析。这个系统打败了人类国际象棋冠军卡斯帕诺夫,这就说明这样的系统在一定的条件下能够超过人类的水平。
这种系统成功的秘诀在什么地方?也就是说第一代人工智能成功的秘诀,主要有下面三个因素:
一是依靠知识和经验。以IBM深蓝为例,它分析了70万盘象棋大师下过的棋,还有全部5~6个棋子的残局。根据这些残局和大师下过的棋,总结出来下棋的规则。同时又通过大师和机器的对弈,对有8000个参数的评价函数进行调整,这样就可以把大师的经验也放到程序里。
第二个因素是算法。当时深蓝主要常用采用的是α-β剪枝算法。
最后一个是算力,当时深蓝使用的是IBMRS6000SP2,大体上每秒钟可以分析2亿步,平均来讲是每分钟能够搜索8-12步。
第一代人工智能的优势
我们看一下第一代人工智能的优点。它可以模仿人类的理性智能。首先,它可以解释,可以和人类一样基于知识进行推理,我们不仅可以用来作为理性分析的模型,同时基于知识也可以用来进行机器学习。
这种基于知识的符号学习,可以克服基于数据驱动机器学习方法的缺陷,也就是深度学习方法的那些缺陷,比如不可解释性,推广能力很弱,需要大量的数据等。
第一代人工智能的局限性
但是,第一代人工智能最主要的局限性,体现在它不能随机应变,即基本上只能解决完全信息和结构化环境下的确定性问题。比如下国际象棋就是一个完全信息的,并按照一定规律演化过程。
另外,无论是IBM的深蓝,还是MYCIN医疗诊断系统,所有的知识都是用人工来编制的,所以在知识自动获取和表示上目前还有一些困难。此外,还有一个局限性是涉及到不确定性的知识与推理,第一代人工智能还没有很好的解决办法,导致其应用的范围有限。
第二代AI——深度学习
第二代人工智能,也就是我们现在非常熟悉的深度学习,有时也被称为亚符号模型,或者连接主义方法。
它实际上是通过模拟人类的神经元、神经系统的机制来模拟人类的感性智能/感知(主要),其基本方法如图左所示,把图像/语音直接输入到人工神经网络中。所谓人工神经网络实际上就是一个算法,对输入的信息进行分类,比如这个图像究竟是马还是牛。
因此,深度学习在模式识别上,就是将原始输入数据进行分类,其重要特点是不需要领域知识。过去我们要识别一幅图像,必须人工选择合适的特征。有了深度学习以后,把原始图像的像素输进去就可以识别。
这说明在深度学习中,我们不需要图像相关的知识和语音知识,直接把图像和语音的原始信号输进去就可以,这就使得使用门槛降低,没有专业知识的人也可以使用深度学习。
第二代人工智能的第二个优点是,因为深度学习是使用多层神经网络,这就赋予其强大的学习能力,因此能够处理大数据。
最后,深度学习第二代人工智能主要依靠三个要素:数据、算力,还有算法。使用深度学习以后可以解决很多实际问题,比如图像识别、语音识别的识别率有了大幅提升,2011年在IBM和微软在ImageNet上的图像误识率为50%,4年之后使用深度学习后误识率降到3.57%,实际上超过人类的水平。
第二代人工智能的局限性
但是第二代人工智能也有很大的局限性,最重要的是不能举一反三。
首先,它不可解释,也就是说它可以分辨牛或马,但是我们不知道它的根据,因为这是根据多层神经网络计算得出的结果。第二点是不安全,非常容易受攻击。第三是不易推广,最后一点是需要大量样本来学习。在视觉领域的安全性尤其令人担忧。
比如左边第一张图是一个停止的交通信号,我们只要在交通指示牌上加入一点噪声,图中是加上了几个白块和黑块,它却识别为限速45公里。再比如在图中最左边的坦克侧面涂上一些颜色,机器就将其误识别为校车。这说明,利用深度学习来构造的图像识别系统非常不安全,非常容易受攻击。
人工智能产业现状:大部分不盈利、应用场景有限
利用第一代人工智能技术和第二代人工智能技术构造的系统有什么问题?用这些技术来进行产业化目前的现状是怎样的?
我们可以看到,目前人工智能在很多领域得以应用,包括交通、医疗、安保、智慧城市、家庭服务、智能制造、金融等,同时可以看到这些领域中的人工智能企业数量很多,但是规模很小,大多数是几十人到几百人的规模,千人以上的大企业很少。
人工智能产业的第二个特点是大部分没有盈利。原因就在于第一代人工智能和第二代人工智能技术的局限性,主要表现在两个方面,一方面是现有技术的应用场景有限,只能应用到那些结构化、静态的环境中,比如把现有的第一代和第二代人工智能技术应用到自动驾驶场景中时,如果交通状况比较复杂,就很难应用。
第二是技术本身有局限性。所以,为了使得人工智能的研究工作有进展,特别是为了让企业做大做强,我们必须要发展第三代人工智能的理论和技术。
迈向第三代人工智能需要突破一些理论、方法与关键技术
第三代人工智能理论和关键技术主要为以下三点:
第一,我们必须要探索出可解释和鲁棒的人工智能理论。换句话讲,现在的第一代和第二代人工智能都不够好用怎么办?第二个就是要发展安全、可信、可靠和可扩展的人工智能技术,从而推动人工智能的创新应用。
第三代人工智能的优点有哪些?
如前所述,第一代人工智能符号主义的模型依靠的是知识、算法和算力。第二代人工智能,即亚符号模型/连接主义模型主要依靠的是数据、算法和算力。我们现在发展第三代人工智能,最主要的措施就是把第一代人工智能知识驱动的方法和第二代人工智能数据驱动的方法结合起来,这就可以使我们充分地利用4个要素——知识、数据、算法和算力,特别是算法,即如何去研究新的理论和方法。
下面介绍一下这方面的工作。
在第一代人工智能中,我们做过的一些专家系统,但这些专家系统的规模都比较小,实用性较差。那么我们现在介绍一下在这个方向上做的努力,最典型的代表是美国的沃森系统。
大家知道沃森系统是一个很成功的人工智能系统,它在全美的电视智力竞赛中打败两个全美冠军。它与第一代人工智能相比不同之处在哪里?
当时要建立专家系统,主要的知识和经验来自于专家,比如MYCIN系统传染病的诊断系统,它的知识主要来自于传染病专家。而专家知识是非常昂贵和稀缺的,而且要把专家的知识表示在计算机中,非常耗时耗力,即使是规模不大的MYCIN系统也需要三年才能做出来。主要的挑战是如何扩大人工智能的规模,使其更加实用化,最重要的方法是引进大量的数据。
网络上有大量的非结构化的数据,我们如何自动地把这些非结构化的数据变成计算机可用的语料库,这个问题在沃森系统里得到很好地解决。
有了大量的语料库后,沃森可以利用多种推理机制来解决“问答”的问题,经过对“问题”进行分析与分解,从语料库中找出候选答案,对候选答案进行评分和排序,最后输出问题的答案。
人工智能改变医疗行业
人工智能应用中另一个大的问题是如何使人工智能技术更加可靠、可信。以医疗系统为例。“医疗”主要有三个要素——医务人员、病人和医疗设备和医疗技术。随着医疗技术的发展,医生可以利用先进的设备和技术对病人进行更加高效、准确的诊断。
即使设备和技术有巨大的变化,医务人员和病人的关系始终没有变,也就是说医务人员利用设备和技术为病人治病,所有责任都在医务人员身上,所以病人去看病,主要取决于对医务人员的信任。
设备技术智能化会对医务人员和病人关系起到什么作用呢?由于智能化的设备和技术也参与到诊断过程和疾病的分析过程,这样就产生一个问题,病人和医务人员是否信任设备和技术做出的诊断和决策。所以,当设备智能化以后,我们需要建立一套互信、可靠、高效运行的新医疗系统。
目前的技术,包括人工智能技术,还不足以建立起医生、患者和机器三者之间的信任关系。以医学图像识别为例,假如计算机分析x光片,诊断出病人患有肺癌,但是目前用深度学习方法做出的诊断是不可解释的,医生也无法信任这个结果。所以,只有解决了深度学习图像识别不可解释的问题,才可以建立起病人对诊断结果的信任。
换句话讲,我们要想让这些人工智能技术在医学诊断中发挥更大的作用,就必须提高它的可信度、可靠性和可解释性等。
另外,机器人在服务行业、制造业中有大量应用,比如手术机器人。可以看到,这些机器人的应用场景基本上是结构化的环境,即环境基本上是固定不变的,服务机器人目前在这个领域的应用较多。但是像自动驾驶工作在非结构化环境下,应用就困难得多。所以,我们要想让机器人在更多的领域中应用,也必须解决随机应变等鲁棒性等问题。
我们需要勇闯无人区的创新人才
以上是人工智能的发展现状,从发展现状出发,我们来分析一下未来对人工智能人才培养的要求。
首先,目前发展到第一代和第二代人工智能,我们遇到了瓶颈,需要发展新的第三代人工智能,大家都在探索一条前人都没有走过的道路,因此,无论是对科学研究、开发还是产业来说,都需要有从0~1的创新,因为我们没有办法沿着前人已经走过的路走,所以,技术人员、开发人员和企业家要有一种精神,敢于闯无人区,这是一个很重要的要求。
第二,技术人员,包括管理人员不仅要能够解决问题,更重要的是能提出问题和发现问题。在大学和研究生培养计划下,我们的重点都是在培养解决问题的能力,而在发现问题和提出问题上有所不足。因此,对这样的人才培养必须是提出问题和解决问题的能力并重。
第三,能够理论与实际结合,技术和产业结合。
最后,人才不限于科技人才,还包括管理人才,人工智能企业要想做大做强,必须很好地把资本市场和技术结合起来。因此,我们不仅要培养科技人才,也需要各种各样的管理人才,但不管是管理人才和技术科技人员,创新是最主要的要求。
推荐阅读TensorFlow、PyTorch之后,“国产”AI框架还有没有机会?
重磅!CSDN发布「AI开源贡献奖Top5」「AI新锐公司奖Top10」「AI优秀案例奖Top30」三大榜单
一文读懂:GoogleNet的Inception从v1到v4的演变
90行Python代码,让张小龙的微信地球转起来
突发!印度封禁抖音、微信、快手等59款中国App
厉害!国内大学生计算机编程第一人,一人挑战一个队,百度最年轻T10,现创业自动驾驶
Balancer因通缩代币STA遭遇闪电贷攻击,价值50万美元资产被黑
你点的每个“在看”,我都认真当成了AI