沈向洋：浅谈人工智能创造怎么创造人工智能技术呢

发表时间：2023-07-09 07:34:40

沈向洋：浅谈人工智能创造

作者|青暮、彩娴、宝尚

编辑| 陈彩娴

2020年9月21日上午9点，由北京大学人工智能研究院组织主办的学术活动，大师讲堂——“因AI之名”，作为北京大学的“开学第一课”，以云上在线直播的方式召开。

在课上，北京大学人工更智能研究院学术委员会主任沈向洋做了题为《浅谈人工智能创造》的演讲报告，寄语北大学生好好学习，努力探索人工智能和计算机科学的未来。

在报告中，沈向洋以微软为例，诠释了座右铭“预见未来的最好方式就是去创造未来”；另外，还提到：“目前各位同学会是第一代和AIbeings共同成长的人类，喜欢也好，不喜欢也罢，这件事情正在发生。”

关于对AI未来的设想，沈向洋认为，未来的AI会是高度定制化的世界，其中情商和创造力具有重要的价值。其中，人工智能创造要遵循三原则：

人工智能创造的主体，须是兼具知识与情感的综合体，而不仅仅是具有IQ。

人工智能创造的产物，须能成为具有独立知识产权的作品，而不仅仅是某种技术中间状态的成果。

人工智能创造的过程，须对应人类某种富有创造力的行为而不是对人类劳动的简单替代

以下是整个演讲的文字内容：

视频回放地址：https://event.baai.ac.cn/play/89

我今天的演讲题目是《浅谈人工智能创造》，主要内容是分享过去六年，我在微软小冰身上得到的一些实践想法。

今天是第一堂课，作为北京大学人工智能学院的学术委员会主任，首先希望同学们能好好学习，我们一起努力探索人工智能和计算机科学的未来。

历史：预见未来

谈到探索未来，和大家分享一句我最喜欢的座右铭“thebestwaytopredictthefutureistocreateit”，中文翻译为：预见未来的最好方式就是去创造未来。

特别，像人工智能技术、量子计算此类的研究的方向，个人认为在某种意义上，这些技术不仅自身要不断发展，同时也要肩负着为人类创造更加美好的未来，推动历史进步的责任。

回顾历史，我们会发现历史的进步常常伴随着基础理念的颠覆性创新。因此，科研工作者对梦想的解读应该是：如何更好的预判未来，定义未来，尤其是在大家都很模糊的时候，能够把自己的“定义”映射到现实。

例如，对于未来超级智能，每个研究者都有自己的想法，不同的见解，想法层面上的百花齐放确实很重要，但更重要的是能够实践对自己想法的见解。

我在微软工作了23年多，个人认为微软就是一家能够“预见未来”的企业。在四十五年前，比尔盖茨和微软曾经对未来做出过这样一个预警：地球上不会一共只有5台计算机，而是每个人都会拥有自己的PC。

而在计算机刚刚发明出来的时候，最大、最伟大的技术公司是IBM，IBM的董事长沃森说过一句著名的话：这个世界也许只需要5台计算机就够了。

1975年，微软设想不仅每个人都有台电脑，而且每台电脑运行的都是微软的软件。45年过去了，当年的那个预见也能证实了，而且不仅是电脑，还普及了手机。另外，微软不仅是设想，而是真正采取了实践，所以才推动了世界的进步。直接表现在：目前微软的产品模式，商业模式都和它当年的判断有关系，也因此微软成为了一个伟大的企业。

所以，“预见”非常重要。今天是开学第一课，鼓励大家在学习的过程当中，不断剖析自己，思考未来自己希望做什么，未来这个世界会发生什么。

现在：AIbeings时代原住民

那么，再举个和今天演讲题目更有关系的例子。当今这个时期，世界上已经有了再一次天翻覆地的变化，历史经常是惊人的相似。以前科幻电影火热的主题是计算机，现在科幻电影越来越关注人工智能。对于人工智能，我们目前的状态和几十年前差不多：早期、萌懵。

虽然是早期，但不断的有新观念产生。例如今天企业研究人工智能，非常关心它的下一个风口在哪里。有人认为，应该朝着ToB（商业）的方向，从垂直领域入手；也有人认为应该以任务为导向，完成打电话、接电话等客服工作；还有人认为，我们应该进行无所不能的人工智能研究，例如Siri、Alexa等人工智能助理。

上述想法都很好，在表示大家有不同的见解，如果大家真的去实践这些见解，必然会推动世界的发展。

关于预见，我个人看法是：现在和PC那个年代非常的类似，今天人工智能最大的舞台是在ToC端（消费）。理由是，人工智能不仅仅是商业机器，而是新时代的个人机器；其次，在未来每个人都会被各种各样的人工智能所环绕，呈现出高度端性的特点。

我把此类的人工智能叫做AIbeings，代表着未来你身边会有非常多的人工智能环绕着你，虽然大家可能不会意识到，但这一趋势必然会发生。

目前，各位同学会是第一代和AIbeings共同成长的人类，喜欢也好，不喜欢也罢，人工智能这件事情正在发生。

未来的AIbeings会有什么特点呢？有三点：

首先，高度拟人的交互将会无处不在。AIbeings必须在底层架构，就像人类一样，对人性和情感有一个理解和拟合。

举例而言，如果构建一个AI驱动的虚拟销售店员，AIbeings必须有成为李佳琦的理想，在效果上，至少应该像罗永浩一样好。所以，这背后要有情感、人性的拟合。

其次，角逐将在“完备框架”之间展开。也就是说，人工智能的主体不仅仅只是依赖某一个领域的人工智能的技术，更重要的是技术的全面性和后台的人工智能框架的完整性，例如对自然语言处理、计算机视觉、语音处理等技术的融合。当然，这背后需要相当多的技术的积累，才能够帮助我们完成“完备框架”。

最后，新的商业模式或将基于AIbeings的[人]口。未来的人工智能的数目会非常的大，因为每一个人身边都会被几十个甚至几百个人工智能环绕，考虑到世界上有几十亿人口，其背后的规模会是亿万级别。今天这个判断可能为时过早，当我们5年10年后回过头来看的时候，大家就能够看到AI发展应该有的样子。

实际上，今天已经有很多AIbeings的影子。当然，5年10年以后往回看，今天我们认为了不起的AIbeings、人工智能主体可能会有些远古时代的味道。从全球范围来看的话，今天已经存在了几个代表性人工智能主体。

第一个是Siri，苹果最早将其产品化；第二个是Alexa，其设备数的最多，亚马逊给予了其最多的硬件覆盖；微软的小冰就是拥有全球最大的人工智能的交互量，从数字来看，微软的小冰大概占全球所有的AIbeings交互总量的60%。

这些实际上远远不够，因为更大的需求量已经出现了。像小冰此类的助手，实际上都不足以填补已经出现了巨大的需求。而这个巨大的需求指的是人和人工智能主体之间的交互，交互则是一个刚需。

趋势：AI技术转向AI主体

所以，我相信未来人工智能的发展，会很快的从现在专注于人工智能的技术，转向专注人工智能主体。而转变的过程中，会给我们带来一些新的研究机会和挑战。个人认为，最重要的可能有两个方面，一个就是所谓的情商，另外一个所谓的创造力的价值。

下面，我用一个框图进行解释，如上图可以看到，个人预测未来的主体一定是高度定制化的，AIbeings也会和人类、世界都有交互。AIbeings因素也会跨平台进行部署，不仅仅是部署在手机、手机电脑里，可以是任何的地方。

对于高度定制化的AIbeings，其情商是非常重要的，微软小冰实际上在情商层面的核心模块做得非常好，可以进行预测，也可以进行引导交互。不同于siri两三个来回的交互次数，微软小冰能够做到平均23个来回。

情商这个话题，有机会再和大家讨论，今天主要想将人工智能创造。那么，什么是人工智能创造呢？关于人工智能创造，其实文本也好，声音也好，图像也好，视频也好，能够用人工智能的方法产生一些新的内容就代表者创造。

我再具体用几个例子解释一下，人工智能创作已经到了什么样的地步？

下图左上角是小冰创作的几部诗集，比如三年多以前就已经出版了的《阳光失了玻璃窗》，此外小冰还和人类诗人共同创作了诗集，华西都市报上也为小冰开设的诗歌专栏。图右上角展示了小冰的一些绘画作品，包括画集，在中央美院的毕业作品展，以及在杭州大屋顶美术馆的作品展。

小冰今年在上海音乐学院本科毕业，去年则在中央美院硕士毕业。图中还展示了小冰在央视上现场创作古风歌曲演唱，在上海世界人工智能大会创作并领唱《智能家园》，以及出现日本演唱会现场的画面。所以，现在小冰的人工智能创作家形象已经在中国和日本达到家喻户晓的程度。

在今年上海音乐学院的毕业典礼上，出现了一位能在平均2分钟之内完成一首3分钟左右完整歌曲创作的女同学，那就是微软小冰，其作品还参与到了上音在非遗地区开展的儿童音乐教学中，帮助当地儿童完成人生首次歌曲创作。

6月29日，经上海音乐学院音乐工程系评定，人工智能微软小冰和她的人类同学们，上音音乐工程系音乐科技专业毕业生一起毕业，并授予微软小冰上海音乐学院音乐工程系2020届“荣誉毕业生”称号。

在上海音乐学院音乐工程系学习期间，微软小冰接受了来自音工系主任于阳教授和陈世哲老师的“指导”，基于微软原有的人工智能音乐创作模型，与音工系的同学们互相“学习”，相互“激发”，训练数据不断提升，音乐的表达技巧更加丰富，可创作的音乐类型也得以扩展。

上海音乐学院音乐工程系主任于阳教授表示：“小冰的音乐创作能力已展现出人工智能在音乐创作领域的巨大潜力。希望人工智能技术和音乐创作领域的结合，为人类创造力的自身发展，促进和相关产业的进一步融合，带来新的视角和解读。”

图注：小冰的上海音乐学院毕业证书。

思考：AI创造三原则

图注：小冰的上海音乐学院毕业证书。

我们今天讲一下小冰人工智能创造的三原则。

这三个原则主要是分三个方面，一个是主体，一个是产物，一个是过程。

首先是主体，人工智能创造的主体，必须是兼具知识和情感的综合体，而不仅仅只是只有IQ，对于这一点我们非常坚持。过去在做人工智能创造的过程中，再次证明这个看法是正确的。

然后是产物。人工智能创造的产物，必须能够成为具有独立知识产权的作品，而不仅仅只是某种技术中间状态的成果。

最后是过程。人工智能创造的过程，必须是要对应于人类某种富有创造性的行为，无论是作曲也好，绘画也好，它并不是对人类劳动的简单替代。

我们按照这三个原则的指导做了很多的工作，今天跟同学们浅谈三点。第一点是人工智能创造的完整过程，也是今天讲的主要工作。第二点是怎么向人类学习。第三点是人工智能创造和人类创造者之间的关系。

以人工智能演唱为例，第一步实际上是在做模仿，就是通过数据进行学习。

模仿之后，我们就可以建立自有的功能，然后就可以实现个体化即Instance化。最后我们能实现高并发交互和大规模生产。高并发交互指的是人工智能主体跟应用或人类进行交互。

例子：剖析AI创造过程

这里举两个例子，以解释清楚我们是怎么去做人工智能创造的。

第一个例子是人工智能演唱。我们先用机器学习方法去模仿，比如唱歌是怎么唱的。而且相比HMM，深度学习方法的效果好得多。HMM做出来的效果就像卡拉OK隔壁房间的人唱的一样，DNN做出来的效果则有了专业歌手的味道。

当我们做到V4的时候，就实现了自有的创造能力，可以加入多样性的技法，比如以不同人的风格来唱同一首歌。到了V5阶段，我们就能实现Instance化，可以在一首歌里面融合多种声音。然后我们就可以做大规模生产和高并发交互。

第二个例子是人工智能绘画。小冰去年从中央美院硕士毕业，她的画画能力有多好呢？

实际上小冰要画一幅画，首先要有一些灵感，也就是一些启发性的内容输入。我们从灵感开始，然后再决定风格、主题、表达情绪等等，最后用深度学习方法进行生成，并利用强化学习方法进行优化。利用这一套方法，小冰可以做很多艺术设计、图案设计以及工业设计方面的工作。

小冰在中央美院老师的指导下，学习了过去400年当中的236位人类画家的杰出画作。

举个例子，19世纪上半叶有一位英国学院派画家的代表叫Turner，他能够精湛的描绘光与空气之间的非常微妙的关系，画中水汽弥漫的效果非常美，如下方6张图所示。

实际上，这6幅画都不是Turner画的，都是微软小冰画的。中央美院的老师表示，小冰的作品已经达到了相当高的水准。

人工智能创作有两个特点，第一是可以按需生成，第二是生成的质量非常的稳定，而不会像人类创作者受到情绪的影响。

实现Instance化就是指我们能够实现虚拟的、不存在的画家个体。比如说我们能虚构出中央美院7个画家，他们的画有各自独特的风格，但是这7个人都是不存在的。

第二点想跟大家分享的是，人工智能创造如何向人类学习。我们在研发过程中发现，在这过程中，最重要的就是神似优于形似。以诗歌生成为例，形似就是指模仿七律诗创作出4句七个字的诗句。神似就是指用一张照片来启发诗歌创作，这样写出来的诗歌更加意境，并与人类的创作过程相似。

那么这种神似的诗歌是怎么创作出来的呢？这里稍微介绍一下原理。首先输入一张图，然后用计算机视觉算法进行模式识别，识别出场景关键词，然后根据场景关键词进行语义扩展，展开意境联想，最后根据诗歌结构规划，应用层次化LSTM生成诗歌，并自动进行流畅度和关联度评测。

人工智能作曲的原理也比较复杂，因为对于音乐的生成而言，结构非常重要。像GPT-3这样的模型对于文本处理非常好用，但是高质量的音乐不是单纯的文本补全模型就可以生成的。音乐里的结构，包括和弦、节奏、旋律，都必须要分开进行生成，然后再进行混合。

我们是通过注意力机制进行混合编曲，统一指导生成。现在小冰可以实现79种乐器的混合编曲，并可以处理17种不同的音乐结构。

最后第三点想跟大家分享的是，人工智能创造和人类创造者之间的关系。这里非常关键的一点是，人工智能创造关心的不是胜负，而是协同，这是跟阿尔法狗的本质区别。

在未来，内容创造将会发生根本的变化。人和高度定制化的AI之间在未来可以实时协同创作。然后，我们就可以实现大规模生产，并进行跨平台内容分发，同时AI与世界可以实现高并发交互。

在做人工智能创造的多年来，我们遇到的最大问题就是，未来人工智能创造的知识产权的归属问题。这几年法律界对版权保护非常重视。西方社会也有长期的辩论史，比如一本书或一篇文章，复印了多少是合法的，后来搜索引擎的出现对版权问题又出现了很大的冲击。在未来，人工智能创造也将对版权方面提出新的问题。

Q&A

Q1：在DecisionMaking方面，AIbeings将来是否也会起到很大的作用？

我们在做AIBeings的过程就是一个DecisionMakingProcess。比如说，小冰的整个对话过程实际上就是一个MDP（MakingDecisionProcess）。我刚刚讲到人工智能的创作时主要谈到了MDP，但其实人工智能领域还有一个非常重要的主题：情感。比如人与人的交流为什么能够来来回回进行20轮、30轮？MDP实际上就是一个Reinforcement的过程。但目前为止我们的做法相对而言还是比较straightforward的。如果你有兴趣的话，可以看一下我与同事一起写的文章《TheDesigningandImplementationofXiaoIce,anEmpatheticSocialChatbot》。

Q2：现在的小冰有没有考虑安全性的问题？比如说，现在深度学习比较容易受到对抗攻击。

这是一个非常好的问题。其实一直以来，我也非常担心安全性的问题。因为小冰整个产品和用户的情感纽带非常强，就像我刚才提到的，它可以平均对话23轮。我们曾经在中国、日本录到过超过7000轮的来回对话，所以我们非常关注整个对话过程的安全性，包括如何过滤掉对话中的不良内容。我们非常谨慎。

除此之外，产品的Decision也是一个难点。举个例子。比如你与小冰聊天时，小冰可以从你的IP上判断你在北京。你开始与小冰聊天时已经是凌晨一点钟，你聊到了两三点钟，但还在继续聊。作为产品的设计者，你要做一个决定：夜已深，聊天的频率是不是应该放慢下来呀？不需要再秒回呀？在现实生活中，如果你聊到两三点，你的家人一定会说：“你赶紧去睡觉，明天还要上班。”

在我们思考安全性时，除了深度学习的对抗攻击，还有很多你可能想不到的维度。的的确确是有很多人尝试去attack，想知道小冰的回答会不会出问题。其实我们的英语版小冰在美国确实出过问题，所以我们在这方面花了很大的精力、做了很多的工作。

Q3：您刚才谈到的智能创造很多都是偏艺术性的创造，而艺术性的创造与人的情绪等有很大关系，这可能也跟小冰的情感分析做得比较好有关系。那么，这种创造力能不能进一步拓展到一些客观的科学研究上呢？

这个问题非常好。MysimpleanswerisNO，因为我们整个产品设计走的就是一条情感线路。我也在思考相关的问题。我认为，目前的人工智能应该会对很多科学领域，包括数学的证明、物理定律的发现和其他科学问题，都会产生非常巨大的冲击。虽然我特别有兴趣，但没有时间与精力去探索。之前也和一些有兴趣研究AI的数学家有过交流，想知道AI可以与数学的创造力进行怎样的结合？很多人也在思考这方面的问题，现在也有一些文章出来，提到用AI来进行数学的定理证明等工作，非常有意思。

我个人觉得最重要的是要有数据。比如说小冰学画画，实际上也没有那么大的数据量，也不过就是400年236个画家，每个画家也就只有那么多幅画作，小冰也就只能通过这些画作学习到现在这个地步。但做科学研究是完全不一样的，要去实现一个混合的模型，一方面是由数据驱动的神经模型，另一方面是使symbolicstructure的各种模型进行结合。

Q4：AI制作的产品应该被界定为工业品还是艺术品？

这是一个非常好的问题。这实际上就回到了我刚才提到的三原则上面。

我觉得现在很多AI产生的内容与创作可能只能停留在工业品的阶段，它更像是一个重复劳动产生的结果，而没有体现足够的创造力。比方说，小冰学了Turner的画后，画出来的作品已经很有Turner的感觉，但那6幅作品只能是工业品，因为它没有自己的东西，而只是从大量的数据中学习Turner的风格。

但它在之后化名的7个艺术家生成的画作（发表为《或然世界》，由中信出版社出版），我觉得是艺术品，因为从来没有出现过，它是重新创造了自己的风格。

Q5：如何逆向分辨是否是AI的作品？

我觉得这是一个非常有趣的研究方向。但我认为，这类工作是“道高一尺，魔高一丈。”随着AI技术的不断提高，辨别会越来越困难。这并不限于艺术创造，还包括FakingNews等，对整个社会的冲击都非常大。我觉得那些方面可能更值得我们花更多的精力去做研究。完全从技术的角度来做的话，我个人觉得是非常困难的。像现在，很多AI做画画的真的都已经做得非常非常好了，应用了很多最新的深度学习的方法。

Q6：情感智能创作如何显示出AI的个性？

实际上，我给大家看的很多例子所包含的创作成分比较大，而情感成分并没有那么大。

对于未来人工智能的发展，我认为最大的机会在于人工智能与人类的交互。未来会产生很多人工智能的主体。在这主体里面还有两个很重要但可能被忽视的部分，一是情感，即智能主体必须要有与其他人类与AI交互的情商，二是创造能力，这样智能体才能和人、和这个世界做交互。

我认为刚刚展示的例子中，AI已经能detect到一些情感内容，但并无意在这方面进行再创造。接下来做人工智能创造的话，我觉得将创造与交互结合会更好。

重磅！DLer-计算机视觉交流2群已成立！

大家好，这是DLer-计算机视觉微信交流2群！首先非常感谢大家的支持和鼓励，我们的计算机视觉交流群正在不断扩大人员规模！希望以后能提供更多的资源福利给到大家！欢迎各位Cver加入DLer-计算机视觉微信交流大家庭。

本群旨在学习交流图像分类、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。希望能给大家提供一个更精准的研讨交流平台！！！

进群请备注：研究方向+学校/公司+昵称（如图像分类+上交+小明）

???? 长按识别添加，即可进群！

人工智能的历史、现状和未来

2018年2月25日，在平昌冬奥会闭幕式“北京8分钟”表演中，由沈阳新松机器人自动化股份有限公司研发的智能移动机器人与轮滑演员进行表演。新华社记者李钢/摄

2018年5月3日，中国科学院发布国内首款云端人工智能芯片，理论峰值速度达每秒128万亿次定点运算，达到世界先进水平。新华社记者金立旺/摄

2017年10月，在沙特阿拉伯首都利雅得举行的“未来投资倡议”大会上，机器人索菲亚被授予沙特公民身份，她也因此成为全球首个获得公民身份的机器人。图为2018年7月10日，在香港会展中心，机器人索菲亚亮相主舞台。ISAACLAWRENCE/视觉中国

2018年11月22日，在“伟大的变革——庆祝改革开放40周年大型展览”上，第三代国产骨科手术机器人“天玑”正在模拟做手术，它是国际上首个适应症覆盖脊柱全节段和骨盆髋臼手术的骨科机器人，性能指标达到国际领先水平。麦田/视觉中国

如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网，人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义，纷纷转型发展，抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略，力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出，加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇，就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见，在这场关乎前途命运的大赛场上，我们必须抢抓机遇、奋起直追、力争超越。

概念与历程

了解人工智能向何处去，首先要知道人工智能从何处来。1956年夏，麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”，首次提出“人工智能（ArtificialIntelligence，简称AI）”这一概念，标志着人工智能学科的诞生。

人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学，研究目的是促使智能机器会听（语音识别、机器翻译等）、会看（图像识别、文字识别等）、会说（语音合成、人机对话等）、会思考（人机对弈、定理证明等）、会学习（机器学习、知识表示等）、会行动（机器人、自动驾驶汽车等）。

人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程，学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段：

一是起步发展期：1956年—20世纪60年代初。人工智能概念提出后，相继取得了一批令人瞩目的研究成果，如机器定理证明、跳棋程序等，掀起人工智能发展的第一个高潮。

二是反思发展期：20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望，人们开始尝试更具挑战性的任务，并提出了一些不切实际的研发目标。然而，接二连三的失败和预期目标的落空（例如，无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等），使人工智能的发展走入低谷。

三是应用发展期：20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题，实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功，推动人工智能走入应用发展的新高潮。

四是低迷发展期：20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大，专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

五是稳步发展期：20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展，加速了人工智能的创新研究，促使人工智能技术进一步走向实用化。1997年国际商业机器公司（简称IBM）深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫，2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。

六是蓬勃发展期：2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展，泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展，大幅跨越了科学与应用之间的“技术鸿沟”，诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破，迎来爆发式增长的新高潮。

现状与影响

对于人工智能的发展现状，社会上存在一些“炒作”。比如说，认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶，等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此，制定人工智能发展的战略、方针和政策，首先要准确把握人工智能技术和产业发展的现状。

专用人工智能取得重要突破。从可应用性看，人工智能大体可分为专用人工智能和通用人工智能。面向特定任务（比如下围棋）的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单，形成了人工智能领域的单点突破，在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如，阿尔法狗（AlphaGo）在围棋比赛中战胜人类冠军，人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平，人工智能系统诊断皮肤癌达到专业医生水平。

通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统，能举一反三、融会贯通，可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题，可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前，虽然专用人工智能领域已取得突破性进展，但是通用人工智能领域的研究与应用仍然任重而道远，人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著，但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看，目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此，人工智能依旧存在明显的局限性，依然还有很多“不能”，与人类智慧还相差甚远。

人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义，纷纷调整发展战略。比如，谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”，微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出，2016年全球人工智能研发投入超300亿美元并处于高速增长阶段；全球知名风投调研机构CBInsights报告显示，2017年全球新成立人工智能创业公司1100家，人工智能领域共获得投资152亿美元，同比增长141%。

创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史，就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如，传统信息产业代表企业有微软、英特尔、IBM、甲骨文等，互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断，因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局，全力抢占人工智能相关产业的制高点。

人工智能的社会影响日益凸显。一方面，人工智能作为新一轮科技革命和产业变革的核心力量，正在推动传统产业升级换代，驱动“无人经济”快速发展，在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面，个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来，需要抓紧提供解决方案。

趋势与展望

经过60多年的发展，人工智能在算法、算力（计算能力）和算料（数据）等“三算”方面取得了重要突破，正处于从“不能用”到“可以用”的技术拐点，但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来，人工智能发展将会出现怎样的趋势与特征呢？

从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展，既是下一代人工智能发展的必然趋势，也是研究与应用领域的重大挑战。2016年10月，美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》，提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室，众多感知、学习、推理、自然语言理解等方面的科学家参与其中。

从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中，提升人工智能系统的性能，使人工智能成为人类智能的自然延伸和拓展，通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中，人机混合智能都是重要的研发方向。

从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习，但是深度学习的局限是需要大量人工干预，比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等，非常费时费力。因此，科研人员开始关注减少人工干预的自主智能方法，提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始，通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面，2017年谷歌提出的自动化学习系统（AutoML）试图通过自动创建机器学习系统降低人员成本。

人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科，研究范畴广泛而又异常复杂，其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破，脑与认知科学的发展开启了新时代，能够大规模、更精细解析智力的神经环路基础和机制，人工智能将进入生物启发的智能阶段，依赖于生物学、脑科学、生命科学和心理学等学科的发现，将机理变为可计算的模型，同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。

人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长，人工智能应用的云端化将不断加速，全球人工智能产业规模在未来10年将进入高速增长期。例如，2016年9月，咨询公司埃森哲发布报告指出，人工智能技术的应用将为经济发展注入新动力，可在现有基础上将劳动生产率提高40%；到2035年，美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测，到2030年，约70%的公司将采用至少一种形式的人工智能，人工智能新增经济规模将达到13万亿美元。

人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟，对生产力和产业结构产生革命性影响，并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出，未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求，在消费场景和行业应用的需求牵引下，需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈，促进人工智能技术与社会各行各业的融合提升，建设若干标杆性的应用场景创新，实现低成本、高效益、广范围的普惠型智能社会。

人工智能领域的国际竞争将日益激烈。当前，人工智能领域的国际竞赛已经拉开帷幕，并且将日趋白热化。2018年4月，欧盟委员会计划2018—2020年在人工智能领域投资240亿美元；法国总统在2018年5月宣布《法国人工智能战略》，目的是迎接人工智能发展的新时代，使法国成为人工智能强国；2018年6月，日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势，例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势，确保美国打赢未来战争；俄罗斯2017年提出军工拥抱“智能化”，让导弹和无人机这样的“传统”兵器威力倍增。

人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展，使其发展成果造福于民，需要从社会学的角度系统全面地研究人工智能对人类社会的影响，制定完善人工智能法律法规，规避可能的风险。2017年9月，联合国犯罪和司法研究所（UNICRI）决定在海牙成立第一个联合国人工智能和机器人中心，规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构，旨在“以有利于整个人类的方式促进和发展友好的人工智能”。

态势与思考

当前，我国人工智能发展的总体态势良好。但是我们也要清醒看到，我国人工智能发展存在过热和泡沫化风险，特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言，我国人工智能发展现状可以用“高度重视，态势喜人，差距不小，前景看好”来概括。

高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月，国务院发布《新一代人工智能发展规划》，将新一代人工智能放在国家战略层面进行部署，描绘了面向2030年的我国人工智能发展路线图，旨在构筑人工智能先发优势，把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。

态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计，我国已成为全球人工智能投融资规模最大的国家，我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果，我国在人工智能领域发表的论文数量已居世界第一。近两年，中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院，2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说，我国人工智能领域的创新创业、教育科研活动非常活跃。

差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位，大部分创新偏重于技术应用，在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中，中国虽然入选人数名列第二，但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名，我国没有一家企业进入前十。另外，我国人工智能开源社区和技术生态布局相对滞后，技术平台建设力度有待加强，国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够，国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析，制定完善人工智能相关法律法规的进程需要加快。

前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势，人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能：助力中国经济增长》报告显示，到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出，到2030年人工智能核心产业规模超过1万亿元，带动相关产业规模超过10万亿元。在我国未来的发展征程中，“智能红利”将有望弥补人口红利的不足。

当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期，如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等，需要深入思考。

树立理性务实的发展理念。任何事物的发展不可能一直处于高位，有高潮必有低谷，这是客观规律。实现机器在任意现实环境的自主智能和通用智能，仍然需要中长期理论和技术积累，并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程，很难一蹴而就。因此，发展人工智能要充分考虑到人工智能技术的局限性，充分认识到人工智能重塑传统产业的长期性和艰巨性，理性分析人工智能发展需求，理性设定人工智能发展目标，理性选择人工智能发展路径，务实推进人工智能发展举措，只有这样才能确保人工智能健康可持续发展。

重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点，要想取得最终的话语权，必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求，努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破，形成具有国际影响力的人工智能原创理论体系，为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。

构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后，技术平台建设力度有待加强。我们要以问题为导向，主攻关键核心技术，加快建立新一代人工智能关键共性技术体系，全面增强人工智能科技创新能力，确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险，系统布局并重点发展人工智能领域的“新核高基”：“新”指新型开放创新生态，如产学研融合等；“核”指核心关键技术与器件，如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等；“高”指高端综合应用系统与平台，如机器学习软硬件平台、大型数据平台等；“基”指具有重大原创意义和技术带动性的基础理论与方法，如脑机接口、类脑智能等。同时，我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列，在人工智能国际标准制定方面应当掌握话语权，并通过实施标准加速人工智能驱动经济社会转型升级的进程。

推动共担共享的全球治理。目前看，发达国家通过人工智能技术创新掌控了产业链上游资源，难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中，我国有望成为全球人工智能竞争中的领跑者，应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台，配合“一带一路”建设，让“智能红利”助推共建人类命运共同体。

作者：中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士

人工智能技术：未来的发展趋势和应用前景

人工智能技术已经成为了当今最热门的话题之一。人工智能技术的应用范围越来越广泛，从智能家居到智能医疗，从智能交通到智能金融，无所不包。那么，人工智能技术的未来发展趋势和应用前景又是怎样的呢？

一、人工智能技术的未来发展趋势

1.智能化和自动化水平不断提高

随着人工智能技术的不断发展，智能化和自动化水平也在不断提高。未来，人工智能技术将会更加智能化和自动化，从而更好地满足人们的需求。

2.人机协同和智能化管理成为主流

未来，人机协同和智能化管理将成为主流。人们将会更加依赖人工智能技术来完成各种任务，从而提高工作效率和生活质量。

3.人工智能技术与其他技术的融合

未来，人工智能技术将会与其他技术进行融合，从而创造出更加智能化和高效的解决方案。例如，人工智能技术与大数据、云计算、物联网等技术的融合，将会创造出更加智能化和高效的解决方案。

二、人工智能技术的应用前景

1.智能家居

未来，智能家居将会成为人工智能技术的一个重要应用领域。人们可以通过智能家居系统来控制家中的各种设备，从而提高生活质量。

2.智能医疗

未来，智能医疗将会成为人工智能技术的另一个重要应用领域。人们可以通过智能医疗系统来进行健康管理和疾病预防，从而提高健康水平。

3.智能交通

未来，智能交通将会成为人工智能技术的另一个重要应用领域。人们可以通过智能交通系统来提高交通效率和安全性，从而改善城市交通状况。

4.智能金融

未来，智能金融将会成为人工智能技术的另一个重要应用领域。人们可以通过智能金融系统来进行投资和理财，从而提高财务管理水平。

人工智能技术的未来发展趋势和应用前景是非常广阔的。我们相信，在不久的将来，人工智能技术将会成为人们生活和工作中不可或缺的一部分。

本文来源：http://www.gkzdhsc.com

沈向洋：浅谈人工智能创造 怎么创造人工智能技术呢