郑南宁院士：让人工智能领域的中国声音愈发响亮—新闻—科学网人工智能的声音可以自主设定选择吗对吗

发表时间：2023-07-05 06:07:43

郑南宁院士：让人工智能领域的中国声音愈发响亮—新闻—科学网

郑南宁院士：让人工智能领域的中国声音愈发响亮

中国工程院院士、西安交通大学教授郑南宁张行勇摄

郑南宁作学术报告张行勇摄

郑南宁，中共党员，中国工程院院士，西安交大教授、博士生导师，IEEEFellow，现任中国自动化学会理事长，国际模式识别协会（IAPR）理事会成员，中国人工智能产业发展联盟常务副理事长，中国人工智能教育联席会理事长，国家科技重大专项“核高基”咨询专家委员会主任等。曾先后获国家科技进步奖二等奖2项、国家技术发明奖二等奖1项、国家自然科学奖二等奖1项；全国优秀教师，获2020年度杰出教学奖，2020年度“全国先进工作者”的荣誉称号，2020年度陕西省最高科学技术奖。

2021年11月25日，陕西省召开2020年度科技创新大会，表彰荣获2020年度陕西省科学技术奖项目的科技工作者。其中，侯洵、郑南宁、范代娣三位科学家荣获2020年度陕西省最高科学技术奖。

“此次获奖不仅是对我个人的肯定，更是对我们整个科研团队的肯定。我们将继续攻坚克难，让人工智能领域的中国声音愈发响亮！”郑南宁在接受采访时如是说。

“目前中国人工智能的基础理论和算法创新的整体水平，以及支持先进人工智能系统的计算芯片还相对落后。”他补充强调，“在当前人工智能发展新一轮的热潮中，我们要保持清醒的认识，避免不切实际的预言和承诺，不要把学术追求的目标当成眼前的产业现实，给社会公众带来误导。”

我国第一颗宇航级视觉信息和图像处理芯片

“从1985年到今天，我们的研究方向始终没有变，围绕人工智能计算机视觉系统不断突破。”郑南宁介绍。

祖籍陕西西安的郑南宁，1952年出生于江苏南京，在农村插队、在工厂做工的种种经历中，他积极优秀的一面早早显露出来，并且在各种环境中都坚持学习。1972年，郑南宁因其优异表现被推荐到西安交通大学电机工程系工业自动化专业学习，此后，又于1978年成为我国恢复高考后西安交通大学的第一批硕士研究生，1981年获得西安交通大学工学硕士学位。硕士毕业后，他因成绩优异被公派到国外留学，在素有“亚洲第一私立学府”之称的世界著名私立综合研究型大学——日本庆应大学学习。郑南宁深知正经历改革开放的国家迫切需要科技人才来推动经济建设，于1985年取得博士学位，之后结束短暂的博士后研究便回到祖国。

回国后的郑南宁在西安交通大学自动控制系任教，1986年他与交大的西迁教师宣国荣教授共同组建了西安交通大学人工智能与机器人研究所，开始人工智能方向的创新研究和人工智能方向研究生的培养，为我国早期的人工智能发展积累了人才和科研基础，也使西安交通大学人工智能专业始终位于全国前列。

勤学不殆，攻坚克难。他主持研制出我国第一颗宇航级视觉信息和图像处理芯片，带领团队解决了一系列重大工程中视觉芯片与系统的“卡脖子”问题，推动了我国计算机视觉核心技术的自主创新，被国际学术同行评价为“引领了国际上第二次视觉注意研究的高潮”。年仅39岁时他就带领年轻的团队研制出“高性能机器视觉及车型与牌照自动识别系统”，荣获国家科技进步奖二等奖。

他的勤奋努力和对事业的执着追求，使他获得多个成果奖项或荣誉，如1991年获得“做出突出贡献的留学回国人员”，1992年获得“国家级中青年突出贡献专家”，1993年获得“全国优秀教师”，1995年获得国家杰出青年基金，首批入选国家“百千万人才工程”，1996年获得“中国青年科学家奖”，1999年当选为中国工程院院士，是同批当选的最年轻的院士。

“嫦娥五号”月壤表面采样机械臂视觉系统

在2016年度国家科学技术奖励大会上，由郑南宁主持的“视觉场景理解的模式表征与计算理论及方法”项目荣获国家自然科学奖二等奖。

2020年12月2日，“嫦娥五号”顺利完成月表采样和封装。2020年12月19日，“嫦娥”五号携带约2千克月壤样本返回地球。

在这一系统复杂的创新工程壮举中，就有郑南宁带领团队设计完成的“嫦娥五号”月壤表面采样机械臂视觉系统，解决了航天视觉系统核心部件和系统架构的关键技术难题。

据了解，郑南宁先后担任国家“863计划”信息领域首席科学家、国家科技重大专项“核高基”第一任总体组组长，主持或参与制定国家“863”信息领域发展规划、重大专项的战略规划与课题指南，也为我国信息领域前沿技术、关键技术突破和产业发展的战略规划制定作出了贡献。

连续4年蝉联“中国智能车未来挑战赛”冠军的“先锋号”无人驾驶车

“先锋号”无人驾驶车是西安交通大学的校园明星。它连续4年蝉联“中国智能车未来挑战赛”冠军，验证了郑南宁团队在机器学习、计算机视觉、定位与导航等领域的最新研究成果。

“先锋号”的成长用了近20年时间。2000年，郑南宁团队开始部署无人驾驶领域的研究。2004年，团队研发的“思源1号”无人驾驶车开始在校园里缓慢地行驶。随后，团队开始思考如何让实验室的研究成果在真实的物理世界得到验证，并能获得不同交通场景的数据。他们制定了一个雄心勃勃的“新丝绸之路挑战”计划——要让无人驾驶车从西安行驶到甘肃的敦煌。但是，车辆出了校门之后，面对马路上川流不息与随意出没的行人，几乎寸步难行，不断需要人工干预。

“实现完全自主的无人驾驶是一个令人兴奋却又望而生畏的挑战。”郑南宁深有感慨说。

如何在复杂的交通场景中，实现真正的无人驾驶？他带领团队重新出发，开始一点点扎扎实实地攻关。今天的“先锋号”集成了多项先进技术，可以很好地应对多种复杂路况，是“智能制造”的优秀代表。当社会各界都在欢呼“无人驾驶时代要来了”时，郑南宁却认为应该保持冷静，因为无人驾驶并没有那么快进入大众的生活。

“从对错误的容忍度来说，人工智能系统可以分成两大类：一类是犯了错误可以重来，另一类是不能犯错误。无人驾驶是不能犯错误的人工智能系统。”郑南宁多次在各种报告学术会上强调。郑南宁认为，“这些难题都是无人驾驶领域值得研究的方向。同时，无人驾驶技术要得到大规模普及，需要在计算能力大幅提升的同时，在低成本、高性能的传感技术方面也要有进一步突破。”

一个倡导人文关怀的大学校长

在取得研究成果的同时，郑南宁培养了一批学术界和产业界的领军人才，如旷视科技首席科学家孙剑博士、紫光展锐CEO楚庆、华为常务董事汪涛及三巡苍穹的英雄航天员景海鹏等。

围绕人工智能专业的人才培养，郑南宁团队不断探索实践。2018年，西安交通大学成立人工智能学院，设立了人工智能拔尖人才培养试验班，探索培养人工智能方向本科生。2018年11月，人工智能学院成立。2019年3月，人工智能学院获教育部首批“人工智能”本科新专业建设资格。

2019年9月21日至22日，在西安举行的第二届中国认知计算机与混合智能学术大会期间，郑南宁发布新书《人工智能本科专业知识体系与课程设置》。

“中国不仅需要培养出更多的人工智能领域人才，更要培养出高层次乃至世界顶尖的人工智能人才。”郑南宁认为，“在当前第四次技术革命的背景下，我们要做出中国人的贡献，就是要把教育抓好。”

1995年，郑南宁担任西安交通大学副校长，2003年至2014年担任校长职务。郑南宁是西安交通大学校史上自改革开放以来任期最长的一位校长，期间西安交通大学走过了大学合并、扩招等改革变化的风云岁月。

“大学是为学生而存在。大学也正因为有了你们，才充满着活力和朝气。”郑南宁寄语2011届毕业生时说。

“用积极的态度、宽阔的视野去重新认识人才培养。”郑南宁多次提到，“现在的大学生就是未来20年社会的中流砥柱。现在大学生的思想成长得如何，决定了20年后我们社会的价值取向。”

在学生眼里，郑南宁是一口气能做五十个俯卧撑的运动达人，是坚持在繁忙工作中抽出时间带着学生一起跑步、游泳、骑车的“别人家导师”。他认为“体育精神的教育是不可或缺的”。在他的影响下，人工智能学院的师生们也一直坚持锻炼，坚定了“为祖国健康工作五十年”决心。

对学生的人文关怀和发自内心对教育事业的热爱，可以说是郑南宁的人生信念与品行。

人工智能现在可以复制你的声音：这对人类意味着什么

克隆语音只需3.7秒的音频。中国科技巨头百度公布了这一令人印象深刻且有点惊人的壮举。一年前，该公司的语音克隆工具DeepVoice需要30分钟的音频才能完成同样的工作。这说明了创造人工语音的技术加速的速度有多快。在短时间内，AI语音生成的功能已经扩展并变得更加真实，这使得该技术更容易被滥用。

（想自学习编程的小伙伴请搜索圈T社区，更多行业相关资讯更有行业相关免费视频教程等待你来学习。完全免费哦!一定关注我的主页简介哦！）

AI语音生成功能

与所有人工智能算法一样，更多数据语音克隆工具（如DeepVoice）接收到的训练结果更加真实。当您听几个克隆示例时，更容易理解该技术可以做的广度，包括能够切换语音的性别以及改变语音的重音和风格。

谷歌推出了Tacotron2，这是一个文本转语音系统，利用公司的深度神经网络和语音生成方法WaveNet。WaveNet分析称为频谱图的音频的可视化表示以生成音频。它用于为Google智能助理生成语音。这种技术的迭代非常好;这几乎是不可能告诉什么是AI产生，什么声音是人类的产生。该算法已经学会了如何发音具有挑战性的单词和名称，这些单词和名称本来就是机器的标志，以及如何更好地发音单词。

谷歌语音生成技术的这些进步使谷歌助手能够提供名人角色。JohnLegend的声音现在可以作为美国任何设备的选项，包括GoogleHome，GoogleHomeHub和智能手机等Google智能助理。吟唱者的声音只会回答某些问题，例如“天气怎么样”和“月球的距离”，可以按命令唱生日快乐。谷歌预计我们很快会有更多名人角色可供选择。

另一个技术精确程度的例子，乔丹·彼得森（12个生命规则的作者）人工智能模型听起来就像是在敲击艾美琳娜的“失去自己”这首歌。人工智能算法的创建者只用了六个小时的彼得森谈话（取自他在网上随时可用的录音）来训练机器学习算法来创建音频。它需要短的音频剪辑，并学习如何以扬声器的风格合成语音。听一听，你会看到它有多成功。

这项先进技术为Lyrebird等公司提供新服务和产品打开了大门。Lyrebird使用人工智能为聊天机器人，有声读物，视频游戏，文本阅读器等创建语音。他们在他们的网站上承认“创新带来了巨大的责任”，强调了这项技术先驱的重要性，要小心谨慎，避免滥用技术。

这项技术如何被滥用

与其他新技术类似，人工语音可以有许多好处，但也可以用来误导个人。随着人工智能算法越来越好，很难分辨出什么是真实的，什么是人为的，将有更多机会用它来制造真相。

根据研究，我们的大脑没有记录真实和人工声音之间的显着差异。事实上，我们的大脑更难区分假声音而不是检测伪造图像。

现在，这些人工智能系统只需要少量音频进行训练，以创造一种模仿个人说话风格和语气的可行的人工语音，滥用的机会就会增加。到目前为止，研究人员无法确定大脑如何区分真假的神经区分。考虑如何在面试，新闻片段或新闻发布会中使用人工语音，以使听众相信他们正在倾听政府中的权威人物或公司的CEO。

提高人们对这项技术存在及其复杂程度的认识将是保护听众在习惯误导我们时不会因人为声音而堕落的第一步。真正的恐惧是，人们可能会被愚弄，因为它听起来像是来自真实的人。有些人试图寻找技术解决方案来保护我们。但是，技术解决方案不是100％万无一失。我们批判性地评估情况，评估信息来源和验证其有效性的能力将变得越来越重要。

原文链接：https://www.forbes.com/sites/bernardmarr/2019/05/06/artificial-intelligence-can-now-copy-your-voice-what-does-that-mean-for-humans/?ss=ai-big-data#29db535e72a2

郑南宁院士：让人工智能领域的中国声音愈发响亮—新闻—科学网 人工智能的声音可以自主设定选择吗对吗