浅谈人工智能与围棋
1997年,IBM公司的人工智能“深蓝”在国际象棋上战胜了人类最顶点的棋手,但围棋一直是人工智能无法攻克的壁垒,究其原因,因为围棋计算量太大了,对于计算机来说,每一个位置都有黑、白、空三种可能,那么棋盘对于计算机来说就有3的361次方种可能,而宇宙的原子只有10的80次方,所以穷举法在这里行不通了。正因为如此,才有人断言,人工智能永远不可能攻克围棋。然而2016年3月份AlphaGo以4-1的比分击败李世石,让人大跌眼镜。而AlphaGo的算法也不是穷举法,而是在人类的棋谱中学习人类的招法,不断进步,而它在后台,进行的则是胜率的分析,这跟人类的思维方式有很大的区别,他不会像人类一样计算目数,而是胜率。AlphaGo的出现,给人类带来了很大冲击,改变了人类从前对围棋的一些看法,例如上图中的13在此前都是典型的非主流下法,但AlphaGo就在用,而且还很好用,人类也开始大幅度模仿。类似的还有下图还有一例,颠覆了人类对某个定式数十年的看法上图是著名的村正妖刀然而,在人工智能的世界里,没有定式在AlphaGo的计算中,白10如下图,胜率会瞬间提高10%以下是我们国家的人工智能虽然胜率不及阿尔法狗,但也很可观了(其对手均为国内冠军或世界冠军)而绝艺也在网络上帮助我们讲解围棋,下列举一例,前几天的阿尔法0自我对战此时的胜率,双方很接近。十几步过后,机器的世界中,判断白棋稍好其实这就已经很接近了从以上几个图中我们可以看出来无论是阿尔法狗还是绝艺,他们采取的方式是走与人类思维不同的道路,人类普遍的思维方式是算目数,但是机器做不到,至少没有人类那么精准,所以就改为算胜率,在它的世界中可能领先半目胜率是99%,领先10目的胜率是80%,采用一种大家从没想过的方式击败人类。
黄金新十年来临,人工智能面临哪些机遇与挑战
原标题:黄金新十年来临,人工智能面临哪些机遇与挑战?
编者按:本文系专栏作者投稿,作者智能相对论。3月11日,全国两会闭幕,“人工智能”依然是热议话题,不过今年意义却大不一样,十三届全国人大四次会议表决通过十四五规划纲要,智能经济被寄予厚望。2021年很可能会是智能经济的一道分水岭。2021年,智能经济分水岭自2016年以来,两会上关于人工智能的声音就越来越多。2017年两会上,百度CEO李彦宏提交的三份提案就均与AI相关,科大讯飞CEO董事长刘庆峰则提议将“智能+”上升为国家战略……今年两会上“人工智能”依然是高频词汇。李彦宏提交的5份提案涉及自动驾驶和智能交通、智慧养老进社区等方面,均与AI相关;联想杨元庆则提出“新IT”即IntelligentTransformation(智能转型)的概念;小米雷军的建议涉及智能制造等三个方面;360周鸿祎则建议要尽快加强智能汽车网络安全……在两会上被表决通过的十四五规划纲要中,“科技”出现36次,“数字”出现17次,“智能”出现7次。“加快数字发展”与“发展战略性新兴产业”均拥有自己的独立篇章。规划纲要指出:“发展数字经济,推进数字产业化和产业数字化,推动数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。加强数字社会、数字政府建设,提升公共服务、社会治理等数字化智能化水平。”规划纲要明确要“推动互联网、大数据、人工智能等同各产业深度融合,推动先进制造业集群发展,构建一批各具特色、优势互补、结构合理的战略性新兴产业增长引擎,培育新技术、新产品、新业态、新模式。”今年两会上,代表们都在强调两个字:“应用”,更关注AI在产业经济、社会民生与城市治理等领域的落地。十四五规划纲要指出要大力发展智能经济,2021年是十四五开局年,对中国人工智能产业来说,也将是至关重要的年份。“十三五”期间,我国全社会研发经费支出从1.42万亿元增至2.21万亿元,着力加强基础研究和关键核心技术攻关,科技实力进一步增强。人工智能是我国科技自主创新的关键领域之一,我国AI产业取得了全球瞩目的成就,人才、算法、算力等基础已完善。2020年疫情不约而至,AI在防疫中贡献了力量,全社会对智能化达成高度共识。疫情期间我国提出“新基建”战略,人工智能是其重要组成部分之一。已经结束的地方两会也表明,全国多地正加速建设数字经济、发展人工智能产业、加快产业智能化升级。天时地利人和,2021年人工智能将从小范围应用走向大规模落地。新十年,智能经济面临哪些新机遇?1、AI基础技术进一步突破。AI经历“革命性十年”的大发展,底层算法以深度学习为核心。随着AI的大规模应用,AI技术已出现瓶颈。科学家与工程师们在现有技术框架下克服瓶颈,但却很难将其消除。算法层面,人工智能目前处于初级阶段,从被动感知向主动感知、认知和决策还需要技术全面提升;算力层面,人工智能对计算提出更高要求,当前的计算体系在成本、性能与能耗上均不堪重负。新十年,AI基础技术或再度跃迁。递归神经网络LSTM之父JürgenSchmidhuber在2020年就曾撰文指出,自然语言处理(NLP)、计算机视觉与强化学习是AI前十年的技术主线,下一个十年,量子计算、无监督学习、浅层学习网络与算力vs深度学习进展,被寄予厚望。量子计算如果能够取得突破性进展,AI将是另外一番景象:“自1975年摩尔定律提出以来一直颠扑不破,但近10年来我们的发展慢了下来。因此,很多人相信技术进步即将到来,很可能就是我们前文讨论的量子计算。这将有助于推动深度学习的重大进步。”我国已在战略布局下一代AI技术。十四五规划纲要指出,要瞄准人工智能、量子信息、集成电路、生命健康、脑科学、生物育种、空天科技、深地深海等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。2、智能云将成社会“水电煤”。越来越多企业意识到AI价值,然而AI技术门槛颇高,企业自行研发并不现实,也无必要。基于“云服务”模式,企业可快速基于云端AI技术能力开发AI应用。2020年底,IDC报告预测到2021年至少有65%的中国1000强企业将利用自然语言处理、机器学习和深度学习等AI工具,赋能60%在客户体验、安全、运营管理和采购等业务领域的用例。IDC在《中国人工智能云服务市场研究报告(2020H1)》报告中指出,企业智能化转型是驱动AICloud市场规模增长的重要因素,AI云服务厂商在整体AI软件及应用市场中将获得越来越高的市场份额。云计算巨头纷纷在名字中加入“智能”背后,反映出它们对AI云服务的日益重视。前十年,云计算是社会数字化基础设施;新十年,AI将成为云计算市场的一大增量,智能云则将成为智能社会的水电煤。3、服务机器人迎来黄金发展期。前十年,大规模爆发的AI应用却不多。在消费市场,智能音箱、智能汽车、智能家居等少数产品实现智能化并大规模销售;在行业市场,在防疫、教育、金融、物流等少数行业,AI开始逐步应用。新十年有望爆发式增长的AI应用则是服务机器人。服务机器人是指除工业机器人之外的、用于非制造业并服务于人类的各种先进机器人,主要包括个人/家庭用服务机器人和公共服务机器人。人口老龄化加剧、劳动力成本上升,服务机器人市场需求更加强劲。StrategyAnalytics数据显示,继2020年的年销量增长24%之后,服务机器人销量将在2021年加速增长31%。2020年Covid-19疫情推动服务机器人增长,它们帮助家庭清洁地板、陪伴孩子,帮助企业分拣送货,通过紫外光对环境进行消毒。疫情期间,服务机器人明星公司优必选的防疫机器人就在16个国家/地区被应用;华住旗下将近6000家酒店皆推行了无接触智能服务,酒店机器人每月送物超过20万次,成为疫情期间的一道亮丽“风景线”。《2020全球机器人统计报告》显示,全球专业服务机器人销售额增长32%,在2019年达到112亿美元。优必选科技创始人周剑提出,过去十年是服务机器人的10年储备期,未来10年则是黄金发展期,越来越多服务机器人解决方案将在垂直领域落地应用,“未来10年,也许会有一家万亿级的服务机器人公司出现。”服务机器人是我国AI战略的一部分,2017年12月《促进新一代人工智能产业发展三年行动计划(2018-2020年)》提出到2020年,智能家庭服务机器人、智能公共服务机器人实现批量生产及应用。前瞻产业研究院预测,我国服务机器人至2023年销量将超过50万台,销售额预计达277亿美元。4、AI进一步“下沉”到传统行业。前十年,AI在一些行业率先落地,主要集中在金融、教育、娱乐、信息等相对新兴的第三产业。新十年,AI则会进一步“下沉”到千行百业,包括制造业、医疗、养老业以及古老的农业。比如农业,互联网巨头纷纷布局“养猪”业务,落地数字农业战略。AI与IoT设备、农机、无人机、无人车等技术结合,可用于提高农作物产量、优化灌溉系统、保护农田、治理虫害、监测牲畜健康,提升农业效益。有数据显示,农业领域人工智能技术和解决方案方面的支出预计将从2020年的10亿美元增长到2026年的40亿美元。比如医疗,AI与生物科技、医疗科技等技术结合,将会对医疗健康产业产生深刻影响。DeepMind的AlphaFold应用深度学习技术在数十年来的蛋白质折叠生物学挑战中获得重大突破,科学家们用机器学习模型来学习化学分子的表示,以便制定更有效的化学合成计划;再比如养老,今年两会关注老人面临的数字鸿沟,科技企业界代表们纷纷建言献策,助老养老正是服务机器人的重点场景。中国老龄人口已有两亿六千万,老龄产业成为“一个巨大的朝阳产业”,康养养老行业均有大量服务机器人应用场景。在两会上,广东移动党委书记、董事长、总经理魏明表示,发展养老机器人产业既能有效破解养老资源紧缺问题,还能促进智慧养老产业蓬勃发展。优必选科技则对外透露其正在研发康养机器人及智慧康养解决方案,通过5G、物联网和人工智能技术,建设软硬一体化的智慧康养平台。在2020年的世界人工智能大会上,李彦宏有一个判断:AI发展会经历技术智能化、经济智能化、社会智能化三个历史阶段,他认为AI正处在“从经济智能化的前半段向后半段过渡的时期,具体表现在AI能力从逐步向平台化,正在朝向产业化方向演进。”现在看来,李彦宏的判断或许有些悲观,新十年,“社会智能化阶段”已全面来临。收割季,AI产业化依然面临三道老坎技术驱动的产业发展,一般都逃离不了高德纳(Gartner)的“技术成熟度曲线”模型(GartnerHypeCycle),该模型认为,一门技术的发展要经历五个阶段。启动期:概念,媒体有所报道,引起外界兴趣。泡沫期:个别成功案例,一些激进的公司开始跟进。媒体大肆报道,各种非理性的渲染。低谷期:该技术的局限和缺点逐步暴露,对它的兴趣开始减弱。基于它的产品,大部分被市场淘汰或者失败,只有那些找到早期用户的公司艰难地活了下来。爬升期:该技术的优缺点越来越明显,细节逐渐清晰,越来越多的人开始理解它。基于它的第二代和第三代产品出现,更多的企业开始尝试,可复制的成功使用模式出现。媒体重新认识它,业界这一次给予了高度的理性的关注。高原期:经过不断发展,该技术慢慢成为了主流。技术标准得到了清晰定义,使用起来越发方便好用,市场占有率越来越高,进入稳定应用阶段。配合它的工具和最佳实践,经过数代的演进,也变得非常成熟了。业界对它有了公认的一致的评价。AI一路走来,经历了最初被高度看好、泡沫化严重后被广泛唱衰,再到泡沫去掉后成熟稳健发展等阶段。今天AI进入高原期,成为主流技术,将被大规模应用。不过,AI产业依然有一些客观问题有待行业给出答案,这些问题都是老问题,只不过当下更加紧迫。第一个是AI商业化能力有待证明。AI创业公司最有名的当属“CV四兽”,即专注于机器视觉技术服务的四大独角兽公司:商汤、旷视、依图与云从。2020年旷视科技冲击港股IPO未果,3月12日再度冲刺科创板;此前不久依图与语音AI企业云知声IPO折戟,多家AI公司上市遇阻,核心原因在于商业化能力有待证明。《财经》披露的数据显示,商汤2019年营收超过50亿元,而云从和依图分别才刚刚超过8亿元、7亿元。2017年至2019年,旷视营收规模逐年增长,营业收入从3亿元增长至12.6亿元。这些AI独角兽公司都有一些共同特征:营收增长快但整体规模较小,但烧钱规模却很可观,大都已完成数亿甚至数十亿美元融资,却一直亏损,招股书显示,报告期内(2017年、2018年、2019年、2020年9月),旷视科技净亏损达到7.7亿元、28亿元、66.4亿元与28.5亿元,因此有媒体将它们称为“吞金兽”。不只是CV四兽。截至目前,不论是消费端的智能音箱/智能驾驶等AI产品,还是产业端的AI行业服务,普遍都存在“亏损换规模”的现状。对此,一方面,AI企业要积极探寻商业模式,在技术研发外对市场高度重视,强化现金流能力,让AI赚取真金白银,比如可以让AI深度融合场景,对产品做减法,从应用场景的单点和单应用切入,从单点产品到解决方案,再到面,不断壮大AI应用生态。AI企业也要从解决社会重大问题和满足社会重大需求进行突破;另一方面,投资者要给AI公司更多耐心,要有放长线钓大鱼的长期思维,毕竟AI大规模爆发时点才刚刚到来。市场已经证明AI不是技术泡沫,资本应该放宽心,给予AI创业者更多耐心。第二个是AI人才荒依然有待缓解。前些年AI快速爆发,导致AI人才一度供不应求,企业年薪百万招聘AI专业大学毕业生、高价挖角高校AI专家的新闻不少。后来,国家重视AI教育、高校开设AI专业、产学研共同培育AI人才,AI人才荒得到一定程度解决,仅仅是百度就宣称自己已给行业培养100万AI人才;优必选科技则宣称在全球40多个国家,有约150万名学生通过优必选科技学习人工智能。然而,AI人才供给依然跟不上AI产业化进程,新十年AI人才依然供不应求。高端AI人才依然稀缺,根据美国保森基金会旗下智库的统计显示,截至2019年底,全球顶尖AI人才中的近60%定居美国,在中国接受本科教育的顶尖AI人才占比最高,达到29%,就是说,很多中国AI人才出国深造后留在了美国工作,导致中国本土高端AI人才匮乏。中国是AI大国,但领英大数据却显示,中国顶级人工智能人才仅排第六名。细分领域AI人才同样短缺,比如服务机器人领域,AI人才荒更严峻,因为这是一个复杂系统,牵涉到多学科,厂商需求大量复合型技术人才、市场人才以及产品人才;应用场景则需要懂服务机器人和人工智能的人才。然而,复合型研发人才和应用人才太少,直接制约了产品研发和行业应用。2020年国内人工智能人才缺口达500多万,供需比例严重失衡。2021年加强人工智能人才,特别是高端人工智能人才、细分AI领域人才的培养,已迫在眉睫。第三个则是AI伦理问题变成燃眉之急。类似于AI换脸、“基于人脸识别的教室监控”这样的AI应用出现,让人们意识到,AI技术爆发,人类并未完全准备好。任何技术都是双刃剑,AI也不例外。AI技术会给网络欺诈提供便利,让“造假”变得更加容易,且难以辨别;AI技术会让很多人失业,尤其是重复性强的工作,比如收银、客服、监测、软件测试工程师;AI算法是被人训练出来的,人的偏见会被AI继承,比如性别歧视、种族歧视、地域歧视;AI技术被黑客掌握,黑客的攻击手段会全面升级。随着服务机器人、无人车等看得见、摸得着的AI应用爆发,AI伦理变得更重要。服务机器人在服务人类时,可能会跟人或者环境发生冲突/冲撞,责任该如何划分?无人车在马路上出现事故,责任又该如何划分?很多问题都有待解决。我们不能因噎废食限制AI发展,唯有AI伦理与法规双管齐下。AI伦理是人与机器以及AI时代人与人相处的道德准则,“阿莫西夫机器人三原则”就属于机器人伦理。除了道德准则外,法律法规也亟待完善,比如针对自动驾驶的法律法规正在形成。亚马逊、微软、谷歌、IBM、Facebook、苹果等公司已联合成立非营利性人工智能合作组织以解决AI伦理问题;2017年微软在内部成立人工智能伦理委员会(AETHER);2018年Facebook宣布已成立专门伦理团队防止人工智能的偏见。国内,百度李彦宏多次提交关于AI伦理的提案,2019年马化腾就指出“AI治理的紧迫性越来越高”,应以“科技向善”引领AI全方位治理,确保AI“可知”、“可控”、“可用”、“可靠”。我国监管部门则从顶层设计上决定了AI伦理的规范和执行。2019年6月国家新一代人工智能治理专业委员会发布报告,提出发展“负责任的人工智能”,这是我国首次发布人工智能治理原则,当年7月24日,《国家科技伦理委员会组建方案》被通过,根据《国家科技伦理委员会组建方案》要求,组建国家科技伦理委员会,会议指出:科技伦理是科技活动必须遵守的价值准则。AI新十年来临,我们有理由相信,智慧的人类既可以发展利用AI,让AI给国家、社会、企业与人民创造更多价值,也一定可以驾驭AI,与AI和平共处。本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。人工智能的主要优势是什么
人工智能正在各种规模的公司中流行。它推动了各个组织和行业的巨大转变。因此,了解一些令人兴奋的优点将很有用。
人工智能的主要优势是什么?
减少常规人工智能通过使我们的日常工作自动化来实现进化。毫无疑问,机器在细致的任务上超越了人类。通过自动执行常规任务,机器人可以承担与分析、细微判断和问题解决相关的工作。
因此,在工作中应用人工智能将减少工作量,使人类有能力提升自己的技能。摆脱单调的工作,员工将能够专注于工作的创造性。最终,人与机器的结合将使世界变得更美好。
风险较小在危险任务中使用AI功能将减少人类安全风险。人工智能技术将克服许多限制。例如,它可以帮助预测野火威胁并在无人机的帮助下进行扑灭。除此之外,人工智能还参与了解决气候变化的主要原因之一-森林砍伐。AI系统可以检测并传输非法日志记录的声音。现代AI驱动的机器人技术和自动水下机器人允许访问海床以收集海洋生态系统数据,并为各种物种提供了新的思路。
人工智能驱动的机器人可以处理辐射,因此它们在核能工业中经常用于清除碎片,特别是在灾难发生后。即使不能消除危险,机器人也可以带来巨大的价值,有助于应对灾难。
人工智能的主要优势是什么?
没有刹车为了提高生产力,人们需要时不时地保持精力充沛。人工智能驱动的机器可以大大增强这种人类弱点。他们不会感到疲倦,无聊或分心。基于人工智能的机器无需休息。一旦编程了很长的时间,它们就会24x7全天候工作。此外,他们还可以承担一些额外的工作,并且容量更大。
没有人为错误人类倾向于生理,疲劳,压力,情绪,衰老等。所有这些都可能对决策产生不良影响。例如,压力过大的医生或坠机飞行员可能犯下致命的错误,这将导致悲剧,更不用说醉酒司机造成的事故了。
没有减速增强人类工作能力也是人工智能的优点。例如,人工智能减少了审查保险索赔的时间。当保险公司花几天时间做出决定时,人工智能机制可以在几分钟之内应对。尽管如此,先进技术仍需要人类洞察力来塑造采用创新解决方案的方式。
更少的琐事一些AI助手甚至可以理解请求的上下文,并在所有设备之间进行数据同步,例如电话,汽车,电视甚至冰箱。因此,可以从房屋内外的任何地方控制它们。
人工智能驱动的智能家居不仅使生活更简单,更富有活力,而且还有助于节省金钱并减少水和能源的消耗。高效系统包括智能调节特定资源使用的设备。将这些设备集成到智能网络中后,可以进一步降低成本。
人工智能发展现状及应用
导读:人工智能(ArtificialIntelligence),英文缩写为AI。人工智能被认为是第四次科技革命的核心驱动力,目前许多领域都在探索AI技术的应用,可谓方兴未艾。那么什么是人工智能,它经历了怎样的发展历程,现阶段发展状况如何,它有哪些应用。本篇文章就为大家做个简单分享。同时也会为大家详细介绍一下百度的AI技术体系。
本文主要内容:
1.人工智能概念
①智能
②人工智能
2.人工智能的发展
①人工智能的发展历程
②AI是中国的机遇
3.AI与百度
①百度AI的发展历程
②百度AI的技术体系
③百度AI的场景化应用
1.人工智能概念
1.1智能
谈到人工智能,需要首先理解“智能”一词的具体含义。智能是指人类才具有的一些技能。人在进行各种活动的过程中,从感觉到记忆再到思维产生了智慧,智慧产生了人类本身的行为和语言,行为和语言统称为能力;智慧和能力结合在一起就是人工智能中的智能一词。
比如,人类的语言表达能力就是一种智能(语言智能);人类进行复杂数学运算的能力也是一种智能(数字逻辑智能);人类的交往能力也是一种智能(人际智能),人们对音调、旋律、节奏、音色的感知能力,也是一种智能(音乐智能)。他们都属于智能的范畴。
1.2人工智能
把智能的概念与人的逻辑理解相结合,并应用到机器中,让机器能更好的模拟人的相关职能,这就是人工智能。人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。
人工智能概念,最早可以追溯到上世纪90年代初,这个时候需要提到一位科学家:图灵。
艾伦·麦席森·图灵(英语:AlanMathisonTuring,1912年6月23日—1954年6月7日),英国数学家、逻辑学家,被称为计算机科学之父,人工智能之父。
图灵最早定义了什么是人工智能,怎样去界定一个机器(或一个设备)是否具备智能。他最早提出了图灵测试(即:一个人在不接触对方的情况下,经过某种特殊的方式和对方进行一系列的问答,如果在某些时间之内,他无法根据这些问题判断对方是人还是计算机,那么我们就认为这台机器具备智能化的思维)。直到2000年左右,才真正有计算机通过了图灵测试,才实现了一个突破。在2014年图灵测试大会上,出现了一个通过图灵测试的机器(或者称为智能聊天的机器人)。这两年人工智能的高速发展,也印证了最早的图灵测试,这也让我们反向看到了图灵在人工智能定义方面做出的突出贡献。
现今,在做图灵测试时,判断这个设备是否具备人工智能,更多的还是从模拟人的角度来考量。但在当前科技背景下,人工智能需要涵盖更广的内容,它不仅仅要模拟人本身的职能,还需要具备一些扩展、替代甚至延伸的职能。
举个例子,在医疗领域,需要经常在实验室进行病毒化验,人处这样的实验环境下会比较危险,经常会出现一些事故,如果能够用机器替代人来做这些实验,这些事故就可以避免。此时,这台机器就不仅仅是在模拟人,而是在替代人,机器本身就具备了替代人的能力。
当前,很多人在担忧:人工智能的发展会不会对人类造成威胁。其实,目前人工智能还处于早期的阶段(或者称之为婴幼儿阶段),我们还处于弱人工智能时代。
当然,随着时间的推移,将来我们可能会把弱人工智能时代推进到强人工智能,甚至再往前推进到超人工智能和智能爆炸时代。但至少目前,我们离这样的时代还有非常远的距离,要实现这样的目标,需要非常多的时间积累,可能要通过几代人甚至十几代人的努力。所以大家不要有过多的担心,人工智能现在更多的还是用于服务人类,用来提高人们的工作效率。
上图引自MIT大学一位教授。
针对人工智能所覆盖的领域,这位教授提出一个观点:“我们要尽可能避免做这些容易“进水”的工作,以免被日后所淘汰掉”。
这张图水平面以下的工作,如存储,计算、甚至象棋活动等,已经被海平面淹没。在海平面边缘的工作,如翻译、驾驶、视觉和音频等,很有可能在未来的一段时间,随着技术的进步也会被淹没。再来看图上高海拔地区的工作,如艺术创新、科学研究,文学创作等,让人工智能替代人类去做这些工作,在现阶段是比较困难的。要让人工智能实现像人一样具备主观能动性,还需要比较长的时间。我们在选择工作,或者在做技术探索的时候,应该从更高的层面布局,而把那些可以被人工智能替代的工作交给计算机去做,这样我们就可以从一些重复性、冗余性的工作中抽离出来,去专门从事创造性的工作(比如艺术创作等)。
2.人工智能的发展2.1人工智能的发展历程我们回顾一下人工智能发展的历程。
人工智能并不是特别新鲜的词,在计算机出现后不久,大家就已经开始探索人工智能的发展了。
1943到1956年这段时间,为人工智能的诞生期,期间有很多人尝试用计算机进行智能化的应用,当然此时不能称为人工智能,只是有类似的概念。
人工智能的分水岭是1956年达特茅斯会议,在本次会议上正式提出了AI这个词。
1956到1974年这段时间,是人工智能发展的黄金时代,是人工智能的第1个高速发展期,通常把这段时间称之为人工智能大发现时代。
1974到1980年这6年的时间里,进入了人工智能发展的第1个低谷,在这个低谷期,出现了非常多的问题,比如计算上的问题、存储上的问题、数据量的问题,这些问题限制了人工智能的发展。
1980到1987年这段时间是人工智能的第2个繁荣期。期间诞生了大量的算法,推动了神经网络的高速发展,同时出现了许多专业的科研人员,发表了许多创造性的论文。
1987到1993年这段时间是人工智能的第2个低谷期,期间有个词叫“AI之冬”。有大量的资本从AI领域撤出,整个AI科研遇到了非常大的财政问题,这是导致”AI之冬”的主要原因。
1993年之后,人工智能又进入到高速发展期,期间出现了许多经典案例,比如1997年IBM公司的深蓝案例,2001年IBM的沃森案例,2016年谷歌AlphaGo案例。这些案例是人工智能在应用层面的体现。
上图概括了人工智能的发展历程。
可以看到,从1956年达特茅斯会议AI这个词诞生,一直发展到现在,人工智能共经历了60多年的跌宕起伏,并不是仅在2016、2017这两年间才出现了人工智能这个概念。
从宏观上看,AI的发展历程经历了三次比较大的起伏。
第1次起伏是从1943年到1956年,首次出现了神经网络这个词,把人工智能推到一个高峰,期间出现了许多大发现。而第1次低谷使人工智能进入到了反思的阶段,人们开始探讨人工智能的应用。
第2次起伏是在上世纪80年代,期间BP算法的出现,神经网络新概念的普及,推动了人工智能又进入第2次高峰和发展。然而从1987年到1993年又进入到了了第2次低谷,这主要因为一些财政原因导致。
第3次起伏从2006年开始,由辛顿提出了深度学习的概念,把神经网络往前推动了一大步,也把人工智能推到了高速发展阶段,尤其是近几年在非结构化领域取得了许多突破(例如在语音与视觉方面),给人工智能进入商业化应用带来许多的基础性技术沉淀。
人工智能为什么会在前面的发展过程里遇到了那么多的坎坷?为什么在最近这几年会进入一个高速发展期?
我们归结了近几年人工智能高速发展的三点原因:
①算力飞跃
人工智能(尤其是深度学习),对底层计算能力的要求非常高。早期的计算受到了极大限制,从CPU发展到了GPU,使得算力几乎能达到几倍甚至十几倍量级的增长。再从GPU到TPU,计算速度能达到15~30倍的增长,使得在算力层面不断取得突破。此外,大量云资源的出现将我们计算的成本压到了最低,我们在处理海量计算的同时,也可以享受比较低的成本。再者,芯片技术的发展,使得端处理能力持续提高,这些都帮助我们在算力层面取得了很大的突破。
②数据井喷
从PC互联网时代到移动互联网时代,再到可穿戴设备的应用,都产生了大量的数据。这两年,每年产生的数据量可以达到50%左右的增长。2017年到2018年,这段时间内基本上每个月产生的数据量可以达到几十个亿的量级,数据量已经非常高。物联网的连接,能帮助我们把更多的数据采集回来,帮助我们在数据层面做更多的积累,这是数据井喷带来的积极影响。
③算法突破
近几年来,从机器学习到深度学习,算法不断取得突破。使得我们可以处理更多的大规模、无监督、多层次等复杂业务。
算法、算力、数据是人工智能的三要素,算力是骨骼,数据是血液和食物,算法就是大脑,三者不断取得突破,才能促进人工智能高速发展。
2.3AI是中国的机遇
人工智能技术的发展也促进了很多产业的发展。中国目前有非常好的历史机遇,不仅仅是在技术上有大量的积累,同时,国家也为人工智能的发展提供了非常好的政策环境。此外,市场空间、资金支持、人才储备,也都为人工智能的发展提供了非常好的条件。
通过上图可以看到,人工智能的研发人才目前还比较短缺。图上数据来源于领英在2017年所做的全球AI人才报告。以2017年的数据来看,全球人工智能专业的人才数量超过190万,在这190万人才中,美国处于第一梯队,有85万+;而中国在人工智能领域的人才积累比较少,从数据上来看,目前国内人工智能方面的专业技术人才可能只有5万+,当然这是2017年的数据,现在可能会有一些增长,但是量级也没有达到我们想象的那么大。
所以从国内目前来看,这约5-10万的AI技术人才,对比AI产业的高速发展需求,两者之间有巨大矛盾。那怎样更好的用这些人才作为突破,把人工智能方面的技术人才储备提高到百万级别。这正是整个百度(包括百度的教育合作与共建,包括百度所有对外输出的体系,包括我们今天所做的课程)所努力的方向,我们期望通过百度的技术赋能,真正的帮助人工智能取得更好的人才积累,真正培养一些在未来对人工智能行业有巨大贡献的专业人才,这是百度现在的定位目标。
AI浪潮已然到来,行业人工智能时代已经到来。目前,人工智能已经大量应用在2c和2b领域,怎么让人工智能跟具体行业有更好的接触,产生更多的积累,是我们正在重点探索的方向。
比如百度的搜索引擎,已经融入了很多AI元素。模糊匹配、拍照识图、深度挖掘检索等都应用到了大量的人工智能技术。
再如推荐系统,他会基于个人的一些喜好和历史阅读习惯来给用户做一些内容的推荐和匹配,这是很典型的结合大数据做的精准应用,实际上也属于人工智能的范畴。
再如人脸识别技术、语音技术、智慧交通和无人驾驶等,都是AI技术与行业应用的融合,并且这些技术正在不断取得突破。百度现在L4级别的无人驾驶车已经初步实现了一些小规模的量产,未来会有更多的人将真正的体会到无人驾驶给生活带来的便利。
3.AI与百度3.1百度AI的发展历程
上图为百度在人工智能领域的发展轨迹,早在2009年,百度就开始尝试探索人工智能相关技术,直到2019年,百度用了近十年的时间布局人工智能。
2009年尝试性布局人工智能,2013年发布IDL,2014年成立硅谷实验室以及百度研究院,2015年首次发布DuerOS,2016年发布百度大脑1.0版本,同年,百度的自动驾驶技术进入试运营状态,2017年是百度人工智能技术高速发展的一年,不仅成立了深度学习国家实验室,同时也成立了硅谷第二实验室以及西雅图实验室,并且Apollo平台开始运行并对外推广,在2018年到2019年,DuerOS和Apollo平台发展到3.0版本,百度大脑发展到5.0版本。经过近十年的发展和积累,百度的人工智能技术目前处于相对领先的位置。
百度在人工智能领域领域取得的进展有目共睹,比如,百度成立了首个国家级AI实验室;2016年被美国《财富》杂志评选为深度学习领域四大巨头之一;百度的刷脸支付、强化学习、自动驾驶等技术入选MIT2017年全球十大突破性技术;在AI领域,百度的中国专利申请超过2000项。
3.2百度AI的技术体系
百度的技术体系非常全面,覆盖了计算体系、大数据技术体系以及人工智能技术体系等,在机器学习、深度学习、区块链、知识图谱、自然语言处理、量子计算等领域均有雄厚的技术积累。这些技术可以按内容划分成三个板块,第一是A板块(即AI技术板块),第二是B板块(即大数据板块),第三是C板块(即云计算板块)。这就是百度在2016年提出的ABC概念。从一开始的1.0版本,发展到如今的3.0版本,代表着百度在人工智能领域的整体布局。在人工智能领域的布局中,百度的探索不仅停留在最核心的技术上,也同时将核心技术与更多的领域相结合,如边缘计算、物联网(InternetofThings,IoT)和区块链等,得到了如ABC+区块链、ABC+DuerOS、ABC+Apollo等对外输出模式,向各行各业提供解决方案。
在A板块中,将百度大脑分成了不同的层次。最底层是算法层,包含机器学习和深度学习算法,使用百度的PaddlePaddle深度学习框架提供算法层的基础支撑;算法层之上为感知层,感知层可分为对声音的感知和对光的感知,其中,对声音的感知主要是语音技术板块,对光的感知主要是图像技术、视频技术、AR/VR等技术板块;在感知层之上是认知层,认知层更多的是处理人类听到和看到的内容,对其进行深度理解,深度理解需要自然语言处理(NLP/NLU)、知识图谱等技术作为支撑,同时也需要积累大量用户画像数据,这些技术能帮助人们快速的理解和分析人类听到和看到的内容,并对内容进行有效的反馈,这是认知层面的技术;在认知层之上是平台层,平台层将底层的内容进行融合、封装,对外提供开放、完整的AI技术,并引入大量的生态合作伙伴,共同探讨人工智能产业的布局。
百度人工智能整体技术体系,最底层是深度学习框架飞桨PaddlePaddle,作为底层计算框架,飞桨PaddlePaddle支撑着上层场景化能力与平台中的全部板块。在场景化能力与平台中,包含了诸多场景大板块,每个大板块下又细分为多个技术板块,比如语音板块包含了语音合成以及语音唤醒等技术板块;计算机视觉技术中的OCR技术,包括传统通用OCR识别,以及垂直领域OCR的识别,可以对30多个OCR识别领域进行精准识别,比如票据识别、证件识别以及文字识别等;在人脸/人体识别板块,同时也会引入图像审核以及图像识别方面的技术;在视频板块,有视频比对技术,视频分类和标注技术,以及视频审核技术;在自然语言处理板块,有机器翻译技术;知识图谱板块,有AR/VR技术。这些板块构成了人工智能体系的技术蓝图。
近两年来,人工智能技术在各行各业中的应用不断加深,实践证明,单一的技术在落地时会受到诸多限制,所以现在人工智能在落地时可能不仅仅用到某一个单独的技术板块,而是需要先把这些板块进行融合,然后再进行实际应用,比如在拍照翻译的应用场景下,既需要用到OCR技术,同时也用到NLP技术。因此在实际应用中,需要综合各个板块的技术,把不同的技术体系和技术内容有机地融合起来,再去解决行业中面临的痛点。
3.3百度AI的场景化应用
2014年到2015年期间,在计算机视觉领域的部分场景下,计算机视觉识别准确率已经超过了人眼识别。而利用深度学习技术的计算机听觉识别,在2017年左右也已经超过人耳听力极限。
人工智能业务场景化不仅依赖底层的硬件资源,也需要超大规模的标注数据,这是监督学习的特点,所以在人工智能早期研究中,有评论说“有多少人工就有多少智能”,这句话在特定角度来看是具有一定意义的。在监督学习中,训练模型需要庞大的标注数据,再结合GPU强大的数据处理能力去训练特定模型,也就是从算法的层面去做更多的工作,在训练模型的过程中需要发挥人的主观能动性,更好的解决在行业应用中出现的一些痛点,构建出行业专属的模型。
比如,将人体分析技术应用到实际行业场景中时,需要结合人脸识别技术和人体识别技术。可以通过基础手势识别,识别一个人在开车时有没有系安全带、是不是在打电话等。
利用人体分析技术,可以做到行为识别,首先设定特定区域,然后对区域内的人员行为进行识别,比如人群过密、区域越界、人员逆行、徘徊以及吸烟等,在特定场景下,行为识别能够帮助用户避免安全隐患。
自然语言处理有很多相关技术,比如说词法分析、词向量表示、语义相似度、短文本相似度、情感相似度分析等。这些技术用在不同的应用场景下。
在公检法系统应用中,为了避免出现非常严重的问题,如同案不同判,具体解决方案是当诉讼呈递给法官时,根据当前诉讼内容在公检法系统中寻找历史上类似的案件,参考历史类似案件的判决,给法官提供判案依据。
在媒体领域应用中,对基础的财经类新闻,可以由机器进行新闻文章的编写,即机器写作。这些技术都是基于NLP在相应领域做的智能化应用,可以让编辑或记者从重复性的工作中解脱出来。
人工智能从广义上来看,也包括大数据及云计算相关技术,这些技术也都涵盖在百度AI技术体系中。在大数据领域,主要包括数据采集、数据存储、数据分析以及数据可视化等,利用这些技术,我们在进行模型训练的时候,对数据进行科学的管理可以帮助我们提高模型训练效率。
百度AI技术体系也提供算力层面的支持,通过GPU服务器以及FPGA服务器提供的算力,更好的解决应用层面的问题。
百度AI就是这样一个从基础层,到感知层、认知层的完整体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。
回顾本篇文章,我们和大家分享了人工智能的相关概念,人工智能的发展历程,从中也可以看出AI是我们的历史机遇。同时本文也为大家详细介绍了百度的AI技术体系,经过10余年的努力,百度AI已经形成从基础层,到感知层、认知层的完整技术体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。