博舍

人工智能创业,你需要知道的 6 大核心问题 人工智能最核心技术是什么技术呢

人工智能创业,你需要知道的 6 大核心问题

第一个问题:互联网vs人工智能

首先如果今天大家选择创业,我建议更应该关注人工智能,而非互联网。为什么这么讲?

1.互联网的流量红利已经消失;

最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

以PC来说,全球PC出货量连续5年下滑。大家知道国内最后出现的一个PC互联网独角兽是谁吗?是知乎,大概是2011年初推出,这么多年过去,再也没有PC互联网的独角兽出现。做个类比,我们知道2015年移动互联网的渗透率和竞争程度和2011年的PC互联网类似,以此类推,2015年以后再做移动APP,也很难出独角兽了。

毕竟中国连续两年手机出货量都在5亿多台,增长放缓,代表无线流量基本已走平,你多卖一台,我就少卖一台,是存量竞争。今天创业者再做一个纯互联网的APP,投资人问的第一个问题就是你怎么获客。因为现阶段流量格局已定,首屏就那几个APP。

2.互联网+的机会同样有限;

主要在于互联网最大的价值,是解决信息不对称和连接。所以对于电商特别有价值。淘宝用皇冠、钻石等信用体系解决了信息不对称,同时又把全国有这么多买家和卖家连接在一起。这个是互联网的价值。

但很多行业信息和连接并不是痛点。拿医疗举例,中国三甲医院的大夫就那么多,你把全国13亿人民都和这些大夫连接上了也没用,因为一个医生一天还是只能看那么多病人。互联网并没有提高医生看诊的效率。在诸如餐饮、医疗这些传统领域,互联网的帮助是很有限的。

也包括滴滴打车,互联网解决了打车难的问题,但是没解决打车价格的问题。事实上,补贴去掉之后,大家都发现了滴滴一点都不便宜,道理很简单——不管是专车还是出租车,还是需要由人来开,人工成本降不下来,就不可能便宜。

3.真正能够提高社会生产力,解决供需关系不平衡的就是人工智能;

人工智能将给社会生产力带来的提高,以及对人类带来的影响将远远超过互联网。

还是拿医疗来说,很多基层医院水平不高,那未来完全可以通过人工智能来辅助医生读CT、X光等医疗影像。像今年,IBMWatson对皮肤黑色素瘤的诊断,准确率已提高至97%,远远超过了人类专家75%-84%的平均水平。

未来,人工智能无论是在无人车、机器人、医疗、金融、教育还是其他领域,都将爆发巨大的社会效益,这点毋庸置疑。我认为下一波大趋势和大的红利不是互联网+,而是人工智能+。我建议现在的创业者更应该关注人工智能领域的创业机会。

第二个问题:人工智能vs人工智能+最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

人工智能主要分三层。最底层是基础架构(Infrastructure),包括云计算、芯片以及TensorFlow这样的框架。在基础层之上是中间层,叫通用技术(EnablingTechnology),例如图像识别、语音识别、语义理解、机器翻译这些。

基础层和中间层,是互联网巨头的必争之地。比如芯片领域,Intel、英伟达、高通都投入巨资,竞争极其激烈。同样云计算、框架也是一样,都不是小公司能够涉足的领地。

现在对于中间层的通用技术,BAT也极其重视。因为大家都相信人工智能是下一波工业革命浪潮。对腾讯、阿里、百度这些巨头来讲,要想在大浪中屹立不倒,必须要构建出人工智能的生态系统(Ecosystem)。而核心就是要依靠这些EnablingTechnology技术。

相比创业公司,BAT的最大优势是什么呢?第一,不缺数据;第二,为了构建自己的生态系统,未来通用技术一定全部是免费的;第三,虽然通用技术免费,但BAT有羊毛出在身上的猪机会。这是典型的互联网打法。

这里的猪是什么?猪就是云计算。例如百度的ABC策略,分别代表人工智能(AI)、大数据(BigData)和云计算(CloudComputing)。AI我可以不赚钱,开放给大家,那么大家想享受我的服务,就来买我的云吧。

而对于创业企业来说,只做图像识别、语音识别、语义理解、机器翻译这些通用技术,指望通过SDK卖钱,未来路会越来越窄,特别是BAT都免费的压力下。

所以从这个角度讲,创业公司做下面两层风险比较大。我认为创业公司的机会在最上层,就是拿着下两层的成果去服务垂直行业,也就是我们所谓的人工智能+。

第三个问题:人工智能+vs+人工智能最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

深入垂直行业的人工智能+,又可细分为两类情况:即“人工智能+行业”和“行业+人工智能”,他们间有明显的区别。

“AI+行业”简单讲就是在AI技术成熟之前,这个行业、产品从未存在过。比如自动驾驶,亚马逊的Echo智能音箱、苹果的Siri语音助手。在人工智能技术未突破前,不存在这样的产品。因为AI,创造出了一条全新的产业链。

“行业+AI”就是行业本身一直存在,产业链条成熟,只是以前完全靠人工,效率比较低,现在加入AI元素后,使得行业效率有了明显提高。比如安防、医疗等领域。

客观讲,这两个类别都有创业机会。但“AI+行业”,因为是一条新的产业链,创业公司与互联网巨头实际是处在同一起跑线上。巨头们坐拥数据优势。所以从这个角度,“行业+AI”相对对创业公司更为友好,也更容易构建出壁垒。

我认为,未来行业壁垒才是人工智能创业最大的护城河。因为每个行业都有垂直纵深,尽管BAT技术好一点、并不关键。拿医疗+AI举例,什么最重要?大量准确的被医生标注过的数据最重要。没有数据,再天才的科学家也无用武之地。

但在国内,这个医疗数据拿出来非常困难。所以BAT做医疗一点优势都没有,因为他们要把这些数据,从各医院、各科室搞出来也很累。相反,如果一个创业者在医疗行业耕耘很多年,也许拿起数据来比大公司更容易。

这要求创始团队的合伙人中,必须有懂行业、有行业资源的人才。这与互联网+一样,一旦细分到具体行业,并不是说你百度、腾讯有资金、有流量,投入人才就什么都能做,比拼的还有行业资源和人脉。

之所以跟大家聊这个话题,是因为前一段去百度大学跟大家交流,他们提到百度人工智能在无人车和DuerOS的应用。同时又问我,人脸识别在国内安防领域的应用价值非常大。像海康威视有近3000亿人民币的市值,每年光净利润就有近百亿。百度在AI方面是不是该考虑进军这个领域。我回答说千万别,因为安防是典型的、有巨大壁垒的“行业+AI”领域。

即使百度技术好,在人脸识别率方面比海康威视高一个百分点(实际不一定,海康背后有几百人的AI研发团队)。但这并不代表百度就能替代海康。因为安防是“非关键性应用”(non-mission-critical),100个犯人我识别了95个,你比我多识别了一个做到了96个,其实没那么重要。

而反过来,海康对比百度有什么优势?首先海康是做摄像头的,用自己的硬件跑自己的算法,是很自然的事儿。就像苹果手机,软硬一体体验更好。其次,海康做了这么多年的安防,积累了非常多的数据,人脸的数据、环境的数据……在安防领域有数据优势。最后,海康给公安系统做了很多类似警务通、基站信息采集、视图档案管理等SaaS平台的东西,以及警用云系统。我们可以认为公安系统的IT化,其中有一部分就是海康威视参与的。

这些东西可能不赚钱,但却为海康构建了壁垒。因为底层的基础设施都是我建的,那前端的东西就只能用我的(我可以有100个理由,说竞品与我不兼容)。而且海康做了这么长时间,积累了大量的客户资源,特别是政府公安局的资源,开拓这些资源非常需要时间。

这些就是所谓的行业纵深。所以即使对BAT而言,想进入“行业+AI”领域,选择垂直赛道时,同样要非常谨慎。在巨大的行业壁垒面前,真不是说我的算法比你好一些,市场就是我的,只有技术优势仍然差的很远。

回归“AI+行业”和“行业+AI”,通常来讲前者的行业纵深会比较浅,而后者则有巨大的行业壁垒。而行业壁垒,则是创业公司最大的护城河,也是抵挡BAT的关键。

第四个问题:关键性应用vs非关键性应用最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

谈到人工智能领域的创业,很多人都会有个误解,就是如果我团队没有个大牛的科学家,比如斯坦福、MIT的博士坐镇,我都不好意思讲在人工智能方面创业。其实这个认知是完全错的。因为在人工智能领域,算法到底有多重要,完全取决于你要准备进入哪个行业。

根据行业和应用场景不同,我认人工智能的创业本质上有mission-critical和non-mission-critical之分。为了方便大家理解,我们简称为“关键性应用”和“非关键性应用”。

“关键性应用”要追求99.9……%后的多个9,做不到就没法商业化。比如大家认为,99%可靠度的自动驾驶能上路吗?肯定不能,意味着100次就出1次事故。99.9%也不行,1000次出一次事故。

千万记住,99%和99.9%的可靠度差距并不是0.9%,而是要反过来算,差距是10倍。也包括手术机器人,听起来99.9%可靠度已经很高了,但意味着1000次出一次医疗事故,放在美国,医院还不得被巨额索赔搞得破产。

所以“关键性应用”领域,就是一丁点儿错都不能犯的人工智能领域,必须要有技术大牛、科学家或算法专家坐镇。同时,这类项目研发周期都很长。

正如以色列做ADAS(高级驾驶辅助系统)解决方案的Mobileye公司,今年3月被Intel以153亿美金收购。大家知道这家公司研发周期有多长吗?Mobileye成立于1999年,到他们推出首款产品、挣到第一桶金已是2007年。长达8年的研发周期。这在互联网创业里不可想象。包括谷歌无人车从2009年开始研发,到现在一直没有商业化;达芬奇手术机器人从启动研发到2000年拿到美国食品药品管理局(FDA)的认证,花了十年时间。

“关键性应用”的普遍特点就是这样,项目通常很贵,研发周期巨长,离钱非常远,需要持续的融资能力,团队怎样才有持续融资?起码要有非常好的简历和非常好的背景。这个是能够持续融资的必要前提。所以大家可以看到,今天做无人驾驶的创业团队都是高富帅。因为不是高富帅,你都熬不到产品真正商业化应用那天。

当然,如果在人工智能领域都是“关键性应用”,那就没大多数创业者什么事了。实际上,人工智能领域的创业,95%都是“非关键性应用(none-mission-critical)”。简单讲对这些领域,AI的可靠度只要过了基础线,高一点低一点区别不大。

最简单的例子,现在很多公司的门禁开始用人脸识别。你今天带个帽子,明天戴个墨镜或口罩,识别率没法做到99%。可即使没识别出来也没问题。因为所有带人脸识别的门禁都有地方让你按指纹。即使指纹也刷不进去,问题也不大,公司不还有前台吗。

这就是“非关键性应用“。这类项目不追求99%后面的很多个9。实际上,国内人工智能和机器人方向的创业,大部分领域都是“非关键性应用”。当然并不是说,在这个领域算法不重要,你天天认不出来也不行,所以一定要过了基础的可用性门槛,偶尔出现问题可以容忍。“关键性应用”则不能容忍。

“非关键性应用“不追求高大上,简单、实用、性价比高更重要,这样的项目通常比拼综合实力。包括:

对行业的洞察理解。要熟知行业痛点;产品和工程化能力。光在实验室里搞没意义;成本控制。不光能做出来的产品,还得便宜的做出来;供应链能力。不光能出货,还要能批量生产;营销能力。产品出来了,你得把东西卖出去。团队里有没有营销高手,能不能搞定最好的渠道是关键。

所以大家在创业组团队时,一定要想好你选择的赛道处于哪个领域,不同的赛道对于团队的要求是不一样。“关键性应用”必须有技术大牛坐镇,“非关键性应用”则要求团队更加综合和全面。

第五个问题:技术提供商vs全栈服务商最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

现在很多人工智能创业者都是技术背景出身,创业的第一个想法通常是做技术提供商。技术提供商作为创业的敲门砖可以。但如果只定位做技术提供商,未来路会非常窄。为什么说未来只做技术提供商价值会越来越小?原因有几点:

1.首先通用技术一定是大公司的赛道,BAT未来一定会开放免费。

人家大公司会免费提供人脸识别、语音识别、语义理解、机器翻译这类EnablingTechnology,你还打算怎么靠API调用赚钱呢?也许现在还可赚点小钱,但很难成为一个长久的生意。

2.依托于算法的技术壁垒会越来越低。

未来随着基础计算平台和开源平台的丰富成熟,技术方面的壁垒会越来越不明显,整个人工智能的技术准入门槛会越降越低。就像2008年你想找个IOS开发者,很难,现在却很容易一样,所有技术的演进都遵循这一规律。特别随着今天各大学的计算机专业,都纷纷开设机器学习课程,未来人才不缺,这会拉低整个行业的进入门槛。

同时随着谷歌TensorFlow等生态系统的成熟,很多领域都会有训练好的模型可以用来参考(出Demo会更快),创业者只要有足够的数据来训练参数就好了。所以未来算法的壁垒会越来越低,如果这个公司的核心竞争力只是算法,那将非常危险。

3. 技术提供商如果不直接面向用户/客户提供整体解决方案,则非常容易被上下游碾压:

对于技术提供商和算法类公司,如果你的技术壁垒不够高,上游很可能直接把你的事做了。这样的例子比比皆是,比如给海康威视提供人脸识别算法的公司。问题就在于,海康在用你算法的时候,人家也有庞大的研发团队在研究自己的算法。现在用你是人家还没准备好,一旦准备好立刻会把你替换掉。

即使在有一定技术门槛的行业,技术提供商的日子同样并不好过。比如专注嵌入式的视觉处理芯片的Movidius,大疆无人机一直在用他们的芯片。但自从大疆统治了消费级无人机市场后,大疆现在也很自然地开始研发自己的芯片。

按说芯片的技术壁垒并不低,但只要行业集中度高,赢家就会选择通吃。比如做手机的厂商,出货量到了一个阀值,都有动力自己做芯片。像苹果、三星、华为还有现在的小米,都选择了自己做手机CPU。所以联发科、高通这些技术提供商,其实是挺痛苦的。

这其实是一个产业链通用规律:产业链上的垄断者会吃掉所有利润,而且他们非常有动力往上游或下游扩展。拿PC产业链举例,内存、硬盘、整机、显示器……都不赚钱。钱被谁赚走了?Windows和Intel却赚走了绝大部分利润。

既然做纯技术提供商没有出路,那怎么办?浩哥提出“一横一纵”理论。前期做技术服务可以,但是不能一辈子做技术服务。

“一横”就是指你提供的技术服务。通常“一横”能服务很多行业,一定要找到1、2个,你认为最有市场机会,最适合你的垂直领域,深扎进去做“全栈”:把技术转化为产品,然后搞定用户卖出去,实现商业变现,再通过商业反馈更多的数据,更加夯实自己的技术。一句话讲,要做技术、产品、商业和数据四位一体的“全栈”,这就是“一纵”。这才是健康的商业模式。

在垂直外的行业,因为没有利益冲突,你仍可老老实实的做技术服务。这样的话,商业上你能吃透一个垂直行业,技术上你还能通过横向合作,形成更多的数据回路,从而夯实你的技术。这个就是“一横一纵”理论。

那么对于技术创业公司,从“一横”走到“一纵”,要选哪个垂直领域,取决5个关键因素:

市场空间够不够大?

做垂直领域的全栈,还是做横向的技术提供商?取决市场空间哪个更大。找对垂直领域,即使只占一点点市场份额,也可能比做“一横”全归你的收益大。拿美图公司举例,他们有美图秀秀、美拍、美颜相机等APP,同时还会跟很多手机厂商合作,提供相机拍摄的美颜效果,你可以理解这就是技术服务。

但研究2016财报后,大家知道美图秀秀选的“一纵”是什么吗?就是美图手机。以上提到的技术服务都远没有垂直做美图手机赚钱。美图手机占了公司全部营收的93%。虽然美图手机去年的销量大约在74.8万台,仅仅只占国内手机市场全年销量5亿多台的不足0.15%。

行业集中度如何?

做“一横”技术提供商时,最担心的是你的上游或下游过于集中,或者说头部效应越明显,对技术提供商就越不利。举个简单的例子,IDC时代,HP、DELL等厂商卖服务器,都是直接卖给各IT公司,大家日子过的都很滋润。但2010年之后就很难做了,因为云计算出现了。

提供云计算的厂商就那几个,两只手就能数出来。而且头部效应极其明显,仅阿里云一家占了50%以上份额。如果你是一个技术提供商,在跟这么垄断的行业去谈判,你会发现没有任何筹码。所以现在就很悲催,假设我是阿里云,会让你列出BOM成本,我就给你5%或10%的利润,这个生意就很难做了。

在这种情况下,你当然有意愿也往上游走。但带来的问题是什么?如果上游集中度高,说明这事的壁垒很高,你作为技术提供商想往上走,同样很困难;如果这个上游集中度低或客户很零散,对你是件好事。但是你也没有太大动力往上游走,因为这个市场本来就很零散,你即使杀进去,可能只有1%的市场份额,而且使得99%的人都变成你的竞争对手了。这是个悖论。

技术是改良还是革命?

如果你的技术创新对这个垂直领域是革命性的,就越有机会走到上游。如果只是改良性的,你就老老实实在下游赚个辛苦钱算了。越是颠覆性的东西,越有机会往上游走。因为上游越离不开你,意味着你有机会做他的事。

打个异想天开的比方,如果你能提供一个“待机一礼拜”的电池,那你就可以考虑自己做手机,你的手机只打一点:一星期不用充电,而且是全球唯一!就这一点可能就够了,因为这个技术是革命性的。相反,如果是改良性的技术,例如你的电池待机只是比以前多了10~20%,那你还是老老实实卖电池吧。

双方壁垒谁更高?

技术提供商的壁垒和上游客户的壁垒哪个更高,也决定做“一纵”的成败。拿比较火的直播平台而言,现在都有美颜功能,例如给女孩长出个耳朵那种,这个通常都是第三方提供的技术。技术本身的壁垒并不高,很多公司都能提供,虽然效果有一些小的差异,但你没有明显优势。

可是直播的壁垒相当高,这事有网络效应,用户越多会吸引更多的美女主播,因为能赚到更多钱,美女主播越多,也会带来更多的用户。同时你舍得花钱,需要很多资金来买流量以及签约很NB的主播。所以这个事壁垒很高。你做技术提供商壁垒不高。这种情况下,虽然技术提供商只能赚个辛苦钱,但是仍然完全没有机会往上游走。

到底跟团队基因相符不相符?

能做得了技术服务,不代表能做垂直解决方案,做全栈,因为团队不一定有行业经验,这是很大的问题。亚马逊的无人便利店AmazonGo出来之后,国内不少技术团队也想提供类似的技术,甚至想做2C的便利店。

与他们聊完后,我都会劝他们再考虑一下,你的技术再好,对于用户而言,他买东西的时候,会看这个便利店有人还是无人的吗?不会,这不是优先选项。他首要考虑的还是——哪个便利店离我更近,以及我想买的东西这个便利店有没有。

从这个意义讲,这又回到了零售的本质。所以如果团队没有零售的基因,没有懂零售的人,就别考虑自己开便利店的事。这时候,很多人可能会问“那我找个懂行业的高管不就行了么?”这事没那么简单,如果CEO不了解行业本质,其实是很难靠一个高管去弥补的。

我特别相信基因决定论,如果任何一个新的商业,BAT找个懂行业的高管就能搞定了,那中国互联网的生意就全是BAT的了,就没创业公司什么事了。BAT,一个做搜索,一个做电商,一个做社交。其实他们3个都把对方的事情已尝试了一遍,最后都不成功。所以大家能做什么,不能做什么,跟这个公司的基因是高度相关的。

第六个问题:2Cvs2B

最后一个问题,简单说一下,科技成熟都需要一定的时间。因为从任何技术普及演进的角度,几乎都延续了先是从军工(航天)、到政府、到企业、到B2B2C、再到2C这个规律。人工智能也一样,目前人工智能在2C市场还不是很成熟。

简单说机器人,在个人消费者市场,出货量大的机器人只有4类产品:扫地机器人、无人机、STEAM教育类机器人和亚马逊ECHO为代表的智能音箱。为什么2C市场早期的普及有一定的困难,简单讲几个原因:

1.产业链不成熟

我做一个创新的东西,成品有10个部件。每一个部件都得自己做,而且因为出货量不大,每个部件都没有规模效应,这就导致每个部件都很贵,那你最后做出成品一定很贵。这是非常大的问题。

2.2C是额外花钱

这也是很重要的一个问题,2C端的用户因为自掏腰包、额外花钱,所以对价格通常比较敏感,产品很贵就是一个很大的门槛。

3.2C产品的用户期待度高

用户买了这么贵的东西,自然对产品的期待度会更高很多。大家觉得我买一个机器人回来,恨不得什么都能干:又能唱歌、又能跳舞、又能聊天、又能清洁、又能讲英语。但这是不现实的,现在的技术成熟度离此还有些远。

相对于2C端,这些问题在2B端却不是问题。

1.2B端对价格承受能力更高

首先,企业对价格的承受能力显然比2C强很多。你说一个机器人2万,2C消费者不可能买,但企业问题不大,企业对成本承受能力高。

2.2B的核心目的是降成本

举例工业机器人,10万块钱一个,听起来很贵。但一个工业机器人替代你2个岗位。这2个岗位一年也得10万块钱,还不算四险一金。然后这机器人能工作4年,这一下成本只有你原来的25%,甚至不到。那么企业一算账,觉得还是很便宜。

3.2B可以采取人机混合模式

还有2B端的机器人应用更简单一些。一方面大多是单任务,机器人只要做好一件事就行了,实现起来简单。另外,很多都是以”人机混合”模式在作业。也就是以前需要10个人干活,现在我用机器人替代一半人。简单重复的工作用机器人替代,复杂的用剩下的5个人,这就是”人机混合”模式。

举个例子,现在国内外已有很多安保机器人,按固定路线去巡逻。你可以理解为移动的摄像头,当然算法上肯定加入了一些识别的东西。固定绕路线巡逻,这个完全可以交给机器人来做。难的是,在巡逻的过程中,如果发现有老太太摔倒了,让机器人扶起来,这个目前还做不到。

但这不重要,你们后台不还有5个人么,让他们过来就好了。所以人机混合是2B比较主流的模式,这个大幅降低了机器人普及的难度。

最后再说一点,目前大多数AI创业公司都是技术专家主导,这很容易理解,因为现在技术还有壁垒,技术专家主导起码保证产品能做出来。不过未来随着技术门槛的降低,特别在“非关键应用”领域里,团队的核心主导,会慢慢过渡到产品经理和行业专家为主,因为他们离用户需求最近。“非关键应用”领域,懂需求比技术实现更重要。长期来看,人工智能创业和任何其他领域的创业一样,一定是综合实力的比拼!

最新最热的IT技术付费社区IT帮 itbang.me,你发帖提问,我发短信通知大牛来回答,信不信?itbang.me

元宇宙背后,你应该了解的人工智能核心技术

原创:王稳钺资料来源:单博

一、真假元宇宙

最近元宇宙这个概念非常火,网上的资料也是铺天盖地。但个人认为元宇宙这个概念里蹭热点的人非常的多,元宇宙还是处于概念为主的阶段。很多人说自己在做元宇宙,但其实都是真假难辨的状态。在元宇宙这个词出现之前,其实有很多相关的概念,比如虚拟现实(VR)、数字孪生、自动化等。数字孪生其实就是仿真建模,比如说我国的国产的飞机919等大型的机械化的电气化的设备在生产的过程中,都会涉及到跟数字孪生相关的一些数字仿真。元宇宙这个概念,其实应该更加理性去看待,关于元宇宙,人们达到了一个共识就是它一定是确定性的一个未来,但是它如何、何时能够到来,还是一个未知数。

关于一个技术的发展,经常可以用Gartner技术成熟度曲线来对它进行一个衡量。在一个技术诞生初期会有一个爆发期,但是往往会带来一个过高的期望,来到一个峰值。峰值过后就会有一个下降的冷却期。之后,在泡沫崩盘之后会有一个缓慢爬升的过程,最后才能投入到真实的生产科研这些应用当中。

如果要实现能够在一个虚拟的世界里面生活、互联、人际交往,其实还需要大量的基础设施,软硬件的发展、市场的培育、内容的建设,需要这几点甚至更多的协同才能实现。所以元宇宙现在有真有假,众说纷纭,所以一定要用相对冷静和务实的态度来看待元宇宙。

二、人工智能现在在哪里?

人们普遍认为AI是离元宇宙相对较近的方向,我们可以通过AI和元宇宙之间的关联来了解一下AI技术现在发展到了什么程度,未来还有哪些发展。元宇宙中一个重要的方面就是人机交互和信息的传递,这在AI当中也有很多应用。例如抖音,有没有发现抖音越刷越爱看呢?每天推荐的都是感兴趣的内容。还有淘宝,即使最近不太想买东西,偶尔也会打开淘宝看一看。淘宝就会根据最近浏览过的商品来推荐可能感兴趣的商品,比如最近浏览过手机耳机,就有可能会推荐其他电子产品;搜索过衣服,就会推荐很多符合审美,符合价位的服装。除此以外,包括很多音乐软件也有猜你喜欢等等歌单的推荐。这些都是属于推荐系统在日常生活中的应用。

计算机视觉在日常生活中也有广泛的应用。比如说手机解锁,上下班刷脸打卡、高铁站机场等需要通过人证比对来做身份的检验、自动驾驶等等。自然语言处理同样如此,人们的生活也都离不开有道词典等翻译软件。

三、认识人工智能

很多书、教材中都会说人工智能没有一个明确的定义。但是我们可以将它定义为——为机器赋予人的智能,即像人一样感知,像人一样思考,像人一样行为。其实感知、决策控制这三点就是机器要具有的人的智能。感知,就像人的视觉、听觉;思考,像人一样在不同的情况下要做出决策;做出决策,还要执行,这就属于像人一样行为。

在人工智能诞生之初,人工智能这个词是怎么来的呢?其实它最早和控制论是非常相关的。其实控制论和人工智能是一个相辅相成的概念。控制论这个词出现得更早,其实它就是早期的人工智能概念。随着学术界出现了争执和风波,一群AI的学者,为了脱离原本维纳的控制论,所以起了一个新词叫人工智能。所以如果在谷歌的词频里面搜索一下的话,也可以看出来,早期的时候,在五六十年代的时候,控制论这个词迎来了一波高峰,但后来就衰落了。

那现在这个时代,当谈论到人工智能的时候,其实是在谈两个概念,即算法工具和智能硬件。因为人工智能其实是在硬件的促进下发展的,三驾马车指的就是算法、算力和数据。关于算法工具,其实就是深度学习和强化学习。AlphaGo就是将深度学习和强化学习相结合产生的。硬件系统主要的就是指移动端的芯片,比如手机里的芯片。

今天人工智能算法中最火的名词就是深度学习了。但是人工智能有许多流派,符号主义、连接主义、统计主义、行为主义等等,在这些流派下面会诞生不同的算法的门类,不同的算法门类里面细节还有很多算法,人工智能的算法非常多,比如说知识图谱、专家系统、遗传算法等,他们都属于AI的算法。但最近十年是深度学习比较流行,但是如果真的想扎根于人工智能的话,不要放弃其他算法,因为人工智能的发展,一直都是三十年河东,三十年河西。在最早的时候符号主义和专家系统特别流行,现在就不流行了,但没人知道十年之后他不会再次流行。

在人工智能诞生之初,科学家会想怎么实现人工智能呢,然后就诞生了不同的流派。在最早符号主义比较占上风,科学家们都认为通过这种基于规则的数理逻辑、数学逻辑(加减乘除、与或非)就可以实现人的智能。因为计算机刚刚诞生的时候,就是利用这些进行计算的。但是即使到了现在人脑的原理,人们也没有完全的理解,现在的电脑也还是不能代替人脑,所以符号主义没有走得很远,逐渐没落了。

其实在人工智能诞生的早期,还有另外一个流派就叫做连接主义,或者叫连接流派。它是模拟大脑的连接结构。该流派主要是模拟人脑的结构。人脑由神经元组成,那机器脑就由人工神经元构成;人的大脑皮层是一层一层连接起来的,那机器里面的大脑就由一层一层的人工神经元连成。这就是连接主义这一派的思路,所以这也是神经网络和深度学习所属的流派。所以从最早人工神经元发展到多层感知机,然后发展发展到神经网络,这些学习算法发展到现在就成为了深度学习。

其实行为主义也一直在流行。行为主义的代表算法就是遗传算法。遗传算法是强化学习的一个特例,这一类的算法是模拟人的行动和决策的,人类看到什么事情,会做出什么样的行动。比如,当人类看到前方有障碍物会躲避,那这个从感知到行动的行为,科学家认为如果机器也能像人一样有从感知到行为的映射,那机器就具有了人类的智能,所以叫行为主义。

最后一个流派叫统计主义,这个非常像数理统计这一派的,它其实就是机器学习,因为机器学习的全称叫做统计机器学习。那这一类的流派的科学家就希望系统可以自动地从数据中获得知识,而不需要人告诉他,也就是在数据,也可以叫经验中学习。在经验中学习,其实跟人的学习的过程是很像的。比如监督学习和无监督学习,就很像人类的学习的过程。机器学习通常被划分为监督学习、无监督学习和强化学习。监督学习就类似于老师在说,哪个是正确的哪个是错误的。在这种标签或者老师的监督下,在数据中产生算法,产生模型。监督学习非常适合解决分类或者回归类问题。监督学习就没有老师了,相当于完全自习的状态,所以无监督或者无老师学习,它很适合解决一些聚类的问题,没有明显的标签或者是没有明显的好坏,甚至没有明确的对错的一些问题。比如社交网络里面的一些舆情的信息等等,都可以用聚类来做分析。另外一个就是强化学习,它适合解决的是决策问题,比如说机器人的控制、自动驾驶、下围棋、下国际象棋等等。当然围棋因为它的难度比较高,在2016年的时候才被AlphaGo解决,但也并不能叫完全解决。

机器学习之后就发展到了神经网络。神经网络根据网络结构可以分为两类,即卷积神经网络和递归神经网络(或循环神经网络)。卷积神经网络更适合于解决空间相关的信号,比如照片。递归神经网络,或者循环神经网络,它适合解决与时间相关的信号,比如语音信号。

深度学习是什么时候得到发展的呢?在2012ImageNet挑战赛里,Alex提出了一个网络,把深度学习变成了一个参数可调可学习的状态。所以从2013年开始,深度学习就蓬勃发展了。但这一个挑战赛最早只在学术界有一定的影响力。什么时候工业界和大众都开始关注到深度学习呢?其实是AlphaGo战胜人类之后,但战胜人类的是深度强化学习,但反倒让深度学习火了,这也是非常有意思的情况。

四、像人一样感知——以人脸识别为例

如果让机器实现人脸识别,总共分几步呢?其实有三步就够了。如果要求高的话,就需要有四步。第一步就是做一个人脸检测,先要检测出人脸区域,再去识别。但在检测和识别中间还需要检测关键点。什么叫人脸的关键点呢?比如鼻子、嘴巴、眼睛、眼角、鼻翼、嘴角等等。关键点的作用是因为人脸识别不一定是正对镜头,有可能是侧面,通过关键点就能把偏的人脸矫正,然后通过正的人脸去比对。

解决人脸的检测问题又分几步呢?人脸检测其实最早分为三步,在深度学习的发展之后,人脸检测流程就变简单了。虽然算法变复杂了,但流程呢变简单了,速度也变得越来越快了。现在有一些目标检测叫两阶段检测,例如RCNN系列算法。还有一阶段的算法,比如YOLO,SSD系列。在深度学习的驱动下,目标检测算法兵分两路,分为一阶段和两阶段。

五、像人一样决策&行动——以自动驾驶为例

就一辆车来说,让AI代替驾驶员的过程就是完全代替人的过程。那什么来代替人的眼睛呢?可以是激光雷达,但激光雷达的价格非常高;还有可能是摄像头,比如特斯拉,就不使用激光雷达,只基于视觉的障碍物检测;还可以是毫米波雷达。因为毫米波雷达它测距比较远,价格便宜,所以可以在汽车上装很多个。一般自动驾驶的计算设备就在车的后备箱中,由工控机、GPU等组成。还包括一些执行单元,比如方向盘、油门等。

那要实现无人驾驶,要解决几个问题呢?第一要解决这种感知问题,比如车道线、障碍物等等。第二还要认知它,克服一些不确定性,增强检测的鲁棒性等等。第三就是决策,看到了障碍物,还要思考该如何规划轨迹。第四就是控制,最后就是执行了。另外,比如说高精度地图、定位感知和GPS、北斗等等,这些也都是非常重要的环节。

在自动驾驶中,因为获取数据的传感器很多,比如有单目相机、双目相机、毫米波雷达、激光雷达等,这就会涉及到传感器的融合了。其实传感器融合是一个非常传统的科研方向。早期的时候都叫数据融合,但随着科研领域流行词汇的改变,现在更多的称为多模态融合。

其实学习人工智能并不难,想要实现前面提到的目标检测任务,其实只需要十几行代码。元宇宙是未来下一代互联网,是人类未来的数字化生存。元宇宙是一系列技术的“连点成线”,能够带来超越想象的潜力,驱动产品创新和商业模式创新。终极的元宇宙将包含:互联网、物联网、AR/VR、3D图形渲染、AI人工智能、高性能计算、云计算等技术,具有改变世界的潜力。如果对元宇宙感兴趣,而又不知道从哪入门,那么从AI这个大家公认与元宇宙最相近的方向开始学习是很好的选择。

人工智能和AI到底是什么浅谈人工智能和AI

文章目录我们每天所谈论的人工智能,究竟是什么?我们正处于AI时代:衣食住行中的AI什么是人工智能?AI对传统行业的冲击AI对广告行业和媒体行业的冲击AI对教育行业的影响AI对艺术创作行业的影响AI对物流行业和工业行业的影响我们每天所谈论的人工智能,究竟是什么?

        人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。        人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。        人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。        简单而言什么是人工智能这个问题的答案很简单,但它非常重要。如何理解人工智能,决定了我们如何面对人工智能,如何抓住人工智能浪潮所带来的时代机遇。

        在知道答案之前,需要先了解一下:最近一些年,人工智能给我们的生活带来了哪些变化。它们不声不响地发生着,当你发觉时却早已势不可挡……

我们正处于AI时代:

        其实,我们即将处于一个人工智能时代,每天都在和人工智能打交道。现在,让我们一起正式推开人工智能的大门,一起来扒一扒AI对我们『衣食住行』的影响。

衣食住行中的AI

        前几日我去逛街,发现Selected的实体店里多了一个试衣神器叫魔镜系统,手只要轻轻一挥,就可以展现各种衣服在身上的效果,原来它长这副模样。

        它主要使用了计算机视觉和3D建模技术,消费者只在魔镜里输入自己的性别、身高、体型就可以选择心仪的衣服,进而通过技术将服装的虚拟影像『穿』在镜中的人像上,同时还可更换为同一款式的其他色彩。这就可以在更短的时间里试穿更多的衣服,而且省去排队的麻烦,这真是给女生的一大福利啊!对于商家也是一大福音,自2008年,全球最大的时尚集团之一绫致时装将selected引进中国市场以来,SELECTED由最初的50家店铺,增长到现在已超过1000家。        SELECTED基于新零售这个时代趋势下的,采用大数据技术、人工智能技术更大程度上的充实客户体验感,提高品牌影响力。

        同是服装行业的优衣库,在四月新发布的福布斯2019年富豪榜中,优衣库的创始人柳井正击败软银掌门人孙正义再次成为日本首富,其中RFID电子标签、智慧门店发挥了不容小觑的作用。

        RFID电子标签也就是射频识别技术,相较于需要人工操作的条形码,RFID标签使得购物篮中的所有商品可以一次扫描,大大节省支付和库存管理的时间,从而保证热销产品产量迅速提高。

        另外,RFID电子标签将获取更加详尽的信息,比如消费者何时拿取商品和放回货架,及产品于何时何地售出,其产生的大量数据可以结合人工智能技术可以分析消费者行为。

        智慧门店采用智能导购可以为顾客选择和搭配服饰,提高购买率。

        在深圳万象天地的优衣库,每层楼都有两个电子智能屏幕。这是一款导购机器人,智能导购员是其主要功能。通过人机对话,分析用户的筛选条件,最终在屏幕上推送用户所需商品。

        智能导购给我们提供了更加精准、优质、舒适的服务。

        技术真是日新月异,90年代时,我们只会在实体店里买衣服,根本不会有什么网上购物的概念。随着互联网技术和移动支付技术的成熟,网购似乎已成为了大多数人生活中不可或缺的一部分,足不出户就可以购买到心仪的衣服。

        如今,AI、VR技术的发展,智能试衣更是会提高消费者网店和实体店的购物体验。

『民以食为天』,那在饮食方面,人工智能对我们有什么影响呢?人工智能可不可以帮助我们控制饮食,保持魔鬼身材和好气色呢?

        推荐一款APP——CocoNutritionist给大家,它是由麻省理工开发的,通过AI分析食物成分,合理地安排膳食并燃烧你的卡路里。

        这款APP的使用非常简单,只需要打开APP说你今天吃了什么,APP通过语音识别技术和语义分析技术,自动记录你的饮食信息;然后通过另外一套AI分析系统分析各个食物的营养成分和卡路里,并将营养数据可视化。我们可以清晰地掌握和控制自己的饮食。

        还有啊,你可以拍下那些『不知其名』的食材,APP会为你分析它的营养价值和热量,并给出适宜你的烹饪食谱。可谓是集合了计算机视觉、语音识别、语义分析各大技术于一体的健康小助手,指导人们科学健康地生活。

        聊完吃的,我们再一起来到美丽的西湖畔,感受一下阿里巴巴未来酒店里面的黑科技。

        进入酒店,刷脸完成check-in,乘电梯刷脸就可以按楼层;进入房间,刷脸就可以打开房门;

        当进入房间之后,客房小管家天猫精灵已等候在内,你可以通过天猫精灵控制房间温度、灯光、窗帘、电视等;餐厅里为你上菜的是机器人服务员。

        从大堂到电梯再到房间,乃至餐厅、健身房等等,都涵盖人脸识别、语音控制、智能机器人等黑科技服务。

        基于AI智能的酒店智慧系统解决方案,为住客节省时间、提供方便,且帮助酒店服务人员减少重复性工作。据阿里未来酒店CEO王群介绍,“未来酒店的人效比是同档次、同规模酒店的1.5倍。”可能再过10年,可能司机这个职业将被AI取代,2017年12月2日,深圳无人公交车打响了第一枪,无人公交正式上路。

        虽然有司机的监控,但已基本实现了无人驾驶的功能。

        除此之外,还记得2018年春晚上,100辆比亚迪无人驾驶车队声势浩浩荡荡,在港珠澳大桥向全球华人展示强大的科技魅力!

什么是人工智能?

        人工智能这个词近年来已经深入到我们生活的方方面面并被捧得热火朝天,但是,极少人真正知道它到底是怎么一回事。

机器人

        相信很多人都会说机器人,其充其量只能算是人工智能的外在形态。

        人工智能并不等同于这些“外在形态”,它是在背后负责操控一切的“大脑”,比我们想象的还要强大得多。

        我们每天所谈论的人工智能,究竟是什么?

        维基百科这样解释:“人工智能亦称机器智能,是指由人制造出来的机器所表现出来的智能。”而更富远见与洞察的答案却是:

        人工智能=技术+应用。此处,技术是指那些能“让机器模拟人的基础能力”的技术。比如,人的眼睛能看,传统的机器不能,那我们就去研发“图像识别技术”,让机器能看;比如,人能理解文字,传统的机器不能,那我们就去研发“自然语言处理技术”,让机器能理解文本。

        此处,应用是指各行各业。所有可能应用到上述技术的地方,比如:安防、新零售、交通、工业等。

        这个等式在告诉我们:同样的技术,应用在不同的领域,能够创造不同的社会价值;同样的应用场景,搭配不同的技术,则都能够以不同的方式创造社会价值。

        接下来,我会为你详细地诠释这一点。

        人工智能,最终把那些传统意义上,只有人能做的事情,不管是简单劳累的体力劳动——感知和运动,还是复杂的脑力劳动——推理、决策和学习,都交给机器或软件去完成,它们会做得和人一样好,甚至是比人更好。

        那我们一起感受一下AI是如何把图像识别技术、GAN网络、自然语言处理技术应用到各行各业中。比如:广告行业、媒体行业、教育行业、艺术创作行业、物流行业和工业行业,颠覆了各传统行业的工作方式,消灭重复性劳动!

AI对传统行业的冲击AI对广告行业和媒体行业的冲击

        阿橙大学专业学的是广告设计,毕业后,他去了一家4A广告公司担任设计师。

        对他而言,工作中最痛苦的时候并不是找不到做图的灵感,而是无休止地根据甲方爸爸的要求改图。

        半夜守着电脑等甲方回复,打开电脑看到辛苦做的图又被提了一大堆修改意见,就觉得要精神崩溃。

“logo再大一点、颜色再亮一点,要体现出我们的理念和精神……”“我感觉设计得还不够大气,能不能换一个更高端的字体……”

        而另一位在互联网公司做新媒体编辑的小爽,她的苦恼则是:你永远不知道新的热点和明天哪个会先来。

        当新事件发生的时候,就是她在电脑前埋头码字、思考抓眼球的标题的时候。

“晚上十点主编打电话告诉我某某明星又爆出大料……”“你体会过辛苦排版了一下午的微信文章被打回的心碎吗……”

        我听着大家吐槽,却不知该如何告诉他们:这些烦恼,很快将不复存在了。不想重复性地替甲方爸爸改图?没问题啊,这件事,未来将由AI来替你做。

        早在去年,阿里就发布了一款名叫“鲁班”的人工智能设计师。

        鲁班在去年双十一期间上岗,平均每秒做8000张海报,共计在双十一期间完成了四亿张设计图。

        简单来说,在鲁班的“人工智能小脑袋瓜”里存着海量的广告元素:如文案、产品、背景、点缀元素、LOGO等,他们不同的组合方式形成了一套“设计语言库”。

        设计师在做图的时候需要分析甲方的需求,调用脑子里存储的资源,思考解决方案,有时难免会出现“灵感枯竭”的情况。

        但鲁班的小脑袋瓜里装的东西可太丰富了,只要你一声令下,它就能一秒调出你想要的。

        这意味着,在大批量作业的商业设计领域,AI有着非常明显的优势:既快速,又齐整。

        从此再也不需要设计辛辛苦苦地做完一大批“每一个都不一样,但整体又要一样”的图后,感觉自己是个瞎子。

        可我们有没有想过为什么鲁班可以将脑袋中的元素完美地组合呢?

前面有提及过按照一系列地组合方式呀。

        但是组合方式,或是说广告的模版是怎么来的呢?难道是设计师给出的?No,No,其实是依靠其背后的深度学习,对大量的设计广告案例(图像)进行结构化标注,然后输入大型的神经网络学习风格和排版,最后输出空间+视觉的设计模版。

        其实鲁班就是深度学习在设计行业里的一个应用,技术是应用的灵魂,而应用是技术的载体。

好吧,人工智能又能如何帮忙解决媒体行业里文字创作的烦恼呢?

        好,我们就来看看新媒体运营们头疼的:追赶热点、组织文案、写稿。

        不想大晚上被主编的电话叫醒,没问题啊,这份工作AI一样可以帮你完成得好好的。

        早从去年开始,公众号“中国地震台网”就已经在用AI新媒体编辑写即时新闻了。

        比如说,前不久日本北海道地区发生5.5级地震的新闻就是由AI写的,排版和文字长这样:

虽然文字和排版都很简单,但猜猜写这篇推送AI用了多久?

        只用十秒,就完成一篇推送。24小时超长在线,一有突发事件就能马上开始工作。

换做是我来写作的话,十秒钟大概只够时间写完一个标题吧_;。

        人工智能写作依靠的是背后的数据库和优秀的技术比如自然语言处理,将数据、案例素材、文字流畅地组合一起形成文章。

        如果说,上班一族最讨厌的是无意义的重复性劳动,那么,对于学生党而言,最烦恼的应该就是考试了吧。考试不仅考的是学习能力,还有应试技巧(没错,就是套路)。那么,在考试之中,人工智能的表现又如何呢?

AI对教育行业的影响

        先看看千军万马过独木桥的高考。2017年,成都的AI-MATHS高考机器人参加了高考数学,在掐断题库、断网、无人干涉的情况下进行解题。结果是,它分别用了22分钟和10分钟完成了高考北京文科数学卷和数学全国卷二,最终分别获得了105分和100分,平均分102.5。

        虽然人家考得一般,但人家题目做得快啊,给你十分钟写一张卷子,你能考这个成绩吗?可见,在学习方面,人工智能做的也并不比你差。不好好学习的话,可能连考试都考不过AI。再告诉你个事儿,AI在“考试”领域可不仅仅能成为参与者,它还能成为老师一样的批改者。        在浙江外国语学院国际学院,来自阿里巴巴的人工智能已经为11位留学生批改了作文,平均每篇作文批改时间为40秒。

        说不定在不远的将来,决定你考试过不过,能不能拿到毕业证的,不再是人类批改员,而是更准确、更高效的人工智能批改员。同样的,无论是AI考试还是AI批阅试卷还是上个案例中的AI写作,都是深度学习——自然语言处理的应用,我们看到了同一技术可以实现不同的应用。

AI对艺术创作行业的影响

        图像风格迁移是计算机视觉领域中,比较有意思的应用。风格迁移也就是:你给人工智能一张随便拍的照片,它就能帮升级成梵高风格的绘画作品。

        图像风格迁移的背后可以是深度学习——卷积神经网络的图像特征提取,比如2016CVPR(CVPR是计算机视觉的顶级会议)论文《ImageStyleTransferUsingConvolutionalNeuralNetworks》就采用卷积神经网络来进行风格迁移。

        还可以是利用GAN网络技术风格迁移,在2018CVPR论文《Multi-ContentGANforFew-ShotFontStyleTransfer》中,将设计师设计好的某些艺术字母风格迁移到没有出现过的字母上,避免重复设计。

        GAN网络学习第一行的P、U、W三个字母的艺术风格,生成其余23个字母的艺术风格,如上图中的最后一行。

        或许现在你还不知道什么是卷积神经网络、GAN网络,或许还比较难理解背后技术的思想,但现在我们只需知道它是深度学习的一个技术即可。

        一个应用的实现往往可以选择不同的技术,这就需要我们结合具体应用和分析应用的特点选择适宜的技术。

        人工智能确实无法凭空创造,但只需要给它一点点线索,它就能从强大的小脑袋瓜里给你输出想要的东西。

        比如谷歌家出的一个会画画的黑科技AutoDraw。大概就是,你随便鬼画个什么,谷歌都能把它变成一副正儿八经的画。

没想到AI还真能手绘图像,那它背后的技术是什么?

        其实AutoDraw使用了图像识别技术,AutoDraw首先识别出用户用简单线条画出的图形,然后根据识别的结果将『简单线条』替换为系统内置的『准确』图形。通常提及图像识别技术时,人们大多数时候会想到人脸识别、物品识别,现在我们可以了解到同样的图像识别技术,当稍微调整之后可以做出更多有趣的应用。

在制图、绘画的设计行业里,需要大量的创意和灵感,AI表现得并不比人类差,同样是艺术领域里的音乐演奏和创作,AI的表现如何呢?

        近日,首个机器人音乐舞台剧《墨甲幻音》上演为清华大学庆生,演员有竹笛机器人,箜篌机器人和排鼓机器人,奏响了科技和文化的琴瑟和鸣。

        但是,这可不是AI初次展露在音乐中的天赋,深圳平安科技在“全球AI艺术大赛(GlobalAIArtCompetition)”的作品《青春记忆》荣获大赛最高荣誉一等奖。它可是由人工智能完全创作的音乐,无论是制曲还是填词。

        那它是如何制造出来的呢?它学习了5万多首相同风格的音乐作品,10万多篇流行音乐歌词和诗歌,通过深度神经网络学习特征,制作出曲和词,然后再学习一个深度模型将曲和词联合起来。

        人工智能已经称为一种可行的工具,帮助音乐创作人创造出更多佳作。流行歌手泰伦萨瑟恩(TarynSouthern)与AI合作,共同打造她的首张专辑《IAMAI》。

以上这些需要用脑的工作都能交给人工智能完成,还做得不比人类差。那么,那些重复性劳动程度高的体力活就更不用说了。我们来看看需要大量人力支持的物流行业是如何利用AI的?

AI对物流行业和工业行业的影响

        京东早就用上了物流机器人。

        在东莞麻涌的一个京东分拣中心,原来的300位分拣员工,被裁到了仅剩20人,而这个裁员还将继续。

那谁负责去派送呢?

        去年开始,京东的无人车就在北京的6所大学完成了第一次的派送任务。原本由快递小哥负责的派送工作,现在也换成了人工智能。

        不需要担心无人车会送错、延误等等,这辆无人车配置多种传感器结合计算机视觉技术一路上能360度感知路况,比人类派送员还要靠谱。

        感慨这世界变化太快?其实,在你的视线范围之外,还有更多行业正在受到人工智能的冲击。物流行业如今朝着无人化、自动化发展,工厂和生产流水线就更不用说了。你知道上海通用金桥工厂的凯迪拉克轿车是如何生产出来的吗?繁重劳累的焊接工作,在机器人的手中如同拈花般轻松自如。

        偌大的车间内,只有10多位工人,他们管理着386台机器人,每天与机器人合作生产80台凯迪拉克。

        无论是AI制图、制曲、写作、考试、阅卷、快递派送、无人车间都依靠【技术】的支撑,而【应用】上的更高需求使得技术得以迭代优化。

        我们从人工智能在传统行业中的应用中探索AI的本质,除此之外,我们还需想想看,用AI既节省成本,又提高效率,有哪个聪明的企业家不会选择使用人工智能替代人力的重复性劳动呢?

        这下,你能明白为什么我说,在不久之后,大家的“烦恼”都将不复存在了吧。

        全球最权威的咨询公司麦肯锡的研究报告称:预计到2030年,人工智能的发展,将有7500万至3.75亿人需要重新找工作。

        这意味着全球每100人中,就有3~14个人需要另谋出路。

        在18年西班牙世界零售大会上,刘强东说“未来京东,百分之百无人化运营,未来的京东将是一家自动化运营的企业,京东将在未来的十年里,把现在的16万员工减少到8万。”

        在这样的背景下,有的人会想我的工作也不一定会被机器替代,且行且看不着急,但我想说的是:科技不一定只意味着淘汰,更多是机会和价值。

        人工智能简而言之:人工智能=技术+应用。

(后续待补充)

最危险的新兴技术是什么

新浪科技讯北京时间3月3日,据国外媒体报道,在喜欢以末日思维思考的人看来,技术必将给文明带来灾难。诚然,我们也许永远看不到通过CRISPR基因编辑技术出生的婴儿、失去控制的自动驾驶汽车、或者想杀害人类的人工智能。但随着技术加速进步,万一这一天真的到来,事态可能远超我们的想象。但与此同时,有一个问题值得思考:最危险的新兴技术是什么?让我们看看专家们对此怎么说吧。

泽菲尔·蒂乔特(福特汉姆大学法学副教授)

办公室监控。这种技术会造成严重的信息不对称,让雇主可以像对待实验室小白鼠一样监视自己的员工,使本就恶劣的上下级关系进一步恶化。雇主们深知如何以不健康的方式刺激员工工作,也知道如何用更少的工资榨取更多的价值。这让他们可以排除异己,还能通过区别对待离间员工。这种技术如今在职场中已经随处可见,假如不加以制止,很快就会泛滥成灾。

迈克尔·利特曼(布朗大学计算机科学教授)

在2021AI100报告中,有一章描述了人工智能当前对我们最紧迫的威胁有哪些。这支包含17人的专家团队认为,虽然人工智能系统在现实世界中的应用可以造福人类,但随着其应用范围的扩大,误用、过度使用、以及滥用的风险也将激增。

专家团队对人工智能最大的担忧在于所谓的“技术解决主义”,即“认为像人工智能这样的技术可以用来解决任何问题”的心态。许多人都认为,人工智能所做的决策客观中立、不偏不倚,但这些决策结果可能得到不恰当的应用,也可能基于历史偏见、甚至明晃晃的歧视。如果数据或数据解读算法不够透明,公众就可能被蒙在鼓里,根本不清楚这些决策会对自己的生活造成怎样的影响。

人工智能系统目前已经被用来在网上发布虚假信息了,因此很可能对民主造成威胁,被用作散播法西斯主义的工具。另外,如果对人工智能中的人为因素考虑不够充分,就会导致人们在“不信任人工智能系统”和“过度依赖这些系统”之间来回摇摆。人工智能算法也在涉及器官分配、疫苗等医疗问题的决策制定中起到了一定作用,很可能导致生死攸关的后果。

如果在出现问题时,对系统效果负责的个人或组织可以负起主要责任,人工智能的危险性或许能得到缓解。将所有利益相关方牵涉进来,虽然会大大减慢人工智能解决困难问题的速度,但却是不可或缺的一步,因为技术滥用的负面后果实在过于严重。技术专家也应当像医疗行业一样,坚决遵守“不伤害”原则。

戴维·沙姆韦·琼斯 (哈佛大学流行病学教授)

至于谁能担得起“最危险的新兴技术”这一头衔,候选人显然有很多。例如,CRISPR等基因编辑技术的效果不一定有支持者们宣称的那样强大,反而有可能造成严重破坏。此外,社交媒体也展现出了造成大范围伤害的威力。但最令我担心的,还是人脸识别技术在监控领域的大规模应用。从很多方面来说,这项技术都是一项重要的社会资产。例如,人脸识别可以提高交易效率,登机时无需出示身份证或登机牌,在商店买东西时也可以直接刷脸付账。人脸识别也可以加强社会治安,更容易找到和逮捕犯罪分子。

所以这种技术危险在哪里呢?首先,我们的一举一动都将不再隐私,总有人能知道我们在哪、我们去过哪里。就算这些个人信息没有被滥用,隐私感和匿名感的丧失也会让人感觉不适。此外还有信息滥用问题,并且这种风险是真实存在的。任何有途径拿到这些信息的人都有可能将其用于不法目的。从心理扭曲的追求者到政府部门,都有可能对我们去的地方和见的人进行监视,甚至预测我们的下一步行动。并且我还怀疑,这种技术的危害也许远超我们的想象。

瑞安·卡罗 (华盛顿大学法学教授)

我认为最危险的信息技术当属量子计算机。除了加密破解之外,量子计算的危险性其实已经不是什么新鲜事了。早从超级计算机时代开始,量子计算对个人隐私的威胁就已有加速增长之势。如今有了足够的数据和处理能力,当今的计算机系统抓取私人信息的能力更是在不断增强。我担心的是,利用量子计算技术,政府和企业都将变成“福尔摩斯”,从公开信息中猜出我们的所有秘密。

艾米·韦伯(前景、趋势及情境规划公司FutureTodayInstitute首席执行官)

最危险的新型技术应该是生物学,或者说得更准确些,合成生物学。这门技术的目标只有一个:利用细胞编写全新的(或者更好的)遗传编码。合成生物学运用工程学、人工智能、遗传学和化学方法,对生物身体部件或生物体进行重新设计,从而加强特定能力或创造新功能。利用一系列最新合成生物学技术,我们不仅能读取和编辑DNA编码,还能编写出新的编码。这就意味着,我们很快就能给生物体编程了,就好像它们是微型电脑一样。

合成生物学让我们可以将DNA序列变为软件工具,就像Word一样,只不过编辑的对象是DNA编码而已。研究者按自己的想法完成DNA编写或编辑后,新的DNA分子就可以借助3D打印机之类的技术凭空“打印”出来。这种DNA合成技术正在飞速进步中。如今的技术已经能常规打印出包含几千个碱基对的DNA链了,可用于建立新的细胞代谢通路、甚至足以构成一个完整的细胞基因组。

这样可能会造成什么问题呢?用不了多久,我们就能编写出任何病毒的基因组。想到新冠病毒,这种设想似乎很吓人,但病毒不一定都是坏事。事实上,病毒只是盛放遗传编码的容器而已。未来我们也许可以创造出对人体有益的病毒,用于治疗癌症等特定疾病。

合成生物学将在气候危机和食物及水资源短缺中发挥重要作用。它将减少我们对动物蛋白质的依赖,最终还能实现药品定制化,人们的身体将成为自己的“药房”。

但合成生物学之所以是最危险的新兴技术,原因并不在科学本身,而是出在我们人类身上。这要求我们挑战现有的心智模式,提出一系列复杂艰深的问题,还要对生命的起源展开理性讨论,否则我们就会制造风险、错失机会。在接下来10年里,我们要充分利用数据、证据及科学精神来制定关键决策,比如制造哪些治病专用的新病毒、基因隐私是什么样的概念、以及谁拥有“生物体”的所有权等等。监管机构也要确定企业应如何从人工编辑细胞中盈利、以及在实验室中保存合成生物体需遵守什么流程。

我们本身在合成生物学中也扮演了重要的角色。如果你可以重新编辑自己的身体,你会做出什么选择?如果可以对你未来的子女进行编辑,你会不会对此感到困扰?如果食用合成生物可以缓解气候变化,你会接受吗?合成生物学将成为人类有史以来打造过最强大、最可持续的制造平台。我们如今正处于这场工业革命的风口浪尖。

杰伦·范登霍文 (代尔夫特理工大学伦理与技术教授)

我认为最危险的技术是那些阻挡人们了解世界和他人需求的社会或认知技术。这些技术容易导致人性的泯灭,使人们变得自私自恋、不为他人考虑。这些技术就像造雾机一样蒙住了我们的双眼,让我们对人类共同体和人类的责任视而不见。这些技术完全没有信仰可言。研发它们的人要么是被别人当成工具利用,要么极其天真幼稚,要么是同谋,要么就是伪造假象的大师、坚决否认人类未来可能遭遇的一切苦痛。

所以我认为,这些助长认知混乱的数字技术是我们面临的最大威胁。这些技术的危险性很容易被遮蔽或否认,因此大多数人都觉得没什么不对。而与此同时,其它真正能造福人类的技术反而会被污名化。暴君和恶棍饱受赞誉,英雄和救世主却被肆意抹黑。

有的人还未放弃抵抗气候变化、寻找抗疫方法、阻止医院利用人工智能分诊、揭露深层骗局等等。但这些人如今已难以辨明哪些才是真相、哪些做法在道义上可以接受。而多数人恐怕都早已放弃了对真相的追寻,变得温驯顺从、洋洋自满。

希德·约翰逊(纽约州立上州医科大学生物伦理与人类学副教授)

异种移植(即将一种动物的器官和组织移植到另一种动物体内)一直被视作移植器官短缺的解决方案之一。有成千上万人在苦苦等待救命的器官,有些人最终熬不过漫长的等待、在这个过程中不幸逝世。从上世纪60年代到90年代,研究人员做了无数次将灵长动物器官移植给人类的尝试。但到目前为止,还没有患者在接受异种器官后存活下来。有人只活了短短几小时,有人坚持了几天活几周,原因之一在于免疫系统对新器官产生的排异反应、甚至可怕的超急性排异反应。

物种之间差异越大,排异风险越大,就像人类和猪一样,毕竟两个物种之间隔了8000万年的进化差异。但猪目前被我们视作较为理想的器官来源,因为饲养难度低,器官大小适合人类使用,并且每年被屠宰的猪本就达到了数亿头之多,所以为了器官杀死它们似乎也不存在太大的伦理道德问题。

灵长类动物与人类之间的遗传相似性会增加人畜共患病的感染风险。美国食药监局就明确禁止了将灵长类动物的器官用于异种移植。但猪也可能感染与人类相似的病毒,也可能传播人畜共患病。1998和1999年,马来西亚的养猪户中就爆发了一次因猪传播的尼帕病毒导致的病毒性脑炎,导致100人死亡、超过1百万头猪被扑杀。

新冠也是一种人畜共患病,可能先后跨越了好几个物种、最终才传播到人类身上,引发了这起已夺走数百万条生命的全球大流行,给医疗体系造成了重击,引发了一系列全球性社会经济动乱。目前,我们已在狗、猫、雪貂、黑猩猩、大猩猩、水獭、大型猫科动物、欧洲的人工养殖貂、以及美国的野生白尾鹿身上都发现了新冠病毒。

人畜共患病通过异种器官移植传播的风险是个十分严肃的话题,许多组织都建议对器官接受者、其密切接触者、以及参与移植过程的医疗工作者进行终生观察。观察的目的倒不是保护器官接受者本身,而是出于公共卫生考虑。因此异种移植是一项极其危险的新兴技术。在最糟糕的情况下,也许会爆发另一场全球性大流行病,造成灾难性后果。

除了异种移植之外,器官短缺其实还有其它解决方案,并且有些已经可以投入应用了,例如增加人类捐赠者的数量。还有些正在研发中(例如:体外培育人体器官,利用3D生物打印技术实现受损器官的体内修复和再生等等)。这些技术都没有造成全球大流行病的风险。而异种移植技术在经历了数十年的研究、以及无数次失败后,仍存在诸多疑点。如今新冠疫情已进入第三个年头,异种移植的疾病传染风险已经成为了一个重点问题,其危险性再怎么高估也不为过。

约翰娜·布莱森(柏林赫尔蒂行政学院伦理与技术教授)

我认为最危险的新兴技术其实是各种国家治理形式。我们对社会控制已经有了充分的了解。有些国家对这些信息的使用主要出于好意,但有些则用其压迫和操纵少数群体、甚至削弱占多数群体的权力,无论是哪种方式,结果都很残酷。我们还要意识到,这种暴行也包括“文化种族屠杀”,即抹去人们留下的所有记录和历史、否认其祖先的存在和身份。这种做法虽然不一定会真的杀死这些人,但也会严重打击其蓬勃发展的能力。

要想解决这些问题,唯一的办法就是创新治理形式,鼓励合作行为,尊重基本权利。很多技术事实上都有“双重用途”。我们不能选择躺平、认为解决方案不在自己掌控范围内。在任何社会层级上,政治觉醒度和参与度都十分重要。而且有趣的是,我们利用社交媒体等工具,已经在很大程度上提高了人们的政治意识。所以我认为还是有希望的,只不过要做的工作还有很多。

伊丽莎白·希尔特(伊利诺伊理工学院哲学教授)

最危险的新兴技术应该是某种能够脱离人类控制和监管的技术。技术不会奇迹般地凭空出现,本身也并不危险,危险之处其实在于设计、改造和部署它们的人类。

虽然有很多人猜测,未来可能会出现超级人工智能、对人类进行统治和支配,但我认为,新兴技术有很多更加实际的方法逃离人类掌控。

例如,技术的作用原理若不够透明,就很容易脱离我们的控制。此外,针对某一技术的功能和影响,制造商或企业也许会对公众歪曲事实、或有所隐瞒。

人类的情感投入也可能导致失去对技术的掌控。我们与技术开展互动时,越是符合自己的直觉和情感,就越容易掌握这门技术。因此类人机器人常常会模仿人与人之间的互动方式。但如果赋予技术情绪等人类特征,可能会导致人类单方面的情感投入,使得人与技术之间的互动不再受理性主导、而是受感性因素驱使。在这类互动关系中,人类将成为更容易受伤害的一方。(叶子)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇