2023年人工智能领域发展七大趋势
2022年人工智能领域发展七大趋势
有望在网络安全和智能驾驶等领域“大显身手”
人工智能已成为人类有史以来最具革命性的技术之一。“人工智能是我们作为人类正在研究的最重要的技术之一。它对人类文明的影响将比火或电更深刻”。2020年1月,谷歌公司首席执行官桑达尔·皮查伊在瑞士达沃斯世界经济论坛上接受采访时如是说。
美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界,其将在7大领域“大显身手”。
增强人类的劳动技能
人们一直担心机器或机器人将取代人工,甚至可能使某些工种变得多余。但人们也将越来越多地发现,人类可借助机器来提升自身技能。
比如,营销部门已习惯使用工具来帮助确定哪些潜在客户更值得关注;在工程领域,人工智能工具通过提供维护预测,让人们提前知道机器何时需要维修;法律等知识型行业将越来越多地使用人工智能工具,帮助人们对不断增长的可用数据中进行分类,以找到完成特定任务所需的信息。
总而言之,在几乎每个职业领域,各种智能工具和服务正在涌现,以帮助人们更有效地完成工作。2022年人工智能与人们日常生活的联系将会变得更加紧密。
更大更好的语言建模
语言建模允许机器以人类理解的语言与人类互动,甚至可将人类自然语言转化为可运行的程序及计算机代码。
2020年中,人工智能公司OpenAI发布了第三代语言预测模型GPT—3,这是科学家们迄今创建的最先进也是最大的语言模型,由大约1750亿个“参数”组成,这些“参数”是机器用来处理语言的变量和数据点。
众所周知,OpenAI正在开发一个更强大的继任者GPT—4。尽管细节尚未得到证实,但一些人估计,它可能包含多达100万亿个参数(与人脑的突触一样多)。从理论上讲,它离创造语言以及进行人类无法区分的对话更近了一大步。而且,它在创建计算机代码方面也会变得更好。
网络安全领域的人工智能
今年1月,世界经济论坛发布《2021年全球风险格局报告》,认为网络安全风险是全世界今后将面临的一项重大风险。
随着机器越来越多地占据人们的生活,黑客和网络犯罪不可避免地成为一个更大的问题,这正是人工智能可“大展拳脚”的地方。
人工智能正在改变网络安全的游戏规则。通过分析网络流量、识别恶意应用,智能算法将在保护人类免受网络安全威胁方面发挥越来越大的作用。2022年,人工智能的最重要应用可能会出现在这一领域。人工智能或能通过从数百万份研究报告、博客和新闻报道中分析整理出威胁情报,即时洞察信息,从而大幅加快响应速度。
人工智能与元宇宙
元宇宙是一个虚拟世界,就像互联网一样,重点在于实现沉浸式体验,自从马克·扎克伯格将脸书改名为“Meta”(元宇宙的英文前缀)以来,元宇宙话题更为火热。
人工智能无疑将是元宇宙的关键。人工智能将有助于创造在线环境,让人们在元宇宙中体会宾至如归的感觉,培养他们的创作冲动。人们或许很快就会习惯与人工智能生物共享元宇宙环境,比如想要放松时,就可与人工智能打网球或玩国际象棋游戏。
低代码和无代码人工智能
2020年,低代码/无代码人工智能工具异军突起并风靡全球,从构建应用程序到面向企业的垂直人工智能解决方案等应用不一而足。这股新鲜势力有望在2022年持续发力。数据显示,低代码/无代码工具将成为科技巨头们的下一个战斗前线,这是一个总值达132亿美元的市场,预计到2025年其总值将进一步提升至455亿美元。
美国亚马逊公司2020年6月发布的Honeycode平台就是最好的证明,该平台是一种类似于电子表格界面的无代码开发环境,被称为产品经理们的“福音”。
自动驾驶交通工具
数据显示,每年有130万人死于交通事故,其中90%是人为失误造成的。人工智能将成为自动驾驶汽车、船舶和飞机的“大脑”,正在改变这些行业。
特斯拉公司表示,到2022年,其生产的汽车将拥有完全的自动驾驶能力。谷歌、苹果、通用和福特等公司也有可能在2022年宣布在自动驾驶领域的重大飞跃。
此外,由非营利的海洋研究组织ProMare及IBM共同打造的“五月花”号自动驾驶船舶(MAS)已于2020年正式起航。IBM表示,人工智能船长让MAS具备侦测、思考与决策的能力,能够扫描地平线以发觉潜在危险,并根据各种即时数据来变更路线。2022年,自动驾驶船舶技术也将更上一层楼。
创造性人工智能
在GPT—4谷歌“大脑”等新模型的加持下,人们可以期待人工智能提供更加精致、看似“自然”的创意输出。谷歌“大脑”是GoogleX实验室的一个主要研究项目,是谷歌在人工智能领域开发出的一款模拟人脑具备自我学习功能的软件。
2022年,这些创意性输出通常不是为了展示人工智能的潜力,而是为了应用于日常创作任务,如为文章和时事通讯撰写标题、设计徽标和信息图表等。创造力通常被视为一种非常人性化的技能,但人们将越来越多地看到这些能力出现在机器上。(记者刘霞)
【纠错】【责任编辑:吴咏玲】上海人工智能的硬科技与软实力:以应用场景引领产业聚集发展
人工智能作为
新一轮产业变革的
重要驱动力
正在重塑
生产、分配、交换和消费等
经济活动各环节
从衣食住行
到医疗教育
人工智能技术就像
新时代的“电力”
赋能城市数字化转型
▲上海首批“AI+园区”试点应用场景的张江人工智能岛
上海是最早提出把加快发展人工智能作为优先战略的城市之一。在这片沃土上,人工智能取得了怎样的发展?上海市经济和信息化委员会表示,从产业层面的硬科技角度上看,截至2020年,上海人工智能重点企业达1149家,形成较为完备的人工智能产业链条。全年规上产业规模达到2246亿元,实现50%左右逆势增长,行业复苏态势明显,2018-2020年的年均增速为29.5%。上海正逐步形成“基础研究和前沿理论研究平台+应用创新平台+重大算力服务平台”的多层次、全链条覆盖的AI创新体系。
从人工智能的软实力上看,作为人工智能领域影响力最大、最高级别的盛会,2021世界人工智能大会将于明日(7月8日)在上海举行。以“智联世界众智成城”为主题的大会将围绕“AI赋能城市数字化转型”方向,探讨人工智能技术创新与产业落地的前沿进展。这是第四届世界人工智能大会,对比往届,可用三个“最”来描述:最新前沿方向、最全行业生态、最优应用体验。上海市经济和信息化委员会表示,最优应用体验方面,体现在线下线上智能会展、场内场外智慧体验。
一是展览内容更丰富。今年的线下参展企业预计突破300家,其中,首次参展的企业比例超过40%,上海以外地区企业、外国企业占比超过50%。首发首展亮点包括商汤AR自动驾驶导览小巴、美团城市低空配送网络、优必选大型仿人服务机器人、燧原邃思2.0芯片、中移动光伏智能检测系统、星环数字化转型“魔方底座”等。
二是应用体验更智慧。用AI技术办AI大会,在会场这个“核心点”上,建好一座AI赋能的智慧场馆,呈现一条AI应用的精品路线。围绕会场周边,打造无人驾驶、无人工厂样板等经济数字化场景、世博源智慧商业等生活数字化场景、临港新片区“时空AI”等治理数字化场景。大会还将创新推出数字人民币体验、AI+王者荣耀电子竞技等活动,欢迎广大市民朋友参与体验。
三是云上会展更生动。今年大会所有论坛活动除了少数闭门会议,都将提供线上直播。线上云平台升级为2.0版,打造云直播、云会场、云展览,进一步增强观众的互动体验。
▲2020世界人工智能大会云端峰会开幕式
一位参与过前三届世界人工智能大会的头部大数据企业负责人表示,第一届大会是搭个台,之后一届比一届办得大办得好,折射的是大会的吸引力越来越强,是上海的人工智能产业崛起的缩影。“第一届时,上海的人工智能产业在全国还不能说绝对领先,但是通过大会的招牌效应,以及运用场景的引领,现在头部的人工智能企业都会希望在上海落地,这就是上海人工智能的‘软实力’。”
事实上,在过去的这一年,上海继续秉持以应用驱动产业发展的理念,牵引产业链上下游协同布局,打造人工智能产业集群。在这样的思路指导下,上海人工智能产业克服去年疫情带来的不利影响,危中迎机,逆势增长。
作为基础研究和前沿理论研究平台,上海人工智能实验室、上海脑科学与类脑研究中心、上海人工智能算法研究院、上海自主智能无人系统科学中心、上海期智研究院、上海人工智能研究院、中国科学院计算技术硏究所智能处理器研究中心、微软亚洲研究院(上海)等研究机构落户上海,攻关重大基础理论,打造人工智能战略科技力量集群。上海白玉兰开源开放研究院、微软一仪电人工智能创新院等技术开发转化平台揭牌成立,连接理论算法与应用实践,加快关键共性技术转化落地。
作为应用创新平台,商汤、依图、明略等国家新一代人工智能开放创新平台授牌,商汤、依图、上汽、腾讯、深兰、寒武纪、优刻得等市级人工智能创新中心成立,亚马逊、IBM、阿里、百度、华为、科大讯飞等头部企业人工智能创新中心在沪布局,促进面向行业的技术应用研发,形成赋能示范效应。
一系列的“首发”也诞生在上海。依图科技“求索”系列云端芯片、天数智芯7nmGPGPU芯片、腾讯AI开放平台、华为全栈式AI战略和AI芯片、寒武纪云端和终端芯片、商汤重大算力平台等在上海首发。
壁仞科技联合创始人张凌岚在谈及为何选择落地上海时表示,“上海在全国来说都是非常非常优秀的,不管是从政府的扶持力度、人才密集程度、高校的密集程度都是芯片产业最好的条件。”壁仞科技创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。
目前,人工智能作为上海重点发展的三大先导产业之一,围绕“东西集聚、多点联动”的布局,已形成具有标志性的产业集群。
“东带”以浦东新区人工智能创新应用先导区建设为抓手,推动浦东张江智能产业+科创融合发展,人工智能岛已成为国内行业产业和应用标杆,并逐渐推动由岛扩区发展模式;临港新片区积极引进地平线等领军企业,智能网联汽车综合测试稳步开展。
“西带”徐汇西岸国际人工智能中心正式启用,吸引国际顶尖企业和科研机构入驻,微软亚洲研究所、上海期智研究所等在此落地。基于国产芯研发出的智能产品在西岸“智塔”35楼的上海鲲鹏生态创新中心展出。此外,市北高新、长阳创谷、虹桥智谷等特色园区加快建设,华东无人机基地等区域产业正集聚发展,杨浦、静安、普陀、长宁、宝山等各区域人工智能特色创新载体建设步伐加速推进。
以此为基础,应用赋能不断深入推进。上海在全国率先发布人工智能应用场景建设实施计划,累计开放3批58个应用场景,发布洋山深水港、申通地铁、华东无人机基地、张江科学城等综合性应用场景。推进全国人工智能“揭榜挂帅”赛道建设,围绕智能网联汽车、医疗影像辅助诊断、视觉图像身份识别、智能传感器等赛道,开展测评工作,梳理一批行业标准成果和政策瓶颈。
中科院微系统所“免开颅微创植入式高通量柔性脑机接口”、商汤AR自动驾驶导览小巴、天数智芯从零突破GPGPU等等技术突破成果不断在此展现。
这样的布局必然引来多层次人才的集聚,上海人工智能重点企业从业人员达18.7万人(2020年7月)。国际化高端人才集聚,图灵奖得主姚期智、微软亚洲研究院院长洪小文、商汤科技创始人汤晓鸥等国际顶级人工智能专家落户上海发展。上海11所高校成立人工智能研究院,9所高校设置本科人工智能专业,38所高校开设104个人工智能相关学科专业,2019年招生数11490人、在校生数35492人,为人工智能发展储备大量后备人才。依托上海交大、同济大学建立人工智能平台基地,依托仪电集团、计算技术研究所、上海电科所建设人工智能专业继续教育基地,培养出大批人工智能领域专业技术人才。
除了人工智能产业链完备,配套的资本支持也在上海汇聚融合。上海人工智能产业投资基金成立,完成首轮资金募集,设置“上海AI会客厅”,与上交所共建“科创板AI产业工作站”,打造人才、科技、产业、资本等各类要素联通、对接、整合的“一站式”平台。
2021年是“十四五”开局之年,上海将全力推动建设融合人工智能、5G、物联网等技术的新型智能基础设施,支撑推动数字产业化和产业数字化发展,大力培育发展在线新经济,全面推动人工智能等技术在城市治理、生活、经济领域的深化应用。重点推动智能芯片、关键算法等核心技术攻关,全面激发企业主体创新活力,构建自主产业生态,继续打造创新型应用场景,推动人工智能应用深化,满足城市经济、生活、治理深层次发展需求;持续扩大人工智能产业规模。推进重点企业服务工作,营造一流营商环境,在资本、市场、人才等方面为企业做好协调服务,加快培育一批具有国际竞争力的龙头企业。争取“十四五”期间规上产业规模年均增长15%左右,2025年达到4000亿元。
浅析机器学习算法的应用场景!
Datawhale干货
作者:知乎KingJames,伦敦国王大学
知乎| https://www.zhihu.com/people/xu-xiu-jian-33
在学习算法的过程里,难免有疑问:k近邻、贝叶斯、决策树、svm、逻辑斯蒂回归和最大熵模型、隐马尔科夫、条件随机场、adaboost、em这些算法在一般工作中分别用到的几率多大?一般用途是什么?需要注意什么?
首先简要回答一下:以上这些算法,如果是指书本或者大学课堂里面教的,那么在目前国内机器学习应用最多的一些工业界场景中,它们的使用频率接近0,没啥实际用途。如果楼主是想为未来工作做积累,或者是面试做准备,你还得对以下算法多做研究,这些才是目前工业界主流应用的算法。
(决策树模型这部分专门说一下:大部分课程里面教的决策树模型比如CART、ID3等,这类模型工业界几乎不用,树模型用的最多的是GBDT、XGBoost和LightGBM。GBDT金融科技领域用的多,LightGBM目前销量预测领域用的多。)
01国内工业界应用最多的领域我们先从工业界对于机器学习的需求开始说起,明白用户需求才知道什么算法用的多。首先大家可以看一下IDCMarketScape发布的2019中国机器学习开发平台市场的报告,里面国内做机器学习头部公司是:第四范式、百度、阿里云,这是头部三家企业。
然后我们看一下上图中某头部公司的客户都来自于哪个领域:
图片来自于官网截图
我们可以很清晰地看出主要来自于这些领域:金融、媒体、零售;为什么?原因如下:
第一个是因为数据:做ToC生意的客户积累的用户多,数据也多,满足机器学习建模对数据量的要求。金融、媒体、零售积累了大量C端用户的数据;
第二个是因为场景:这些领域的客户有些大量可以使用机器学习建模的场景,也是国内工业界最早尝试将机器学习引入到实际的建模场景中的。
具体哪些场景下面会细述。
02国内工业界应用最多的机器学习算法说清楚主要应用领域和场景以后,分析算法就很清楚了。
2.1金融领域金融领域使用机器学习建模最多的场景就是风控。当然风控也要进行细分,主要应用机器学习建模的细分场景如下:
信用卡交易反欺诈:分类任务,GBDT算法+LR逻辑回归;
信用卡申请反欺诈:分类任务,GBDT算法+LR逻辑回归;
贷款申请反欺诈:分类任务,GBDT算法+LR逻辑回归;
反洗钱:分类任务,GBDT算法+LR逻辑回归;
是的没错,目前在金融领域涉及到风控的几乎都是GBDT+LR,目前市场上还没有哪一家金融科技公司做反欺诈、反洗钱场景使用的不是GBDT+LR,这是目前市场上做该场景效果最好的算法。
同时金融行业存在高监管的属性,乙方AI厂商给银行做项目时,最终项目交付时都需要模型可解释,LR模型存在一个优点就是特征可以解释,特征工程很清晰,每个特征的贡献度也可以统计出来。如果用深度学习模型等,可能效果差不多,但是完全不可解释,这种在金融这种强监管的场景下,不可解释的模型是不符合监管要求的。金融行业的属性导致的,目前深度学习在金融风控领域应用非常有限。
此外确实也有用XGBT算法在上述这些场景,XGBT在GBDT算法进行了一些优化。具体大家可以参考这里:https://www.zhihu.com/question/41354392。但实际目前用GBDT的还是多。
营销场景:为用户推荐理财产品、基金产品、保险产品或者邀请用户办理信用卡账单分期等;
这部分主要用的都是推荐的算法,主要都是基于协同过滤CF算法+简单的策略;营销场景做推荐,一般分为三个部分:召回+排序+业务规则。召回层面会利用协同过滤CF算法、FM算法,构建排序模型还是LR模型居多,金融领域目前使用深度学习相对较少,但是在互联网和其他领域使用深度学习做排序模型已经很广泛了。
2.2媒体领域在媒体领域最典型的就是今日头条了,包括像很多其他的媒体端如小红书、抖音等;这里面最常应用机器学习的就是推荐场景。大家经常发现的一点就是今日头条、小红书经常会根据你之前看过的一些内容来给你推相关内容。比如你经常看大长腿,小红书就一直给你推,别问我怎么知道的。
推荐:基于内容item的推荐、基于知识图谱的推荐、基于协同过滤算法的推荐。资讯信息物料的推荐,这里面会涉及到Doc2Vec、Lsi等算法,因为涉及到一部分对于物料语义的理解。今日头条推荐算法详解:https://www.leiphone.com/news/201801/XlIxFZ5W3j8MvaEL.html
2.3零售领域在零售领域,使用机器学习建模最多的场景也是推荐场景和搜索场景中的排序。APP上购物车页面提交订单时为用户推荐相似商品、推荐可能感兴趣的商品,以及针对什么样的用户推荐什么样的优惠券等等。
推荐:协同过滤CF算法、FM算法+LR排序模型、深度学习模型目前在推荐领域使用也十分广泛了。
除去推荐,零售领域还有一个使用机器学习建模比较多的场景,就是对某类商品进行销量预测,根据预测量来调整商品的供给。
销量预测:目前基本都转用LightGBM算法了;
这里附上之前Kaggle里面关于销量预测的case,排名第一的将自己的源码share出来的,感兴趣的可以自行下载研究。https://www.kaggle.com/c/favorita-grocery-sales-forecasting/discussion/47582
零售领域还有一个应用非常多的场景,就是做供应链优化,物流调度,给外卖骑手配单等。但这部分不能算作机器学习,更多是运筹学的知识。目前国内做的比较好的是杉数科技。
供应链优化:运筹学的知识
03未来工业界应用比较有前景的算法所以如果你是一个学生或者想转行到机器学习领域,课堂上教的那些算法只是简单入门完全不够用,只是让你了解基本的思想。如果你想进入工业界的机器学习领域尤其是当前比较热门的推荐&金融科技领域,你需要对:GBDT、LR、推荐算法等很了解,如果能再对XGBoost和LightGBM了解就更好了,而所谓的KNN、Kmeans、贝叶斯、最大熵模型等等,这些只是基础算法,了解这些基础算法完全无法解决你校招找工作时面试的问题。
同时给大家分享几个当下比较火的机器学习热门研究方向:
3.1AutoML目前工业界最火的机器学习研究方向就是AutoML,自动机器学习技术,不需要机器学习专家参与建模,机器全自动完成建模。之前华为开出200多万年薪的那位博士生就是研究AutoML的。
AutoML技术这两年发展的很迅速,工作上自己了解我司的AutoML实际场景落地时,在一些场景上AutoML构建的模型效果表现已经和经验丰富的数据科学家人工构建的模型效果没有任何差异了,但是AutoML大幅降低了人力成本和时间成本。但AutoML在实际工业界落地时,遇到的最大问题就是对于数据治理,科学家们很多时候80%建模的工作在做数据整合和数据清洗等。
关于AutoML技术的出现会不会导致大量ML从业人员失业了?希望进一步了解的可以阅读下面回答:https://www.zhihu.com/question/387574523/answer/1796066073
3.2强化学习另一个热门研究领域就是强化学习,随着阿法狗战胜柯洁和王者荣耀AI绝悟的火爆,将强化学习这一细分领域带入到广大从业人员的事业里。强化学习在工业界的热度也在逐步攀升,工作上越来越多的甲方来咨询强化学习,希望用强化学习来尝试一些场景的应用,之前强化学习更多还是在学术界研究。目前强化学习在游戏行业应用已经十分成熟了,现在有向其他行业扩展的趋势,比如零售领域的供应链干线优化、互联网领域的推荐场景、军工领域的仿真等。对于强化学习不了解的读者可以阅读下面文章:通俗易懂讲解强化学习。
3.3联邦学习AI发展的三大核心要素:算法、算力和数据。而当前AI发展面临的一个问题就是如何在面临监管对于用户数据隐私安全越来越严,如何合理合法地采集和应用用户信息,甚至在保证用户数据不离开本地的情况下实现模型训练和更新。各大AI公司和互联网厂商都要寻求这方面的解决方案,联邦学习的出现就是为了解决这一问题。
联邦学习的解释如下:
在保护各方数据隐私安全的情况下,实现各方联合建模,最终得到比联邦中任意一方单独建模效果更优的模型。目前世界上B端企业间的纵向联邦学习的研究是由香港科技大学计算机科学与工程学系主任,第一位华人国际人工智能协会(AAAI)院士&AAAI执行委员会委员-杨强教授牵头发起的,纵向联邦学习已经在金融&广告领域大规模应用。因为联邦学习是一个新兴的领域,专业性人才很稀缺,企业对于这方面的人才也是求贤若渴。希望对联邦学习做进一步了解的可以点击阅读通俗易懂讲解联邦学习。
——The End——
为了方便读者学习,我们建立了微信群,欢迎大家进群讨论。请先加我的微信后,邀请进群。无关人员请绕道,谢谢合作!
整理不易,点赞三连↓
人工智能应用场景及未来发展趋势 一 什么是人工智能人工智能是当前比较热门的科学和各国重点发展的前沿技术,但人工智能(Artificial Intell
来源:雪球App,作者:玖点半,(https://xueqiu.com/2857816313/132432573)
一.什么是人工智能
人工智能是当前比较热门的科学和各国重点发展的前沿技术,但人工智能(ArtificialIntelligence,缩写为AI)一词的出现,却是早在1956年由麦卡赛、明斯基、罗切斯特和申农等一批具有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题时提出来的,它也标志着"人工智能"的正式诞生。
人工智能是指通过计算机实现人的头脑思维所产生的效果,是对能够从环境中获取感知并执行行动的智能体的描述和构建。从狭义认知角度来讲,人工智能可分为人工智能产业(包含技术、算法、应用等多方面的价值体系)、人工智能技术(包括凡是使用机器帮助、代替甚至部分超越人类实现认知、识别、分析、决策等功能)两大类。
人工智能得到快速发展的时期,是2008年金融危机之后,美日欧等西方发达国家希望借助机器人实现再工业化。此时的工业机器人比以往任何时候都发展的更快,更加带动了人工智能和相关领域产业的不断突破,很多必须用人来做的工作如今已经能用机器人实现。
而企业层面,目前在人工智能领域领先的企业,包括IBM、谷歌、微软、苹果、东芝、三星等大型科技企业,国内人工智能领先的企业,包括百度、科大讯飞,中国国家电网、阿里、腾讯以及一些新兴科技企业,如商汤科技、云从科技、码隆科技、影普科技、Yi+等。
二.国内人工智能应用领域及产值规模2.1.国内人工智能应用领域及产业规模人工智能作为科技创新产物,在促进人类社会进步、经济建设和提升人们生活水平等方面起到越来越重要的作用。国内人工智能经过多年的发展,已经在安防、金融、客服、零售、医疗健康、广告营销、教育、城市交通、制造、农业等领域实现商用及规模效应。
2018年国内人工智能技术为实体经济贡献收益规模达到251.1亿元人民币,而据艾瑞咨询预测数据,2019年人工智能将为实体经济贡献收入超570亿元,到2022年贡献收入将达到1573亿元,年复合增长率达到58.2%。
在2018年人工智能251.1亿元市场规模中,安防领域占比份额最高为53.8%,其次则是金融领域,份额占比为15.8%。
2.2.人工智能在安防领域的应用安防是为数不多的可以将人工智能成熟应用并落地的行业,为此,安防也被认为是人工智能的第一着陆场。这是因为人工智能在安防领域的快速落地,除了不需要过多的基础建设之外,也得益于全国范围内安防设备的普及以及政府部门大力发展雪亮工程、智慧城市、平安城市、智慧交通、天网工程等公共安全领域项目工程的推动。其中,2018年公共安全领域安防贡献的市场份额就超过70%。
人工智能在安防领域的应用主要是利用其视频结构化(视频数据的识别和提取技术)、生物识别技术(如指纹识别、人脸识别等)以及物证特征识别(如目前大力推广的ETC对车牌的识别等)等三大特性。其改变了过去需要通过人工取证、被动监控的安防形态,视频数据的识别和提取分析,使人力查阅监控的时间大大缩短,而生物识别又大大提升了人物识别的精准性,极大提升了公共安全治理的效率。
2018年,我国“AI+安防”软硬件市场规模达到135亿元(不含C端用户),其中视频监控占比达到88.1%,据艾瑞咨询预测2019年将达到350亿元,而到2022年,安防规模将超过700亿元,复合增长率将达到51.45%。
2.3.人工智能在金融领域的应用
人工智能在金融领域的应用仅次于安防,这要得益于移动互联网、区块链、云计算、大数据等新技术的日趋成熟,为金融行业的智能化转型升级奠定重要基础。
从技术层面,人工智能的本质上是机器通过大量的数据训练作出智能决策,人工智能能够赋予机器具有理解力的“大脑”,让机器能够解读文字、数据所包含的“语义”,通过自学的方式获得判断的规则。金融行业作为高度数据化的行业,加之业务规则和目标明晰,是人工智能、大数据处理技术和云计算等数据驱动技术的最好应用场景。以此同时,在互联网时代,金融行业的在线业务将成主流,数据量的激增,超出了人的经验范畴和处理能力,而这些却是人工智能最擅长处理的。人工智能正在对金融产品、服务渠道、服务方式、风险管理、授信融资、投资决策等带来新一轮的变革。
2018年国内金融领域人工智能相关科技投入(包括软件和硬件设备)约为166.8亿元,较2017年增速为42.9%,到2022年人工智能相关投入将超580亿元,年复合增长率超过37%,其中银行是人工智能相关应用的主要投入方,占比超过70%。
目前,人工智能在金融业的应用,主要集中在智能支付、智能理赔、智能投顾、智能客服、智能营销、智能投研、智能风控等场景,这些场景又以银行最具有代表。
2.3.1.智能客服智能客服是人工智能在金融领域应用最广的。智能客服机器人取代了传统菜单式语音和人工客服模式,能够提供7*24小时的客服服务。智能客服在电话场景当中主要表现为机器管理和语音问答分析,智能客服可以通过深度学习文本中的对话、语音对话场景,并加以应用回复。智能客服目前在银行领域应用最广,平安银行的客服服务人工智能替代率超过80%,其服务量也提升了两至三倍,客服的人力降低了40%。
2.3.2.智能投顾智能投顾,即人工智能投资顾问,其是通过人工智能的深度学习和分析能力,为客户提供个人理财产品策略咨询,包括股票配置、基金配置、债权配置、交易执行、投资损失避税等策略。智能投顾的最大特点,是弱化“人性”,在基于大数据分析、AI算法等的前提下,一旦投资者选定了某种方案,资产的进出抛售就会严格按照既定的标准实行。
智能投顾的应用,最早可追溯到2016年年底,“摩羯智投”在招商银行手机APP的上线。目前,智能投顾已成为银行、券商、保险等金融机构的标配型服务。
2.3.3.智能风控金融行业在传统风控环节中,存在信息不对称、成本高、时效性差、效率低等问题。而智能风控因为引入了人工智能科技,使得贷前审核、贷中监控和贷后管理等环节效率和准确度都得到了极大的提升,智能风控还能促进风险管理差异化。另外智能风控在信用反欺诈、骗保反欺诈、异常交易行为等方面也发挥了越来越重要的作用,为金融行业欺诈风险的分析和预警监测提供坚实的技术支持。
2.3.4.智能投研与智能投顾相比,智能投研主要面对B端企业用户,为其提供辅助投研的工具。对于金融机构来说,人工智能技术的介入,使得传统投研的各个环节发生一定的优化和革新,解放大量基础的投研信息搜集类工作,而前期信息搜集的耗时性和不全面性,也是传统投研中较为主要的缺陷。智能投研是在金融数据基础上,通过深度学习、自然语言处理等人工智能方法,对数据、事件、结论等信息进行自动化处理和分析,为金融机构提供投研支持。
2.4.人工智能在客服领域的应用前文金融领域中已经提到了智能客服的应用,当然智能客服不仅仅只限于金融行业,在其他行业也运用得越来越广。客户服务引入人工智能技术后,整体上节省了10%以上的运营成本。另外,通过对语音等非标准化数据的识别,企业能沉淀下一手数据资源,为后续精准营销、产品升级等环节做好铺垫。
据艾瑞咨询数据,2018年,国内智能客服业务规模达到27.2亿元,其中以智能客服机器人为代表的人工智能应用业务规模达到7.9亿元,预计2022年智能客服业务规模将突破160亿元,年复合增长率为56%,人工智能应用业务规模突破70亿元。
2.5.人工智能在零售领域的应用人工智能在零售领域的应用已经十分广泛,包括无人便利店、智慧供应链、客流统计、无人仓储等细分领域。人工智能通过深度学习以及计算机视觉、图像智能识别、大数据应用等技术,使得工业智能机器人可通过自主判断和行为学习,完成各种复杂的任务,包括在商品分拣、运输、出库等环节实现自动化。另外,将人工智能技术应用于客流统计工作中,其通过人脸识别客流统计功能,门店可以从性别、年龄、表情、新老顾客、滞留时长等维度建立到店客流用户画像,为调整运营策略提供数据基础,帮助门店运营从匹配真实到店客流的角度提升转换率。
2018年中国现代渠道主要零售商数字化建设投入为285.1亿元,其中人工智能投入约为9亿元,占比3.15%,据预测,到2022年其数字化建设投入将突破700亿元,人工智能投入将超过178亿元,占比超过25%,这主要得益于阿里巴巴、京东、苏宁等零售巨头的推动,以人工智能应用为代表的新零售概念处于增长的上升通道,未来两年将保持较高增速。
而以计算机视觉技术为核心的人脸识别和商品识别是主要建设方向,相关投入占整体的55%以上。另外,零售领域供应链的优化最为复杂,对人工智能算法的可用性要求最高,但更靠近零售业的核心点,未来可释放的增益价值也将最大。
三.人工智能未来发展趋势目前,人工智能的研究及应用主要集中在基础层、技术层和应用层三个方面,其中基础层以AI芯片、计算机语言、算法架构等研发为主,技术层以计算机视觉、智能语音、自然语言处理等应用算法研发为主;应用层以AI技术集成与应用开发为主。而国内人工智能企业多集中在应用层,占比高达77.7%,技术层和基础层企业占比相对较小,分别只占有17.9%和5.4%。当然,未来随着5G的建设普及以及科技进步,人工智能除了在语音识别、计算机视觉技术的继续拓展和实地运用外,在人工智能芯片、机器学习、神经网络等方面也将引来增强趋势,人工智能也将在越来越多的领域得到应用落地。
另外,人工智能与物联网的结合(即AIoT)也将更紧密,AI的介入让物联网有了连接的大脑,使得万物互联互通成为现实,未来或将颠覆现有的产业模式。经济方面,助力产业价值链延伸,目前产业很难依靠既有技术与业务模式打破产业生命周期,AIoT通过设备感知与数据分析支撑新的产品形态与服务模式落地,开拓新的市场空间,产生新的发展周期。社会发展方面,数据价值得到挖掘,实现大量线下数据线上化,实现自动高效处理。
$海康威视(SZ002415)$$上证指数(SH000001)$$沪深300(SH000300)$
人工智能之K近邻算法(KNN)
人工智能之K近邻算法(KNN)
原创 张志荣
前言:人工智能机器学习有关算法内容,请参见公众号“科技优化生活”之前相关文章。人工智能之机器学习主要有三大类:1)分类;2)回归;3)聚类。今天我们重点探讨一下K近邻(KNN)算法。^_^
K近邻KNN(k-NearestNeighbor)算法,也叫K最近邻算法,1968年由Cover和Hart提出,是机器学习算法中比较成熟的算法之一。K近邻算法使用的模型实际上对应于对特征空间的划分。KNN算法不仅可以用于分类,还可以用于回归。
KNN概念:
K近邻算法KNN就是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(K个邻居),这K个实例的多数属于某个类,就把该输入实例分类到这个类中。
如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K近邻算法使用的模型实际上对应于对特征空间的划分。
通俗地讲,就是“物以类聚,人以群分”。
分类策略,就是“少数从属于多数”。
算法描述:
KNN没有显示的训练过程,在测试时,计算测试样本和所有训练样本的距离,根据最近的K个训练样本的类别,通过多数投票的方式进行预测。具体算法描述如下:
输入:训练数据集T={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{c1,c2,...,cK}和测试数据x
输出:实例x所属的类别
1)根据给定的距离度量,在训练集T中找到与x距离最近的k个样本,涵盖这k个点的x的邻域记作Nk(x)。
2)在Nk(x)中根据分类规则(如多数表决)确定x的类别y:
核心思想:
当无法判定当前待分类点是从属于已知分类中的哪一类时,依据统计学的理论看它所处的位置特征,衡量它周围邻居的权重,而把它归为到权重更大的那一类中。
kNN的输入是测试数据和训练样本数据集,输出是测试样本的类别。
KNN算法中,所选择的邻居都是已经正确分类的对象。KNN算法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
算法要素:
KNN 算法有3个基本要素:
1)K值的选择:K值的选择会对算法的结果产生重大影响。K值较小意味着只有与输入实例较近的训练实例才会对预测结果起作用,但容易发生过拟合;如果K值较大,优点是可以减少学习的估计误差,但缺点是学习的近似误差增大,这时与输入实例较远的训练实例也会对预测起作用,使预测发生错误。在实际应用中,K值一般选择一个较小的数值,通常采用交叉验证的方法来选择最优的K值。随着训练实例数目趋向于无穷和K=1时,误差率不会超过贝叶斯误差率的2倍,如果K也趋向于无穷,则误差率趋向于贝叶斯误差率。
2)距离度量:距离度量一般采用Lp距离,当p=2时,即为欧氏距离,在度量之前,应该将每个属性的值规范化,这样有助于防止具有较大初始值域的属性比具有较小初始值域的属性的权重过大。
对于文本分类来说,使用余弦(cosine)来计算相似度就比欧式(Euclidean)距离更合适。
3)分类决策规则:该算法中的分类决策规则往往是多数表决,即由输入实例的K个最临近的训练实例中的多数类决定输入实例的类别。
算法流程:
1)准备数据,对数据进行预处理。
2)选用合适的数据结构存储训练数据和测试元组。
3)设定参数,如K。
4)维护一个距离由大到小的优先级队列(长度为K),用于存储最近邻训练元组。随机从训练元组中选取K个元组作为初始的最近邻元组,分别计算测试元组到这K个元组的距离,将训练元组标号和距离存入优先级队列。
5)遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax。
6)进行比较。若L>=Lmax,则舍弃该元组,遍历下一个元组。若L