人工智能的底层逻辑到底是什么算法 or 逻辑人工智能三大底层逻辑是什么意思

发表时间：2023-07-04 21:08:29

人工智能的底层逻辑到底是什么算法 or 逻辑

底层逻辑是什么?这本身就还没有达成有共识。但是，大家基本可以理解，所谓的“底层逻辑”大概就是指一个事物发生的最根本的原因或需求。有些时候也会指向一个事情的基础或本质。

针对题主的问题，人工智能的底层逻辑是什么，的确很难回答。对于人工智能来说，大数据和算法缺一不可。有很多事情是相辅相成，互相依存的，只有结合在一起才能发挥出最大的作用，少了任何一样都不行。

数据的意义毋庸置疑，没有数据就不可能进行数据处理，自然不可能发展出人工智能。但是，数据再多，如果没有能力挖掘出数据的能力，那么就难以发挥价值。一片土地，没有可以播撒的种子，那就只能任其荒芜。上好的种子，没有可以耕种的土地，同样不可能孕育生命。数据和算法的关系类似于土地和种子，大数据是人工智能的土壤，而算法是产生人工智能的直接工具。如果有人问你，土地和种子，哪一样才是植物的根本?我相信答案还是显而易见的，那就是种子。因为种子才是生命真正的源头。人工智能的产生，依赖的主要工具就是算法，而大数据发挥了类似土壤的功能。种子携带生命，土壤孕育生命。算法让人工智能出现，数据让人工智能落地。

因此，要说数据和算法谁才是人工智能的底层逻辑，算法的说服力会强一些，毕竟算法才是驱动力。当然，数据的重要性也是无可忽视的，没有数据，算法就像没有土地可以耕种的种子，没有用武之地。

最后，再次强调，数据和算法都是必不可少的部分，缺了哪一样都不可能产生人工智能。

人工智能产业链的三个核心，底层硬件、通用AI技术及平台、应用领域相关公司盘点

原文：http://m.elecfans.com/article/671552.html

据腾讯研究院统计，截至2017年6月，全球人工智能初创企业共计2617家。美国占据1078家居首，中国以592家企业排名第二，其后分别是英国，以色列，加拿大等国家。

图片来自腾讯研究院

根据艾瑞咨询的数据，2020年全球人工智能市场规模约1190亿人民币，未来10年，人工智能将会是一个2000亿美元的市场，空间非常巨大。

本文针对人工智能产业链的三个核心，底层硬件、通用AI技术及平台、应用领域相关公司盘点。

图片来自易观

底层硬件

国际芯片巨头长期盘踞，中国初创企业很难进入

在人工智能领域，传统的芯片计算架构已无法支撑深度学习等大规模并行计算的需求，这就需要新的底层硬件来更好地储备数据、加速计算过程。

基础层主要以硬件为核心，其中包括GPU/FPGA等用于性能加速的硬件、神经网络芯片、传感器与中间件，这些是支撑人工智能应用的前提。这些硬件为整个人工智能的运算提供算力，目前多以国际芯片巨头为主。

目前在GPU领域，英伟达主打工业级超大规模深度网络加速，并于日前推出了基于Volta、首款速度超越100TFlops的处理器Tesla；英特尔主要围绕FPGA构建产业，推出了模仿人脑的人工智能芯片。谷歌也推出了第二代TPU芯片，为自己的开源TensorFlow框架提供芯片支撑。

除了这些国外的芯片行业巨头，在AI芯片领域国内还有众多的初创公司，如中星微、寒武纪以及西井科技等，但在产业布局能力和研发实力方面还远不足以匹敌国外芯片巨头。

AI芯片：提供用来加速深度神经网络、机器视觉以及其他机器学习算法的微处理器

图片来自易观

云端训练：谷歌（ASIC）、英伟达(GPU)

云端推理：谷歌（ASIC）、英伟达(GPU)、AMD(GPU)、英特尔(FPGA)、Actel(FPGA)、赛灵思(FPGA)、Altera(FPGA)（被英特尔收购）

设备端推理：高通（移动端）、深鉴科技（机器人）、寒武纪科技（移动端、CV、机器人）、地平线科技（CV、机器人、语音）、FaceOS（CV）、思必驰（语音）、声智科技（语音）、云知声（语音）、启英泰伦（语音）、耐能（IoT）、NovuMind（IoT）、微软（VR）、华捷艾米（VR）、IBM（类脑芯片）、西井科技（类脑芯片）

视觉传感器：图像传感器及视觉算法/软件解决方案提供商，用于捕捉和分析视觉信息，代替人眼做各种测量和判断

图片来自易观

激光雷达：禾赛科技、巨星科技、slamtec、robosense、北科天绘、Quanergy、Velodyne LiDAR、大族激光、中海达、擂神智能、北醒、数字绿土

毫米波雷达：博世、隼眼科技、Continental、DENSO、行易道科技、Delphi、森思泰克、智波科技、cheng-tech、ZFTRW、HELLA、Autoliv

监控摄像头：海康威视、大华、宇视科技、Tiandy、Towe、汉邦高科、泰科、亚安科技

自动驾驶摄像头：索尼、Hella、Panasonic、博世、ZFTRW、大陆、OmniVision、Mobileye

3D体感：Microsoft、苹果、华捷艾米、凌感、Vidoo、Orbbec

技术驱动层算法和计算力成主要驱动力，开源化是趋势

技术层是人工智能发展的核心，对应用层的产品智能化程度起到决定性作用，在这一发展过程中，算法和计算力对AI的发展起到主要推动作用。

技术层主要依托基础层的运算平台和数据资源进行海量识别训练和机器学习建模，以及开发面向不同领域的应用技术，包含感知智能和认知智能两个阶段。

感知智能阶段通过传感器、搜索引擎和人机交互等实现人与信息的连接，获得建模所需的数据，如语音识别、图像识别、自然语音处理和生物识别等。

认知智能阶段对获取的数据进行建模运算，利用深度学习等类人脑的思考功能得出结果，如机器学习、预测类API和人工智能平台等。在此基础上，人工智能才能够掌握“看”与“听”的基础性信息输入与处理能力，才能向用户层面演变出更多的应用型产品。

当前，国内的人工智能技术平台在应用层面主要聚焦于计算机视觉、语音识别和语言技术处理领域，国内技术层公司发展势头也随之迅猛，其中的代表性的企业包括科大讯飞、格灵深瞳、捷通华声(灵云)、地平线、SenseTime、永洪科技、旷视科技、云知声等。

AI通用技术：AI通用技术公司开始向产业链上下游延伸，用整套解决方案

深耕垂直领域

图片来自易观

计算机视觉：通过计算机视觉算法及软硬件为客户解决人脸识别、图像识别、视频分析等需求的解决方案提供商。如以下公司↓

腾讯优图、阿里巴巴、三星、微软、Intel、百度、搜狗、商汤、旷视科技、依图、云从科技、Yi+、格灵深瞳、Sensingtech、VISCQVERY、飞搜科技、图普科技、极限元、触景无限、猎户星空、深醒科技、云飞励天

人脸识别：旷视科技、腾讯优图、蚂蚁金服、FaceID、汉王科技

、Facethink、思源科安、云飞励天、商汤科技、云从科技、依图科技、百度、阿里、腾讯、科大讯飞、阅面科技、猎户星空、格灵深瞳、中科奥森、平安科技、海鑫智圣、飞搜科技、汉柏智能、人人智能、中德宏泰

视觉识别：三固科技、Perceptln、云天励飞、博云视觉、径卫视觉、飞搜科技、人人智能、埃尔森智能、魔视智能、亿图视觉、速感科技、码隆科技、深晶科技、图麟科技、图漾科技、黑眸科技、神目科技

语音识别：智能语音通过语音识别算法及硬件为客户提供语音识别/合成/交互等软件/解决方案及智能硬件产品的厂商

科大讯飞、微软、Nuance、搜狗、百度、捷通华声、腾讯、阿里巴巴、思必驰、云知声、声智科技、出门问问、普强信息、灵伴科技、极限元、Rokid、标贝科技、语智科技、Speakin、智齿客服、助理来也、京东JIMI智能客服、紫冬锐意、纳象立方

自然语言理解：通过自然语言处理/语义分析等技术提供智能聊天、对话、问答、客服机器人的技术及软件服务商

搜狗、百度、微软、阿里巴巴、腾讯、小i机器人、图灵机器人、三角兽、来也、追一科技、EMOTIBOT、智言科技、蓦然认知、分音塔科技、新译科技

机器学习|知识图谱：通过知识图谱/机器学习技术为企业和个人提供大数据分析、辅助决策服务

搜狗、百度、腾讯、阿里巴巴、微软、第四范式、爱拼、艾耕科技

云计算、大数据、算法是构成人工智能的三大要素，通用人工智能技术逐渐融入主流云计算平台，并结合大数据分析服务各行各业。

图片来自易观

大数据服务：国双、天云大数据、数据堂、明略数据、易观、Talkingdata

OS：安卓、ROS、微软、图灵机器人、Linux

云计算服务：微软WindowsAzure、CloudFoundry、RedHatOpenShift、GoogleAppEngine、百度BaiduAppEngine、阿里AliCloudEngine、新浪SinaAppEngine、腾讯云、华为、OneNET、金山云、青云、沃云、七牛云、华胜天成、世纪互联

物联网平台：特斯联、机智云、氦氪、深智云、云智易、AbleCloud、艾拉物联、青莲云

场景应用层AI与场景深度融合，领域应用更加广泛

应用层主要是基于基础层与技术层实现与传统产业的融合，实现不同场景的应用。随着人工智能在语音、语意、计算机视觉等领域实现的技术性突破，将加速应用到各个产业场景。

应用层按照对象不同，可分为消费级终端应用以及行业场景应用两部分。

消费级终端包括智能机器人、智能无人机以及智能硬件三个方向

场景应用主要是对接各类外部行业的AI应用场景。

近年来，国内企业陆续推出应用层面的产品和服务，比如小i机器人、智齿客服等智能客服，“出门问问”、“度秘”等虚拟助手，工业机器人和服务型机器人也层出不穷，应用层产品和服务正逐步落地。

IBM最早布局人工智能，“万能Watson”推动多行业变革；

百度推出“百度大脑”计划，重点布局无人驾驶汽车；

而谷歌的人工智能业务则较为繁杂，多领域遍地开花，包括AlphaGo、无人驾驶汽车、智能手术机器人等；

微软在语言语义识别、计算机视觉等领域保持领先。

除此此外，家电行业也掀起了人工智能的热潮，不少家电企业都瞄准了人工智能，潜心研发AI技术，将其应用于家电产品。今年以来，长虹、美的、格力、格兰仕等都在向智能制造转型，试图立足“SmartHome”，将人工智能和智慧家庭更紧密地结合在一起。

智能家居：切入智能家居领域的AI技术及解决方案提供商

百度、阿里巴巴、小米、搜狗、出门问问、360、云知声、科沃斯机器人、Emotibot、三角兽、图灵机器人、Rokid、思必驰、声智科技、机智云、地平线机器人、毫米科技、渡鸦科技、云丁科技、西默科技、lifesmart、百芝龙智慧科技

服务机器人：拥有家用/商用智能服务机器人技术并提供硬件产品的厂商

科沃斯机器人、优必选机器人、360、京东、Slamtec、Roobo、Canbot、Geek+、ARTrobot、Rokid、小米、出门问问、小鱼在家、擎朗、快仓、智言科技、达闼科技、库柏特、极智嘉科技、深之蓝、梅卡曼德机器人、克路德机器人、智齿科技、真机智能、海默机器人、乐聚机器人、扬天科技、ROOBO、优爱智合、普渡科技、进化者机器人、云问机器人、AICRobo、megarobo、工匠社、云迹科技、珞石机器人、若贝特机器人、上海元趣、灵伴即时、墨子AI、拓野机器人、北冥星眸、萝卜科技、游尔机器人

人机交互：Versa、叶浪智能、吉斯卡、翼石科技

图片来自易观

移动设备及软件：将AI技术用于智能手机/可穿戴设备/无人机等软硬件技术及解决方案提供商

百度、搜狗、阿里巴巴、出门问问、科大讯飞、华为、旷视科技、微软、来也

无人机：大疆创新、亿航智能、Yuneec、极飞科技、零零无限、零度智控、TOPXGun、奇蛙智能、扩博智能、德知航创、3DRobotics、Parrot（派诺特）、AscTec、Microdrones、AEE一电、PowerVision、智能鸟、红鹏、FlytrexSky、Skycatch、华科尔、独角兽FPV、澄星、YUNEEC

智能驾驶：为智能驾驶提供视觉传感器/解决方案及整车的技术/产品提供商，不含车载智能语音语义厂商。

驭势、Momenta、奇点汽车、蔚来、图森、易航智能、Minieye、景驰科技、SmarterEye、ZongMu、极自、饮冰科技、极目智能、清智科技、智行者科技、Roadster.ai、Drive.ai、图森为了、FMC汽车、未来黑科技、踏歌智行、中科慧银、斑马数智、极奥科技

行业应用：将AI通用技术应用于金融、安防、建筑、医疗、教育、零售/电商、视频/娱乐/社交等领域，或传统行业通过研发AI技术赋能自身业务以实现降本增效、提升用户体验的公司。

图片来自易观

金融行业：旷视、商汤、依图、云从、博易识道、Yi+、捷通华声、第四范式、京东金融、Pintec

安防行业：旷视、商汤、依图、云从、特斯联、海康威视、东方网力

医疗行业：iCarbonX、腾讯觅影、搜狗明医、天智航、康夫子、万里云、汇医慧影、医渡云、羽医甘蓝、医拍智能、推想科技、图玛深维、体素科技、E诊断、迪英加、智成科技、视见医疗、雅森科技、海鹅科技、联影医疗、汇医慧影、深睿医疗、PereDoc、伦琴医疗、人和未来、希氏异构、康夫子、博实股份、妙手机器人、璟和技创

企业服务：布本智能、闪银奇异科技、深兰科技、冰鉴科技、法里、飞蝉智投、NewsBreak、PaperWeekly、Video++、BigQuant、墨丘科技、特斯联科技、华瑞新智、DeepBrain、妙盈科技、华瑞新智科技、追一科技、Aibee、文安智能、助理来也

教育行业：科大讯飞、高木、百度作业帮、IPIN、优必选、云知声、学霸君、小猿搜题、英语流利说、嘿哈科技

客服行业：小i机器人、图灵机器人、三角兽、蓦然认知、Emotibot、灵伴科技、追一科技、智言科技

视频|娱乐：Yi+、爱奇艺、Viscqvery、极限元、图普科技、华捷艾米、Video++

零售|电商：阿里巴巴、京东、旷视、Yi+、甘来

建筑：旷视、商汤、特斯联、小库科技、马良行

法律：华宇、法狗狗、法律谷、理脉

招聘：拉勾、IPIN、辈出

新闻资讯：今日头条、腾讯、微信公众号、一点资讯

以下为国内知名投资机构在人工智能领域的代表性投资：

真格基金：地平线机器人、智齿科技、格灵深瞳、助理来也、亿航无人机、泼辣熊、零零无限科技。

红杉资本中国：地平线机器人、格灵深瞳、助理来也、大疆科技等。

IDG资本：小i机器人、智齿科技、SenseTime、碳原子科技、芋头科技、零零无限科技、科沃斯机器人等。

创新工场：蓝胖子机器人、小雨在家、易致机器人、旷世科技等。

金沙江创投：地平线机器人、零零无限科技、天机等。

北极光创投：图谱科技、进化动力等。

启明创投：云知声、旷世科技等。

东方富海：亿航无人机、永洪科技等。

联想之星：旷世科技、思必驰、乐驾等。

晨兴资本：地平线机器人、碳原子科技、美洽等。

英诺天使基金：臻迪智能、通用机器人、速感科技等。

GGV纪源资本：亿航无人机、深之蓝水下机器人、元趣味等。

湖杉资本：天博智、元趣等。

光速安振中国创业投资：助理来也、小鱼在家等。

高通：云知声、七鑫易维等。

线性资本：地平线机器人、芋头科技等。

经纬中国：Camera360、永洪科技等。

达泰资本：金石机器人、永洪科技。

极客帮创投：异构智能、碳原子科技等

以下为《互联网周刊》与eNet研究院评选的2017年度人工智能企业百强

2017年度人工智能企业百强排名企业领域1百度开放的人工智能服务平台2阿里巴巴互联网综合服务提供商3腾讯互联网综合服务提供商4华为人工智能自动化业务、智能芯片5平安集团人工智能金融研发平台6搜狗综合人工智能解决方案平台7科大讯飞智能语音技术提供商8华大基因多组学精准检测、医疗数据运营服务提供商9珍岛集团SaaS级智能营销云平台（Digi-MarketingAI）10中科创达智能终端平台技术提供商11博实股份智能成套装备系统解决方案提供商12全志科技智能应用处理器SoC和智能模拟芯片设计厂商13汉王科技文字识别技术与智能交互14商汤科技人工智能视觉深度学习平台15智车优行互联网思维造车科技公司16face++ 旷视科技人工智能产品和行业解决方案提供商17智臻智能智能机器人技术提供和平台运营商18出门问问自主语音识别、语义分析、垂直搜索19七牛云计算机视觉领域AI创新服务商20GEO集奥聚合第三方数据整合和场景化应用平台21Chinapex创略企业级智能客户数据平台22TalkingData腾云天下移动互联网大数据平台23碳云智能健康大数据平台24寒武纪科技深度学习专用的智能芯片25Rokid智能机器人研发科技公司26暴风AI电视AI电视开发27中星微电子芯片设计企业28依图科技计算机视觉科技公司29触宝AI输入法30智能管家智能硬件科技公司31地平线机器人嵌入式人工智能和系统级解决方案提供商32云知声物联网人工智能服务33达闼科技云端智能机器人运营商34盛开互动视觉识别和人工智能技术研发公司35优必选科技智能家庭机器人研发36旗瀚科技自动化控制、人工智能技术、云平台服务37云从科技人脸识别及计算机视觉研发38阅面科技深度学习和嵌入式视觉39玻森数据中文自然语言分析云服务提供商40图森未来城际物流运输自动驾驶解决方案提供商41Geek+物流仓储智能机器人科技公司42数据堂大数据服务平台43Video++消费级视频的AI科技44深鉴科技深度学习处理器解决方案45掌贝智能化的店铺营销服务46A.I.Nemo小鱼在家互联网硬件和智能家电的创新型公司47丁盯智能智能家居、智能生活硬件技术公司48永洪科技大数据服务和BI商业智能分析服务商49臻迪智能工业级无人机及机器人开发公司50诺亦腾动作姿态捕捉系统研发51卓翼科技通讯、计算机、消费类电子产品研发52汇医慧影第三方的医学影像咨询平台53Momenta无人驾驶解决方案提供商54体素科技人工智能医疗影像服务55思必驰智能硬件领域语音公司56瑞为技术视觉感知技术方案提供商57海致网络可视化大数据分析服务提供商58乂学教育人工智能自适应网络教育公司59思岚科技激光雷达机器人定位导航解决方案供应商60捷通华声语音、手写识别等智能人机交互61格林深瞳计算机视觉和深度学习技术以及嵌入式硬件研发62速感科技以机器视觉为核心的人工智能创业公司63佑驾创新汽车ADAS驾驶辅助系统研发商64图玛深维自动化辅助诊断系统与医学数据分析系统65云天励飞视觉人工智能领域66中科汇联专注于软件开发、咨询服务的互联网公司67涂图(TuSDK )视频图像服务商68医渡云大数据医疗的科技公司69推想科技医疗服务推想深度人工智能70镭神智能激光雷达解决方案提供商71亮风台AR核心技术与产品研发72零零无限科技无人机技术公司73图普科技图像识别服务供应商74冰鉴科技人工智能第三方独立征信平台75公子小白陪伴型机器人研发商76图灵机器人个性化智能机器人平台77飞搜科技人脸识别、图像识别78三角兽科技中文智能交互系统79普强信息智能语音识别和语言处理技术80猎萝卜智能猎头招聘平台81智齿科技智能客服技术开发商82猛犸反欺诈业务反欺诈服务商83贝尔科教机器人儿童培训84智位股份开源硬件、机器人产品服务商85远鉴科技专注人工智能生物识别领域86声智科技人工智能交互与声学解决方案服务商87埃夫特智能工业机器人设计、研发、制造与系统应用开发公司88中科视拓人脸识别技术89祈飞科技智能机器人系统方案商90水滴科技计算机视觉技术91米文动力机器人智能控制系统解决方案提供商92中科奥森人脸识别和智能视频技术93驭势科技无人驾驶解决方案提供商94速腾聚创机器人感知技术研发及相关设备提供商95第四范式人工智能技术与服务提供商96ImageQ大数据语义分析云平台97linkface深度学习技术和计算机视觉研究98云洲智能自动智能无人船99擎朗智能智能机器人研发生产100智行者科技无人驾驶解决方案提供商

人工智能的三层基本架构

来啦，坐。

我是老杨，如约而至。今天我要来讲讲人工智能的知识了。

人工智能

请允许我先占用你一分钟讲个小故事：依稀记得2012年，老杨当时在做电商广告平台，广告平台嘛最核心的就是赚更多的钱，而提升广告的点击率又是最直接最有效的手段，提升点击率的目的当然也很明显，就是把广告推给最合适的人来促成更多的点击，所以我需要清楚的知道躲在电脑背后的用户是男是女还是隔壁邻居的二大爷的侄女的小狗狗，预测用户性别正好是一个典型的监督学习问题，为了赚更多的钱，我就头悬梁锥刺股的去啃了监督学习的东东：逻辑回归、决策树、支持向量机等，好在用起来的确是美不胜收的，大大的赚了一发，没白学。

这就是我与人工智能的初识，虽然目的有点俗不可耐，但是它让我领略到了人工智能的魅力，开启了我通往人工智能的大门，之后我又把非监督学习、神经网络等在广告点击率预估场景中进行了应用，也收获颇丰。仔细想想互联网广告行业在技术创新上一直是很领先的，看来金钱果然是进步的源动力，^_^。

故事告一段落了，言归正传，众所周知人工智能缘起于1956年达特茅斯大会，发展至今

人人都在说的底层逻辑到底是什么意思

最近频繁看到一个字眼，叫“底层逻辑”。

乍一看见这个词汇的时候我是懵逼的，感觉自己是个土鳖。自动检索了下自己的词汇库，这是我的词汇盲区。

直到今天我终于搜了下“底层逻辑”到底是个什么意思。

然后发现这么高大上的词汇竟然连百度百科都没有一个，但我没有放弃，去知乎搜了下答案。发现有一些回答。

看了一些评论点赞比较多的答案以后，发现这是个新词汇。不同的答案，有长篇累牍解释的，有侃侃而谈的。但我越看越懵逼，我觉得自己是个土鳖无疑了。不仅看不懂，我还怀疑自己的智商。

直到我看到一个网友一针见血的回答：

事物的内部矛盾，是事物发展的根本原因。底层逻辑是这些骚话漫天的快餐知识学者造出来的词，其实就是推动复杂事物发展内在的主要矛盾。

我这才看明白，嗐，所谓底层逻辑说的不就是高中政治课本上就学过的嘛。

已卒。

感觉就是不好好说话。

简述人工智能，及其三大学派：符号主义、连接主义、行为主义

人工智能是什么

人工智能是一个很大的圈子，但是基础必然是机器学习

什么是机器学习呢？

说白了就是你告诉机器你想做什么？并且给它一堆数据让它去模仿着做

（比如，咱们上高中，老师会告诉我们一个目标就是考高分，然后给我们一堆练习册和答案，我们的目的就是让我们做的题的解和答案一致）

机器学习需要什么？算法，数据，程序，评估，应用

机器学习能做什么？机器学习在数据挖掘，图像识别，语音和自然语言处理中有着广泛应用

人工智能哪些领域

回到本文的正题。全面认识人工智能之所以困难，是有客观原因的。

其一、人工智能是一个非常广泛的领域。当前人工智能涵盖很多大的学科，我把它们归纳为六个：

（1）计算机视觉（暂且把模式识别，图像处理等问题归入其中）、（2）自然语言理解与交流（暂且把语音识别、合成归入其中，包括对话）、（3）认知与推理（包含各种物理和社会常识）、（4）机器人学（机械、控制、设计、运动规划、任务规划等）、（5）博弈与伦理（多代理人agents的交互、对抗与合作，机器人与社会融合等议题）。（6）机器学习（各种统计的建模、分析工具和计算的方法），

这些领域目前还比较散，目前它们正在交叉发展，走向统一的过程中。

由于学科比较分散，从事相关研究的大多数博士、教授等专业人员，往往也只是涉及以上某个学科，甚至长期专注于某个学科中的具体问题。比如**，人脸识别**是计算机视觉这个学科里面的一个很小的问题；深度学习属于机器学习这个学科的一个当红的流派。很多人现在把深度学习就等同于人工智能，就相当于把一个地级市说成全国，肯定不合适。

三大学派

为更充分认识人工智能，我们从他的派系来了解人工智能的发展

人工智能符号主义

早在上个世纪五十年代，人们基于”让机器产生像人类一样的智能“这样的美好愿望，提出了人工智能的概念，所以一切试图做到这一点的都可以看作”人工智能“的技术，比如在人工智能早期曾十分流行的人工智能三大流派之一的符号主义，人们自己总结规则，然后通过if-else的方法堆砌成一个专家系统，这也属于人工智能领域，而且是人工智能领域非常重要的一部分。

正是这些符号主义者，早在1956年首先采用“人工智能”这个术语。后来又发展了启发式算法>专家系统>知识工程理论与技术，并在20世纪80年代取得很大发展。符号主义曾长期一枝独秀，为人工智能的发展作出重要贡献，尤其是专家系统的成功开发与应用，为人工智能走向工程应用和实现理论联系实际具有特别重要的意义。在人工智能的其他学派出现之后，符号主义仍然是人工智能的主流派别。这个学派的代表人物有纽厄尔(Newell)、西蒙(Simon)和尼尔逊(Nilsson)等。

近些年来符号主义中的知识图谱在很多智能问答应用中还发挥着很重要的作用，但这种符号主义的手段对于人工消耗极大，每一个规则都需要人手工录入，机器无法自主学习，所以为了解决这个问题，人们提出了机器学习的想法，这时候我们不再需要给机器逐个录入规则本身，而是让机器自己在数据中学习到规则，所以一切试图做到这一点的，都可以看作是机器学习的技术。

对于商用QA系统生成的答案，即使并没有很人性化的回答到问题，但表述的准确性和正确性往往比所谓的智能更重要，所以业内普遍还是偏向于使用符号主义中的知识图谱技术，而不是深度学习让机器学习规则。

人工智能连接主义

认为人工智能源于仿生学，特别是对人脑模型的研究。它的代表性成果是1943年由生理学家麦卡洛克(McCulloch)和数理逻辑学家皮茨(Pitts)创立的脑模型，即MP模型，开创了用电子装置模仿人脑结构和功能的新途径。它从神经元开始进而研究神经网络模型和脑模型，开辟了人工智能的又一发展道路。

其中最具代表的神经网络，和深层次神经网络（深度学习）。所以在深度学习领域中，就是不断的增加一个神经网络的隐藏层神经元，让输入的数据被这些神经元不断的抽象和理解，最后得到一个具有泛化能力的预测网络模型

而我们一般把隐藏层超过三层的网络，称之为：深度神经网络

至于网络中每个节点到底在理解什么，很难用精确的数学手段去分析。我们唯一能做的就是：收集数据，送入数据，进行训练，然后期待结果

当然也不是说我们对一个深度神经网络完全不可把控，起码我们能在比如学习率，激活函数，神经元层数和数量等等方面调节神经网络的大致工作行为，俗称——调参

深度学习的训练可以来这里进行体验：Tensorflow游乐场：http://playground.tensorflow.org/

近些年来，人工智能，机器学习领域随着算力，数据和从业者的不断增加，正在不断的涌现着一些十分有趣的想法，等待着探索和发现。

人工智能行为主义

行为主义认为人工智能源于控制论。除了深度学习以外，目前机器学习领域中还有另外一项振奋人心的技术，强化学习。

强化学习的灵感来自于人工智能三大流派之一的行为主义，让一个智能体（Agent）不断的采取不同的行动（Action），改变自己的状态（State），和环境（Enviroment）进行交互，从而获得不同的奖励（Reward）,我们只需要设计出合适的奖励（Reward）规则，智能体就能在不断的试错中习得合适的策略，

强化学习近些年来也得到了很多的应用，从alphago开始，到近期腾讯的”觉悟“，通过强化学习训练的游戏AI，已经让人类选手开始在MOBA游戏中深感绝望，当然像觉悟这样的AI，在强化学习中也加入了深度学习部分，也就是所谓的深度强化学习。

机器学习该怎么学？

-机器学习本质包含了数学原理推导与实际应用技巧

机器学习中有很多经典算法，既然要学习，那就需要清楚一个算法是怎么来的（推导）以及该如何应用

数学重要吗？非常重要的，大学的数学基础即可，如果你都忘了，大致的印象还是有的吧，我觉得与其从头过一遍数学，不如边学边查，一个合适的做法就是哪里不会点哪里，我每天也在查很多知识点

一定要学数学，学推导吗？我知道会用不就可以了吗？有句老话，不光要知其然还要知其所以然，这对我们的应用具有很大的帮助

推导肯定是重中之重了，因为对于我们来说学习的目的就是转换成自身的资本让我们更有竞争力，面试与笔试的时候，这些推导全来了

程序员兄弟如果要转行，让你看数学你肯定要疯的，重点应在于如何应用（库的使用，完整项目如何构建，从头到尾的流程）

底层实现和上层应用

像很多技术领域一样，往往可以把这个领域的知识体系简单的分为两层：底层实现和上层应用。

而上层应用中往往随着该领域的发展又会出现很多经过验证的行之有效的经典方法

比如编程语言中Java这个体系，jvm虚拟机，字节码技术构成了Java体系的底层实现，并通过Java语言向上提供应用的接口，而像Spring、Mybatis等框架，以及各种常用的库，则是人们在多年实践中总结而成，能高效的用于生产的经典上层实现，那在实现一个经典任务的时候，Java程序员往往会直接使用这些框架和库，而他们往往也能应对绝大多数问题。

同样，在深度学习领域，我们学习过的像梯度下降，反向传播，CNN，RNN，以及未详细说明的其他的一些基本原理，则构成了现代神经网络的底层实现，而像LeNet-5网络，LSTM，GRU以及AlexNet，VGG，ResNet，Yolo等等，则是在神经网络发展的过程中经过检验而行之有效的模型，

同样，这些经典的网络模型在很多常见的场景，比如语音识别，自然语言处理，图像识别等领域中都能有不错的效果，所以想要用神经网络实现一个具体任务，那么应该首先考虑这些已有的经典网络模型，就像我们使用spring开发Java项目一样，是很自然的选择，

而我们为了提高自己Java项目的开发水平，可能需要去熟悉框架的实现，好消息是我们可以阅读他们的源码，只要你想，就能知道所有细节，而坏消息是这些代码往往非常的庞杂，配合文档和资料也需要很长时间的学习和研究。

同样为了提高对神经网络应用水平，我们需要去熟悉这些经典网络模型，最好的方法就是阅读他们的论文，好消息是这些论文一般都不会特别的长，内容也相对单一，很快就可以看一遍，但坏消息是这些论文一般不会附带源码，一般都是数学公式和图表，阅读他们的门槛可能更高，

但另外一个好消息就是，对于这些经典的网络结构，目前网络上已经有很多人写博客做了更通俗易懂的解读，比如一篇关于LSTM的著名博客，《UnderstandingLSTMNetwork》,这要比看LSTM的原论文要轻松许多，有些文章甚至会逐步的贴出相应的代码，比如对于LeNet5和AlexNet，随便一搜就能找到一大批关于他们论文的解读和用keras实现的代码，所以对于这些经典网络的学习并不是一件特别困难事情。

当然，人工智能作为一门正处于高速发展的学科，每段社区都会有新的idea被提出，有些可能是变革性的，有些可能只是一个小的修补，不论怎样，如果你希望了解这些新的想法，那么唯一的方法就是去看原始的论文，这可能会比较艰难，因为很多论文都是对想法进行简单的描述，然后给出一些公式，而且一般不会详细的说明这些公式每一步推导的细节，最后贴出测试效果的图表，而且并不会附赠源代码，所以为了提高阅读的效率，只能是多看，排除那些写的特别晦涩的论文，一般来说一个领域内的论文，看的多了也就能慢慢的培养出一点感觉，

当然这里还有个很重要的问题，那就是要对机器学习神经网络的底层实现有足够的了解，不仅仅是概念上的，还有数学上的。当然，如果你并不是想做机器学习，神经网络相关的研究工作，而只是想把它应用到自己实际的问题上，那倒是不必研究的如此深刻，在理解了大致工作原理之后，去学习使用那些经典的模型就好，正如我们在学习编程语言的时候，即使不是特别深入的了解计算机的底层实现，也可以写出不错的程序，但是如果是从事像操作系统这样的计算机的方面的研究工作，那么深入的学习则是不可避免的。

当AI懂创作、会画画，AIGC爆发的底层逻辑是什么

打开网易新闻查看精彩图片「核心提示」无论是卖出天价的AI作画，还是近期风靡全球的ChatGPT，都预示着AIGC（人工智能生成内容）赛道将迎来产业大爆发。此时，理解AIGC的演进历程和底层架构，以及AIGC会带来哪些改变，将成为观察产业趋势的关键。作者|李鑫

编辑|刘杨

未来的艺术展，会不会变成机器人之间的PK？

这个问题如果问在几十年前，人们可能会说这是遥远的科幻，而在人工智能（AI）一日千里的今天，回答它恐怕需要思考再三。

2018年，一幅由AI创作，名为《埃德蒙·贝拉米画像》曾在纽约佳士得拍卖行以43.25万美元的价格被拍下——这是估价的40多倍，成为第一幅被拍卖的人工智能作品。

去年9月，另一幅名为《太空歌剧院》的作品获得了美国科罗拉多州博览会艺术比赛的金奖。令人意外的是，这幅作品并非作者杰森·艾伦亲自手绘，而是用AI作画工具Midjourney完成。

赛后，两位评委都称此前并不知道Midjourney是AI工具，但二人随后也都表示，即使他们知道，同样也会授予作者最高奖项。这一度引发AI创作的作品该不该拿来参加比赛的大讨论。

不过，如果和最近火遍全球的ChatGPT做对比，AI作画似乎只是开胃菜。这个能作诗、编悬疑小说、甚至写代码的人工智能聊天机器人，上线两个月便收获1亿用户，以至于特斯拉CEO马斯克直言：“ChatGPT非常好，我们离强大到危险的AI不远了。”比尔·盖茨甚至定性ChatGPT的出现“不亚于互联网和个人电脑的诞生”。

AI作画、ChatGPT有什么共性？本质上，它们都属于AIGC的范畴，即人工智能生成内容。

AIGC潜力不容小视，根据PrecedenceResearch预测，AIGC将在2022年后迎来应用的爆发。预计市场空间将由2022年的108亿美元上涨至2032年的1181亿美元，10年的复合增速高达27%。

可见，AIGC将会在未来的商业世界中扮演越来越重要的角色，此时了解其演进历程和底层逻辑将成为关键。

1、技术、需求双轮驱动

AIGC看似一夜爆发，实则是多年技术沉淀的结果。

1957年，历史上第一支由计算机创作的音乐作品《依利亚克组曲》诞生，这被看作AIGC故事的起点。

不过，在人工智能发展初期，受限于种种因素，相关算法大多基于预先定义的规则或者模板，远算不上智能。而相关高昂的系统成本无法带来可观的商业变现，也让各国政府纷纷减少在人工智能领域的投入，AIGC没有取得显著进展。

AIGC真正引发市场关注，来自近年生成式对抗网络（GAN）、Transformer、扩散模型（DiffusionModel）等深度学习生成算法相继涌现。这些生成算法为AI高品质输出内容打下基础。

比如画出获奖作品《太空歌剧院》的Midjourney，就参考了CLIP和Diffusion，构建了自己的闭源模型。而ChatGPT的底层——AI大模型GPT3.5，底层技术则是来自2017年谷歌重磅发布的Transformer。

如果说技术推动只是AIGC发展的左脚，那么创新需求的牵引，则是AIGC加速落地的右脚。

随着用户对内容数量和质量的需求爆增，但传统的内容生产模式在产能和质量上，正逐步暴露短板。

内容的生产方式可分为三类：偏传统的专业生成内容（PGC）、用户生成内容（UGC）、更新颖的人工智能生成内容（AIGC）。

PGC内容往往制作标准高、工作周期长，但由于供给端人力资源有限，PGC难以满足大规模内容生产的需求；UGC模式则相反，它满足了个性化需求且提高了容量上限，但由于其对制作者、生成工具、内容话题没有限制，质量无法保证。

AIGC虽然暂时无法替代这两种内容生产模式，但能对两种生产方式起到优化作用。借助AIGC，创作者一方面能够通过持续深度学习提升内容的专业性；另一方面AI也能辅助专业创作者，提升创作效率。

在文本领域，腾讯打造的“梦幻写手”的新闻写作系统能够在规定的22种场景中进行写作，具有0.46秒的平均发稿速度；在音频领域，风险投资机构a16z曾透露，Siri联合创始人TomGruber目前已经打造了能够实时动态编曲的自适应音乐平台LifeScore。用户只需向LifeScore输入一系列的音乐“原材料“，AI就会改编并实时混音，带来音乐表演。

随着AIGC时代来临，商业世界的变化远不止于此。

2、如何打出新型“闪电战”?

众所周知，英国人发明了坦克，但德国人发明了基于坦克的闪电战。

一项新技术、工具诞生后，谁能将其用到极致，谁越能占据主动。

本轮生产力革命的受益者，或许不只是AIGC技术的发明人，更是把AIGC技术用到极致，进行模式创新的先行者。正如当年的互联网，以浏览器为起点，后续衍生出了社交网络、电商、视频、游戏等一系列更具想象空间的新模式。

在电商行业，AIGC正试图降低商家和用户间的交易成本。

2021年4月，阿里巴巴上线了3D版天猫家装城。对于商家，天猫帮助其快速构建3D购物空间；对于消费者，3D版天猫家装城支持消费者自己动手做家装搭配，消费者可以沉浸式体验“云逛街”。

数据显示，3D购物的转化率平均值为70%，较行业平均水平提升了9倍，同比正常引导成交客单价提升超200%，同时商品退换货率明显降低。

再比如在金融行业，AIGC正帮助企业不断增强品牌粘性。

2022年年初，商汤科技为宁波银行上海分行专属打造了001号数字人员工“小宁”，这位数字人化身大堂经理为日常客户提供各类业务咨询和服务办理。

去年12月16日，“小宁”主持了一场虚实结合、打破次元壁的线上直播活动。活动中，“小宁”可以幽默介绍自己的工作内容，并向网友推荐宁波银行的多种金融产品和优惠福利。从粉丝互动到直播带货，商汤数字人“虚拟IP”可以自主直播运营，用更低的业务运营成本为企业前端带来全天候的“用户触达”。

数字人商业潜力巨大。根据《虚拟数字人深度产业报告》的预测，到2030年，中国虚拟人整体市场规模将达到2700亿元人民币。从商业模式上看，虚拟数字人的客单价相对更高。

小冰CEO李笛在接受采访时曾表示，之前他们尝试销售终端内容时，只能按剂量去销售，形成的是类似菜市场一样的内容市场，单价非常低。“后来，我们把生成的能力捆绑在数字人身上，平均客单价迅速从20万提高到了300万。”

目前，随着以ChatGPT为代表的自然语言技术（NLP）再一次在单点取得突破，进一步降低AI的使用和触达门槛，AIGC的商业化表现不俗。

2021年成立的Jasper，通过其文字生成功能，用户可以生成社交媒体标题，编写短视频脚本、广告营销文本、电子邮件内容等工作。成立当年，Jasper就拥有7万多名客户，其中不乏Airbnb、IBM等知名企业。2021年一年便创造了4000万美元的收入，2022年预估收入为7500万美元。

这些数字充分展示了AIGC产业不俗的商业化落地速度和效果。随着自然语言技术、计算机视觉技术和AIGC生成算法的不断发展和优化，AIGC产业的商业化应用将会更加广泛和深入。这些应用不仅可以帮助企业提高效率、降低成本、提升竞争力，也可以为用户提供更加个性化、智能化的服务和体验。

3、AIGC掀起“三大军备竞赛”

AIGC的爆发，正吸引知名投资机构围观。

去年9月，红杉美国发表《生成式Al：一个创造性的新世界》，核心观点认为AIGC将成为众多产业新一轮范式转移的开始。

在文章结尾，作者憧憬，如果技术继续沿着当下的变化速度发展，那么AI自己写备忘录、将文字轻松转变为皮克斯电影的科幻未来，将不再遥远。

红杉的预测是不是空想？事实上，目前AIGC领域逐步掀起的三重“军备竞赛”，正加速让理想照进现实。

第一重军备赛，来自更大的模型，它让AIGC更会表达。

大模型之所以重要，是因为AIGC生成的文本、图像、音频等多模态内容，结构和语义相对复杂，要想生成高质量内容，需要模型具备强大的学习和表达能力。此时，大模型具有更多参数、更深网络结构、更丰富学习数据的特点，可以更好地拟合和表达生成任务的模式和特征，在AIGC中发挥其独特优势，实现高质量的内容生成。

比如在自然语义处理（NLP）领域，龙头公司OpenAI在2022年开发的ChatGPT的底层大模型GPT-3.5，就包含1750亿的参数，且调用了8000亿个单词（相当于1351万本牛津词典）的训练数据。这千亿参数，海量学习数据，也让ChatGPT应对不少问题能对答如流，正常得不像个机器。

在计算机视觉领域，国内人工智能龙头企业商汤科技的视觉大模型同样布局深厚。2021年商汤推出一套名为SenseCoreAI大装置的人工智能基础设施，这套装置同时布局模型层、平台层、算力层，能够低成本、大规模生产人工智能模型。

基于这套大装置，商汤开发的视觉大模型，参数已达到320亿，是基于公开信息可查的计算机视觉中，具有最大参数量的模型。

之所以视觉大模型的参数量少于语言大模型，主要是由于相比语言文字，可用于训练的视觉数据信息维度相对偏少，而且受到此前计算机硬件的限制，计算机视觉技术的发展和自然语言处理技术存在数十年差距。但随着数据量和计算能力的增加，视觉大模型在未来几年内将有显著发展。

打造领先的大模型，除了取决于先进的算法，还取决于丰富的产业实践经验。因为只有基于大量应用实践，企业才能构建泛化性能更好、通用性更强的大模型。

自2016年起，商汤科技开始全面布局AIGC包括文字、语音、图像、视频、代码、三维人物动作等多模态的数据分析和内容生产。这些丰富的应用实践，不但促进了商汤AIGC大模型的研发，也反过来促进多模态内容的生产，彼此形成正循环。

大模型之外，第二重军备赛点，来自更高的算力。

大算力，一方面可以支持更复杂的模型和更大规模的数据训练，提高AIGC生成内容的质量和多样性；另一方面可以提高AIGC生成内容的生产效率和速度，支持实时生成和个性化定制。

不过，获得大算力，需要支付高昂的成本，一般的小企业无法负担。

《财经十一人》曾测算，如果某企业想以1万枚英伟达A800GPU为基准构建智能算力集群，每枚GPU价格10万元，那么仅GPU的采购成本就高达10亿元。再考虑到服务器采购成本通常占据数据中心建设成本的30%，构建一个智能算力集群的建设成本将超过30亿元。

高昂的成本，也使得全国算力网络的建设，只有政府和产业资深行业玩家才能参与。2022年5月，西南地区最大的人工智能计算中心——成都智算中心正式上线。

这座智算中心由成都高新区、郫都区与华为公司共同建设运营，总投资高达109亿元。其中，人工智能算力平台采用基于华为昇腾AI基础软硬件的AI集群，算力达到300PFLOPS（每秒30亿亿次浮点运算），相当于15万台高性能PC的计算能力。

在上海，作为商汤科技SenseCoreAI大装置的底座，全新启用的商汤临港人工智能智算中心（AIDC）目前上线了1.745EFLOPS（每秒174.5亿亿次浮点运算）的算力规模，并获得强劲的市场需求。

截至2022年8月，上海临港AIDC对外服务算力已突破1EFLOPS。为算法模型的分析、低成本训练、大规模数据管理提供支撑。

打开网易新闻查看精彩图片不过，虽然AIGC可以辅助提高内容的创作效率，甚至改变内容的创作模式，但这项技术仍会让设计、文案等非行业人士感觉高高在上。此时，只有更细化地打造出面向各个行业的垂直型AIGC工具，才能真正实现行业的革新。

这也使得产业玩家要想脱颖而出，需要打赢第三军备竞赛点——让应用门槛更低，让AIGC应用更普惠。

目前OpenAI近期已宣布开放ChatGPT和语音转文本模型Whisper模型API（应用接口），开发人员可以通过API将ChatGPT和Whisper模型集成到自己的应用程序和服务中，并由此访问到最前沿的语言以及语音到文本功能。

通过一系列全面优化，自去年12月以来，OpenAI也已成功将ChatGPT的使用成本降低了90%；谷歌的AutoDraw应用程序，可以帮助用户自动将简笔画转换为专业的矢量图形，省去了用户自己做图的麻烦；

商汤科技则在近日发布了拥有30亿参数的多模态多任务通用大模型“书生（INTERN）2.5”，并在GitHub上的商汤通用视觉开源平台OpenGVLab中开源。“书生（INTERN）2.5”在多模态多任务处理能力方面有多项突破，将视觉、语音及多任务建模三个模型能力有效融合，其图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

打开网易新闻查看精彩图片利用多模态多任务通用大模型辅助完成自动驾驶场景中各类复杂任务

“书生（INTERN）2.5”是商汤科技向通用人工智能（AGI）迈出的坚实一步，已建立起AGI模型的研发架构，凭借在计算机视觉方面的积累，其视觉能力在全球处于领先位置，语言能力仍在增强，相信在这一竞赛中后续会推出更大、更强的AGI模型。

AIGC规模化落地后，各行各业将产生怎样的变化？在近期召开的“2023全球人工智能开发者先锋大会”上，商汤科技CEO徐立提出了一个“新二八定律”。

他表示，过去传统行业的二八定律，是机器20%的指令/代码解决80%的事情，企业会把部分能力抽象出来，变成各种库、编译包，所以20%的工作是自动化的，剩下的80%由人来定制。

“但是当有了生成式AI，我们将迎来‘新二八定律’，即80%的工作由机器完成，20%的工作才由人来做。基模型推动的行业领域的变化，再推动行业应用的迭代，这套流程可能成为未来标准化的生产流程。”

4、写在最后

有关技术如何在社会中扩散？演化经济学家卡萝塔·佩蕾丝在其《技术革命与金融资本》一书中总结道，每一轮技术革命都会经历两期、四阶段：导入期（爆发阶段、狂热阶段）和展开期（协同阶段、成熟阶段）。

在导入期，新技术会被引入少数行业做示范，然后大量热钱会在此时涌入。而一旦导入期示范效果好，新技术就会进入大规模应用时期，也叫展开期。

展开期建立在技术和制度框架彼此协调的基础上，是一个相对稳定而繁荣的发展时期。许多国家会在展开期达到高就业水平。因此，人们往往将展开期看作“黄金时代”或“美好年代”。

回看当下，近几年智能驾驶、智能监控、AIGC产业等AI细分赛道的持续爆发，其示范效应或将推动人工智能产业整体逐步从导入期进入展开期。

而随着ChatGPT等应用的横空出世，我们也会发现，AI产业的演进已诞生更明确的方向，即通过大模型结合大算力实现通用型AI，让非资深的企业和个人也能享受到技术进步。此时，谁能提前深度布局大模型以及配套强算力，谁将构筑更高的壁垒，更早收获产业红利。

打开网易新闻查看精彩图片

人工智能的底层逻辑到底是什么算法 or 逻辑 人工智能三大底层逻辑是什么意思