人工智能 (AI) 体系结构人工智能底层架构是什么样的

发表时间：2023-07-04 02:37:33

人工智能 (AI) 体系结构

你当前正在访问MicrosoftAzureGlobalEdition技术文档网站。如果需要访问由世纪互联运营的MicrosoftAzure中国技术文档网站，请访问https://docs.azure.cn。

人工智能(AI)体系结构设计项目06/25/2023

人工智能(AI)是计算机模拟人类智能行为的功能。通过AI，计算机可以分析图像、理解语音、以自然方式交互，以及使用数据进行预测。

AI概念算法

算法是用于解决问题或分析一组数据的一系列计算和规则。它就像一个流程图，其中包含提出问题的分步说明，只不过是以数学和编程代码形式进行编写。算法可以描述如何确定宠物是猫、狗、鱼、鸟还是蜥蜴。另一种更复杂的算法可以描述如何识别书面或口头语言、分析其字词、将其翻译为其他语言，然后检查翻译的准确性。

机器学习

机器学习(ML)是一种AI技术，可使用数学算法来创建预测模型。该技术使用特定算法分析数据字段，并通过使用在数据中发现的模式来“学习”该数据以生成模型。然后，使用那些模型做出与新数据有关的明智预测或决策。

预测模型将根据已知数据进行验证，通过为特定业务方案选择的性能指标进行衡量，然后根据需要进行调整。此学习和验证过程被称为“训练”。通过定期重新训练，ML模型会随着时间的推移而改进。

规模化机器学习

Microsoft的机器学习产品有哪些？

深度学习

深度学习是一种ML，可以自行确定其预测是否准确。该技术也使用算法分析数据，但其操作规模比ML大。

深度学习使用的人工神经网络由多个算法层组成。每层均可查看传入数据，执行自己的专用分析，并生成其他层可以理解的输出。然后，系统会将此输出传递至下一层，在其中以不同的算法执行其自己的分析，依此类推。

每个神经网络都有许多层，而且有时使用多个神经网络，因此计算机可以通过自己的数据处理来学习。与ML相比，此技术需要更多的数据，更高的计算能力。

深度学习与机器学习

Azure上深度学习模型的分布式训练

Azure上深度学习模型的批量评分

Azure上PythonScikit-Learn和深度学习模型的训练

Azure上PythonScikit-Learn和深度学习模型的实时评分

机器人

机器人是一种可执行特定任务的自动化软件程序。你可将其视为没有身体的机器人。早期机器人相对简单，使用相对简单的算法逻辑处理重复性任务和大型任务。例如，搜索引擎使用Web爬网程序自动浏览和编录Web内容。

机器人现已变得更加复杂，不仅可使用AI和其他技术来模拟人类活动和决策，通常还可通过文本消息甚至语音直接与人类交互。例如，可以预订餐位的机器人、帮助客户服务交互的聊天机器人（或对话AI）以及将突发新闻或科学数据发布到社交媒体网站的社交机器人。

Microsoft提供了Azure机器人服务，这是专为企业级机器人开发构建的托管服务。

关于Azure机器人服务

负责任的机器人的十个准则

Azure参考体系结构：企业级对话机器人

工作负载示例：Azure上提供的用于酒店预订的对话式聊天机器人

自治系统

自治系统是不断发展的新类的一部分，突破了基本自动化的局限。自治系统不是像机器人一样，几乎没有变化或毫无变化地重复执行特定任务，而是赋予计算机智能功能，使其适应不断变化的环境，以实现预期目标。

智能建筑已采用自治系统自动控制照明、通风、空调及安全等操作。更复杂的示例是自导向机器人，可用于探测坍塌的矿井，以全面反映其内部情况，确定结构稳固的部分，分析透气性，并在没有远程端实时人工监视的情况下需要救援时检测被困矿工的生命体征。

MicrosoftAI中的自治系统和解决方案有关MicrosoftAI的常规信息

详细了解MicrosoftAI，并随时了解相关新闻：

MicrosoftAI学校

AzureAI平台页

MicrosoftAI平台页

MicrosoftAI博客

GitHub上的MicrosoftAI：示例、参考体系结构和最佳做法

Azure体系结构中心

高级体系结构类型预生成AI

预生成AI就是可供使用的现成AI模型、服务和API。这些工具可帮助你向应用、网站和流添加智能功能，而不必收集数据，然后生成、训练和发布自己的模型。

例如，预生成AI可能是预训练模型，可以按原样合并，也可以用于为进一步自定义训练提供基准。再比如基于云的API服务，你可以随意调用该服务以所需方式处理自然语言。

Azure认知服务

认知服务为开发者提供了使用预生成API和集成工具包创建应用程序的机会，这些应用程序可以听、说、看、理解，甚至可以开始推理。认知服务中的服务目录可分为五大支柱类别：视觉、语音、语言、Web搜索和决策/建议。

Azure认知服务文档

免费试用Azure认知服务

选择Azure认知服务技术

在Azure中选择自然语言处理技术

AIBuilder中的预生成AI模型

AIBuilder是MicrosoftPowerPlatform中的一项新功能，可提供点击式接口，即使用户没有编码或数据科学技能，也可以向应用添加AI。（AIBuilder中的一些功能尚未正式发布，仍处于预览状态。有关详细信息，请参阅按区域划分的功能可用性页。）

你可以生成和训练自己的模型，但AIBuilder还可提供立即可用的精选预生成AI模型。例如，你可基于预生成模型在MicrosoftPowerApps中添加一个组件，以识别名片中的联系信息。

Azure上的PowerApps

AIBuilder文档

AIBuilder中的AI模型类型

AIBuilder中的预生成AI模型概述

自定义AI

尽管预生成AI很有用（而且越来越灵活），但从AI中获取所需内容的最佳方式或许是自己构建系统。显然，这是一个深奥复杂的主题，除了刚介绍的内容以外，我们先看一些基本概念。

代码语言

AI的核心概念是使用算法来分析数据和生成模型，以采用有效方式进行描述（或评分）。算法是由开发者和数据科学家（有时由其他算法）使用编程代码编写的。目前，最常用于AI开发的两种编程语言是Python和R。

Python是一种通用的高级编程语言。其语法简单易学，强调可读性。没有编译步骤。Python具有大型标准库，但它也支持模块和包添加功能。这有助于模块化，也有助于根据需要扩展功能。Python的AI和ML库生态系统较大，并且不断增长，其中包括Azure中随时可用的许多库。

Azure产品主页上的Python

面向Python开发人员的Azure

适用于Python的Azure机器学习SDK

有关机器学习与Python和AzureNotebooks结合使用的简介

Scikit-learn。用于Python的开源ML库

PyTorch。具有丰富生态系统的开源Python库，可用于深度学习、计算机视觉、自然语言处理等

TensorFlow。开源符号数学库还用于ML应用程序和神经网络

教程：在AzureFunctions中使用Python和TensorFlow应用机器学习模型

R是一种语言和环境，适用于统计计算和图形。从在线映射广泛的社交趋势和市场营销趋势到开发财务和气候模型，均可使用此语言。

Microsoft已完全采用R编程语言，并为R开发者提供了许多不同的选项，以便他们在Azure中运行自己的代码。

在Azure机器学习中以交互方式使用R。

教程：通过Azure机器学习在R中创建逻辑回归模型

培训

训练是机器学习的核心。这是“教”算法创建模型的迭代过程，用于分析数据，然后根据结果做出准确预测。此过程实际上有三个常规阶段：训练、验证和测试。

在训练阶段，会对一组已知的优质数据进行标记，以便可以识别单个字段。将标记的数据提供给为做出特定预测配置的算法。完成操作后，该算法会输出一个模型，以一组参数的形式描述发现的模式。在验证过程中，会对新数据进行标记并将其用于测试模型。算法会根据需要进行调整，并可能会经历更多训练。最后，测试阶段使用没有任何标记或预选目标的实际数据。如果模型的结果是准确的，则将其视为准备就绪，可以进行部署。

使用Azure机器学习训练模型超参数优化

超参数是控制训练过程本身的数据变量。这些变量是控制算法运作方式的配置变量。因此，超参数通常是在模型训练开始之前进行设置，并且在训练过程中不是按参数方式进行修改。超参数优化涉及运行训练任务中的试用版，评估作业完成程度，然后根据需要进行调整。此过程会生成多个模型，每个模型都会使用不同的超参数系列进行训练。

使用Azure机器学习优化模型的超参数模型选择

训练和超参数优化过程会生成大量候选模型。这些模型具有许多不同的差异，包括准备数据所需的工作量、模型的灵活性、处理时间量，当然还包括其结果的准确性。根据需求和约束条件选择最佳训练模型被称为“模型选择”，但这更像是训练前的预规划，毕竟是选择最佳训练模型。

自动化机器学习(AutoML)

自动化机器学习（也称为AutoML）是机器学习模型开发中耗时的迭代性任务实现自动化的过程。此过程可以显著减少获取生产就绪ML模型所需的时间。自动化ML可帮助执行模型选择、超参数优化、模型训练和其他任务，不需要用户具有广博的编程知识或域知识。

什么是自动化机器学习？计分

评分（也称为“预测”）是在给定一些新输入数据后根据训练机器学习模型生成值的过程。创建的值（或分数）可以表示对未来值的预测，但也可能表示可能的类别或结果。评分过程可生成多种不同类型的值：

推荐项和相似性分数的列表

有关时序模型和回归模型的数值

概率值，指示新输入属于某个现有类别的可能性

与新项最相似的类别或群集的名称

分类模型的预测类或结果

批量评分是指在某个固定时间段内收集数据，然后分批进行处理时的评分。此过程可能包括生成业务报表或分析客户忠诚度。

实时评分就是正在执行且尽可能快地执行的评分。经典示例是信用卡欺诈行为检测，但在语音识别、医学诊断、市场分析以及许多其他应用中也可以使用实时评分。

有关Azure上自定义AI的常规信息

GitHub上的MicrosoftAI：示例、参考体系结构和最佳做法

AzureGitHub存储库上的自定义AI。即一系列脚本和教程，可帮助开发者在其AI工作负载中有效使用Azure

适用于Python的Azure机器学习SDK

Azure机器学习服务示例笔记本(Python)。即有关示例笔记本的GitHub存储库，用于演示Azure机器学习PythonSDK

适用于R的Azure机器学习SDK

AzureAI平台产品/服务

下面是可用于根据需求开发AI解决方案的Azure技术、平台和服务的细分。

Azure机器学习

此服务是企业级机器学习服务，可更快地构建和部署模型。Azure机器学习提供了Web界面和SDK，以便你可以大规模快速训练并部署机器学习模型和管道。请将这些功能与开放源代码Python框架（如PyTorch、TensorFlow和scikit-learn）配合使用。

Microsoft的机器学习产品有哪些？

Azure机器学习产品主页

Azure机器学习数据体系结构指南概述

Azure机器学习文档概述

什么是Azure机器学习？总体定位，其中包含指向多个学习资源、SDK、文档等内容的链接

Azure机器学习参考体系结构

Azure上PythonScikit-Learn和深度学习模型的训练

Azure上深度学习模型的分布式训练

Azure上Python机器学习模型的批量评分

Azure上深度学习模型的批量评分

Azure上PythonScikit-Learn和深度学习模型的实时评分

使用Azure机器学习的Python模型的机器学习操作化(MLOps)

Azure上R机器学习模型的批量评分

Azure上R机器学习模型的实时评分

AzureDatabricks上Spark机器学习模型的批量评分

企业级聊天机器人

在Azure上生成实时建议API

Azure自动化机器学习

Azure为自动化ML提供广泛支持。开发者可以使用无代码UI或通过代码优先的笔记本体验来构建模型。

Azure自动化机器学习产品主页

Azure自动化ML信息图(PDF)

教程：使用Azure机器学习中的自动化ML创建分类模型

教程：使用自动化机器学习预测出租车费

使用Python配置自动化ML试验

将CLI扩展用于Azure机器学习

使用Azure机器学习CLI自动执行机器学习活动

Azure认知服务

这是一系列全面的AI服务和认知API，可帮助你构建智能应用。这些特定于域的预训练AI模型可以使用你的数据进行自定义。

认知服务产品主页

Azure认知服务文档

Azure认知搜索

这是AI支持的云搜索服务，可用于移动应用和Web应用开发。此服务可搜索专用异类内容，带有用于AI扩充的选项（如果内容为非结构化内容或内容在采用其原始格式时无法搜索）。

Azure认知搜索产品主页

AI扩充入门

Azure认知搜索文档概述

在Azure中选择自然语言处理技术

快速入门：在Azure门户中创建Azure认知搜索认知技能集

Azure机器人服务

这是一个专门设计的机器人开发环境，具有快速入门的现成模板。

Azure机器人服务产品主页

Azure机器人服务文档概述

Azure参考体系结构：企业级对话机器人

工作负载示例：Azure上提供的用于酒店预订的对话式聊天机器人

MicrosoftBot框架

GitHubBotBuilder存储库

Azure上的ApacheSpark

ApacheSpark是并行处理框架，支持使用内存中处理来提升大数据分析应用程序的性能。Spark提供了用于内存中群集计算的基元。Spark作业可在内存中加载和缓存数据，并可重复查询，查询速度比基于磁盘的应用程序（如Hadoop）快得多。

AzureHDInsight中的ApacheSpark是Microsoft的ApacheSpark在云中的实现。HDInsight中的Spark群集可与Azure存储和AzureDataLakeStorage兼容，因此你可以使用HDInsightSpark群集处理Azure中存储的数据。

适用于ApacheSpark的Microsoft机器学习库，即MMLSpark(MicrosoftMLforApacheSpark)。它是一个开源库，在Spark生态系统中添加了许多深度学习和数据科学工具、网络功能和生产级性能。详细了解MMLSpark功能。

AzureHDInsight概述。有关功能、群集体系结构和用例的基本信息，以及指向快速入门和教程的指针。

教程：在AzureHDInsight中生成ApacheSpark机器学习应用程序

HDInsight上的ApacheSpark最佳做法

配置HDInsightApacheSpark群集设置

HDInsight中的机器学习

MMLSpark的GitHub存储库：适用于ApacheSpark的Microsoft机器学习库

在HDInsight上创建ApacheSpark机器学习管道

用于机器学习的AzureDatabricksRuntime

AzureDatabricks是一个基于ApacheSpark的分析平台，具有一键设置、简化的工作流以及一个供数据科学家、工程师和商业分析师相互协作的交互工作区。

用于机器学习的DatabricksRuntime(DatabricksRuntimeML)可用于启动具有分布式训练所需全部库的Databricks群集。此工具可为机器学习和数据科学提供随时可用的环境。而且，其中包含多个常用库，包括TensorFlow、PyTorch、Keras和XGBoost。它还支持使用Horovod进行分布式训练。

AzureDatabricks产品主页

AzureDatabricks文档

AzureDatabricks中的机器学习功能

操作指南：用于机器学习的DatabricksRuntime

AzureDatabricks上Spark机器学习模型的批量评分

AzureDatabricks上的深度学习概述

客户案例

各个行业都在以令人鼓舞的创新方式应用AI。下面是大量客户案例研究和成功案例：

ASOS：在线零售商使用Azure机器学习服务解决难题

KPMG使用Azure认知服务帮助金融机构节省数百万美元的合规成本

Volkswagen：机器翻译用40种语言表达Volkswagen

Buncee：NYC学校使用AzureAI为各个年龄各种层次的读者提供支持

InterSystems：数据平台公司以史无前例的速度生成重要信息，改善了IT健康状况

Zencity：数据驱动型初创公司提供资金帮助本地政府改善居民的生活质量

Bosch依靠IoT创新，帮助驱动程序防止严重事故，提高流量安全性

AutomationAnywhere：机器人进程自动化平台开发者使用Azure认知服务扩充其软件

Wix使用Azure认知搜索在1.5亿个网站上部署可缩放的智能搜索

AsklepiosKlinikAltona：使用MicrosoftHoloLens2和3D可视化效果提高手术精准度

AXAGlobalP&C：全球保险公司使用基于云的HPC对复杂的自然灾害建模

浏览更多AI客户案例

后续步骤

若要了解Microsoft提供的人工智能开发产品，请参阅MicrosoftAI平台页。

有关如何开发AI解决方案的训练，请参阅MicrosoftAI学校。

GitHub上的MicrosoftAI：示例、参考体系结构和最佳做法安排了基于Microsoft开源AI的存储库，并提供教程和学习材料。

人工智能的技术构架

原标题：人工智能的技术构架

人工智能产业的技术构架通常由基础层、技术层和应用层构成：

(1)基础层。基础层一般由软硬件设施以及数据服务组成。软件设施主要包括智能云平台和大数据平台，比如国外的谷歌大数据平台和国内的百度智能云平台等；硬件设施主要包括CPU硬件及芯片，美国的高通和苹果都是这个领域的代表企业；数据服务包括通用数据和行业数据，由于大部分已经积累海量数据的互联网企业不会对外分享数据资源，故市场上出现了很多第三方数据提供企业，典型代表就是国内海天瑞声技术公司以及国外的CrowdFlower数据服务公司。目前，我国在基础层这个层面还比较薄弱。

(2)技术层。技术层由基础框架、算法模型以及通用技术组成。基础框架主要指分布式存储和分布式计算，同时也是大数据技术的基础；算法模型分为机器学习、深度学习以及强化学习，其中机器学习是实现人工智能的一种重要手段，例如生活中常用到的iPhone手机的Siri助手以及高速公路收费站点的ETC车牌识别系统都是运用了机器学习的算法，深度学习和强化学习则是机器学习的技术之一，最典型的运用代表就是谷歌公司开发的阿尔法围棋机器人（AlphaGO）；通用技术有自然语言处理、智能语言、计算机视觉等，我国现在在这个领域已经达到了世界上中上水平，代表企业有科大讯飞和依图网络科技等。

(3)应用层。应用层主要包括应用平台和智能产品，应用平台主要是各种智能操作系统，如美国的IOS系统和安卓系统，以及国内的华为鸿蒙系统等；智能产品包括像人脸识别、智能客服、无人驾驶等运用了人工智能技术的设施设备。近来十几年，我国在这个层面的发展呈爆发式的趋势，涉及的领域有零售产业、金融产业、电商服务、安保工作、教育产业等。

返回搜狐，查看更多

责任编辑：

人工智能系统架构

一、架构图

上图架构一个C/S架构

智能终端（C）包括智能音箱、人脸识别、人脸支付等应用和智能操作系统。人工智能大脑（S）构成包括智能云平台、大数据平台，机器学习、深度学习，语音识别模型、图像识别模型和API服务接口。重点需要关注的是智能终端(C)主要负责信号的采集和最后输出。

例如智能音箱：仅完成对信号的采集和输出，目前都是在远端实现的，采集信号传输到服务器端，人工智能大脑接收信号后，通过建立语音识别模型，然后进行识别，处理完成之后把这个结果反馈给客户端，接着在智能音箱这一端把这个相应的内容输出出去。需要说明的一点是：语音合成也是在服务器端完成的。

二、案例（略）

三、价值

无联网状态了，基于C/S模式，那么在离线情况下，如何处理？边沿计算很重要

例如：互联网环境下未来研发出的自动驾驶依赖于网络环境，自动驾驶过程中对前方障碍物和其他车辆的识别是通过摄像头来做这个信号采集，采集好了之后不会在本地进行计算，而是会上传到智能大脑云端进行识别，识别过程中如果出现网络中断情况的话，那么这个车辆的控制将会发生什么样的结果是不可预知的，那么在这个里面，大家以后考虑人工智能产品时候，要把这个问题考虑在里面，包括这个网络环境信号的不稳定等都会是人工智能这种C/S模式下的一个未来的灾难。

人工智能常用框架

上一讲我们简单探讨了人工智能是什么，那么既然知道是什么，下一步去搞清楚，怎么去做？用什么去做？目前市面上了，大家都是怎么做的，正所谓，工欲善其事，必先利其器，本来是个非常复杂的工程，利用工具，我们就能轻松运用和理解

下面简单介绍几种框架，帮我们实现人工智能

1.TensorFlow

“使用数据流图表的可伸缩机器学习的计算”

语言：C++或Python。

TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor（张量）意味着N维数组，Flow（流）意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。

TensorFlow是一个使用数据流图表进行数值计算的开源软件。这个框架被称为具有允许在任何CPU或GPU上进行计算的架构，无论是台式机、服务器还是移动设备。这个框架在Python编程语言中是可用的。

TensorFlow对称为节点的数据层进行排序，并根据所获得的任何信息做出决定。点击查看详情！

优点：

使用易于学习的语言（Python）。使用计算图表抽象。用于TensorBoard的可用性的可视化。

缺点：

这很慢，因为Python不是语言中最快的。缺乏许多预先训练的模型。不完全开源。2.MicrosoftCNTK

“开源深度学习工具包”

语言：C++。

我们可以称之为微软对Google的TensorFlow的回应。

微软的计算网络工具包是一个增强分离计算网络模块化和维护的库，提供学习算法和模型描述。

在需要大量服务器进行操作的情况下，CNTK可以同时利用多台服务器。

据说它的功能与Google的TensorFlow相近；但是，它会更快。在这里了解更多。

优点：

这是非常灵活的。允许分布式训练。支持C++、C＃、Java和Python。

缺点：

它以一种新的语言——网络描述语言（NetworkDescriptionLanguage,NDL）来实现。缺乏可视化。3.Theano

“数值计算库”

语言：Python。

Theano是TensorFlow的强有力竞争者，是一个功能强大的Python库，允许以高效率的方式进行涉及多维数组的数值操作。

Theano库透明地使用GPU来执行数据密集型计算而不是CPU，因此操作效率很高。

出于这个原因，Theano已经被用于为大规模的计算密集型操作提供动力大约十年。

然而，在2017年9月，宣布Theano的主要开发将于2017年11月发布的1.0版本后停止。

这并不意味着它是一个不够强大的库。你仍然可以随时进行深入的学习研究。在这里了解更多。

优点：

正确优化CPU和GPU。有效的数字任务。

缺点：

与其他库相比，原生Theano有点低级。需要与其他库一起使用以获得高度的抽象化。AWS上有点bug。4.Caffe

“快速、开源的深度学习框架”

语言：C++。

Caffe是一个强大的深度学习框架。

像这个清单上的其他框架一样，深度学习的研究速度非常快。

借助Caffe，您可以非常轻松地构建用于图像分类的卷积神经网络（CNN）。Caffe在GPU上运行良好，这有助于在运行期间提高速度。查看主页获取更多信息。

Caffe主要的类有：

优点：

Python和MATLAB的绑定可用。性能表现良好。无需编写代码即可进行模型的训练。

缺点：

对于经常性网络不太好。新体系结构不太好。5.Keras

“人类的深度学习”

语言：Python。

Keras是一个用Python编写的开源的神经网络库。

与TensorFlow、CNTK和Theano不同，Keras不是一个端到端的机器学习框架。

相反，它作为一个接口，提供了一个高层次的抽象化，这使得无论它坐落在哪个框架上，神经网络的配置都会变得容易。

谷歌的TensorFlow目前支持Keras作为后端，而微软的CNTK也会在很短的时间内做到这一点。在这里了解更多。

优点：

它是用户友好的。它很容易扩展。在CPU和GPU上无缝运行。与Theano和TensorFlow无缝工作。

缺点：

不能有效地用作独立的框架。6.Torch

“一个开源的机器学习库”

语言：C。

Torch是一个用于科学和数字操作的开源机器学习库。

这是一个基于Lua编程语言而非Python的库。

Torch通过提供大量的算法，使得深度学习研究更容易，并且提高了效率和速度。它有一个强大的N维数组，这有助于切片和索引等操作。它还提供了线性代数程序和神经网络模型。点击查看详情！

优点：

非常灵活。高水平的速度和效率。大量的预训练模型可用。

缺点：

不清楚的文献记录。缺乏即时使用的即插即用代码。它基于一种不那么流行的语言——Lua。7.Accord.NET

“机器学习、计算机视觉、统计和.NET通用科学计算”

语言：C＃。

这是专为C＃程序员设计的。

Accord.NET框架是一个.NET机器学习框架，使音频和图像处理变得简单。

这个框架可以有效地处理数值优化、人工神经网络，甚至可视化。除此之外，Accord.NET对计算机视觉和信号处理的功能非常强大，同时也使得算法的实现变得简单。点击查看详情。

优点：

它有一个强大而积极的开发团队。非常有据可查的框架。质量可视化。

缺点：

不是一个非常流行的框架。比TensorFlow慢。8.SparkMLlib

“可扩展的机器学习库”

语言：Scala。

Apache的SparkMLlib是一个非常可扩展的机器学习库。

它非常适用于诸如Java、Scala、Python，甚至R等语言。它非常高效，因为它可以与Python库和R库中的numpy进行互操作。

MLlib可以轻松插入到Hadoop工作流程中。它提供了机器学习算法，如分类、回归和聚类。

这个强大的库在处理大型数据时非常快速。在网站上了解更多信息。

优点：

对于大规模数据处理非常快速。提供多种语言。

缺点：

陡峭的学习曲线。即插即用仅适用于Hadoop。9.Sci-kitLear

“用Python的机器学习”

语言：Python。

Sci-kitlearn是一个非常强大的机器学习Python库，主要用于构建模型。

使用numpy、SciPy和matplotlib等其他库构建，对统计建模技术（如分类、回归和聚类）非常有效。

Sci-kitlearn带有监督学习算法、无监督学习算法和交叉验证等功能。点击查看详情！

优点：

许多主要算法的可用性。有效的数据挖掘。

缺点：

不是构建模型的最佳选择。GPU效率不高。10.MLPack

“可扩展的C++机器学习库”

语言：C++。

MLPack是一个用C++实现的可扩展的机器学习库。因为它是用C++编写的，所以你可以猜测它对于内存管理是非常好的。

MLPack以极高的速度运行，因为高质量的机器学习算法与库一起出现。这个库是对新手友好的，并提供了一个简单的API使用。点击查看详情！

优点：

非常可扩展。Python和C++绑定可用。

缺点：

不是最好的文献记录。11、Pytorch

2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch。Pytorch和Torch底层实现都用的是C语言，但是Torch的调用需要掌握Lua语言，相比而言使用Python的人更多，根本不是一个数量级，所以Pytorch基于Torch做了些底层修改、优化并且支持Python语言调用。它是一个基于Python的可续计算包，目标用户有两类：

使用GPU来运算numpy一个深度学习平台，提供最大的灵活型和速度

人工智能 (AI) 体系结构 人工智能底层架构是什么样的