博舍

大数据与人工智能的关系 讲述大数据与人工智能的关系是

大数据与人工智能的关系

本文摘自林子雨编著《大数据导论》(访问教材官网)

作者:厦门大学计算机科学系林子雨博士/副教授全国高校知名大数据教师

E-mail:ziyulin@xmu.edu.cn

人工智能和大数据都是当前的热门技术,人工智能的发展要早于大数据,人工智能在20世纪50年代就已经开始发展,而大数据的概念直到2010年附近才形成。从百度指数的数据可以看出,人工智能受到国人关注要远早于大数据,且受到长期、广泛的关注,在近两年再次被推向顶峰。人工智能的影响力要大于大数据。大数据关注度从2013年开始得到较多关注,2017年4月达到顶峰。

人工智能和大数据是紧密相关的两种技术,二者既有联系,又有区别。1.人工智能与大数据的联系一方面,人工智能需要数据来建立其智能,特别是机器学习。例如,机器学习图像识别应用程序可以查看数以万计的飞机图像,以了解飞机的构成,以便将来能够识别出它们。人工智能应用的数据越多,其获得的结果就越准确。在过去,人工智能由于处理器速度慢、数据量小而不能很好地工作。今天,大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展,甚至可以说,没有大数据就没有人工智能。另一方面,大数据技术为人工智能提供了强大的存储能力和计算能力。在过去,人工智能算法都是依赖于单机的存储和单机的算法,而在大数据时代,面对海量的数据,传统的单机存储和单机算法都已经无能为力,建立在集群技术之上的大数据技术(主要是分布式存储和分布式计算),可以为人工智能提供强大的存储能力和计算能力。2.人工智能与大数据的区别人工智能与大数据也存在着明显的区别,人工智能是一种计算形式,它允许机器执行认知功能,例如对输入起作用或作出反应,类似于人类的做法,而大数据是一种传统计算,它不会根据结果采取行动,只是寻找结果。另外,二者要达成的目标和实现目标的手段不同。大数据主要目的是通过数据的对比分析来掌握和推演出更优的方案。就拿视频推送为例,我们之所以会接收到不同的推送内容,便是因为大数据根据我们日常观看的内容,综合考虑了我们的观看习惯和日常的观看内容;推断出哪些内容更可能让我们会有同样的感觉,并向将其推送给我们。而人工智能的开发,则是为了辅助和代替我们更快、更好地完成某些任务或进行某些决定。不管是汽车自动驾驶、自我软件调整亦或者是医学样本检查工作,人工智能都是在人类之前完成相同的任务,但区别就在于其速度更快、错误更少,它能通过机器学习的方法,掌握我们日常进行的重复性的事项,并以其计算机的处理优势来高效的达成目标。

大数据技术与人工智能的关系

结合了学习的知识和网上的相关资料,我个人觉得大数据与人工智能的关系如下:

人工智能需要数据来建立其智能,特别是机器学习,大数据技术为人工智能提供了强大的存储能力和计算能力。

如果说大数据相当于人的大脑存储了海量知识,而人工智能则是吸收了大量的数据,并不断的深度分析创造出更大的价值。

人工智能离不开大数据,大数据依托着人工智能。

以上是我个人对于学习的知识和网上的相关资料做的一个总结

大数据与人工智能的关系

将202.96.44.88划分为四个字网(包括0和全1的子网),写出子网掩码,并写出四个子网

m0_73812013:为什么0不能取到啊

lim(x→0)(tan(tanx)-sin(sinx))/(tanx-sinx)

2301_77232297:右式怎么化的?谁能解释一下?

MySQL8.0.X卸载并重新安装并启动

ㅤ:为啥一直卸载不掉,在服务里面一直可以看到

JSONOBject的fluentPut(key,value)方法:可链式设置元素

wuyunxiao5:请问Object类型包括List吗

思维导图Vue组件mindmap

一只努力的小青蛙:项目是不是挂了?依赖拉不下来

一文读懂:大数据、人工智能、机器学习与深度学习

导读:大数据、人工智能是目前大家谈论比较多的话题,它们的应用也越来越广泛、与我们的生活关系也越来越密切,影响也越来越深远,其中很多已进入寻常百姓家,如无人机、网约车、自动导航、智能家电、电商推荐、人机对话机器人等等。

大数据是人工智能的基础,而使大数据转变为知识或生产力,离不开机器学习(MachineLearning),可以说机器学习是人工智能的核心,是使机器具有类似人的智能的根本途径。

本文主要介绍机器有关概念、与大数据、人工智能间的关系、机器学习常用架构及算法等,具体如下:

机器学习的定义

大数据与机器学习

机器学习与人工智能及深度学习

机器学习的基本任务

如何选择合适算法

Spark在机器学习方面的优势

01机器学习的定义

机器学习是什么?是否有统一或标准定义?目前好像没有,即使在机器学习的专业人士,也好像没有一个被广泛认可的定义。在维基百科上对机器学习有以下几种定义:

“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。

“机器学习是对能通过经验自动改进的计算机算法的研究”。

“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”

一种经常引用的英文定义是:Acomputerprogramissaidtolearnfromexperience(E)withrespecttosomeclassoftasks(T)andperformance(P)measure,ifitsperformanceattasksinT,asmeasuredbyP,improveswithexperienceE。如果你对大数据开发感兴趣,想系统学习大数据的话,可以加入大数据技术学习交流扣扣群:4583+数字45782,欢迎添加,私信管理员,了解课程介绍,获取学习资源

可以看出机器学习强调三个关键词:算法、经验、性能,其处理过程如图所示。

▲机器学习处理流程

上图表明机器学习是使数据通过算法构建出模型,然后对模型性能进行评估,评估后的指标,如果达到要求就用这个模型测试新数据,如果达不到要求就要调整算法重新建立模型,再次进行评估,如此循环往复,最终获得满意结果。

02大数据与机器学习

我们已进入大数据时代,产生数据的能力空前高涨,如互联网、移动网、物联网、成千上万的传感器、穿戴设备、GPS等等,存储数据、处理数据等能力也得到了几何级数的提升,如Hadoop、Spark技术为我们存储、处理大数据提供有效方法。

数据就是信息、就是依据,其背后隐含了大量不易被我们感官识别的信息、知识、规律等等,如何揭示这些信息、规则、趋势,正成为当下给企业带来高回报的热点。

而机器学习的任务,就是要在基于大数据量的基础上,发掘其中蕴含并且有用的信息。其处理的数据越多,机器学习就越能体现出优势,以前很多用机器学习解决不了或处理不好的问题,通过提供大数据得到很好解决或性能的大幅提升,如语言识别、图像设别、天气预测等等。

03机器学习、人工智能及深度学习

人工智能和机器学习这两个科技术语如今已经广为流传,已成为当下的热词,然而,他们间有何区别?又有哪些相同或相似的地方?虽然人工智能和机器学习高度相关,但却并不尽相同。

人工智能是计算机科学的一个分支,目的是开发一种拥有智能行为的机器,目前很多大公司都在努力开发这种机器学习技术。他们都在努力让电脑学会人类的行为模式,以便推动很多人眼中的下一场技术革命——让机器像人类一样“思考”。

过去10年,机器学习已经为我们带来了无人驾驶汽车、实用的语音识别、有效的网络搜索等等。接下来人工智能将如何改变我们的生活?在哪些领域最先发力?我们拭目以待。

对很多机器学习来说,特征提取不是一件简单的事情。在一些复杂问题上,要想通过人工的方式设计有效的特征集合,往往要花费很多的时间和精力。

深度学习解决的核心问题之一就是自动地将简单的特征组合成更加复杂的特征,并利用这些组合特征解决问题。深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联以外,还能自动从简单特征中提取更加复杂的特征。下图展示了深度学习和传统机器学习在流程上的差异。如图所示,深度学习算法可以从数据中学习更加复杂的特征表达,使得最后一步权重学习变得更加简单且有效。

▲机器学习与深度学习流程对比

前面我们分别介绍了机器学习、人工智能及深度学习,它们间的关系如何?

 

▲人工智能、机器学习与深度学习间的关系

人工智能、机器学习和深度学习是非常相关的几个领域。上图说明了它们之间大致关系。人工智能是一类非常广泛的问题,机器学习是解决这类问题的一个重要手段,深度学习则是机器学习的一个分支。在很多人工智能问题上,深度学习的方法突破了传统机器学习方法的瓶颈,推动了人工智能领域的快速发展。

04机器学习的基本任务

机器学习基于数据,并以此获取新知识、新技能。它的任务有很多,分类是其基本任务之一。分类就是将新数据划分到合适的类别中,一般用于类别型的目标特征,如果目标特征为连续型,则往往采用回归方法。回归是对新目标特征进行预测,是机器学习中使用非常广泛的方法之一。

分类和回归,都是先根据标签值或目标值建立模型或规则,然后利用这些带有目标值的数据形成的模型或规则,对新数据进行识别或预测。这两种方法都属于监督学习。与监督学习相对是无监督学习,无监督学习不指定目标值或预先无法知道目标值,它可以将把相似或相近的数据划分到相同的组里,聚类就是解决这一类问题的方法之一。

除了监督学习、无监督学习这两种最常见的方法外,还有半监督学习、强化学习等方法,这里我们就不展开了,下图展示了这些基本任务间的关系。

▲机器学习基本任务的关系

05如何选择合适算法

当我们接到一个数据分析或挖掘的任务或需求时,如果希望用机器学习来处理,首要任务是根据任务或需求选择合适算法,选择哪种算法较合适?分析的一般步骤为:

▲选择算法的一般步骤

充分了解数据及其特性,有助于我们更有效地选择机器学习算法。采用以上步骤在一定程度上可以缩小算法的选择范围,使我们少走些弯路,但在具体选择哪种算法方面,一般并不存在最好的算法或者可以给出最好结果的算法,在实际做项目的过程中,这个过程往往需要多次尝试,有时还要尝试不同算法。不过先用一种简单熟悉的方法,然后,在这个基础上不断优化,时常能收获意想不到的效果。

06Spark在机器学习方面的优势

在大数据上进行机器学习,需要处理全量数据并进行大量的迭代计算,这要求机器学习平台具备强大的处理能力。Spark与Hadoop兼容,它立足于内存计算,天然的适应于迭代式计算,Spark是一个大数据计算平台,在这个平台上,有我们大家熟悉的SQL式操作组件SparkSQL;功能强大、性能优良的机器学习库SparkMLlib;还有图像处理的SparkGraphx及用于流式处理的SparkStreaming等,具体有以下优势:

完整的大数据生态系统:我们大家熟悉的SQL式操作组件SparkSQL,还有功能强大、性能优良的机器学习库SparkMLlib、图像计算的SparkGraphx及用于流式处理的SparkStreaming等。

高性能的大数据计算平台:因为数据被加载到集群主机的分布式内存中。数据可以被快速的转换迭代,并缓存后续的频繁访问需求。基于内存运算,Spark可以比Hadoop快100倍,在磁盘中运算也比hadoop快10倍左右。

与Hadoop、Hive、HBase等无缝连接:Spark可以直接访问Hadoop、Hive、Hbase等的数据,同时也可使用Hadoop的资源管理器。

易用、通用、好用:Spark编程非常高效、简洁,支持多种语言的API,如Scala、Java、Python、R、SQL等,同时提供类似于shell的交互式开发环境REPL。

07小结

本文简单介绍了机器学习与大数据,与人工智能的关系。同时也介绍了机器学习的一些基本任务和如何选择合适算法等问题,在选择机器学习平台时,这里我们介绍了Spark这样一个大数据平台的集大成者,它有很多优势,而且也得到越来越多企业的青睐。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇