人工智能让冬奥会气象预报更精准
2月8日,当看到中国选手谷爱凌以漂亮的高难度动作夺得自由式滑雪女子大跳台金牌时,北京大学重庆大数据研究院博士张烺忍不住欢呼起来。她对于冬奥会比赛的关注相比普通观众更多了一份关切,因为她所在团队的研究成果正保障着冬奥会的气象预报。
在中国科学院院士、北京大学副校长、北京大学重庆大数据研究院首席科学家张平文领衔下,该院研究团队参与了国家重点研发计划“科技冬奥”重点专项项目“冬奥赛场定点气象要素客观预报技术研究及应用”课题研究,开发出人工智能MOML算法赋能天气预报模型,使预报更精准。
相比夏奥,冬奥会的举行受天气影响更大。其气象保障是冬季复杂地形条件下的中小尺度边界层气象问题,为了让奥运健儿在赛场上有良好发挥,往往对预报的精细度要求更高,甚至达到百米级、分钟级,这一直是国际气象界的难点。
“我们的研究是通过人工智能算法,对天气预报模式的结果进行订正,让其更精准。”张烺是北京大学重庆大数据研究院智能会商与人工智能天气预报实验室的博士,她介绍,气象业务中会产生海量的气象数据,目前全球广泛采用的数值天气预报模式,是通过大型计算机作数值计算,用物理方程表达天气演变的物理过程,从而预测一段时间内大气运动状态和气象。全球数值天气预报能力不断提高,基本上可以解决大部分区域的大尺度预报问题,但针对小尺度、精细化的预报需求,数值计算存在误差,预报员还需要通过会商给出预报结论。
以往会商对预报员依赖度很高,需要综合各方数据并结合自身经验对模式输出数据偏差进行订正。而人工智能算法在融合、处理信息中的先天优势,它在一定程度上可以代替预报员在会商中整合、分析信息的过程,通过数据挖掘、学习,将预报员的经验内化在算法中,实现智能、高效的预报。由张平文院士领衔的研究团队开发出预报员的人工智能算法MOML,实现了智能订正,提高了预报效率的同时进一步提高预报的准确率。
“对于模式输出数据偏差的订正方法,国内外均开展了广泛研究。”张烺介绍,如以前采用的MOS方法,主要针对单站进行订正,如果想得到较理想的订正结果,需要人工进行参数调整,准确率提高有限,而通过人工智能算法,可以实现对格点进行预报。目前,MOML算法在温度、湿度、风速、风向等天气要素上已取得突破,不仅可以很好地辅助预报员,大幅减少预报员的工作量,相比常规方法来说,它将预报的准确性提高了10%以上。
据了解,北京冬奥会已经实现了气象短时临近预报“百米级尺度、分钟级更新”,可快速生成覆盖冬奥山地赛场的100米分辨率、逐10分钟更新的网格化温、湿、风、降水等天气要素客观分析以及0到12小时预报产品。
张烺表示,除了服务冬奥会,他们团队也正在对MOML算法在气象预报中的应用进行进一步研究,针对重庆更加复杂的山地环境,他们正在与重庆市气象局合作,让相关研究成果在重庆应用。(记者雍黎)
[责编:赵宇豪]人工智能、机器学习和深度学习的概念、联系与区别
本文属于转载内容,文章来源:小白都能看懂:人工智能、机器学习和深度学习的联系与区别!创建于:2023.01.30
文章目录1、人工智能(ArtificialIntelligence)2、机器学习(MachineLearning)3、深度学习(DeepLearning)4、总结注:为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。
人工智能,即ArtificialIntelligence,简称AI。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
“人工智能”是“一门技术科学”,它研究与开发的对象是“理论、技术及应用系统”,研究的目的是为了“模拟、延伸和扩展人的智能”。这就如同物理学、数学科学一样,是一个非常庞大的范畴和研究体系。
1、人工智能(ArtificialIntelligence)人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。“人工智能”是“一门技术科学”,它研究与开发的对象是“理论、技术及应用系统”,研究的目的是为了“模拟、延伸和扩展人的智能”。我们现在看到的貌似很高端的技术,如图像识别、NLP,其实依然没有脱离这个范围,就是“模拟人在看图方面的智能”和“模拟人在听话方面的智能”,本质上和“模拟人在计算方面的智能”没啥两样,虽然难度有高低,但目的是一样的——模拟、延伸和扩展人的智能。另外,人工智能在50年代就提出了。
人工智能研究目的:促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能的研究领域也在不断扩大,下图展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。
通常将人工智能分为弱人工智能和强人工智能
前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题。
2、机器学习(MachineLearning)随着人对计算机科学的期望越来越高,要求它解决的问题越来越复杂,已经远远不能满足人们的诉求了。于是有人提出了一个新的思路——能否不为难码农,让机器自己去学习呢?
机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务;相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。这里有三个重要的信息:1、“机器学习”是“模拟、延伸和扩展人的智能”的一条路径,所以是人工智能的一个子集;2、“机器学习”是要基于大量数据的,也就是说它的“智能”是用大量数据喂出来的;3、正是因为要处理海量数据,所以大数据技术尤为重要;“机器学习”只是大数据技术上的一个应用。常用的10大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。
3、深度学习(DeepLearning)相较而言,深度学习是一个比较新的概念,严格地说是2006年提出的。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点,是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和自然语言处理(NLP)领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者我们可以将“深度学习”称之为“改良版的神经网络”算法。深度学习又分为卷积神经网络(Convolutionalneuralnetworks,简称CNN)和深度置信网(DeepBeliefNets,简称DBN)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。所以看起来的处理方式有点像下图(想深入了解的同学可以自行google)。
神经网络的计算量非常大,事实上在很长时间里由于基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一下子火热起来。击败李世石的Alphago即是深度学习的一个很好的示例。Google的TensorFlow是开源深度学习系统一个比较好的实现,支持CNN、RNN和LSTM算法,是目前在图像识别、自然语言处理方面最流行的深度神经网络模型。事实上,提出“深度学习”概念的Hinton教授加入了google,而Alphago也是google家的。
所以综合来说,三者的区别和联系,可以概括如下:
4、总结人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还需要更高的运算能力支撑,如GPU。
文章来源:小白都能看懂:人工智能、机器学习和深度学习的联系与区别!
统计学,数据挖掘,机器学习和人工智能之间的区别及联系
统计学,数据挖掘,机器学习和人工智能之间的区别及联系首先,让我们来对这些学科进行大致的了解
①:统计学统计学是在资料分析的基础上,自17世纪中叶产生并逐步发展起来的一门学科,它是研究如何测定、收集、整理、归纳和分析反应数据资料,一边给出正确信息的科学。统计学广泛的应用在各门科学,从自然科学、社会科学到人文科学,甚至被用来做工商业和政府的情报决策。随着大数据时代的来临,统计的面貌也逐步被改变,与信息、计算机等领域密切结合,是数据科学(DataScience)中的重要主轴之一。
②:数据挖掘在当今大数据时代,企业有大量可用的数据,数量巨大,其价值和知识是不可估量的。如何从这些海量混乱的数据中获取有价值的信息,帮助企业更好地发展,是许多企业迫切需要解决的问题之一。
数据挖掘是指通过算法从大量数据中搜索隐藏在其中的信息的过程,通过数据挖掘我们可以从海量错综复杂,看似毫无关联的数据中提取出有用的信息,发挥出信息的价值;在我看来,数据挖掘更像是大数据处理的一个基础,为我们数据的处理并提取有用的信息打下了坚实的基础。
此外,传统的数据挖掘一般只能支持单机小规模数据处理。由于这种限制,传统的数据分析挖掘一般采用抽样方法来减少数据分析的规模,这也导致分析结果不准确。将计算机技术运用于数据挖掘之中,我们可以进行数据的可视化分析,数据挖掘算法,预测性分析,语义引擎及数据质量及数据管理。以上技术的发展提高了分析结果的准确性。
③:机器学习机器学习被认为是人工智能的一方面:给定一些可用离散术语(例如,在一些行为中,那个行为是正确的)描述的人工智能问题,并给出关于这个世界的大量信息,在没有程序员进行编程的情况下弄清楚「正确」的行为。典型的是,需要一些外部流程判断行为是否正确。在数学术语中,也就是函数:馈入输入,产生正确的输出。所以整个问题就是以自动化的方式建立该数学函数的模型。在二者进行区分时:如果我写出的程序聪明到表现出人类行为,它就是人工智能。但如果它的参数不是自动从数据进行学习,它就不是机器学习。
④:人工智能人工智能是计算机科学的一个子领域,创造于20世纪60年代,它涉及到解决对人类而言简单却对计算机很难的任务。详细来说,所谓的强人工智能系统应该是能做人类所能做的任何事。而深度学习是如今非常流行的一种机器学习。
而对于工作岗位,在一家创业公司,数据科学家通常要做很多类型的工作,其扮演的工作角色可能包括:执行、数据挖掘师、数据工程师或架构师、研究员、统计学家、建模师(做预测建模等等)和开发人员。
机器学习对比深度学习这些都是数据科学的分支。当这些算法被用于自动化的时候,就像在自动飞行或无人驾驶汽车中,它被称为人工智能,更具体的细说,就是深度学习。如果数据收集自传感器,通过互联网进行传输,那就是机器学习或数据科学或深度学习应用到了IoT上。机器学习一系列在数据集上进行训练的算法,来做出预测或采取形同从而对系统进行优化。
机器学习与统计学之间的区别《MachineLearningVs.Statistics》这篇文章试图解答这个问题。这篇文章的作者认为统计学是带有置信区间(confidenceintervals)的机器学习,是为了预测或估计数量。
数据科学对比机器学习机器学习和统计学都是数据科学的一部分。机器学习中的学习一词表示算法依赖于一些数据,来调整模型或算法的参数;这包含了许多的技术,比如回归、朴素贝叶斯或监督聚类。但不是所有的技术都适合机器学习;数据科学要比机器学习广泛。数据科学中的数据可能并非来自机器或机器处理(调查数据可能就是手动收集,临床试验涉及到专业类型的小数据)。