博舍

人工智能的冬天,真的要来了吗 人工智能冬天

人工智能的冬天,真的要来了吗

尽管如今人工智能正在给我们的行业带来许多革命性的变化,并且在全球劳动力市场中逐渐取代人力,但很多专家依旧在思考,人工智能应用是否已经遇到瓶颈。查尔斯·崔曾表示,当今深度学习系统的弱点正变得越来越明显。

 

然而,研究人员认为,人工智能的未来依旧是美好的。但是可能在不久的将来,会迎来人工智能的冬天,在在此之后,人工智能工程师们将以各种创新突破桎梏,引领我们进入机器思维的永恒之夏。

 

随着互联网的蓬勃发展,人工智能行业有足够多的图片、声音、视频等各类数据来训练神经网络并进行广泛应用。人工智能自1993年以来,取得的进步愈发显著,然而,面对汹涌而至的海量数据和不断复杂的算法,我们正在接近一个芯片上可以安装装晶体管数量理论上的物理极限。虽然可以通过一些短期解决方案如调整芯片设计以适应人工智能应用程序,但当我们用尽了能优化传统芯片设计的方案之后又会出现什么情况呢?

但直到目前,可实现“量子霸权”、比传统计算机更加高效的量子计算机还不存在。如果我们在真正的“量子霸权”到来之前就达到了传统计算能力的极限,恐怕未来还会出现人工智能的又一个冬天。人工智能研究人员正努力解决的问题日益复杂,并推动着我们去实现阿兰·图灵对人工通用人工智能的愿景。然而,仍存在大量工作要做。同时,没有量子计算的帮助,我们将很能实现人工智能的全部潜力。

 

 

 

虽然现在无法笃定人工智能的冬天是否会到来,但是我们仍需要保持警惕,意识到潜在的风险并密切关注迹象,在情况到来之前做好充足准备。

人工智能课程设计报告

人工智能课程设计报告1.引言

随着我国经济快速发展,城市人口急剧增加,带来了一系列的社会问题。交通拥堵,环境遭到破坏,公共交通的快速发展可以有效解决人们出行和交通拥堵的问题。自行车具有机动灵活、低碳环保的优点,若自行车可以取代现在的机动车,那么道路就不会那么拥挤,人们的出行效率就会大大提升,汽车废气的排放量也将大大的减少,环境的质量也会提升。同时,为了完美的解决从地铁站到公司、从公交站到家的“最后一公里”路程,共享单车应运而生.共享单车有效的解决了“走路累,公交挤,开车堵,打车贵”的苦恼。一夜之间,北上广深、甚至部分二线城市,共享单车大街小巷随处可见。继2016年9月26日ofo单车宣布获得滴滴快车数千万美元的战略投资,双方将在共享单车领域展开深度合作之后,摩拜单车也于2017年1月完成D轮2.15亿美元(约合人民币15亿元)的融资,国内共享单车更加火爆,最近一张手机截屏蹿红网络。在这张截图上,24个共享单车应用的图标霸满了整个手机屏幕,真的是“一图说明共享单车的激烈竞争”。而在街头,仿佛一夜之间,共享单车已经到了“泛滥”的地步,各大城市路边排满各种颜色的共享单车。共享经济的不断发展逐渐的改变着人们的日常生活,共享精神也逐渐深入人心。1.1任务要求要求运用人工智能相关理论和方法设计计算机系统解决实际问题。2.详细设计2.1设计步骤1.共享单车骑行数据的获取运用python库(BeautifulSoup,requests,scrapy)对优易数据网站(http://www.youedata.com/)Kaggle和进行爬取共享单车的骑行数据。将爬取的数据写入csv文件中:分析数据集:数据集来源于加利福尼亚大学欧文分校(UCI)大学的公开数据集:https://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset,本次数据集的信息参考该网站。共享单车数据集包含有两个文件,一个是按天来统计的共享单车使用量数据,另一个是按照小时数来统计的使用量。共享单车数据集是在2011年至2012年间收集的,此处的共享单车是采用固定桩形式的单车,类似于中国的永安行,并不是我们目前所看到的满大街的小黄车,摩拜之类。本数据集总共有17389个样本,每个样本有16列,其中,前两列是样本序号和日期,最后三列数据是不同类型的输出结果。

2.导入并理解数据

首先导入并读取查看训练数据和测试数据:

测试数据共7列,10886行,且所以数据完整,没有缺失。然后需要我们通过模型来进行预测。导包:3.数据处理与分析在数据处理过程中,最好将训练数据与测试数据合并在一起进行处理,方便特征的转换。通过查看数据,确保测试数据均无缺失,或不一致。特别是在,日期时间特征由年、月、日和具体小时组成。可以根据日期计算其星期,然后就可以将日期时间拆分成年、月、日和星期5个特点。分析按天来统计的共享单车使用量数据集:4.数据分析规范数据后,快速查看各影响因素的结果:从相关系数,不同月份、季节对骑行人数的影响。未来更加值观地展现所有特征之间的影响,通过绘制柱状图来实现。接下来,深入分析各特征的影响规律,对每个特征进行可视化:由随机森林模型预测分析:结果说明:Instant记录号Dteday:日期Season:季节(1=春天、2=夏天、3=秋天、4=冬天)yr:年份,(0:2011,1:2012)mnth:月份(1to12)hr:小时(0to23)(在hour.csv有)holiday:是否是节假日weekday:星期中的哪天,取值为0~6workingday:是否工作日1=工作日(是否为工作日,1为工作日,0为周末或节假日weathersit:天气(1:晴天,多云;2:雾天,阴天;3:小雪,小雨;4:大雨,大雪,大雾)temp:气温摄氏度atemp:体感温度hum:湿度windspeed:风速casual:非注册用户个数registered:注册用户个数cnt:给定日期(天)时间(每小时)总租车人数,响应变量y(cnt=casual+registered)1.输出结果可以看出,这个数据集中没有缺失值,且每一列的数据特征都一致的,不需要进行额外的修改2.数据集中的season等7列是int64类型,意味着这些数据需要重新转换为独热编码格式,season中的1=spring,2=summer,3=autumn,4=winter,需改成独热编码形成的稀疏矩阵。构建随机森林回归模型:直接使用随机森林回归模型直接拟合

绘制不同特征的相对重要性直方图:3.关键技术1.导包操作:科学计算包nnumpy,pandas。可视化工具matplotlib,seabornMatplotlib是一个python的2d绘图库,我们可以通过这个库将数据绘制成各种2D图形(直方图、散点图,条形图等)。2.我们做数据可视化,其实就是对数据进行分析,pandas是一个非常强大的数据分析工具包。通常使用pandas进行下列图形的快速绘图:1.‘line’2.‘bar’forbarplots3.‘box’forboxplot4.‘area’forareaplots5.‘scatter’forscatterplots3.NumPy(NumericalPython)是目前Python数值计算中最为重要的基础包,主要包含以下内容:·高效多维数组ndarray,提供了基于数组的便捷算数操作以及灵活的广播功能;·对所有数据进行快速的矩阵计算,而无需编写循环程序;·对硬盘中数组数据进行读写的工具,并对内存映射文件进行操作;·线性代数、随机数生成以及傅里叶变换功能;·用于连接NumPy到C、C++和FORTRAN语言类库的C语言API。4.Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。5.在Python中,有很多数据可视化途径。Matplotlib非常强大,也很复杂,不易于学习。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。

4.运行结果4.1运行环境硬件配置:Cpu主频2.80GHz,8GB内存软件配置:Windows操作系统(x86),python3.6,pycharm4.2运行结果打印初始数据集:直接使用随机森林回归模型结果:不同特征的相对重要性直方图:

数据可视化分析

一周内骑行时间分析

不同月份骑行人数可视化分析4.3实验结果分析

1.在没有对数据集进行任何处理的情况下,采取了默认的随机森林回归模型得到的模型在测试集上的MSE很大,解释方差分和R2都是0.93,表明模拟还可以。2.从相对重要性图中可以看出,温度对共享单车的使用有较大的影响性,从正常生活中可以理解,冬天太冷或夏天太热,骑行共享单车的人数就会显著减少。所获取的数据集是2011和2012年的,如果要得到更加可信的结果,还需要更多年份的数据。

1.可以从图表中看出秋季和冬季的骑行人数较多,可能是气候的原因,太热人们不愿意骑车出行2.早上上班和晚上下班高峰期,骑行人数有明显的增加,反观工作时间,骑车的人数较少,上下班时段为使用共享单车的高峰。3.非工作日中人们出行可能会更多使用汽车或其他公共交通出行,工作日中使用共享单车较多,周末时可能数量会相对减少。

1.在夏季5,6,7,8月份是全年的共享单车使用最多的时候,相比12月与1月是全年用车低峰,冬季户外太冷,共享单车使用急剧下降。5.心得和结论5.1结论和体会本次人工智能课程设计完成了对共享单车数据的分析和数据可视化,从中更加直观的反映不同月份,不同时间共享单车的使用情况,以及使用随机森林回归模型反应影响共享单车使用的因子的重要性。设计中通过直方图,曲线图等图表简练地反映了共享单车的使用情况。但由于数据集采用的年份较少,不能得到一个更加可信的参考结果,因此还需要更多年份的数据。影响共享单车使用还有地域等等客观因素,这些还没考虑周全,希望以后能完善对其的研究。设计中遇到的问题:1)normalize是标准化,另外你这里分别对训练和测试数据标准化是有问题的。分别处理会导致数据分布变得不一样。2)数据特征工程做的少,类别型特征没有处理。3)模型跑出来之后,完全没有结果的解析主要参考文献[1]加利福尼亚大学欧文分校(UCI)大学的公开数据集https://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset,访问日期:2019年12月.[2]优易数据网站http://www.youedata.com/,访问时间:2019年12月[3]Python机器学习经典实例,PrateekJoshi著,陶俊杰,陈小莉译[4]《ProbabilisticGraphicalModels-PrinciplesandTechniques》Koller著[5]《IntroductiontoMathematicalStatistics》第六版,Hogg著[6]TwoFacesofActiveLearning50,Dasgupta,2011[7]ActiveLearningLiteratureSurvey8,Settles,2010[8]ASurveyofOnlineFailurePredictionMethods2,Salfner,2010[9]《统计学习方法》作者李航[10]《机器学习及其应用》周志华、杨强主编。[11]《数学之美》,作者吴军[12]《PatternClassification》(《模式分类》第二版)作者RichardO.Duda[5]、PeterE.Hart、David。

人工智能让冬奥会气象预报更精准

2月8日,当看到中国选手谷爱凌以漂亮的高难度动作夺得自由式滑雪女子大跳台金牌时,北京大学重庆大数据研究院博士张烺忍不住欢呼起来。她对于冬奥会比赛的关注相比普通观众更多了一份关切,因为她所在团队的研究成果正保障着冬奥会的气象预报。

在中国科学院院士、北京大学副校长、北京大学重庆大数据研究院首席科学家张平文领衔下,该院研究团队参与了国家重点研发计划“科技冬奥”重点专项项目“冬奥赛场定点气象要素客观预报技术研究及应用”课题研究,开发出人工智能MOML算法赋能天气预报模型,使预报更精准。

相比夏奥,冬奥会的举行受天气影响更大。其气象保障是冬季复杂地形条件下的中小尺度边界层气象问题,为了让奥运健儿在赛场上有良好发挥,往往对预报的精细度要求更高,甚至达到百米级、分钟级,这一直是国际气象界的难点。

“我们的研究是通过人工智能算法,对天气预报模式的结果进行订正,让其更精准。”张烺是北京大学重庆大数据研究院智能会商与人工智能天气预报实验室的博士,她介绍,气象业务中会产生海量的气象数据,目前全球广泛采用的数值天气预报模式,是通过大型计算机作数值计算,用物理方程表达天气演变的物理过程,从而预测一段时间内大气运动状态和气象。全球数值天气预报能力不断提高,基本上可以解决大部分区域的大尺度预报问题,但针对小尺度、精细化的预报需求,数值计算存在误差,预报员还需要通过会商给出预报结论。

以往会商对预报员依赖度很高,需要综合各方数据并结合自身经验对模式输出数据偏差进行订正。而人工智能算法在融合、处理信息中的先天优势,它在一定程度上可以代替预报员在会商中整合、分析信息的过程,通过数据挖掘、学习,将预报员的经验内化在算法中,实现智能、高效的预报。由张平文院士领衔的研究团队开发出预报员的人工智能算法MOML,实现了智能订正,提高了预报效率的同时进一步提高预报的准确率。

“对于模式输出数据偏差的订正方法,国内外均开展了广泛研究。”张烺介绍,如以前采用的MOS方法,主要针对单站进行订正,如果想得到较理想的订正结果,需要人工进行参数调整,准确率提高有限,而通过人工智能算法,可以实现对格点进行预报。目前,MOML算法在温度、湿度、风速、风向等天气要素上已取得突破,不仅可以很好地辅助预报员,大幅减少预报员的工作量,相比常规方法来说,它将预报的准确性提高了10%以上。

据了解,北京冬奥会已经实现了气象短时临近预报“百米级尺度、分钟级更新”,可快速生成覆盖冬奥山地赛场的100米分辨率、逐10分钟更新的网格化温、湿、风、降水等天气要素客观分析以及0到12小时预报产品。

张烺表示,除了服务冬奥会,他们团队也正在对MOML算法在气象预报中的应用进行进一步研究,针对重庆更加复杂的山地环境,他们正在与重庆市气象局合作,让相关研究成果在重庆应用。(记者雍黎)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇