人工智能课程设计报告
人工智能课程设计报告1.引言随着我国经济快速发展,城市人口急剧增加,带来了一系列的社会问题。交通拥堵,环境遭到破坏,公共交通的快速发展可以有效解决人们出行和交通拥堵的问题。自行车具有机动灵活、低碳环保的优点,若自行车可以取代现在的机动车,那么道路就不会那么拥挤,人们的出行效率就会大大提升,汽车废气的排放量也将大大的减少,环境的质量也会提升。同时,为了完美的解决从地铁站到公司、从公交站到家的“最后一公里”路程,共享单车应运而生.共享单车有效的解决了“走路累,公交挤,开车堵,打车贵”的苦恼。一夜之间,北上广深、甚至部分二线城市,共享单车大街小巷随处可见。继2016年9月26日ofo单车宣布获得滴滴快车数千万美元的战略投资,双方将在共享单车领域展开深度合作之后,摩拜单车也于2017年1月完成D轮2.15亿美元(约合人民币15亿元)的融资,国内共享单车更加火爆,最近一张手机截屏蹿红网络。在这张截图上,24个共享单车应用的图标霸满了整个手机屏幕,真的是“一图说明共享单车的激烈竞争”。而在街头,仿佛一夜之间,共享单车已经到了“泛滥”的地步,各大城市路边排满各种颜色的共享单车。共享经济的不断发展逐渐的改变着人们的日常生活,共享精神也逐渐深入人心。1.1任务要求要求运用人工智能相关理论和方法设计计算机系统解决实际问题。2.详细设计2.1设计步骤1.共享单车骑行数据的获取运用python库(BeautifulSoup,requests,scrapy)对优易数据网站(http://www.youedata.com/)Kaggle和进行爬取共享单车的骑行数据。将爬取的数据写入csv文件中:分析数据集:数据集来源于加利福尼亚大学欧文分校(UCI)大学的公开数据集:https://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset,本次数据集的信息参考该网站。共享单车数据集包含有两个文件,一个是按天来统计的共享单车使用量数据,另一个是按照小时数来统计的使用量。共享单车数据集是在2011年至2012年间收集的,此处的共享单车是采用固定桩形式的单车,类似于中国的永安行,并不是我们目前所看到的满大街的小黄车,摩拜之类。本数据集总共有17389个样本,每个样本有16列,其中,前两列是样本序号和日期,最后三列数据是不同类型的输出结果。
2.导入并理解数据首先导入并读取查看训练数据和测试数据:
测试数据共7列,10886行,且所以数据完整,没有缺失。然后需要我们通过模型来进行预测。导包:3.数据处理与分析在数据处理过程中,最好将训练数据与测试数据合并在一起进行处理,方便特征的转换。通过查看数据,确保测试数据均无缺失,或不一致。特别是在,日期时间特征由年、月、日和具体小时组成。可以根据日期计算其星期,然后就可以将日期时间拆分成年、月、日和星期5个特点。分析按天来统计的共享单车使用量数据集:4.数据分析规范数据后,快速查看各影响因素的结果:从相关系数,不同月份、季节对骑行人数的影响。未来更加值观地展现所有特征之间的影响,通过绘制柱状图来实现。接下来,深入分析各特征的影响规律,对每个特征进行可视化:由随机森林模型预测分析:结果说明:Instant记录号Dteday:日期Season:季节(1=春天、2=夏天、3=秋天、4=冬天)yr:年份,(0:2011,1:2012)mnth:月份(1to12)hr:小时(0to23)(在hour.csv有)holiday:是否是节假日weekday:星期中的哪天,取值为0~6workingday:是否工作日1=工作日(是否为工作日,1为工作日,0为周末或节假日weathersit:天气(1:晴天,多云;2:雾天,阴天;3:小雪,小雨;4:大雨,大雪,大雾)temp:气温摄氏度atemp:体感温度hum:湿度windspeed:风速casual:非注册用户个数registered:注册用户个数cnt:给定日期(天)时间(每小时)总租车人数,响应变量y(cnt=casual+registered)1.输出结果可以看出,这个数据集中没有缺失值,且每一列的数据特征都一致的,不需要进行额外的修改2.数据集中的season等7列是int64类型,意味着这些数据需要重新转换为独热编码格式,season中的1=spring,2=summer,3=autumn,4=winter,需改成独热编码形成的稀疏矩阵。构建随机森林回归模型:直接使用随机森林回归模型直接拟合
绘制不同特征的相对重要性直方图:3.关键技术1.导包操作:科学计算包nnumpy,pandas。可视化工具matplotlib,seabornMatplotlib是一个python的2d绘图库,我们可以通过这个库将数据绘制成各种2D图形(直方图、散点图,条形图等)。2.我们做数据可视化,其实就是对数据进行分析,pandas是一个非常强大的数据分析工具包。通常使用pandas进行下列图形的快速绘图:1.‘line’2.‘bar’forbarplots3.‘box’forboxplot4.‘area’forareaplots5.‘scatter’forscatterplots3.NumPy(NumericalPython)是目前Python数值计算中最为重要的基础包,主要包含以下内容:·高效多维数组ndarray,提供了基于数组的便捷算数操作以及灵活的广播功能;·对所有数据进行快速的矩阵计算,而无需编写循环程序;·对硬盘中数组数据进行读写的工具,并对内存映射文件进行操作;·线性代数、随机数生成以及傅里叶变换功能;·用于连接NumPy到C、C++和FORTRAN语言类库的C语言API。4.Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。5.在Python中,有很多数据可视化途径。Matplotlib非常强大,也很复杂,不易于学习。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。
4.运行结果4.1运行环境硬件配置:Cpu主频2.80GHz,8GB内存软件配置:Windows操作系统(x86),python3.6,pycharm4.2运行结果打印初始数据集:直接使用随机森林回归模型结果:不同特征的相对重要性直方图:
数据可视化分析
一周内骑行时间分析
不同月份骑行人数可视化分析4.3实验结果分析
1.在没有对数据集进行任何处理的情况下,采取了默认的随机森林回归模型得到的模型在测试集上的MSE很大,解释方差分和R2都是0.93,表明模拟还可以。2.从相对重要性图中可以看出,温度对共享单车的使用有较大的影响性,从正常生活中可以理解,冬天太冷或夏天太热,骑行共享单车的人数就会显著减少。所获取的数据集是2011和2012年的,如果要得到更加可信的结果,还需要更多年份的数据。
1.可以从图表中看出秋季和冬季的骑行人数较多,可能是气候的原因,太热人们不愿意骑车出行2.早上上班和晚上下班高峰期,骑行人数有明显的增加,反观工作时间,骑车的人数较少,上下班时段为使用共享单车的高峰。3.非工作日中人们出行可能会更多使用汽车或其他公共交通出行,工作日中使用共享单车较多,周末时可能数量会相对减少。
1.在夏季5,6,7,8月份是全年的共享单车使用最多的时候,相比12月与1月是全年用车低峰,冬季户外太冷,共享单车使用急剧下降。5.心得和结论5.1结论和体会本次人工智能课程设计完成了对共享单车数据的分析和数据可视化,从中更加直观的反映不同月份,不同时间共享单车的使用情况,以及使用随机森林回归模型反应影响共享单车使用的因子的重要性。设计中通过直方图,曲线图等图表简练地反映了共享单车的使用情况。但由于数据集采用的年份较少,不能得到一个更加可信的参考结果,因此还需要更多年份的数据。影响共享单车使用还有地域等等客观因素,这些还没考虑周全,希望以后能完善对其的研究。设计中遇到的问题:1)normalize是标准化,另外你这里分别对训练和测试数据标准化是有问题的。分别处理会导致数据分布变得不一样。2)数据特征工程做的少,类别型特征没有处理。3)模型跑出来之后,完全没有结果的解析主要参考文献[1]加利福尼亚大学欧文分校(UCI)大学的公开数据集https://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset,访问日期:2019年12月.[2]优易数据网站http://www.youedata.com/,访问时间:2019年12月[3]Python机器学习经典实例,PrateekJoshi著,陶俊杰,陈小莉译[4]《ProbabilisticGraphicalModels-PrinciplesandTechniques》Koller著[5]《IntroductiontoMathematicalStatistics》第六版,Hogg著[6]TwoFacesofActiveLearning50,Dasgupta,2011[7]ActiveLearningLiteratureSurvey8,Settles,2010[8]ASurveyofOnlineFailurePredictionMethods2,Salfner,2010[9]《统计学习方法》作者李航[10]《机器学习及其应用》周志华、杨强主编。[11]《数学之美》,作者吴军[12]《PatternClassification》(《模式分类》第二版)作者RichardO.Duda[5]、PeterE.Hart、David。
信息技术环境下智慧课堂的构建研究
智慧课堂的实现依赖于学校信息化教学平台的构建,信息化教学平台基于互联网、云计算和大数据等现代信息技术,打破了传统的“学校—教室—教师—学生”的教学常态,为教师和学生提供一种智能化、个性化、多样化的教学环境。信息化教学平台一般由以下四个层次构成:云终端接入层(PC机、智能手机、ipad)、虚拟实验平台层(统一身份认证、访问控制、数据分析)、资源虚拟化平台层(虚拟计算资源、虚拟存储资源、虚拟网络资源)和云基础设施硬件层(服务器集群、网络设备、存储设备)。信息化教学平台的硬件拓扑见图1。
图1信息化教学平台的硬件拓扑
信息化教学平台以私有云模式为基础,在云基础设施硬件层通过光纤连接服务器集群和各类存储资源;在资源虚拟化平台层通过虚拟化技术将硬件资源如计算、网络、存储资源等映射为逻辑资源,通过CloudStack云计算管理软件实现各类资源的统一管理和分配;在虚拟实验平台层用户通过统一身份认证后,可以申请虚拟化后的计算、网络和存储资源,在虚拟机上实现实验环境的部署和教学资源的共享;在云终端接入层,教师和学生通过智能终端登录信息化教学平台,获取云平台上的计算服务、网络服务和存储服务。信息化教学平台的建设遵循“以学生为中心”的原则,充分体现了教育的自由、平等和开放原则,并且平台建设是动态的,将随着信息技术的发展不断完善。
2.智慧课堂教学新形态
在信息化教学平台的支持下,智慧课堂教学形态从传统的“以教师为中心”发展为“以学生为中心”,翻转课堂、微课、慕课和创客教育的发展为智慧课堂的发展提供了新的动力。
(1)微课
微课是利用多媒体技术就某一个知识点制作的短小精炼的在线教学视频,具有制作简单、内容精简准、吸引学生注意力等优点。近年来微课广受教育者的喜爱,它满足了移动学习时代知识的传播和学生个性化学习的要求。
(2)慕课
慕课是大规模在线开放课程。教师首先在慕课网上开设课程,通过制作资源、课程测试、布置作业等方式组织教学,最后组织考试,评定成绩。学生注册自己感兴趣的课程,通过观看慕课视频、完成作业、参加测试等方式进行自主学习。在学校教育背景下,在慕课的基础上又产生了小规模限制性在线课程SPOC(SmallPrivateOnlineCourse),在知识碎片化和时间碎片化的环境下,慕课有效地实现了资源共享,提高了资源利用率。2012年以来,慕课在学生人数、课程数量、参与学校数量上一直呈现稳定增长的态势。据ClassCentral统计,截止2017年,慕课的学生总数达到了7800余万人,慕课平台已经成为学习者提升专业能力和拓展职业生涯的重要切入点,在教学中发挥的作用不断增强。
(3)翻转课堂
翻转课堂改变了传统的“教→学”模式,而采用“学→教”模式。在课前,教师负责制作和上传微课等教学资源,学生在课前完成课程学习,并积极进行互动交流。在课上,教师创建学习环境并提出问题,引导学生独立探索,通过师生、生生之间的协作学习寻找问题答案。教学过程的中心是学生,学生可以随时随地进行自主学习或协作学习。
(4)创客教育
创客是指不以盈利为目的、努力把自己的创意变为现实的人。创客是“互联网+”时代的产物,鼓励动手实践和分享交流。基于创客的教学一般采取线上和线下相结合的教学模式,一方面,在线上通过信息化网络教学平台的微视频、微课和慕课等教学资源进行自主学习;另一方面,在线下通过教师的引导开展创意设计和创作。创客教育不仅注重知识的探究性和综合性,而且注重能力的应用性和多元性。创客教育以探究创新为主导,以学生完成创新型应用型任务为主线,培养学生的动手实践能力和创新能力。
微课、慕课、翻转课堂和创客教育的发展都是依托于云计算、互联网和大数据等网络信息技术,并且会随着网络信息技术的发展发挥越来越重要的作用。在学校教育背景下,微课、慕课、翻转课堂和创客教育的内在联系见图2。
图2微课、慕课、翻转课堂和创客教育的内在联系
3.智慧课堂教学流程设计
在传统的课堂教学模式下,教师的教学流程为备课、讲课、布置作业、批改作业,学生的学习流程为预习、听课、完成作业,教师和学生的互动交流仅限于课堂提问,这在一定程度上影响了教学效果。而智慧课堂基于学校的信息化教学平台,以云计算、大数据等信息技术为依托,通过微课、慕课、翻转课堂和创客教育等新型教学模式,坚持以“学生为中心”的宗旨,教学流程发生了巨大的变化,有效实现“教”与“学”的深度融合。智慧课堂教学流程主要分为以下几个环节:学情分析、微课预习、测评反馈、教学设计、提出问题、创建环境、独立探索、协作学习、汇报讨论、课后作业、微课辅导、反馈评价(见图3)。
图3智慧课堂教学流程
(1)课前阶段
课前阶段以学情分析为核心。收集学生的学习数据,包括学生的预习情况、作业的完成情况等,然后平台对学生数据进行挖掘分析,精确掌握学生学习薄弱环节,教师根据学生薄弱环节合理推送微课预习内容,学生在平台上通过测试题等进行预习反馈,教师根据学生预习情况合理设置教学方案,实现以学定教。
(2)课中阶段
课中阶段以师生互动、生生互动为核心。教师根据学生预习情况提出问题,创建多种情景导入新课,引导学生共同探究和学习,学生重点听取感觉疑惑的知识,提高学习效率。课程学习后,全班学生通过集体讨论、分组讨论或个人汇报的方式进行反馈,教师针对课堂探究情况和学生反馈情况进行课堂总结,巩固重难点,拓展知识。
(3)课后阶段
课后阶段以个性化辅导为核心。教师可以通过大数据分析结果,智能为不同学习程度的学生推送不同难度的作业和微课辅导视频,以适合每个同学的需求。教师可以通过平台及时批改作业,学生也可在平台上进行沟通交流,教师根据学生反馈结果设置下一次的课程方案。
现代信息技术下智慧课堂的产生改变了传统“教”与“学”的形态,给教育教学改革提供了新的思路。本文分析了智慧课堂的特征,在信息化教学平台环境和智慧课堂教学新形态的基础上,提出了智慧课堂在课前、课中和课后阶段的教学流程设计方案,提高了学生的自主学习能力。目前智慧课堂的研究处于起步阶段,还有许多待解决的问题,比如如何对学生的学习态度和情感等做出客观测评,这些问题都需要在实践过程中不断探索和解决。
参考文献
[2]姜强,赵蔚,李松,等.个性化自适应学习研究———大数据时代数字化学习的新常态[J].中国电化教育,2016(02).
[3]孙曙辉,刘邦奇,李鑫.面向智慧课堂的数据挖掘与学习分析框架及作用[J].中国电化教育,2018(02).
[4]张霞霞.我国智慧学习的建设现状和发展方向[J].教学与管理,2018(30).
[5]张艳明,桂忠艳,李力恒.基于云计算的计算机实验教学平台建设[J].微型电脑应用,2018,34(12).
[6]J.A.Gonzalez-Martinez,M.L.Bote-Lorenzo,E.Gomez-Sanchez,andR.Cano-Parra.CloudComputingandEducation:Astate-of-the-ArtSurvey.Computers&Education,2015.
|作者:张艳明桂忠艳李巍巍
|来源:中国知网
|美编:姚苏哲返回搜狐,查看更多