浅谈大数据技术在政府服务中的应用
虽然政府大力推广电子证照使用、推动政府数据资源信息共享,然而,由于信息化建设初期缺乏统一的统筹规划,地方各级政府部门的业务系统建设标准不一,妨碍数据资源互通共享,普遍存在数据资源分散、数据标准差异、数据库版本多样、数据转换难等问题,增加了数据共享中的改造、对接和维护成本,使得数据资源失去了应有的使用价值。
2.数据质量监管难
“互联网+政务服务”的数据来源种类繁多,数据类型复杂,数据质量不可避免地会出现数据冗长、数据不真实不完整不一致等问题。这些数据不仅不能成为使用者做出科学决策的依据,甚至还会误导使用者,因此务必要对数据资源进行清洗、校验和分析,提升数据的可信度、真实性与完整性。
3.存在信息鸿沟
信息鸿沟是指信息资源“富裕”和“贫穷”之间存在的鸿沟。我国地大物博,在年龄、民族、地域、职业、教育背景、收入水平等多方面因素都会导致信息鸿沟的问题,从而在使用“互联网+政务服务”时会产生一定的信息弱势群体,无法充分享受到“互联网+政务服务”提供的优质政务服务,这导致其公平性无法充分地体现,在一定程度上阻碍了“互联网+政务服务”的高速发展。
4.安全问题
通过大数据技术将政府各部门共享的分散数据大规模集中分析处理,取得了大量有价值的数据资源,并保存在大数据存储平台。然而,随着计算机技术的高速发展,黑客攻击软件也在不断升级,甚至大数据技术也被黑客应用于网络攻击方面,从而不可避免地增加数据安全与公众隐私信息泄密的风险。同时,木马、网络病毒、系统漏洞、自然灾害、人为操作失误、软硬件设备故障等因素,也无时无刻威胁着数据资源的安全。
5.大数据人才缺乏
“互联网+政务服务”应用大数据技术主要是以信息化技术为基础,而信息化技术的掌握和使用离不开大数据专业人才。但是,由于政府各部门的人员编制、知识结构、福利待遇、岗位流动等综合因素,导致大数据相关人才极为缺乏,尤其是既懂得政务具体业务,又精通计算机技能以及拥有大数据思维的复合型专业人才异常匮乏。人才的缺乏阻碍了大数据技术和“互联网+政务服务”的充分融合,使政府各部门借助于大数据提升“互联网+政务服务”的服务能力难以发挥应有的效果。
三、利用大数据技术改进政府网站服务的思考
1.转变观念,形成大数据思维方式
大数据思维对“互联网+政务服务”带来的影响,不仅是工作思维、创新思维、“互联网+”思维的转变,更重要的是因为思维方式改变而带来的变化。“互联网+政务服务”应用大数据技术的难点不在于数据采集、程序开发、运行维护等技术层面,而在于建立一种大数据思维方式,并且使用大数据思维去观察、分析、研判政务服务中出现的问题,使大数据在各项政务服务中发挥更大的作用。
2.开展政务服务网站集约化建设
建设统一服务门户、统一事项目录、统一申办受理的政务服务集约化平台,促使政府各部门联动创新、优化服务,改善多头管理的问题。通过优化整合政府各部门共享的数据资源,采用“数据多跑路”,实现“群众少跑腿”,依托大数据技术提升数据的价值。力争实现所有政务服务事项全程网上办理,为社会公众提供便捷、安全、高效的政府在线服务,让公众共享“互联网+政务服务”的建设成果。
3.缩小信息鸿沟
加大信息化基础设施的建设与投入比例,解决我国城乡发展不平衡、提供服务不丰富、硬件设施不完善等基础设施问题。通过增设现场自助办理一体机、政务APP、政务小程序等方式,扩展多渠道的“互联网+政务服务”办理模式,提升公众办理政务服务的体验感;同时,做好“互联网+政务服务”的宣传和推广工作,让更多公众逐步接受“互联网+政务服务”的全新政务模式。
4.加强信息安全建设
强化信息安全的法规保障,提高信息安全的执法力度和违法成本,为数据开放以及共享提供法律上的保护。要加大信息安全技术研发,逐步提升成熟、可靠、安全的国产网络安全核心设备的使用数量。要提高对网络攻击、敏感数据泄露、系统漏洞等安全隐患的信息安全监控和防御能力,健全数据安全标准体系和评估体系。要制定信息安全应急方案,做好处置突发信息安全事件的应对工作。
5.开展培训,引进人才
实现大数据技术在“互联网+政务服务”中的应用,需要复合型、高素质的大数据人才队伍。政府各部门应定期组织相关工作人员进行大数据知识培训,逐步提升工作人员的综合素养和技术水平。另外,要加大力度引进大数据方面的专业人才,并建立完善的保障与激励制度,吸引更多素质高、业务精、技术强的复合型大数据人才参与“互联网+政务服务”信息化建设。微信公众号:电子政务智库
作者:广州市公安局梁志斌
来源:《江南论坛》2019年第03期
免责声明:本文转自网络公开渠道,旨在为广大用户提供最新最全的信息,电子政务智库不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。抄袭本文至其它渠道者引发的一切纠纷与本平台无关。
推荐
返回搜狐,查看更多
技术帖!爆发中的勘探地球物理人工智能应用研究
(2)关于所用技术:在所有107篇论文中,有72篇论文运用了深度神经网络DNN(其中46篇运用了卷积神经网络CNN,2篇运用了循环神经网络RNN),7篇论文运用了字典学习算法DL,5篇论文运用了生成对抗网络GAN,6篇论文运用了随机森林算法RF,17篇论文运用了各类聚类分析算法(如SVM、KNN、K-means、SOM等),还有9篇论文运用了其它算法。
(3)关于应用领域:107篇论文中,绝大部分论文涉及油气勘探地震数据处理与解释,有3篇论文涉及激发激化、电磁、磁法勘探数据分析,4篇涉及测井数据处理分析。论文内容涉及的应用领域分布如下:自动化处理解释方面的论文共53篇(其中地震相识别14篇、微地震信号检测10篇、断层拾取9篇、初至拾取5篇、近地表建模3篇、盐丘顶底拾取2篇、速度拾取2篇、地震道编辑1篇、层位拾取1篇、其它解释6篇),信号处理方面的论文共22篇(其中去噪13篇、提高分辨率4篇、地震数据重建与道插值4篇、数据压缩1篇),偏移反演方面的论文共15篇(包括叠后反演、叠前AVA反演、全波形反演、偏移等),油藏参数预测方面的论文共20篇(包括由地震属性预测岩性参数和流体性质12篇、测井参数分析4篇、油藏开发动态监测和产量预测等4篇),其中有些论文包含多个方面的应用。
(二)企业人工智能技术研发与应用
受时间和精力限制,笔者在本届SEG年会上没有系统而详细地参观和了解参展厂商有关人工智能应用的产品情况,而只是随机而又重点关注了部分参展厂商的情况,因此了解的情况不全面也不完全准确。
从展台参观情况看,将人工智能作为重要宣传点的厂商有:GeophysicalInsight公司、Emerson-Paradigm公司、WesternGeco公司,他们或在展台宣讲和展示,或在年会日报上刊文宣传,另外中国的群智合公司也参展展示其基于深度学习技术的地震初至拾取软件。
Paradigm公司展板
WesternGeco公司的盐丘顶底面自动拾取成果展示
群智合公司初至自动拾取展板
(三)开幕主题报告
谷歌云公司油气与能源部副总裁DarrylWillis在SEG年会15日上午的主题演讲中重点谈论了油气工业的数字化转型问题,他演讲的题目直截了当“TheCostofthestatusquo:Getonboardorgetleftbehind(现状的代价:赶上船还是被拉下)”。DarrylWillis在演讲中呼吁大家抓紧行动,采用云计算、人工智能、机器学习等技术从日益增长的海量数据中挖掘更多信息服务于决策和洞察,大幅度缩短地震数据采集、处理、解释到井位规划的周期,数据处理与分析解释周期从年缩短为周,井位规划等决策周期从月缩短为天。
DarrylWillis演讲中对地震资料处理解释自动化的展望
(四)SEG启动人工智能研究项目
值得提及的是,人工智能技术应用已经引起了SEG协会的高度重视,SEG主席NancyHouse于2018年9月18日出席在北京举办的“SEG人工智能与机器学习应用研讨会”并作“TheUnconventionalRevolutioninExplorationGeophysics:IsMachineLearningtheAnswer?”报告。
SEG还正在启动SEAMAI联合研究项目,旨在推动人工智能技术在勘探地球物理领域的应用。SEG人工智能联合研究项目有三个计划目标:
(1)为全球勘探地球物理行业人工智能研究定义一套用于数据交换、合作项目和研究交流的格式与标准;
(2)为油气地球物理行业定义最重要的人工智能挑战问题,发布一套可供公开使用的测试性能指标和测试数据;
(3)建立和管理一个勘探地球物理人工智能应用全球通讯交流网络。
SEG人工智能研究项目计划书
三、重要进展与成果
总观机器学习技术应用研究论文,感觉机器学习技术应用研究已经在几个应用领域取得了较大的进展,有些已经基本达到了实用化程度,有些已经在实际生产中取得了实质性的应用成果,而大多数还处于探索和试验之中。
印象较深的研究成果和重要进展简述如下:
1、盐丘顶底自动化解释
看到两篇有关盐丘顶底自动化解释方面的论文,一篇是Schlumberger旗下WesternGeco公司OddgeirGramstad和MichaelNickel的,另一篇是美国德州大学Austin分校YunzhiShi、XinmingWu和SergeyFomel的,两篇文章采用的技术方案基本类似而稍有差异。
Schlumberger公司OddgeirGramstad和MichaelNickel的文章考虑了两种场景,一个场景是在一个工区内选取约15%的手工拾取或半自动拾取的盐丘顶底面结果进行训练,然后应用于全工区;另一个场景是用一个工区的手工拾取结果进行训练,然后应用于相邻的其它工区。他们包含11个卷积层的卷积神经网络模型输入的是从三维地震数据体抽取的横测线分离出的二维地震剖面数据片(128x128),输出是相同格式的图像,每个像素表示是否为盐丘顶/底(1或0)。测试结果表明,第一个场景下92%的盐丘顶面预测结果与人工解释结果误差不大于2个样点,而第二个场景84%的盐丘顶面预测结果与人工解释结果误差不大于2个样点。两个测试工区的面积分别为25419和33624平方千米,盐丘顶底面拾取处理的周期由原来的数周下降到数天。
用于盐丘顶底检测的卷积神经网络模型
从地震数据体中抽取的样本子集数据和对应的人工解释盐丘顶
盐丘顶面手工解释结果与基于训练的卷积神经网络模型自动解释结果对比
未包含在训练数据集之内另一个大工区盐丘顶面手工解释结果
与基于训练的卷积神经网络模型自动解释结果对比
另一个大工区盐丘底面手工解释结果
与基于训练的卷积神经网络模型自动解释结果对比
YunzhiShi、XinmingWu和SergeyFomel采用了与Schlumberger公司基本类似而稍有差异的技术方案。他们采用了基于卷积神经网络的编码-解码器网络,其中包含了7个卷积层,整个图像(400x400)通过该网络处理直接输出盐丘概率图像。他们采用了SEAM第一期模拟数据集进行试验,用若干测线的数据进行训练,然后应用于整个数据体进行测试。训练数据集的盐丘标签采用了XinmingWu研发的半自动化盐丘边界拾取技术进行处理得到。
应用于盐丘检测的基于卷积神经网络的编码-解码器网络
部分训练样本地震剖面及盐丘标签输出展示
部分测试样本地震剖面及盐丘检测输出结果展示
部分测试样本地震剖面及盐丘检测输出结果展示
2、自动化断层解释
断层的自动拾取是当前人工智能应用研究的一个主要方向(9篇论文涉及),今年报告的成果已经展示了其较强的实用性,但尚未见展现良好效果的规模化应用成果。断层自动拾取的研究方法基本都采用的是卷积神经网络,但在训练数据集的组织上却有两种完全不同的路线,一种是完全基于合成地震记录模拟不同倾角、不同断距的断层和不同频率子波的地震响应,构建卷积神经网络检查存在不同倾角断层的可能性,以此合成地震记录数据集作为训练数据集,训练出的卷积深度神经网络模型应用于实际地震记录,伍新明采用的就是这种方法。另一种就是直接在实际地震数据中选择部分数据作为训练数据集,以相干体作为断层存在概率的标签信息,以此训练出的卷积深度神经网络模型应用于其它实际地震数据,沙特阿美公司北京研发中心YueMa等采用的是这种策略。
美国德州大学Austin分校的伍新明等基于卷积神经网络模型进行断层检测的结果如下。其特点一是采用合成地震记录生成训练数据集,二是采用7层卷积神经网络模型不但能检测是否为断层,而且还能检测出断层的倾角。基于20万个训练样本合成地震记录训练得到的卷积神经网络模型应用于实际地震记录,其效果明显优于以前的相干系数和断层似然概率算法,但该文给出的只是二维地震图像处理结果。现场报告中提到了三维工作成果,构建了90个模型样本建立的训练数据集。
用于断层检测的卷积神经网络模型
用于训练的带断层和不带断层合成地震记录
卷积神经网络模型断层识别示意图
一个实际地震数据断层检测测试结果对比
另一个实际地震数据断层检测测试结果对比
这里以沙特阿美公司北京研发中心YueMa等的论文为例,详细介绍其方法和结果。下面图件分别给出了他们采用的卷积神经网络模型、输入数据、训练数据集、模型测试结果和实际地震数据应用结果。需要强调的是,他们采用的卷积神经网络模型包含两个卷积层、两个全连接层和一个softmax分类器,两个卷积层均包含64个5x5的滤波器,两个全连接层分布包含384和192个特征,采用了相干数据作为断层概率标签,预测输出给出中心点是否断层的概率,其输入的样本数据是包含纵测线、横测线和时间切片三个二维剖面数据(3x24x24),而不是一个三维数据体,输入数据进行了标准化预处理。从包含多个数据体构成的测试数据集中选择了50000个断层样本和50000个非断层样本进行训练,得到断层概率预测模型,然后应用于模型数据和实际数据。对一个未包含在训练数据集中的实际地震资料(1000x655x1083大小)进行了应用测试,预测准确率为74%,其计算时间为2.5小时,计算环境保护20个节点,每个节点包含40个CPU核。论文中未提及训练所耗费的时间。
卷积神经网络模型结构
卷积神经网络模型输入数据为纵测线、横测线和时间切片三个二维剖面数据
用于训练的地震数据体及标签数据体
断层和非断层样本示例
模型数据测试结果
实际地震数据体和CNN预测的断层概率数据体与相干体
断层概率时间切片
GeophysicalInsights公司的TaoZhao和PradipMukhopadhyay综合应用卷积神经网络模型和方向平滑/锐化处理来优化断层识别效果。首先,用基于二维数据片的卷积神经网络模型进行断层识别,然后用方向LoG平滑/锐化处理优化断层成像结果。
基于二维数据片的卷积神经网络模型
断层图像优化规则化流程
地震数据时间切片相干体和地震剖面(含训练标签样本)
优化算法预测的断层与地震相干体预测的断层
3、地震相自动识别
地震相自动识别方面的论文有14篇,采用的方法也千差万别,包括卷积神经网络、随机森林、字典学习、K-平均、K近邻和SOM等统计聚类方法。这里仅选择几个典型方法进行介绍。
美国德州大学Austin分校的NamPham、SergeyFomel和DallasDunlap的文章是唯一一篇河道检测方面的论文,他们借鉴计算机图像识别中的SegNet网络架构构建了编码-解码卷积神经网络,用于对三维地震数据体进行古河道检测,在合成地震记录上进行训练,用训练得到的网络模型对实际地震数据进行处理。卷积层包含16个大小为3x3x3的滤波器,每个卷积层后都有一个批处理归一化处理和2x2x2的池化层。
SegNet网络架构
合成地震记录训练数据
用于测试的实际地震数据
实际地震数据古河道检测结果
GeophysicalInsights的TaoZhao用编码器-解码器卷积神经网络进行地震相识别,输入地震剖面数据,同时得到地震剖面上每个样点的地震相分类识别结果。应用卷积神经网络进行地震相识别等处理有两大类方法,一类是基于片的模型(Patch-basedmodel),另一类是编码器-解码器模型(Encoder-decodermodel)。前者是输入一个地震图像片(如片大小为65x65x65),进行处理后输出的是整个图像的分类(只有一个值,如是否是盐丘、河道等,标记在图像的中心点);而后者输入整个地震剖面,进行处理后输出的是整个图像上每个样点(像素点)上的分类,因此输入和输出的图像大小一样。因而,前者是图像级分类,后者是像素级分类,形成了图像的分割,而前者要达到像素级分类必须进行滑动处理,不难看出,前者需要的计算量更大。TaoZhao基于北海F3地震数据集进行了测试,得到了不错的结果。据TaoZhao报告,基于测线的分割算法相对基于片的像素级分类算法,性能要提高千倍。
地震相识别的两种卷积神经网络模型对比
地震相分类
训练数据集:340线地震剖面与拾取的地震相
纵测线150两个模型的地震相预测结果
横测线650两个模型的地震相预测结果
编码器-解码器模型地震相预测结果三维可视化展示
丹麦理工大学JesperS.Dramsch和MikaelLuthje也基于北海F3地震数据集进行了地震相识别研究,他们采用的是二维图像识别算法,而且采用的是图像识别领域两种常用的卷积神经网络模型Waldeland卷积神经网络模型和VGG16卷积神经网络模型。
Waldeland卷积神经网络模型结构
VGG16卷积神经网络模型结构
带标签的训练数据
横测线500的Waldeland卷积神经网络模型自动识别结果
横测线500的VGG16卷积神经网络模型自动识别结果
乔治亚理工学院的HaibinDi、ZhenWang和GhassanAlRegib也是用F3数据集进行研究,采用的是称为反卷积神经网络模型(DCNN)。
反卷积神经网络模型结构示意图
训练数据集剖面之一
DCNN网络训练学习曲线
反卷积神经网络模型预测结果
反卷积神经网络模型预测结果
乔治亚理工学院MuhammadA.Shafiq等人提出了一种基于稀疏自编码神经网络模型的非监督学习地震特征分析流程,提取地震数据图像中不同的特征信息。
基于稀疏自编码神经网络模型的非监督学习地震特征分析流程
稀疏权系数及其分类
北海F3数据集地震特征剖面图
SEAM模型数据集地震特征剖面图
新西兰实际地震资料特征时间切片图
4、初至自动拾取与近地表建模
有关初至拾取的论文有5篇,另外3篇论文是关于近地表建模的,也与初至拾取有一定的关系,这里选择若干典型结果作介绍。
休斯顿大学KuoChunTsai等人用一种半监督深度神经网络模型DSSNN进行地震初至拾取,首先用DUA(非监督深度自编码器,由非监督深度编码器DUE和非监督深度解码器DUD组成)对非标签样本数据进行训练,用以提取数据特征,然后用DDNN对标签样本数据进行训练,获得地震初至拾取模型。
半监督深度神经网络模型DSSNN示意图
(DUE表示非监督深度编码器,DUD表示非监督深度解码器,DDNN表示深度反卷积神经网络)
同一输入不同模型(DSNN和DSSNN)不同训练样本数(100-500)时神经网络模型的输出
监督深度神经网络和半监督深度神经网络模型预测的初至拾取结果
中国科技大学XudongDuan等人则构建了一个卷积神经网络模型对用其它方法获得的地震初至拾取结果进行可靠性分析,识别出不可靠的拾取结果。他们用35万道标签地震道进行训练,获得的模型用于验证数据集取得了97.9%的高精度分类,而用于另外的地震数据集也获得了95%的分类精度。他们采用的卷积神经网络模型,输入多道地震数据(根据地震初至拉平后的地震时窗数据,5道),输出为对应各道初至的可靠性评判结果(1为可靠的好结果,0为不可靠的坏结果)。
用于地震初至可靠性分析的卷积神经网络模型
根据地震初至拉平后的地震时窗数据道集(底部)
地震初至拾取可靠性分析说明
地震初至拾取及识别出的不可靠初至结果
坏拾取结果改正后的地震初至
Paradigm公司YanivHollander等人也提出了一种综合传统方法和卷积神经网络进行地震初至拾取的方法,他们首先将地震道分成一系列重叠的时间窗口数据段,用卷积神经网络检测该窗口中是否存在初至,如存在初至则用能量比法确定精确的初至时间。
用于检测时窗内地震初至存在性的卷积神经网络模型
用传统能量比法和综合方法拾取的初至进行校正后炮道集
沙特阿美公司TaqiAlyousuf等人提出了一种基于神经网络模型进行面波频散曲线自动拾取,进而反演近地表模型的方法。
地震炮点道集及面波频散
用于面波频散曲线拾取的神经网络模型
训练数据集示例
基于自动拾取反演的不同频率相速度分布
近地表速度模型三维展示
基于标准层析成像和构造规则化反演得到的静校正地震剖面对比
5、地震速度自动拾取
地震速度自动拾取方面有两篇文章,一篇是沙特阿美公司YueMa、XuJi、TongW.Fei和YiLuo的,另一篇是美国德州大学Austin分校ReetamBiswas等人的。前者基于卷积神经网络模型,后者基于循环神经网络模型。
沙特阿美公司YueMa等人的论文采用了卷积神经网络模型,输入数据为NMO校正处理后的二维CMP地震道集数据片,输出为速度比例值(与真速度的比值)。模型包括2个卷积层分别包括32和64个滤波器,卷积层后跟1个池化层,后面包含2个全连接层,每层有1024个神经元。文中给出了Marmousi模型数据集测试情况。
用于地震速度自动拾取的卷积神经网络模型
(a)速度正确
(b)速度偏小
(c)速度偏大
用于训练的NMO道集-标签值数据集
Marmousi模型数据集测试结果
美国德州大学Austin分校ReetamBiswas等人采用循环神经网络进行地震叠加速度估计,循环神经网络包含了1000个神经元,分析样本数据为一定时间窗口和偏移距范围(Nt*Nx)。用一个二维剖面地震数据进行测试,先用人工拾取获得叠加速度剖面,然后随机选出其中18%的CMP地震道集数据进行训练,对另外82%的CMP地震道集数据进行应用测试。
循环神经网络模型示例
CMP道集及速度拾取处理数据块表示
人工拾取的叠加速度与循环神经网络模型估计的叠加速度剖面对比
人工拾取速度和循环神经网络模型预测速度叠加剖面对比
一个CMP道集的处理结果对比
6、智能去噪
用机器学习进行噪声压制和提高信噪比的论文有13篇之多,采用了卷积神经网络、生成对抗网络、字典学习-稀疏表达等技术,限于篇幅在此就不作介绍了。
7、地震数据重建与道插值
地震数据的重建可以用来进行地震道内插、噪声压制、提高分辨率和数据压缩等,本届SEG年会中有关论文有9篇,采用的方法包括卷积神经网络自编码器、残差网络、生成对抗网络等。
WesternGeco公司StephenAlwon给出了基于生成对抗网络进行噪声压制和地震道内插的结果,GANAN和GATIN是分别用于噪声压制和道内插的网络模型。
GANAN生成对抗网络生成器和判别器架构细节
GATIN生成对抗网络生成器网络架构细节
地震道内插结果
同济大学和清华大学BenfengWang、NingZhang和WenkaiLu用残差网络进行炮点道集的重建,解决道内插问题。
ResNet残差网络架构
层状模型地震记录共炮点道集重建结果
实际地震数据共炮点道集重建结果
意大利米兰理工大学SaraMandelli等人用卷积自编码器进行叠前炮点道集的道内插。
U-Net卷积自编码器网络
不同缺道情况下的道内插结果
Chevron公司AdamD.Halpert应用生成对抗网络提高地震剖面的分辨率,该技术广泛应用于超分辨率图像处理中。
生成对抗网络可由低分辨率图像生成高分辨率图像
二维地震数据高分辨率处理结果
三维地震数据高分辨率处理结果
意大利米兰理工大学FrancescoPicetti等人也用同样的生成对抗网络提高地震资料的分辨率。
提高分辨率处理结果
8、储层参数预测
关于储层参数预测的应用场景较多。第一大类是测井曲线的处理,即基于多种测井曲线预测地层参数如岩性、孔隙度、泥质含量、含有饱和度等,这一场景是神经网络模型的一个成熟应用领域,有多篇论文采用的就是这一方法。第二大类是综合应用地震资料和岩石物理资料由地震数据预测储层参数,这一类的具体应用场景复杂多变,采用的方法技术也较多。限于本文篇幅过长,对此类论文也不作介绍了。
9、微地震数据分析
关于油气开采、非常规油气压裂产生的微地震信号检测、处理和分析解释的论文有多篇,限于本文篇幅过长,对此类论文不作介绍了。
10、反演
反演类的论文较多达14篇,涉及叠前AVA反演、叠后反演、全波形反演等,所采用的方法包括卷积神经网络、深度神经网络、Hopfield网络、字典学习与稀疏表达等多种,现选择几个结果作介绍。
斯坦福大学VishalDas等人试验了应用一维卷积神经网络模型由地震道反演波阻抗曲线,生成一系列不同地层岩性、孔隙度、泥质含量组成的一维模型,生成合成地震记录,以此训练一维卷积神经网络模型,用训练模型预测一维波阻抗曲线。试验表明,波阻抗反演的可靠性对地震子波频率较为敏感。
训练数据集合成地震记录流程
地震波阻抗反演卷积神经网络模型示意图
卷积神经网络模型地震波阻抗反演试验结果
电子科技大学BinShe等人用基于字典学习与稀疏表示(DLSR)方法处理地震道反演问题,他们用Marmousi模型和实际地震剖面进行了试验,并与其它方法进行了对比。
从Marmousi模型学习得到的波阻抗字典中的前30个原子
Marmousi模型不同信噪比条件下反演结果对比
一个实际二维地震剖面的波阻抗反演结果对比
哈尔滨工业大学WenlongWang等人则试验了用二维卷积神经网络模型直接由叠前炮点道集地震数据反演地震速度剖面。
用于叠前地震数据反演速度剖面的二维卷积神经网络模型
训练样本示例
样本测试反演速度模型
反演速度模型曲线示例
美国LosAlamos国家实验室YueWu等人提出了一种基于卷积神经网络的全波形反演网络模型“InversionNet”,网络模型具有编码-解码器架构,编码器提取地震记录中的高层次数据特征并压缩到一个高维向量中,解码器将其特征解码转换为速度模型,解码器里还加入了一个Atrous卷积模块。模型的输入是叠前地震道集,输出是速度模型。作者构建了60000个速度模型并计算合成地震记录,每个模型计算3炮,每炮32道,以此构成训练数据集,其中50000炮用于训练模型,10000炮用于测试。
基于深度学习的数据驱动反演技术示意图
InversionNet网络架构图
Atrous卷积模块示意图
InversionNet速度反演效果示例
德克萨斯大学Austin分校SonPhan和MrinalK.Sen提出了一种基于Hopfield神经网络的叠前AVA波形反演方法,从叠前角度道集反演得到角度反射系数,再转换成纵横波速度和密度参数。
反演得到的纵横波速度和密度曲线
反演得到的纵横波速度和密度参数剖面
休斯顿大学YuchenJin等人提出了一种数据驱动型的低频拓展方法,以改善全波形反演中的低频信息,他们采用了基于深度感知器(Inception)的卷积神经网络模型。
数据驱动低频扩展技术框架
深度感知器模型基本单元的结构
低频扩展全波形反应结果
德克萨斯大学Dallas分校YulangWu和GeorgeA.McMechan实现了一种基于卷积神经网络模型的全波形反演方法CNN-FWI,用卷积神经网络模型抽取目标体几何特征并用于速度反演,从而优化了全波形反演的精度,基于SigBee模型数据的测试表明其精度优于基于梯度下降法全波形反演。
CNN_FWI算法实现流程图
CNN_FWI算法中所用卷积神经网络
不同方法全波形反演结果对比
Rice大学的MaartenV.deHoop则对面向地球物理反问题的深度神经网络框架进行了一般性讨论,笔者对此没能消化吸收故不作进一步介绍。
四、有关问题的说明
1.关于训练数据集的问题
有关人工智能的研究需要海量数据进行训练和测试,不同作者根据研究内容采用了众多的合成地震数据和实际地震资料,有些是业界共享的,有些是自己计算生成的,有些是私有的实际地震数据,其中应用最多的是:Marmousi模型数据、SEAM模拟数据集、Opendteck北海F3数据集。
2.关于开发环境的问题
大多数论文中没有特别提及研究工作所依赖的软件开发环境,看到提及的包括(因笔者没有系统阅读论文全文,因此相信一定遗漏了许多):Pytorch(www.pytorch.org)和TensorFlow(www.tensorflow.org)。据了解,目前人工智能研发应用较多的环境包括:TensorFlow,Caffe,Pytorch,MatLAB等。
特别提及的是,部分论文作者还开源了他们的研究数据和代码,如:
伍新明:断层检测,地址:https://github.com/xinwucwp/osv/
邸海滨:地层特征分区,断层检测,地址:https://haibindi.wixsite.com/haibin-di和https://ghassanalregib.com
Dramsch:地震相识别,地址:https://github.com/JesperDramsch/segam18
3.关于性能测试标准的问题
目前,人工智能技术在地球物理中的应用研究所采用的技术种类繁多,应用领域多而广,采用的测试数据和开发环境也不尽相同,更缺乏统一的性能测试标准,这些都在很大程度上制约了业界研究成果的交流、分析和评价。特别是,缺乏丰富的海量数据用于深度学习模型的训练和测试,限制了更多的研究者进入这个研究领域。相信,SEG协会即将开展的SEAMAI研究项目将为打破这一僵局提供好的开端。
******************************************************************
从今年SEG年会上机器学习方面的论文数量、采用的方法、应用领域和实际应用效果多方面综合来看,我们可以认为2018年是人工智能技术在勘探地球物理中应用研究的爆发年,而相对而言2017年可以看作是觉醒年。
这些研究开拓了我们解决地球物理问题的新思路、新途径,尽管大多数论文成果尚处于探索研究阶段,没有达到实际应用的水平,有些论文成果的技术路线正确但由于计算性能、泛化能力等方面的限制还达不到实用化水平。但不管如何,现有成果已经充分展现了机器学习技术特别是深度学习技术强大的解决问题的能力,充分展现了深度学习技术广泛的适应性,说明了这个领域是一个值得大家关注和发力的领域,是一个有待挖掘的金矿。
相信明年有更多、更丰富、更成熟、更实用化的研究成果展现。
2018年11月14日
本文来源《地学新视野》公众号
免责声明:海贝能源公众号旨在分享和传播优秀文化思想,无任何商业目的,版权归原作者所有,如有侵权请与我们联系!欢迎广大朋友投稿。返回搜狐,查看更多
人工智能应用嵌入政府治理:实践、机制与风险架构 ——以杭州城市大脑为例
由于大数据分析具有计算复杂和研究周期长等特点,所以发掘其价值需要借助“云计算”这样的超强计算处理技术。云计算属于分布式计算技术,简单描述就是经过互联网的程序拆分之后交由多个服务器进行响应搜索、计算分析,然后传达给用户。它像人的大脑,给大数据中植入数学算法便可进行快速思考学习,把从虚拟资源服务集合中获取的大数据信息进行挖掘、过滤、筛选,寻找相关性并产生预测信息,进而做出有逻辑关系的相关行为信息判断。云计算内耗最小但功效最大,通过它网络服务者可以在数秒之内实现数千万计甚至亿计的信息处理,达到“超级计算机”般的效能。云计算正式成为传播概念则是在2006年8月的搜索引擎大会上,由Google首席执行官埃里克·施密特首次提出。2012年,云计算迎来快速发展,各种有关的技术、方案、应用陆续出现。从目前的市场占有量来看,国际上以亚马逊的AWS领先,国内则以杭州阿里巴巴的阿里云领先。
对于什么是人工智能,尚未取得一致的意见。这个概念早在1956年就由麻省理工学院的LISP语言发明人、“人工智能之父”约翰·麦卡锡在达特茅斯(Dartmouth)学会上提出,即让机器的行为能表现出人一样的智能行为。但这个概念忽略了机器智能中的知觉和自我意识。从当前人工智能分类来看,通用人工智能像人类大脑一样能够通盘思考、处理视听、推理判断、规划设计,同时具备举一反三和融会贯通的特质。而专用人工智能是面向特定任务开发,如著名的阿尔法狗(AlphaGo)围棋程序,只在局部范围的单项运用中超越了人类智能。回到其定义上,拆分人工智能一词,“智能”也尚未有确切定义,一般理解为智能是个体对客观事物具有合理分析、判断、目的导向、有效处理的综合能力。结合“人工”选择一个赅简的理解,即埃特尔考察若干人工智能定义之后所推荐的赖斯定义:“人工智能就是关于如何使计算机去做现在由人做得更好的事情的研究”。计算机是工具,目标是通过其完成人类智能能完成的更复杂的工作。
从对大数据、云计算、人工智能的概念解读中可以看到,本文选取的人工智能技术概念更具综合性和模糊性。本文不对技术概念本身做更多探讨,只对这一技术运用所带来的治理变革进行一定的探索。
2.智能治理的相关概念辨析
从技术嵌入治理角度,目前学术界和政府部门提及较多的是数字治理、智能治理与智慧治理。在本文中,明确其内涵、联系和区别是重要的。
数字治理是数字要素和治理要素相结合,将政府传统的电子政务技术提升到社会治理层面,利用信息通信技术(ICT)渗透政府行政过程内部与外部的重要产物。信息技术体现的数字化特征使政府逐渐扁平化和透明化,出现了“网上政府”“电子政府”等称谓,而数字治理作为这些概念的演化被适时提出,“它所倡导和关注的是治理主体与客体之间的信息互动以及社会公众利用技术参与公共事务的能力”。
智能治理,其中的“智能”一词应赋予技术意义。从治理智能来看,是治理过程、治理行为呈现智能化特征;从治理对象来看,是治理对象应具备技术的智能性。国外学者Blackman等认为智能治理应首先作为一个概念框架去研究政府与环境的相互作用。Chikhale等认为智能治理关注信息技术嵌入执行活动的有效性,以及它对解决恶性事件的影响。总的来看,这种治理方式强调的是智能技术嵌入社会治理过程中时,治理方式和治理手段体现智能化特征,实现治理精细化、个性化、智能化、互动和谐的目标。
智慧治理,不是单向定位的技术治理概念,而是综合了价值理念与技术智能的治理方式。它包含两层含义,一是智慧治理要体现一种思维方式,具备对民主、公平、开放、协同、合作等价值理念的选择和回应,它从人类整体和未来考虑问题,追求利益和占有的适度化和道德化,“是人类为实现幸福而准备的综合统一的机能和调控机制”;二是智慧治理是一个技术治理方案,能够使政府、社会及民众有效沟通、互动和协作,从而塑造出一个全新的和谐共生的社会形态。如国外学者Meijer和Bolivar认为智慧治理是“通过使用信息和通信技术获得更好的结果和更加开放的治理过程,从而执行新的人类协作方式”。
通过对数字治理、智能治理和智慧治理的概念解析,可以看出三者并非孤立的概念,具有联系又可区别。通过对颜佳华和王张华研究成果的梳理,三者具备“同构性关联”“互镜式发展”“螺旋式上升”的联系,但概念建构侧重点不同,概念建构实践依据不同,治理活动具体内容不同(详见表1)。从这些对比中可以看出,研究选择的基于人工智能应用的杭州城市大脑个案使用智能治理这一概念更符合当下人工智能嵌入政府治理这一问题视角。
3.基于人工智能开发的智能治理工具——城市大脑
城市大脑是一个巨大的数据共享与处理平台,利用人工智能技术,实现城市治理的数据共享;通过全局实时分析,实现城市公共资源的优化配置。城市大脑以数据为核心,依托深度学习、科学算法、智能建模和快速分析,将数据分析结果实时呈现,为政府决策人员提供参考。具体来说,政府数据、全网公开数据、IOT感知数据和成像设备数据接入平台后,通过数据的存储、分类、融合和计算,最终实现城市中自然资源、水电资源、道路资源、政务资源、医疗资源和警务资源的智能配置(见图1)。
杭州城市大脑内核依托的是阿里云的人工智能技术,经过不断技术攻关,已成为杭州市的人工智能中枢。政府将与城市治理相关的数据通过归集、分类和平台接入后,城市大脑平台便可通过算法建模进行快速分析,实时将结果传入城市相关基础设施促进公共资源优化配置,实现城市智能运行,最终演化为治理城市的超级人工智能。从组成上来说,杭州城市大脑由数据采集系统、数据交换中心、开放算法平台、超大规模计算平台和数据应用平台这五个系统组成。与人类大脑类似,城市大脑有分别负责信息传递、执行、决策、运输等作用的子系统。数据采集系统是输送数据的执行层“小脑”,开放算法平台是算法建模的决策“皮质层”,数据交换中心是数据融合的基础“脑核”,数据应用平台负责决策输送,超大规模计算平台类似供血的心脏,提供强大的算力(详见图2)。其中超大规模计算平台依托的是阿里云自研的飞天(Apsara)系统,这个系统可将百万级的服务器连接成一台超级计算机。城市大脑涉及数据量巨大,仅视频摄像头便有5万多路,算法决定其聪明程度,而超快的反应力则需要强大的计算能力。
(二)技术嵌入视角下的政府治理研究综述
“治理”是当前学术界和政府部门的热门词汇,从治理话题涵盖来看,有全球治理、国家治理、城市治理、农村治理、地方治理;从治理的实务主体来看,有政府治理(政府面向公众的治理)、社会治理(社会组织与公众参与的治理);从治理的技术支撑来看,有数字治理、数据治理、智能治理、智慧治理。治理具有形形色色的组合形式,但其概念本身就涵盖多种理解。本文从“治理”视角出发,理应先对其建立一种认识。“治理”一词源于西方学界,原意是控制、引导、操纵之意。治理理论的发展、实践、传播与时代背景相关联,受到异质性的政治制度、经济制度、社会发展的影响,因此对治理问题的研究需联系相关制度环境。就治理的内涵而言,国外学者Fukuyama认为,治理是政府制定和执行规则以及提供服务的能力,这参照了韦伯的理解,将治理视为政府的一种执行,属于公共行政而非政治和公共政策。国内学者徐晓林和刘勇认为治理是公共管理组织运用公共权力维持秩序,满足公共需要,在制度关系中实现对公共行为的引导、控制和权力规范,从而促进公共利益最大化。包国宪和郎玫则视治理为一个分析框架,研究微观的政府组织模式与宏观上的政府、市场与社会之间的匹配问题。就中西方对治理的不同认识,王浦劬认为西方当前学术话语更多是政府分权和社会治理,而社会主义国家强调政治管理的力量。国外学术界与国内学术界对于治理词汇组合的选择习惯也不同,国外学者倾向于直接使用“治理”,而国内学者倾向于使用“政府治理”。政府治理在西方学界更多指治理政府内部的方式,中国学术界则更多面向公共事务、公共社会问题和公共价值问题,强调政府各级行政机构的主导地位,也是主流学者比较认可的对中国治理实践的分析性概念。
确定政府治理这一前置概念,结合当前对政府治理影响最大的因素——技术,技术与治理组合视角应怎样界定?一种是技术赋能视角,强调技术赋予治理主体某种能力使治理期望得以实现;另一种是技术嵌入视角,强调技术与治理主体结合使治理目标得以实现。本文研究主体杭州城市大脑已然实现技术与治理主体的结合,因此选择嵌入视角能准确描述本文所呈现的技术治理内涵。技术治理是一个由来已久的概念,有多维度解释,可以作为治理手段、治理机制、治理理念。作为技术手段,强调政府利用先进技术来提升治理的效能;作为治理机制,强调治理结构、过程和方式的优化;作为治理理念,强调技术在治理国家中具有强大威力,也叫技治主义(Technocracy),遵循科学管理和专家政治两个原则。关于技术治理的讨论,从国家治理角度,国家不再作为一个抽象的政治实体,而是在办公室、街头、窗口和网络等不同场景中开展治理活动,其限度是“在单一治理技术与多元化的治理场景之间和在技术的规范统一性和事实全面性之间存在固有矛盾”,风险是工具意义强化而目的价值弱化,可能会带来专家权力过大导致极权、整体性治理危机以及反治理。从技术治理实践延伸的角度,技术嵌入城市治理之中已有积极成果,城市公务员信息技术能力较高,推动了治理中价值观念、信息交易、权力结构、治理过程和治理效果的变化。延伸到乡村治理,技术嵌入发挥了压缩时空与建构社会的作用,改变了乡村社会的权力关系,驱动了乡村“精准”机制运作,激发了较为复杂而多维的治理效应。但技术治理与科层体制具有“双向性”,即技术赋能科层,科层规制技术,因此基于技术嵌入治理的逻辑,需要警惕技术官僚主义,以及技术万能、技术替代、技术赋权和技术共赢这四重幻象。这些研究在技术治理话题的本土语境下进行了理论和实证的解读,但偏向泛技术治理的讨论。本文讨论的人工智能应用嵌入政府治理,侧重于治理手段的理解和微观视角的切入。
技术治理可以作为一个可持续管理的工具,且不是一个僵化的结构,而是一种活的、不断发展的灵活方法。但大而泛的讨论会有偏离事实的风险,切入微观角度和事实更有利于理论演绎与现实对应。因此选取技术治理的治理手段维度,按照技术类别和技术手段来区分是可行且有意义的,虽然分类关系可能会相对模糊,但可以细化研究方向和研究问题,比如随着大数据、云计算、人工智能、区块链技术的兴起,有不少新的治理概念衍生出来且呈现螺旋式的上升演进趋势,如数字治理、智能治理、智慧治理,都是技术治理的战术手段但又有显著差别。这些概念前文已做相关区分和选择,此处主要细化研究问题。当前的主流技术对政府治理问题都有哪些方面的研究?首先是技术支撑视角,最前沿的主要集中在大数据和人工智能,亦有极少的从互联网、物联网、块数据、区块链、云计算和人工智能出发进行综合分析。其次是研究问题,经过整理,集中在主流技术对政府治理的积极影响、风险挑战与治理原则,有一些研究则指向技术和组织优势更为显著的城市政府主体。从技术治理的角度,大数据作为人工智能产生和发展的必要前提,其先进的信息处理技术和可改善决策过程的技术,能为组织提供新的机会来利用信息并获得竞争优势。而人工智能作为一个更高级的工具,更像是一个前沿技术的集合体,将对政府治理产生的积极影响,但其风险也是未知的。
本文通过梳理相关学者研究,分大数据-政府治理和人工智能-政府治理两个模块,将积极影响作为政府治理中的革新要素,风险挑战作为风险要素,治理建议作为治理要素,用表格的形式集合相关学者的观点(详见表2和表3),以期较全面地呈现相关研究进展。
可以看到,不少学者对技术嵌入政府治理问题在积极影响、风险挑战和治理建议方面进行了许多有益探讨,对后续研究具有一定的启发意义。既有研究呈现以下特征:首先,研究内容相对集中且偏向于预测性的思考,多为主流技术对政府治理所带来的革新作用、风险预测、现实挑战和未成体系的治理建议,缺乏微观事实依据;其次,研究呈现的技术嵌入政府治理的风险要素多是零散组合,缺少基于技术嵌入的侵入逻辑进行理论架构;再次,研究大多从理论和概念层面思考问题,缺少案例研究和量化研究。
基于对技术治理的梳理和案例的选择,本文将政府治理层次定位于地方政府,研究视角定位于技术嵌入,核心概念定位于智能治理,即政府利用大数据、云计算、人工智能等智能技术框架使得治理方式和治理过程智能化,并在这个治理框架内实现治理科学高效、协作迅速、精细透明的治理方式。
(三)研究方法
研究选择的方法为案例法。根据RobertK.Yin的观点,案例研究作为规范性的质性分析,是对某类现象进行考察分析,得出具有普遍性意义的一种经验性研究方法。本文选择案例法,有几方面的考虑:第一,本文着眼于做探索性的研究,目的是能为后续研究做铺垫,而此类研究一般以质性分析为主。同时,人工智能应用于政府治理尚未成为普遍现象,不适宜做规模性的调查研究。第二,针对城市中政府治理这一综合复杂的结构,人工智能应用中虽然含有大数据、云计算等具有量化特征的技术,但本文聚焦治理实践而非技术量化。第三,案例研究的重要目标是促进知识的发展,人工智能嵌入地方政府全面治理这一新的社会事实,作为以前没有的现象,通过寻找个案的分析能“为知识发展尤其是构建萌芽理论提供新论据或新视角的发现”。
三、案例简介
(一)杭州城市大脑的智能治理实践历程
杭州城市大脑是杭州市开展城市全面、智能治理的重要引擎,其建设离不开国家和地方政府的战略支持、企业的核心技术支撑以及地方政府与企业的协同合作。通过对关键事件的归纳,其发展可分为以下四个阶段(见图3)。
1.项目建构阶段(2016年4月—2016年12月)
2016年4月,阿里技术委员会提出在杭州建设城市大脑的构想,得到政府支持后,7月便在云栖小镇落成杭州城市大脑的运营中心。杭州城市大脑项目由杭州市政府主导,参与者包括阿里云在内13家企业的顶尖人工智能科学家,其首要治理对象为交通拥堵。项目获准和运营中心落成之后,9月便在杭州市萧山区开展道路交通初步试验,测试显示车辆通行速度平均提升3%~5%。10月,在2016杭州云栖大会上,城市大脑项目宣布正式启动。12月,杭州市委市政府成立了以市委书记任组长,市委常委任副组长的“城市大脑”建设领导小组,汇聚企业、政府、公安等各方力量,集合建委、财政等10个部门,形成合力建设城市大脑项目,也标示着城市大脑项目在技术和组织支持建构上基本实现。
2.项目运行阶段(2017年1月—2018年4月)
企业技术团队和政府建设领导小组建立起来后,为做好服务城市大脑建设的数据需求,2017年1月,杭州市数据资源管理局宣布成立,成为建设城市大脑的重要支持机构。6月,数据资源管理局正式运行,11月底时,归集59个部门共230.35亿条数据。7月,城市大脑交通V1.0平台上线,测试结果显示良好,其中在高峰时段各道路速度提升明显,市心路、通惠路平均速度提升18%以上,育才路平均速度提升20%以上,晨晖路平均速度提升10%以上。同月,杭州市政府开始组织专家编写城市大脑发展规划。11月,科技部召开《新一代人工智能发展规划》暨重大科技项目启动会,宣布杭州城市大脑为首批四家国家新一代人工智能开放创新平台之一,标示杭州城市大脑进入更高层次的发展和应用。
3.项目拓展阶段(2018年5月—2018年12月)
城市大脑经过交通治理第一关的检验后,不断寻求在城市治理中更多领域的拓展。2018年5月,由杭州市数据资源管理局牵头制作的全国首个城市数据大脑规划——《杭州城市数据大脑规划》发布,明确了杭州市未来5年城市大脑的建设方向,2022年要实现城市大脑交通治理领域全覆盖以及其他行业系统建设与实际运行。2018年12月,杭州城市大脑(综合版)在杭州云栖小镇正式发布,实现了从交通领域向环保、城管等领域的全面延伸,大大拓展了城市大脑的应用范围,是真正意义上的杭州智慧城市的中枢系统。同月,杭州城市大脑项目获评中国十大创新治理案例之一。
4.项目完善阶段(2019年1月之后)
杭州城市大脑(综合版)上线之后,城市大脑便进入了自我完善与全球传播阶段。2019年9月,杭州城市大脑“数字驾驶舱”正式上线运行,表明杭州城市大脑打破了层级孤立,实现了市级、区(县、市)级、镇街级和市级部门间的互联互通。截至2019年9月,在杭州城市大脑的影响下,全球其他22个城市也布局了城市大脑。杭州城市大脑实现了自我建设向全球扩展的积极传播态势。12月,杭州城市“大脑中枢”系统接入覆盖市财政局等49个市级单位、余杭等15个区、县(市)(含钱塘新区、西湖景区),共计148个“数字驾驶舱”。2020年1月,在应对全国新型冠状病毒肺炎疫情中,杭州市卫健委与公安系统利用城市大脑平台第一时间建立了卫健警务防控系统,实现了早期的数据掌握与防控手段介入。
(二)杭州城市大脑个案的典型意义
本文选取杭州城市大脑作为案例,主要基于以下几个原因:第一,经济发展方面,杭州市已成为数字经济之城,数字经济持续引领杭州发展。2014—2018年,杭州数字经济核心产业增加值年均增长22%,对全市经济增长贡献率保持在50%左右。2019年,数字经济核心产业实现增加值3795亿元,增长15.1%,高于GDP增速8.3个百分点,其中数字产业增加值增长16.3%,软件与信息服务产业增加值增长15.7%。第二,在人工智能产业发展方面,根据2019年6月28日发布的《杭州人工智能城市报告》,杭州人工智能产业扶持政策和产业集群已初步形成。在人工智能专利发明申请数和授权数上,依托阿里巴巴等高科技龙头企业和浙江大学的超强工科优势,杭州市人工智能产业发展已属于国内人工智能领域第一梯队。第三,在战略地位上,2017年11月,杭州市城市大脑被列为国家首批四大人工智能开放创新平台之一。2019年10月,杭州市成为了目前国家新一代人工智能创新发展4个试验区之一。显而易见,杭州市城市大脑项目所依靠的产业背景和政策优势,可以满足其发展,也具有个案探讨的价值。
杭州城市大脑在政府智能治理问题上具有多大类型学意义?第一,就代表性而言,在全国各大城市都在加快融合人工智能与政府治理的今天,杭州市城市大脑项目在国家层面和省市级层面都属于先发地位。作为浙江省省会城市,杭州市率先提出城市大脑建设构想,出台全国首个城市大脑发展规划,项目被纳入国家首批人工智能开放创新平台。第二,就实践效果而言,城市大脑项目自2016年10月在杭州云栖大会启动以来,围绕交通治理首先发力。2017年上线的交通V1.0平台测试显示,开展试点的高架路平均延误降低15.3%,出行节省时间4.6分钟,而特殊车辆在道路通行上可节省50%时间。2018年12月,杭州城市大脑(综合版)发布,20秒公园入园和30秒酒店入住等一系列微小却便民的变化正在发生。根据2019年第三方城市交通报告,杭州的百城拥堵排名已从2014年第2位降到了目前的第35位。第三,杭州城市大脑覆盖领域广泛,并已产生积极示范效应。目前,杭州城市大脑覆盖了城管、卫健、文旅、交通等11个领域,共48个场景。全球23个城市引入了城市大脑。
(三)杭州城市大脑智能治理实践的创新经验
现代城市发展过程中政府面临着诸多挑战,如资源高消耗模式的持续性问题、经济发展动力不足问题,都考验政府的治理水平。2016年,杭州在全国率先提出建设针对城市治理问题的人工智能应用——城市大脑,开启了现代技术手段下用数据决策、管理和服务的新里程,优化了公共资源配置的同时也促进了产业的升级。目前杭州城市大脑建设已从单一版走向综合版,从杭州走向全球,其实践的理念、条件、支撑、保障和应用经验在政府现代化治理中发挥了重要的先行意义。
1.先导理念:数字发展与惠民管用
杭州城市大脑在杭州成功落地并逐渐成熟,政府创新的发展理念起重要的先导作用。一是城市整体的发展理念。杭州一直致力于建设一座数字之城,提振经济发展的新动力。2019年12月17日,中国城市科学研究会智慧城市联合实验室发布《2019城市数字发展指数报告》,在数字政务、数字环境、数字生态、数字生活4个一级指标及20个分指标的综合评分中,正在打造“数字经济第一城”的杭州位居全国第一。二是城市大脑的建设理念。满足人民日益增长的美好生活需求是政府在建设管理中的核心努力方向。城市大脑项目以惠民管用作为核心开发要义,通过对城市数据融汇管理、基础设施数字化改造、政务服务和民生服务数字化转型,将政府治理中的“痛点”和群众反映强烈的“热点”用场景应用开发的方式提升了政府的公共服务水平。在城市大脑平台支持下,先后开发了48个场景应用,实现了更加精准便捷的公共服务,增强了人民群众的获得感和幸福感,是杭州连续13年蝉联“中国最具幸福感城市”的中坚技术支撑。
2.基础条件:数据多源归集与互通共融
数据的归集与融通是城市大脑的基础条件。大数据是城市大脑的立身之本,但大多数城市的“大数据”始终处于沉默状态。一方面,政府在经济、社会、文化的管理和服务中,积累了大量数据,但缺乏有效的利用路径。另一方面,部门各自为政现象的存在,使得已归集的数据互不联通,形成数据孤岛。杭州原有52个政府部门和单位共建有760个信息化系统项目,但因为数据权限没有放开,部门间数据不往来,造成了数据孤岛的现象。城市大脑启动建设之后,第一件事便是打破数据壁垒,联通数据孤岛,建设了大数据的平台,并配合成立了杭州市数据资源管理局,负责为城市大脑的数据融通服务,目前已累计归集837亿条数据。数据融通让城市大脑与政府各部门之间有了奇特的“化学反应”。随着城市大脑的综合运用,数据的归集和融通不仅是跨部门的,且实现了跨区域、跨层级、跨领域的多源数据汇总,为上层人工智能应用提供了全面的数据支撑。
3.核心支撑:强大算力系统与平台算法
强大的算法和算力构成了城市大脑的核心支撑力。在杭州城市大脑的五大系统中,超大规模计算平台和开放算法平台体现了对算法算力的要求。在实现数据归集和融通的基础上,城市大脑的算法依托参与城市大脑建设的诸多顶级人工智能学家,算力依托阿里云的飞天(Apsara)系统,建立了科学的算法模型,实现了超强计算力支撑上的数据融合与创新,形成了城市运行的全局感知、分析和处置。从技术上来说,城市大脑的算力支持全区域多源异构数据的实时连接、调度、处理,算法服务支持主流的深度学习框架和算法组件及一体化算法管理,可以智能生成城市运行中需要重视的核心指标和关键数据。
4.重要保障:政企协同与规划引领
政府与企业的协同机制是城市大脑的重要保障。作为一个复杂的系统工程,其发展有力、进化有序,依靠的是政府与市场力量的协同合作。首先,政府作为主导者,发挥了统筹规划和制度支持的作用。2016年10月,城市大脑宣布正式启动;2016年12月,杭州市便成立了由市委书记统领的城市大脑建设领导小组,一位副市长主抓。另以项目为单位成立工作专班集中办公,政府派出懂业务的人员,企业派出懂技术的人员,云栖工程院派出专家和工程师,实现业务和技术协同合作。目前专班数已有29个,工作人员350余人,分别来自政府部门和50余家企业,统一进驻云栖小镇集中办公。其次,市场运作机制提供了重要的资金支持。对城市大脑项目,杭州市破除了政府单一投资模式,引入市场资本,成立了20亿元的“杭州城市大脑产业基金”。最后,制度规划和完善法规促进了协同机制的有序运行。2018年5月,杭州市政府出台全国首个城市大脑规划——《杭州城市数据大脑规划》。对相关法规也启动修订程序,如交通治理版块2013年颁布的《杭州市机动车停车场(库)建设和管理办法》。
5.目标应用:政府数字驾驶舱与民众多场景应用
应用是城市大脑的最终归宿。城市大脑应用已经构建了横纵架构,横向为政府部门,如杭州城市大脑的卫健、城管系统,已上线50余个;纵向为区县,如杭州城市大脑的上城、萧山平台,已有15个。在独具特色的数字驾驶舱应用中,已启用42个数字驾驶舱,每个驾驶舱同时具备大屏版、PAD版和手机版三种,支持移动办公,其面向市委书记、市长的数字驾驶舱已开发就绪。对于民众的智能服务,已先后推出48个场景应用,使得出行和生活更加便利,部分场景应用详见表4。
四、人工智能应用嵌入的政府治理机制与风险架构
(一)人工智能应用嵌入形成的智能治理机制
杭州城市大脑的治理实践给地方政府利用人工智能参与治理实践提供了有益的范式参考。因此,在案例实践提炼的基础上,本文从人工智能应用嵌入政府治理视角,以智能治理为政府治理革新的描述概念,从政府内外部两方面构建了政府治理中的智能治理机制(见图4)。这一机制的核心运作逻辑是通过人工智能应用降低了信息的不对称,增强了信息的交互,推动了信息共享,使得治理主体之间的信息沟通成本减少,治理主体在解决问题时能够发挥比较优势。
1.管理服务的数字化
2.行政流程的精简化
人工智能应用嵌入政府治理,对政府内部结构将产生重要影响,包括控制政府规模、部门协同便利,最终使得政府结构扁平化、行政流程精简化。政府规模的影响因素很大程度上取决于治理范围界定和事务复杂程度。在科层制下,政府部门数量和层级较多,政务流程复杂且分散,导致了政府规模趋大而非小,信息交流趋于闭塞而非畅通。人工智能的应用,将从政府内部打通部门之间、层级之间的数据隔关,实现数据互通共融。杭州城市大脑第一关是打破数据壁垒,实现数据的归集与融通,从而奠定了后续开发的坚实基础。数据的融通关打通的也是部门之间的协同关。人工智能应用环境下,部门协调将变得便捷,行政流程也可以最大程度实现精简。这不仅有助于释放简单劳动力,降低人力成本,而且有助于打破行政壁垒,推进政府治理的扁平化。以前民众办理一项业务需要多个部门来回跑,政府工作人员处理大而庞杂的信息难免出错,现在人工智能应用通过数据“跑路”、自我学习和纠错机制,可以实现自动化执行。以办公的自动化为例,根据德勤的一份报告,日常工作的自动化每年将节省9670万小时,在全球范围的低端每年节省33亿美元,在高端每年节省12亿小时,从而节省411亿美元。基于杭州城市大脑,杭州市政务大厅增添了便捷的政务自主办理机器,手机客户端也接入了政务办理程序,使得群众办事流程简化、时间缩短。例如以前政府发放补贴有一套严格的流程,群众需要研读政策甚至寻求帮助才有可能拿到,现在依托城市大脑的“亲清在线”平台,补贴可以快速方便地下发到被补贴人手中。这是政府内部治理的重大变革,表现形式便是行政流程的最大化精简。
3.资源配置的智能化
政府与市场是资源配置的两只手,在我国,市场在资源配置中的作用经历了从“基础性作用”到“决定性作用”的转变,但这不意味政府资源配置作用的丧失,而是要求政府以更好的方式去配置资源,服务市场。人工智能应用下,政府的资源配置方式将呈现智能化。智能化是政府可以根据不断触发的需求,将数据信息进行算法建模分析,自主判断和预测,并将计算结果以控制命令的方式传送给相应的执行设备。杭州城市大脑通过红绿灯智能调控提高了道路车辆的通行速度,通过监控视频图像智能分析可快速预警事故和出警处置,通过全市车位信息的接入实现了停车方便、离场快速。资源的智能调配提高了资源利用率。政府可以实现资源配置的智能化,一方面是政府具有充分的信息权,借助已有储备数据、实时互联网数据和物联网数据,使得政府成为“最大的数据生产者和拥有者”。另一方面,大数据、云计算技术、人工智能技术的成熟,人工智能应用可以最大化地在算法命令的引导下实现公共资源配置的优化需求。
4.社会协同的便捷化
政府治理中强调多元治理、协同治理。社会问题越趋复杂,要求政府越趋开放,因为政府难以满足种类繁多问题的治理需求,所以需要开放与社会协作的渠道,集众智治理。人工智能的嵌入,一方面,通过电子化和自动化办公,使得政府内部的行政壁垒、数据壁垒得以打破,便于构建“无缝隙政府”。另一方面,政府通过搭建智能的开放创新平台,让数据开放和共享,使得社会组织及社会个人都可以从开放的数据接口中获取到需要的数据,有利于构建多中心的社会治理结构。杭州城市大脑是国家首批四个人工智能开放创新平台之一,其建设是在政府与社会的协同基础上,其定位是政府与社会协同创新的智能化开放性平台。杭州市政府通过城市大脑的平台打通了各级各部门的数据和业务,企业则利用政府开放的数据和平台实现了技术产品的创新,社会组织和个人则可以贡献治理创意。政府内部之间的无缝隙协作是推进政府与外部力量协作的基础。钱学森先生曾提出“综合集成研讨厅”思想,借鉴其思想,人工智能嵌入政府治理中,人工智能应用将为推进跨领域、跨学科、跨地域的专家协作推进公共政策研究的社会适应性提供更便捷的方式,同时推动政府单一决策响应向多元决策主体参与转变。
5.公众互动的实时化
技术的发展浪潮逐渐模糊了人们互动交流的时空界限,各主体间信息互动成本趋于零,由此“零边际成本时代”到来。人工智能的应用,将使得政府与公众之间的互动与开放联系变得非常便捷,公众对政府的“距离感”和“畏惧感”将逐渐淡化,社会的民主化将得到很大程度的提升。网络媒体的开放式讨论已逐渐使政府认识到民意观测与实时互动的必要性。开放的社交媒体渠道,如微博、论坛,开放的政务咨询平台,如政府网站的领导信箱、投诉咨询口,形成了海量的非结构化的反馈数据,都是公众对政府工作的最佳反馈。杭州城市大脑开发了48个场景应用,启用了42个数字驾驶舱,公众与政府行政人员之间的信息不对称将减少,公众对信息的接受和反馈将实时呈现在场景应用的监控平台和数字驾驶舱的使用终端,政府决策者可以随时随地利用信息比较优势做出合理的决策回应。人工智能数据分析技术背景下,对于政府决策层来说,基于机器学习、聚类技术和自然语言处理技术可以利用文本挖掘和情绪分析来有效分析这些非结构数据的特征分布和偏好性,从而有针对性地选择决策备择方案。对于公众来说,利用智能手机等终端设备,可以随时随地通过政府的开放讨论入口进行政策议程中备择方案的讨论。英国议会为了提高公民参与政策的讨论,2015年时基于大数据技术搭建了电子请愿系统。杭州城市大脑的搭建,使得市民建议、投诉、咨询的路径从政府网站迁移到更多贴近生活场景的应用中。
(二)人工智能应用嵌入的政府治理风险架构
人工智能不是新兴话题。对于人工智能应用未来可能产生的风险挑战,各界讨论从未停息。贝克在提出“风险社会”伊始,便强调了技术发展带来的风险;技术治理运动中,“新技术治理的隐忧”受到了很多关注。智能治理作为技术治理的新手段,对于地方政府治理来说,又有哪些风险挑战呢?基于人工智能应用嵌入政府治理侵入逻辑“个人(Personal)→数据(Data)→算法(Algorithm)→政府(Government)”,本研究构建了人工智能应用嵌入政府治理的PDAG风险挑战架构。
1.个体数据隐私保护缺乏
人工智能应用的基础是数据,而数据产生的主体是生命个体。作为个体,法律对个体人格尊严的保护要求个体的数据信息应得到保护,以避免个体成为纯粹的物。随着政府决策与企业等社会主体决策愈加依赖于大数据的收集和使用,使得个体的隐私无处可藏,甚至完全处于“网络裸奔”状态。从政府层面,借助人工智能系统,可以对每一个社会个体进行全方位、立体化、全天候的完全监督。相对于个体来说,不赋予个体相关的信息权利,将得不到相应的服务响应。在智能应用普遍的今天,个体的姓名、性别、位置信息、电话信息、出行信息、内容创作信息、浏览过的信息都被一一进行记录,经过简单的数据收集和智能算法,便可以推测出个人癖好等私密信息。杭州城市大脑的数据是互联互通的,个体授权的多元数据汇聚在一起,通过深度学习便可进行人物画像,因此对数据保密和安全维护非常重要。而在我国,对个体数据隐私的保护尚无系统规定。虽然《中华人民共和国网络安全法》等法律中有提及,但没有具体的保护规定,对敏感数据也缺乏界定和保护。因此在数字政府已成主流趋势的治理情境下,针对个体的信息保护出台相关法律是极其必要的。艾瑞斯说:“隐私问题部分来说不是大数据分析的问题,它是数字化过程的阴暗面”。杭州城市大脑作为政企协作的产物,利益主体之间的博弈维持均衡状态很难,随着杭州城市大脑由“治堵”向“治城”转变,人工智能应用嵌入地方政府治理的程度就越深,政府对个体数据的侵蚀潜能也会得到放大。现实生活中政府建立的信息系统看起来都比较小而且独立,就单个而言公众觉得无关痛痒且合理,但通过智能技术将这些信息系统整合起来,就会逐渐蚕食个体的自由,这才是真正的危险。
2.数据归属与责任不明确
未来数据资源将成为像土地一样的资源,有所有者和使用者,即有归属者也有责任方。人工智能时代,数据的所有权要从国家与社会的相互权衡中确定平衡点。数据资源能否像土地资源一样,所有权属于国家,个体具有使用权和转让权,这值得探讨,土地资源是可观可测的,而数据资源可测性就明显不足。人工智能时代对数据权力的诉求较为迫切,而当前的物权说、债权说、人格权说、知识产权说和隐私权学说等对数权的定义和保护尚存在困境。对杭州城市大脑未来应用中可能产生的风险挑战,总构师王坚认为数据的归属问题可能最为艰难。因为数据是一种资源,资源具有可营利属性,使用未经授权的资源便可认定是侵权。在责任问题上,未来嵌入政府治理的人工智能应用将不仅仅是一个智能平台,更是具有判断意识的智能机器人,比如环卫机器人、城管机器人、医疗机器人等,他们的开发者来自科技企业,而政府只是使用者。这些智能机器人给社会带来便利化的同时,也将对社会秩序伦理带来挑战,如果城管机器人因判断失误导致指令歪曲执行致人死亡,责任归谁?政府还是开发者?政府的个体还是全体,开发者个体还是开发者公司?更微观地来看,是机器意识自我歪曲的责任还是工作数据输入不当的责任?杭州城市大脑能诞生在杭州,不仅因有阿里这样超级企业存在,且有杭州政府大胆尝试的魄力。城市大脑首发的红绿灯调控问题,杭州交管部门揽下了责任,但这一责任并没有得到细化。这是为杭州城市大脑试验能顺利进行做出的先期承诺,不意味着地方政府将一直为责任买单。总的来说,人工智能参与政府治理是实现机器对人行政行为的替代,其行政责任将呈现模糊性危机。
3.算法歧视风险
人工智能应用参与地方政府治理,算法是关键。算法可以评估喜好、预测生活满意度、决定看到的网络内容、评估犯罪风险、智能生成职业选择、规划最佳行驶路线。杭州城市大脑一系列智能高效、响应迅速的场景应用便建立在此功能之上,它可以调控红绿灯减少路口不必要的等待,根据旅游偏好推荐想要的食宿点,根据停车喜好推荐停车点,根据浏览记录推荐相关的政务信息。生活看起来是智能化了,但算法强大的背后并不能保证客观、公平、公正,这就是算法歧视问题。公平公正虽然本身也是模糊的概念,但是算法创造的公平公正很难摆脱歧视问题,因为算法的智能系统是由代码而不是规则来决定的。人工智能应用嵌入政府治理带来的智能治理,其依靠的是精确的算法,表面看似乎减少了公共行政中人主观决策的因素,由精确的算法代码来执行,但代码仍是人的产物,体现的还是设计者和开发者的主观意愿选择。杭州城市大脑背后主要的服务商阿里,是互联网科技行业的领军企业,拥有一支强大的算法队伍。算法服务支持主流的深度学习框架和算法组件及一体化算法管理,而他们主要还是为企业利益服务,在设计与开发中始终围绕的是企业发展。杭州市政府虽然派驻专班与企业开发人员联合办公,但更多是提需求和掌控进度,缺乏一线开发的实际掌控。因此,即使数据能保证真实客观有效,在算法设计中也难以避免设计者的主观性。算法歧视通常是算法的副产品,是算法不可预知的、无意识的特性,而不是程序员的有意识选择。算法属于设计者的秘密,透明化并不能保证其公平性。一是作为企业商业机密一般拒绝公开;二是缺乏专业知识的社会公众难以认知;三是涉及数据公开又违背数据安全保护义务。
4.政府技术弱势
人工智能时代,掌握巨量数据以及具有巨量数据分析技术的主体将逐渐占据优势,并由此衍生出以数据和算法技术为核心的权力。拥有公共权力和公共资源的国家和政府,在利用人工智能技术提高治理水平时有显著的优势,即收集公民数据和监管公民行为。然而,政府仅仅是人工智能技术应用的使用者,不是设计者和开发者,是缺乏技术能力和技术预见的,因此掌握核心技术的科技企业往往具有技术上的主动权。阿里云是国内云计算的“领头羊”,拥有自主研发的飞天操作系统和全球领先的人工智能技术,除了ET城市大脑,还有ET环境大脑、ET工业大脑、ET医疗大脑等一系列强大的人工智能平台。阿里云依靠其强大的技术在政府治理问题上拥有更多的话语权,而政府既想利用其强大技术又想保证自上而下的单一决策权不受影响是不可能的。在利用人工智能技术实现对公众个体的监督和控制上,技术巨头已利用技术优势染指公共权力。如在特朗普竞选过程中,与其竞选团队有关的英国剑桥分析公司,便盗用了数百万用户的Facebook使用数据,并利用其获得的Facebook使用数据帮助特朗普的竞选,暴露了Facebook在使用和共享信息方面的宽松。随着科技企业技术垄断地位的逐渐提升,政府技术弱势将逐渐明显,技术权力对公共管理权威也将形成挑战。
五、结论和建议
人工智能技术嵌入政府治理带来了可喜的变化,但仍有很多未知的风险。研究以杭州城市大脑作为政府利用人工智能技术的实践案例,介绍了杭州城市大脑的智能治理实践历程和实践经验,构建了人工智能应用嵌入政府治理的智能治理机制和风险架构。可以看到,技术嵌入政府治理,政府治理中自我设限的困局得以改观,决策逐渐向科学判断管理转变,信息开放和互动升级形成了政府决策倒推动力,由技术衍生的新型权力关系得以重新塑造。但人工智能作为一种技术治理的工具或手段,加强对治理目的价值的引导,建立完整的风险防控机制,将有利于应对反治理。总的来说,我们应对人工智能嵌入政府治理持谨慎乐观态度,因为在人工智能奇点到来之前,设定规则可以解决的问题都在人类智能范围内。如何推进智能治理以及如何防范治理风险,基于上述分析,本文给出以下两部分建议。
(一)地方政府推进智能治理的建议
基于杭州城市大脑的实践经验,对于地方政府如何推进智能治理,提出四点建议:
一是保持开放的治理理念。技术治理遵循科学理性的方法帮助治理主体更好地治理,因此对于新兴技术的态度,不应是畏惧而应是敬畏。地方政府的决策者要紧跟技术潮流,用开放的理念,培植本土科技高地,迎接高技术应用。
二是做好数据的归集和融通。数据如今已然成为宝贵的资源,是地方政府实现智能治理的基础。地方政府应在国家倡导的政府数据归集和共享基础上,进一步打通部门之间、上下级之间的数据壁垒关,汇聚政府服务的多元数据。同时利用电子传感器和物联网等设备收集公共空间运行的实时数据,将数据归集做到精细化,并将各类关联数据进行融通,为实现公共服务快速一体化奠定坚实基础。
三是积极接入智能治理平台。智能治理平台不仅可以提高政府公共服务效能,还能有效节约政府施政成本。杭州城市大脑从杭州诞生,已扩展到全球23个城市。而除了阿里开发的城市大脑,华为、腾讯等也开发了类似城市大脑的综合智能治理平台,为地方政府提供了更多选择。因此,地方政府决策者应积极了解、洽谈和引进这类治理平台。
四是强化政企协作和规划引领。对于有实力的地方科技企业,地方政府应加强扶持与协作,将其引入城市大脑等智能开放创新平台上,提高其创新能力和智能治理服务的能力。智能治理实现需要一个积累的过程,地方政府应结合地方实际,以规划为引领,定期总结工作落实情况,逐步推进。
(二)防范人工智能嵌入政府治理风险的建议
对于人工智能应用嵌入地方政府治理可能面临的风险挑战,基于上述讨论,提出四点建议:
一是立法先行,对数据、技术、个人信息保护立法。当数据成为一种资源,人工智能应用将成为未来社会的一种基础设施。个人信息处于一种全裸状态时,界定归属关系和责任关系,需要法律保证,且立法必须先行。立法既需要国家的立法,地方也应建立健全相应的地方法规。
二是健全防控体系,地方政府要防控技术弱势造成的话语权失落,科技企业要防范数据的被攻击风险。地方政府应适当储备部分懂业务也懂技术的人才,在政府内部建立起对数据信息收集、存储、分类、分析利用、安全保障的防控体系。利用大数据开发人工智能应用的企业应当建立起强大的信息安全防御系统,保障政府所提供数据的安全。
三是建立健全多元开放平衡的治理体系。人工智能技术促进了政府信息的开放,也促进了地方政府与社会的协同合作。随着人工智能应用广泛化,社会所面临的问题也将呈现更复杂的趋势,必须依靠多元、开放、平衡的治理体系,实现多主体参与、开放式讨论、平衡关系维持。
四是充分开展全球合作,人工智能发展最终挑战的是人类文明和生存,所以整个国际社会都应对此形成高度的认识和合作关系,共同维持人类生存空间。全球的合作有技术上的合作,更多应是治理规则的合作,比如算法公开。地方政府在利用人工智能应用实现治理智能的过程中,应充分了解国际趋势,寻求治理规则的共享。
文章来源/《甘肃行政学院学报》,2020年第3期
本期编辑/小胖师兄返回搜狐,查看更多