第二章 AI GIS:地理智慧的融合之道
在日益增长的应用需求牵引和日新月异的信息技术推动下,GIS软件技术体系也正日益丰富和完善,其中,AI GIS(人工智能GIS)技术是当前重要的研究方向。AI GIS是指将AI技术与各种GIS 功能进行有机结合,包括融合AI 技术的空间分析或空间数据处理算法(GeoAI)及AI与GIS的相互赋能的一系列技术的总称。AI GIS近年来逐渐成为地理学科研与应用的主要热点,越来越多的学者分别从不同专业应用角度来探讨AI GIS技术在遥感图像处理、水资源研究、空间流行病学、环境健康领域等方面的应用,并取得了很好的成果。已有研究表明,AI GIS扩展了传统GIS的数据处理能力,能高效地识别和分析街景、遥感和航拍图像、文本等非结构化数据中的地理信息;AI GIS能从多源异构的时空数据中捕捉到动态变化的复杂时空变化关系,增强了GIS模型的分析预测能力。这些研究推动了AI GIS技术的发展。
一、AI GIS 的兴起
AI GIS的兴起,进一步提升了地理智慧(Geo-intelligence)。早在2013年(AI GIS研究兴起之前),本章作者就提出了GIS对IT的贡献在于地理智慧,并明确提出把“地理智慧创新IT价值”作为发展GIS软件技术的宗旨。现代地理智慧是指以GIS、遥感和卫星定位技术为基础的地理空间可视化、分析、决策、设计与控制的技术总称。一方面,GIS需要积极融入IT,成为IT的一部分,只有避免在狭小的专业圈子自缚手脚才能获得更广阔的发展和应用空间;另一方面,GIS必须为IT创造不可替代的价值,才有持续存在和继续发展的理由。而地理智慧正是GIS区别于其他信息技术的最为独特的价值。地理智慧包括四个层次,构成了地理智慧金字塔。
第一层是地理可视化,指各行业基于GIS的二维和三维的可视化能力,直观清晰地反映业务数据的空间分布格局特征。这是地理智慧中应用最广泛的价值,不少行业早期应用GIS便是从地理可视化开始的,并一度认为这是GIS的核心价值,实则为最基础的地理智慧体现。在AI GIS体系中,AI结果可通过地理可视化深入挖掘数据价值。
第二层是地理决策,指以GIS空间分析算法为基础,为政府、企事业单位和个人提供辅助决策支持的价值。空间分析是GIS的灵魂,地理决策是地理智慧核心价值之一,常见于应用GIS相对深入的领域。在AI GIS体系中,各种GeoAI算法的分析结果可作为决策依据。
第三层是地理设计,指基于地理空间位置和考虑地理环境的设计方法。地理设计不仅体现在宏观的规划领域,当前正越来越多地应用于相对更微观和具体的设计领域。例如,传统的建筑设计仅考虑被设计对象本身,地理设计则把被设计对象放入地理环境中来考虑,可以让建筑设计在采光、视野、城市形态等方面更加优化,与环境更协调。地理设计是在以二维GIS应用为主的前提下提出来的,在新一代三维GIS广泛应用的今天,地理设计有着更广阔的应用领域和前景。地理设计在智慧城市等应用领域与AI GIS的各方面都有联系。
第四层是地理控制,即基于GIS的空间分析能力实现对环境和动物体的智能化控制。地理控制包括交通信号灯的自动控制与优化、无人机的航路自动规划与自主飞行控制、农业与工程机械的自动路线规划与驾驶等。地理控制当前的研究热点是乘用车辆的自动驾驶。地理控制常需要嵌入AI GIS中的GeoAI算法作为底层核心能力,并通过AI增强的交互与控制功能完成智能化控制。
地理智慧的四个层次,自底向上复杂度越来越高,而成熟度则越来越低。地理可视化是最为基础、应用最广泛的地理智慧,地理决策应用也相当普及,地理设计应用也在快速发展和完善,地理控制则应用较少,特别是乘用车辆自动驾驶距离成熟应用还需要多年时间。
GIS软件技术不断发展和升级,将推进地理智慧不断演进和发展。过去几年,新一代三维GIS技术和大数据GIS技术的发展,都不同程度推动了四个层次地理智慧的进化。而随着人工智能的引入,地理智慧将会迎来新一轮技术的革新,必将进一步提升地理智慧的能力,为IT创造更大的价值。
二、AI GIS技术体系
AI GIS技术由三个部分组成,除了得到广泛研究的GeoAI算法,还包括AI 赋能GIS和GIS赋能AI两部分。GeoAI算法是融合AI的空间数据分析与处理算法,是AI和GIS充分融合的产物,既属于AI,也属于GIS。AI赋能GIS则是利用AI的能力提升GIS软件的功能和用户体验。GIS赋能AI则是GIS利用其可视化和空间分析技术,对AI算法处理其他非空间数据输出的结果进行可视化和进一步空间分析的技术和应用。
在三类AI GIS技术中,GeoAI算法的处理对象通常是空间数据(包括各种矢量或栅格形态的经典空间数据和空间大数据),另外两类通常不涉及使用AI 算法处理空间数据。
人工智能技术诞生于1956年,但在随后相当长的时间里没有得到较大突破。20世纪80年代机器学习诞生后,人工智能技术才得以较快发展,但90年代再次进入低谷。直到2000年,机器学习中的重要分支——深度学习诞生,再次推进人工智能的研究和应用热潮。由此可见,机器学习是当前人工智能的核心,而深度学习是人工智能核心中的热点研究方向。当前AI GIS算法由基础工具中AI 流程工具(AI Pipeline Toolkits)与融合AI技术的空间数据处理和分析算法(GeoAI)共同组成。其中,GeoAI分为空间机器学习(Geospatial Machine Learning)和空间深度学习(Geospatial Deep Learning)两部分算法,随着AI本身的发展,未来也可能会产生新的GeoAI算法类别。基础工具中的AI流程工具是GeoAI 算法的数据准备、模型训练和模型应用整个流程的实现工具。
一般的空间机器学习技术实现复杂性不高,计算速度较快,多适用于各种数据表格形式的空间数据的离散或连续值的分析和预测,模型对于复杂结构关系的学习能力较为有限。而空间深度学习则通过反向传播算法,进行多层次特征提取,可以学习到比一般机器学习更深层次的抽象特征,进而发现数据的复杂模式。以深度卷积神经网络(CNN)为代表的深度学习在图像分类、目标检测、目标追踪、语义分割和超分辨率重建等计算机视觉任务的优异表现,为地球科学领域的未解决的相关问题提供了新的解决思路。
深度学习能从地理空间相关数据中直接学习识别时间与空间特征,能自动高效地构建复杂特征,使数据驱动的地球科学研究发展成为新兴的交叉学科和技术方向——空间深度学习,广泛用于遥感图像处理、智慧城市、水资源环境、环境科学和公共健康等领域,并在空气质量预测、人流拥挤预测、地物分类、道路和建筑物提取等许多研究中取得了较优的效果。以SuperMap(北京超图软件股份有限公司)为例,目前提供的空间深度学习算法包括三维数据分析和影像分析两类,随着应用领域的拓展,将不断丰富算法的种类和数量。
模型不可重现问题一直是AI领域困扰科研界和工业界的一大问题。一些研究成果中呈现了高准确度GeoAI算法,但很难重现。其原因主要为地物的空间特征在不同地域、不同季节的表现并不完全相同,因此提供训练后的模型在地理信息领域并不是最佳方案,需要提供GeoAI算法的训练工具,让应用单位可以根据自身的数据重新训练模型,提高模型推理结果的成功率和准确度。
根据机器学习的一般流程,结合地理空间信息的特殊情况,GeoAI工作流程可分为数据准备、模型构建和模型应用三个环节。
在数据准备阶段,AI GIS平台需要支持一些通用AI标准数据格式与GIS格式的转换,提供AI样本制作工具。在模型构建阶段,AI 模型训练的超参数等元信息与GIS软件难以集成,不同框架的模型文件格式各异,需要设计统一格式进行模型和训练信息的统一。在模型应用阶段,GIS平台需要统一的流程来识别模型格式,并在GIS服务中部署、发布、管理等。
为解决各流程环节的相关问题,GIS(如SuperMap GIS)可提供覆盖全流程的AI流程工具,包括桌面GIS、服务器端GIS、移动端GIS等各种不同的GIS形态产品。下面以SuperMap GIS为例进行说明。
例如,在服务器端GIS中,数据科学服务提供在线交互式Python编码方式供空间数据科学家使用,以及通过服务形式来完成模型注册、发布和应用的机器学习服务。桌面端GIS提供用户可交互操作的桌面流程工具,通过可视化交互操作的方式来完成数据准备、模型构建、模型应用的机器学习流程。组件式GIS则提供Python编码的方式给使用者,通过脚本调用形式来完成整个流程。
三、AI赋能GIS
融合AI的空间数据分析与处理算法研究获得较多关注,除此之外,也可以利用AI技术提升GIS软件的智能化水平。随着GIS的全空间化、泛在化和空天地一体化的发展趋势,空间信息的来源已经从传统的遥感测绘逐渐发展到多种多样的形式,对GIS的数据处理能力提出挑战。深度学习等人工智能技术的非结构化信息感知与提取,能够补充GIS在各种场景下处理新型数据源的能力,提高GIS在数据获取、处理、制图及与用户交互的效率。例如,AI技术可以降低GIS数据采集和测图成本,也可以简化GIS制图和软件交互流程。本文从AI属性采集、AI测图、AI配图和AI交互四个方面进行具体介绍。
在城市管理执法中,需要频繁录入现场执法案件属性信息。基于AI的图像目标检测和分类技术可以有效提高属性采集效率,如在违章停车案件中,可以快速识别车牌编号、车身颜色、车辆类型等信息,并自动完成填报。其他执法场景如暴露垃圾、乱堆物料、非法广告、城市部件等均可以通过AI进行识别并自动填报。类似的AI图像识别应用,可以大幅减少手工录入工作量,提高属性采集工作效率。
GIS中的测图技术正在逐渐从室外走向室内,而测量精度和测量成本是室内测图的两个关键要素。基于激光雷达技术的室内测图方式,测量精度较高,但测量成本也相对较大,且整体流程较为复杂。为解决该问题,可将惯性测量单元(IMU)和计算机视觉技术相结合,显著降低室内测图成本。该方法首先需要获取连续拍摄的室内图片,基于计算机视觉算法对连续图片进行特征点匹配,并通过特征点匹配结果来还原真实空间位置,最后将位置信息通过坐标转换的方式映射到地图中,实现整个AI 测图过程。目前,移动端GIS 软件可以实现基于IMU和计算机视觉的AI测图功能,用户可以在某些应用中用普通的手机设备部分替代较为昂贵的室内测图设备,降低测图成本。
SLAM(Simultaneous Localization and Mapping)是计算机视觉室内定位的基础。SLAM最早应用在机器人领域,其目标是在没有任何先验知识的情况下,根据传感器数据实时构建周围环境地图,同时根据这个地图进行自身定位。IMU是测量物体三轴姿态角(或角速率)及加速度的装置,在导航中有重要应用价值。采用基于IMU和SLAM融合的视觉惯性系统(Visual-Inertial System,VINS),可实现低成本的室内AI 测图功能。
VINS是融合相机和其惯性测量单元数据实现即时定位和地图构建的算法,基于空间矩阵变换原理,结合视觉校准和惯性校准算法,实现二维、三维地图在真实场景中的可视化映射。具体计算过程包括:实时图像获取,摄像机坐标系标定;特征信息提取,立体匹配;空间映射重建(深度感知),得到二维、三维地图在空间中的实时姿态、位置、距离信息,实现动态空间和高清像素分辨率的精确深度检测与标定;设置多个控制点,采用测量平差的方式提高测量精度,最终完成室内测图。
地图配图是GIS的基础功能。传统手工配图要对众多地图内容要素反复搭配与调整,较为复杂和耗时。图像风格迁移是在保留目标图片内容的基础上,将风格图片的色彩构成、色彩分布等整体风格迁移到目标图片上的技术。AI配图即基于图像风格迁移思想,使用机器学习算法,对输入的图片风格进行识别和学习,结合面积权重、目标对象类型等信息,将图像风格迁移到目标地图的一种自动化配图技术。桌面端GIS软件中嵌入AI配图功能,能将风格图片复杂的颜色风格快速迁移到目标地图上,显著提升GIS配图效率和效果。
AI配图的主要流程包括:提取风格图片关键色,即输入选定的自定义地图模板风格图片,基于K-means聚类算法提取图片特征,得到风格图片中的关键色;提取当前地图关键色,主要对原始地图进行关键色提取;面积排序匹配。提取关键色后,需要对提取的图片关键色和地图关键色进行匹配,选择面积匹配算法,按照面积权重将图片的颜色自动匹配至原始地图。
在GIS软件中,经常需要进行地图和场景的交互操作,通过交互操作对空间数据进行查询、浏览和使用。现有的GIS系统,如SuperMap GIS,可借助AI中的语音识别、手势识别、人体关键点检测等技术实现智能化的GIS软件交互。基于手势识别,可以对二维地图和三维场景进行平移、缩放、旋转等交互操作;也可以将手势识别扩展为人体姿态的识别,通过对人体动作的关键点捕捉,识别姿态动作进行二维、三维地图操控。
四、GIS赋能AI
上文主要介绍AI赋能GIS方面,应用AI技术完善和提升GIS软件功能。另外,面向AI计算识别结果,GIS可以利用其空间可视化和空间分析能力处理与挖掘数据价值,即GIS赋能AI。
空间可视化技术是GIS的核心能力之一:GIS提供了多样化的地图展现手段,可对各种应用数据的空间分布特征和趋势进行有效表达;可以将属性值汇总到行政区划图中,在地图中展现不同区域的差异变化,也可以通过规则格网进行属性值聚合,发现高值聚集区域,或者使用热力图对空间整体的热点分布状况进行直观表达。
例如,视频与GIS的集成应用已经成为当前的一个研究热点,借助AI技术,可以实现摄像头频率的目标检测与追踪,也可以进行智能化的人群感知,但如果不借助GIS,很难对遍布整个区域的视频识别结果进行全局展示和综合分析。因此,可以基于空间可视化技术,将视频识别结果在地图中进行热力图、聚合图等多种可视化效果的展示,辅助管理人员掌握整体空间趋势,探查空间异常情况,进一步挖掘视频数据的深层隐含信息。
空间可视化技术可以辅助从整体上认识数据的分布特征,而空间分析技术可以对AI提取结果进行深入处理与挖掘,即将空间计算过程加入AI识别结果的进一步分析过程当中,例如:通过AI技术可以识别出视频数据中的各类关键目标,包括行人、机动车、公交车等;通过建立视频空间和真实地理空间的映射,可以将公交专用车道占用这样的应用问题转化为地理围栏分析,对视频内目标进行空间关系计算,发现进入公交车道的行人和机动车等违章情况。另外,可以基于交通监控摄像头的AI识别获取目标车辆经过的多个位置以及相应时间。基于这些信息,可以结合交通路网数据进行GIS最佳路径分析,还原目标车辆的真实运行轨迹,服务于目标车辆的追踪应用。
五、AI GIS软件技术体系
为了对AI GIS的三个方面进行有力支撑,自底向上构建了四层结构,形成较为完整的AI GIS技术体系。最底层为数据层,既包括遥感影像这样的文件型数据,也包括关系型数据及大数据场景下使用较多的NoSQL数据。数据层之上为AI领域库,主要聚焦样本和模型两个方面开展建设,不断丰富各类空间数据样本和模型。在框架层中,需要通过合理的抽象和封装兼容多种AI框架,既可以避免重复性研发工作,又可以高效地与最新算法和模型研究成果进行融合。最上面的功能层即具体介绍的AI GIS的三个方面。
为了保持AI GIS软件技术体系的一致性,同时服务于多种GIS应用场景,AI技术需要与组件GIS、桌面端GIS、服务器GIS等在内的多种形态的GIS软件进行深度融合,共同构建AI GIS产品体系。其中,AI GIS产品体系的基础为组件GIS产品。由于Python为AI开发主要语言,SuperMap研发了基于Python语言的组件GIS软件iObjects Python,支持空间统计、空间机器学习与空间深度学习等功能。为了服务大数据场景下的AI GIS功能,面向大数据GIS的iObjects for Spark软件中添加了空间机器学习功能支持,使得分析过程可以充分利用集群计算资源;桌面端GIS软件中增加了机器学习模块,用于以图形界面操作方式来构建AI模型。在服务器GIS软件中,SuperMap增加了数据科学服务(Data Science Service),通过在线交互开发方式来构建AI模型及机器学习服务(Machine Learning Service),用于将构建出的AI模型进行注册发布,支撑Web服务化的模型推理。
六、展望AI GIS
作为新一代GIS软件技术体系的重要组成,AI GIS通过融合AI的空间数据分析与处理算法、AI赋能GIS和GIS赋能AI,改变了传统GIS软件处理和分析的方式。利用AI GIS完善发展新一代GIS技术体系是解决当前GIS系统智能化问题的有效方法。
目前,AI GIS初步实现了遥感图像、视频等地理信息的二维视觉提取。随着计算机视觉和全空间GIS技术的发展,地理控制、视觉导航定位中的深度图、点云等三维环境结构感知变得越来越重要,结合三维计算机视觉的智能提取将是AI GIS的下一步发展重点。
目前,制图导航、地物图像识别、空间分析等方面的AI还属于弱人工智能(Narrow AI),只能聚焦某种具体应用问题,离通用人工智能(AGI)还较为遥远。AGI研究有两种主要方式:其一,从先天的类脑结构寻找突破点;其二,以后天的训练学习为主。实际上,二者都能取得相似效果,而互相结合也是AI GIS实现AGI GIS的一个发展方向。
作者:宋关福 北京超图软件股份有限公司