GeoAI入门,这些空间分析请先走一波

  • dqy 

 人工智能(AI)无疑是最近技术圈的潮流风向,从机器翻译、语音识别、图像识别……各种新的应用层出不穷。与众多新技术一样,平台厂商率先在基础算法和框架发力。作为全球空间分析领域的领导者,Esri近期展示了其在地理人工智能GeoAI的阶段成果和发展计划,并且在最新发布的ArcGIS 10.6中集成了微软 CNTK、谷歌TensorFlow等深度学习框架。 
    目前,ArcGIS地理平台时刻在为遍布全球的用户和开发者提供完整的地图可视化和分析平台。其强大的分析能力可以归纳为三大框架:地理处理框架(GP Framework),空间大数据计算框架和机器学习框架。

 这里不对三大分析框架展开讨论,重点带大家了解地理人工智能GeoAI入门的第一步:机器学习工具。分类、预测、聚合是机器学习中使用最广泛的方法,ArcGIS已经封装好了一系列工具,下面简单介绍主要的三个工具集,学习的软件推荐大家使用ArcGIS Pro,可以方便地调用三大分析框架,并实现分析模式探索,训练样本生成,样本导出到TensorFlow或者CNTK框架构建的模型进行训练,再把优化后的模型导回到ArcGIS Pro,最终实现对空间和表格数据的分析和可视化。

分类是基于训练数据集判断目标对象应该归为哪一类的过程,ArcGIS提供了多种分类方法,主要面向遥感影像数据,通过分析像素值和配置信息后对像素进行分类。此前Esri发布过的土地利用类型自动提取和森林砍伐的损失面积评估的机器学习案例就属于这一类。工具包括:最大似然(Maximum Likelihood Classification)、随机森林(Random Trees),支持向量机(Support Vector Machine)。 
    聚合是基于属性值或位置的相似性对目标对象进行分组,ArcGIS提供了基于位置、属性(单一、多元)和位置+属性结合的多种聚合算法,可以用来根据社会经济和人口分布做学区覆盖分析或在自然灾害发生后根据社交媒体活跃度分析人口聚集区域。工具包括:空间约束多元聚合(Spatially Constrained Multivariate Clustering),多元聚合(Multivariate Clustering),Density-based集群(Density-based Clustering),图像分割(Image Segmentation),热点分析(Hot Spot Analysis),聚合和异常值分析(Cluster and Outlier Analysis),时空模式挖掘(Space Time Pattern Mining)。 
    预测是利用已知来估计未知,ArcGIS提供了一系列回归和插值方法用来做预测分析。例如在一个房价评估模型中加入房屋周边的实时空气污染指数,对照最近的销售数据和社区特点等因素进行综合预测。工具包括:经验贝叶斯克里格(Empirical Bayesian Kriging),区域插值(Areal Interpolation),EBK回归预测(EBK Regression Prediction),普通最小二乘回归和探索性回归(Ordinary Least Squares Regression and Exploratory Regression),地理加权回归(Geographically Weighted Regression)。 
    除了上述方法,机器学习还贯穿在整个ArcGIS平台中,包括智能选择数据,参数默认值由数据驱动,工作流程自动化和结果优化。例如在EBK回归预测工具中使用主成分分析(PCA)作为一种降维的手段来改进预测;Density-based聚合工具中使用机器学习技术基于给定的可达图选择聚合容差值;空间约束多元聚类工具使用一种证据积累的方法为用户提供相关的概率聚类结果。 
    面向需要功能扩展的场景,ArcGIS是一个开放可互操作的平台,支持集成互补的方法和技术,开发者使用Python API可以调用ArcGIS函数与开源的Scikit-Learn、 TensorFlow、Pythorch或IBM和微软提供的AI学习引擎进行结合分析,还可以用R编写地理处理功能脚本,使用R-Bridge从R控制台调用ArcGIS函数。 
    地理人工智能GeoAI领域的研究会不断发展,未来Esri将积极推动机器学习方法和整个平台进行集成,增加更多的分析方法和工具,包括传统的逻辑回归、随机森林、支持向量机和时间序列预测等算法,以及创新领域的新算法-深度卷积神经网络,继续让ArcGIS用户和开发者使用最先进的空间机器学习技术解决问题,提升业务价值。 

Leave a Reply

Your email address will not be published. Required fields are marked *