《GeoScene GeoAI地理感知智能技术最新进展及应用场景探索.pdf》由会员分享,可在线阅读,更多相关《GeoScene GeoAI地理感知智能技术最新进展及应用场景探索.pdf(52页珍藏版)》请在三个皮匠报告上搜索。
1、GeoScene GeoAI地理感知智能技术最新进展及应用场景探索易智瑞信息技术有限公司赵素雯人工智能(AI)与GeoAI01GeoScene GeoAI 场景GeoScene GeoAI 工具0203REPORT OUTLINE目录目录人工智能(AI)与 GeoAI人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。何为人工智能?强人工智能弱人工智能具体任务驱动的人工智能自主完成一系列任务,具有类人的逻辑推理、联想、意识控制等综合能力的智能分享地理价值帮助用户成功助力产业发展符号主义的逻辑推理方法专家系统深度学习深度学习语音识别、图像识别算法突破人
2、工智能技术发展历程2015.072017.072017.102017.12国家新一代人工智能创新发展试验区建设工作指引:力争到2030年,布局建设20个左右试验区2018.072018年政府工作报告:人工智能再次列入政府工作报告:加强新一代人工智能研发应用。2019.08国务院正式印发新一代人工智能发展规划,战略确立了新一代人工智能发展三步走战略目标,人工智能的发展至此上升到国家战略层面2020.促进新一代人工智能产业发展三年行动计划(2018-2020年)发布国务院关于积极推进“互联网+”行动的指导意见发布,将人工智能作为重点布局的11个领域之一十九大报告人工智能正式写入十九大工作报告,将推
3、动互联网、大数据、人工智能和实体经济的深度融合国家多次布局“新基建”:国务院常务会议中央全面深化改革委员会第十二次会议中央政治局常务委员会会议11月3日,中共中央关于制定国民经济和社会发展第十四个五年规划和二三五年远景目标的建议发布:科技前沿领域,新一代人工智能排名第一位人工智能成为国家科技发展的战略支撑之一机器学习(含深度学习)强化学习图算法知识图谱运筹优化机器人自然语言处理搜索引擎计算机视觉(2D&3D)计算机图形学语音识别基础层应用层监督机器学习-逻辑回归、KNN、决策树、支持向量机、随机森林非监督机器学习-k-means、DBSCAN基于密度的聚类考虑时间序列的算法:ARMA、NARM
4、A、LSTM概率图模型-有向图模型(朴素贝叶斯、隐马尔可夫模型)-无向图模型(受限玻尔兹曼机模型、条件随机场模型、马尔可夫随机场模型)卷积神经网络循环神经网络对抗神经网络策略梯度算法值函数拟合算法图搜索路径发现社群发现图挖掘图神经网络知识抽取知识融合知识表示知识推理-图像分类-目标检测-图像分割-目标跟踪-图像描述-图像生成-三维几何重建-深度估计-三维坐标估计-三维目标检测和跟踪等-词向量表示-文本分类-序列标注-机器翻译-文档摘要制造水利金融环保自然资源应急管线互联网医疗交通测绘审计园区行业层人工智能(AI)技术概览GeoAI地理空间人工智能地理空间人工智能:人工智能、机器学习及深度学习与
5、地理信息系统的一体化人工智能、机器学习及深度学习与地理信息系统的一体化Integration of Artificial Intelligence,Machine Learning and Deep Learning with GISAIGIS语音识别自然语音生成计算机视觉自然语言处理人脸识别即时视觉翻译数据采集时空大数据三维建模空间建模自动驾驶制图智能预测应用创建激光雷达点云遥感影像分类、识别等点云三维模型重建交通预测、房价预测等GeoAI机器学习、深度学习本次分享侧重计算机视觉领域的深度学习技术遥感影像点云视频自然语言文本GeoAI:AI用于GIS领域的分析、方法和解决方案GeoScene
6、 GeoAI 场景GeoAI常见场景:目标检测指计算机需要在图像中查找目标特征及位置。广泛用于定位卫星、航空或无人机影像中的某些特定特征,并在地图上绘制边界框定位这些特征的位置。计算机为图像分配一个标签或类,比如基于普通相片或图片的“猫狗分类”。在GIS中主要可用于对带有地理特征的图片进行分类,如“密集人群”分类、受损房屋分类、不同作物种植分类、游泳池是否富营养化分类等GeoAI常见场景:对象分类图像中的每个像素都被归为一个特定类别,比如下面左图图像中,黄色像素被归类为猫,绿色像素归为地面,蓝色像素归为天空。在GIS中,这通常被称为像素分类、图像分割或图像分类,常用于土地使用分类、或道路提取等
7、。例如,在下面右图中,通过将道路像素与非道路像素做不同归类,从而提取道路数据GeoAI常见场景:语义分割可将其视为一种更精确的对象检测方法,它绘制每个对象实例的边界,这种类型的深度学习应用也被称为对象分割。在GIS中常用来提取同一类别的不同对象,如下面右图中提取每一个建筑物的顶面GeoAI常见场景:实例分割在视频中识别物体并以矩形框的方式标示,视频目标检测要解决的问题是对于视频中每一帧目标的正确识别和定位。在GIS中视频检测可用于识别视频中的移动目标,如车、人、船,在结合目标地理位置实现后续分析GeoAI常见场景:视频对象识别与追踪对点云数据集中的点进行分类和提取。可用于基于点云数据分类提取建
8、筑物、地面、电力线、电线杆等GeoAI常见场景:点云分类变化检测是深度学习计算机视觉领域一个小方向,变化检测方向所做的事情顾名思义,提取出两幅不同时向变化的地方。一般来说,变化检测根据场景以及我们的关注可以分为单类别变化以及多类别变化。单类别的常见场景如建筑物增减变化,多类别的常见场景如国情普查数据变化。GeoAI常见场景:变化检测GeoScene中的深度学习算法,支撑GeoAI全场景GeoScene中的深度学习算法,支撑GeoAI全场景GeoScene GeoAI结合遥感影像的应用探索房屋提取空地提取网箱提取厂房提取棕榈树提取化工罐体提取道路提取矿井提取飞机识别查违拆违耕林园草提取油气管道后
9、果区管理地理国情检测-水体提取砖窑提取土地覆盖分类政策支持党的二十大报告强调,要“牢牢守住18亿亩耕地红线”全国国土空间规划纲要(20212035年)关于全面实行永久基本农田特殊保护的通知业务需求以耕地和永久基本农田保护地块图斑为基础,监测耕地种植和利用情况,发现疑似耕地“非农化”“非粮化”变化图斑,每年监测2次非农化指标监测非粮化监测遥感+GeoAI 赋能业务转型升级非农非粮监测(自然资源)GeoScene影像+AI提取耕地变化政策支持自然资源调查监测体系构建总体方案国土空间调查、规划、用途管制用地用海分类指南业务需求以园地、林地、草地图斑为基础,主要监测园地、林地、草地图斑变化情况,每年监
10、测两次:监测园地、林地、草地图斑的覆盖及变化情况,监测园地、林地、草地图斑以外区域(建设用地、未利用地)上林草覆盖及变化情况遥感+GeoAI 赋能业务转型升级林草资源监测(自然资源)政策支持中共中央 国务院关于做好2023年全面推进乡村振兴重点工作的意见全国种植业结构调整规划业务需求遥感影像统筹遥感影像自动化处理遥感影像样本库制作变化信息智能提取种植作物识别遥感+GeoAI 赋能业务转型升级种植结构调整(自然资源)GeoScene GeoAI应用于冬小麦种植面积提取数据及数据量:sentinel-2,202004安徽丰县,1475*256*256模型:u-net硬件:NVIDIA Quadro
11、 p3200训练时间:5 min/epoch(batch_size=4)推理时间:2 min/4712*5867Miou:0.9预测相对官网结果误差:0.008某县官方:64.7万亩测试结果:65.2万亩政策支持自然资源部办公厅关于开展2022年卫片执法工作的通知卫片执法技术支撑工作机制关于规范临时用地管理的通知业务需求采用2米卫星遥感影像,每季度核查土地变化图斑,每年4次新增乱占耕地建房挖田造湖挖湖造景违建“大棚房”非法用地采矿遥感+GeoAI 赋能业务转型升级卫片执法(自然资源)GeoAI建筑物提取GeoScene违法建筑物提取政策支持自然资源调查监测体系构建总体方案国土空间调查、规划、用
12、途管制用地用海分类指南业务需求遥感+GeoAI 赋能业务转型升级城市要素监测(自然资源)城市空间布局和形态城区实体地域范围、城区范围、房屋建筑(区)城市规划实施城镇开发边界基本公共服务教育、医疗卫生、社会福利、基层便民服务、文化活动场所、体育活动场所、城市绿地、居住小区、绿地与广场、房屋建筑、铁路与道路;有条件的开展停车场、消防、警务、轨道交通站点和公交站点等监测市政公用设施建设工矿企业(水厂、电厂、污水处理厂、垃圾处理厂等)、机关团体、新闻出版机构、科研机构、消防机构、商业服务机构、殡葬设施等;有条件的开展停车场、基层便民服务机构等监测综合交通运输网络建设铁路与道路、交通设施(隧道、桥梁、码
13、头、高速公路出入口、加油(气)站、立交桥、机场、火车站、长途汽车站、轨道交通站、轨道交通出入口、交通收费站、高速公路服务区);有条件的开展充电站、停车场、公交线路、公交站点和地下交通设施等监测环境治理污水处理厂、垃圾处理厂、垃圾堆放物、水域等;有条件的开展黑臭水体等监测应急救灾地质灾害隐患点、应急避难场所、易积水区、消防机构;有条件的开展地下管线、综合管廊和地下防灾设施等监测历史文化保护历史文化保护区(名城、名镇、名村、文化街区、风貌区)、不可移动文物、历史建筑、传统风貌建筑等;有条件的开展地下埋藏区、古树名木等监测GeoAI井盖提取GeoScene山体滑坡敏感区提取 影像分辨率:0.05米
14、样本量:7800个 推理工具:DetectObjects 推理结果如下据统计目前中国的井盖保有量约50亿套以上;一个50万人口的城市每年对井盖的需求量为1-2万套,全国每年新增井盖数量和每年更换量至少在1500万套以上。而井盖的破损、移位、丢失以及井下水位、可燃气体、有害气体、有毒气体超标等信息不能在第一时间被获取,从而造成安全隐患问题。利用GeoScene的深度学习能力可以提取下水道井盖的数量和位置以及空间分布。GeoScene深度学习实例城市管理之井盖提取ArcGIS+AI辅助农业:植株识别+健康状况评估烟苗识别、火龙果苗、柑橘苗、棕榈树等经济作物的估产和病虫害监控GeoScene深度学习
15、实例城市管理之井盖提取政策支持自然资源调查监测体系构建总体方案国土空间调查、规划、用途管制用地用海分类指南业务需求 以水域图斑为基础,监测:获取地表水体的分布范围、季节变化和水域开发利用保护等监测冰川及常年积雪分布范围及变化遥感+GeoAI 赋能业务转型升级水资源监测(自然资源)GeoAI水资源提取地理国情普查是一项重大的国情国力调查,是全面获取地理国情信息的重要手段,是掌握地表自然、生态以及人类活动基本情况的基础性工作。普查内容:一是自然地理要素的基本情况,包括地形地貌、植被覆盖、水域、荒漠与裸露地等的类别、位置、范围、面积等,掌握其空间分布状况;二是人文地理要素的基本情况,包括与人类活动密
16、切相关的交通网络、居民地与设施、地理单元等的类别、位置、范围等,掌握其空间分布现状。某测绘院使用GeoScene深度学习提取水体,精度基本满足数据更新需求。GeoScene深度学习实例地理国情普查政策支持关于加快煤矿智能化发展的指导意见内蒙古关于进一步加快推进绿色矿山建设的通知 山西省人民政府办公厅关于规范和加强矿山环境恢复治理保证金和煤矿转产发展资金提取使用管理的通知 业务需求采用遥感影像和视频数据基于深度学习实现:道路自动提取固定场所检测人员违规、设备故障和环境异常现象在采矿山统计和生态修复监测废旧矿山修复监测遥感+GeoAI 赋能业务转型升级智慧矿山(矿产)矿井提取道路提取CLEAR战略
17、咨询公司曾发布一份2020智慧农业战略报告,其中提到智慧农业,是可以利用5G技术,提高连接性,利用自动化和机器人进一步解放生产力,以无人化为特征,实现农业产业链的全智能化。它是指建立在数字农业和精准农业基础上的全新农业生产方式与生态系统。“智慧农业对作物模型不断优化,可以指导新农人进行及时浇水、施肥,给田块预警天气、温度异常短信提醒,还可以随时查看每一块田的生长情况,即使出差也两不误,随时可以调整生产计划,是生产管理的智能好帮手。”GeoScene+AI辅助农业:植株识别+健康状况评估烟苗识别、火龙果苗、柑橘苗、棕榈树等经济作物的估产和病虫害监控GeoScene深度学习实例智慧农业化工厂爆炸之
18、后,现场情况并不明晰,人员无法进入,用无人机拍摄现场情况后,使用深度学习快速提取现场残存化学罐体的大体数量、空间分布等,以帮助救援人员明确潜在的危险源以防引起二次伤害。GeoScene深度学习实例化学厂爆炸后残余化学罐的识别从卫星影像上使用深度学习提取过火面积内的建筑(左图),并结合前后时相的影像、利用要素分类模型对提取的建筑物进行分类以定位损毁房屋,统计数量和面积。最终统计到16平方公里区域内372处建筑物的损毁定位,损毁面积达13万平方米。同样的场景可以应用在四川山火等同类场景中。GeoScene深度学习实例山火损失评估3D点云分割、目标检测PointCNN线杆、电力线提取建筑物提取电力设
19、施侵扰铁路设施提取GeoScene GeoAI 点云分类,零代码完成点云分类全流程GeoScene+AI辅助城市规划:从点云中提取三维建筑模型利用深度学习从点云中分类建筑物,并利用GeoScene后处理能力生成带屋顶的建筑物,GeoScene深度学习实例城市空间规划从视频中提取目标,并展示在地图上SiamMask和DeepSortGeoScene GeoAI 视频动态目标识别模型政策支持2022年推进智慧水利建设水资源管理工作要点十四五期间推进智慧水利建设实施方案关于加强河湖水域岸线空间管控的指导意见业务需求基于视频AI对堤岸、站点、涵道等保护区边界侵入、抛物、违建等违法行为自动识别和预警基于
20、视频AI自动识别河道漂浮物、河岸垃圾等异常基于AI技术识别河流周边建筑、网箱养殖、拦河坝等典型目标断面水质统计分析,监测断面水质同比、年度目标分类占比等遥感+AI 赋能业务转型升级智慧河道(水利)GeoAI网箱提取无人机结合 GeoScene FMV进行实时河道巡查GeoScene GeoAI 工具一键导出多源异构数据预处理工具;一体化的标注管理、导出工具;支持样本增强;支持多种通用样本格式;4.0导出样本性能提升9倍在线协同标绘样本制作丰富模型Pytorch、TensorFlow等支持;30余模型,涵盖目标检测、像素分类、视频对象追踪、自然语言处理等4.0新增2个模型,用于目标检测和全景分割
21、16个预训练模型4.0点云支持增强模型训练高效推理提供多种推理工具,支持场景实现;支持服务器端分布式推理;3.1新增变化检测推理推理丰富工具 1700+工具;栅格、矢量等数据处理;后处理个人用户企业级用户GeoScene ProGeoScene Enterprise+Image Server JS Python API遥感影像栅格图像点云视频自然语言文本(3.1)英伟达、国产GPU(曙光DCU.)GeoScene GeoAI全栈产品解决方案样本导出工具:导出训练数据进行深度学习模型训练工具:训练深度学习模型推理工具:使用深度学习分类对象使用深度学习分类像素使用深度学习检测对象使用深度学习检测变
22、化深度学习工具集(GeoScene Pro中)序号大类小类模型英文名样本元数据格式模型推理工具1目标检测(对象检测)对象检测FasterRCNNPASCAL_VOC_rectangles使用深度学习检测对象2RetinaNet3YOLOv34SingleShotDetector5MMDetection6DETReg7实例分割/对象检测MaskRCNNRCNN_Masks8语义分割(像素分类)像素分类UnetClassifierClassified_Tiles使用深度学习分类像素9PSPNetClassifier10DeepLab11边缘检测BDCNEdgeDetector12HEDEdgeDe
23、tector13道路提取MultiTaskRoadExtractor14ConnectNet15像素分类MMSegmentation16变化检测ChangeDetector使用深度学习检测变化17对象分类(分类)对象分类FeatureClassifierLabeled_Tiles、Multi-labeled Tiles使用深度学习分类对象18全景分割全景分割MaX-DeepLab全景分割使用深度学习分类像素19图像转换(图像翻译)风格迁移CycleGANCycleGAN使用深度学习分类像素20Pix2PixExport Tiles21Pix2PixHD22超分辨率SuperResolution
24、23看图翻译ImageCaptioner-Python API使用经过训练的模型对点云进行分类24点云分类点云分割PointCNN-25对象追踪视频对象追踪SiamMask-追踪26DeepSort-注:红字高亮模型为4.0即将新增模型选择对照表样本制作123471在上一步中保存的矢量要素数据,也可以是自己制作的矢量数据,但是必须包含Classname与Classvalue字段2Classvalue字段3样本保存的格式,推荐使用TIFF格式,可以保存多波段样本4分块大小,建议保证分块大小内有完整的2-3个样本并且为2的指数倍5步幅大小,建议为分块大小的一半56参考前述表格选择元数据格式(很重要
25、)样本导出新增附加输入栅格,可以选择附加输入栅格导出变化检测等格式样本7样本种类多样化,样本区域内全标注样本标注准确保证切片内样本的完整性模型优化-样本选择1234567891样本导出的文件夹2训练轮数,也就是epoch3模型类型根据在场景选择的时候就已经决定好了4批量大小为计算机每次处理的样本数量5模型参数在选定模型之后会自动生成,一般情况下默认6学习率建议不用填写,程序执行的时候会自动查找最合适的学习率7在骨干网络选择上,建议先使用默认,后续再调节8预训练模型:默认不选,只有迁移学习时候才会选择9建议取消选择,效果会更好GPU推理模型训练GeoScene支持10+预训练模型对象分类执行推理
26、像素分类对象检测变化检测GeoScene 深度学习能力后处理工具关键配置关键配置推荐推荐备注备注CPU推荐使用intel cpu根据显卡配置以及预算选择内存推荐16GB及以上显存推荐8GB及以上英伟达显卡,算力在6.1及以上固态硬盘推荐SSD 1TB深度学习工作流中会涉及大量文件读写机械硬盘推荐4TB左右影像存储以及模型训练样本所需存储较大基础环境要求注意:GeoScene 4.0 版本可兼容最新版显卡系列为RTX 30系列,cuda版本为11.1英伟达算力查询:https:/ RGB 8位影像deeplabv3建筑物提取0.100.4米 RGB 8位影像MaskRCNN车辆识别0.050.2
27、米 RGB 影像MaskRCNN居民地提取Landsat8影像unet居民地提取Sentinel-2 L1A级别unet土地分类Landsat8影像unet土地分类Sentinel-2 L1A级别unet土地分类0.81米 RGB 8位影像unet总结:GeoScene GeoAI 优势特色即拿即用的工作流程即拿即用的工作流程 桌面端交互式工具、界面 服务器端标准Rest接口 可供专业个人用户研究 也可在企业级系统中集成极大丰富的深度学习算法模型极大丰富的深度学习算法模型 覆盖影像、点云、视频、文本等全业务数据类型 覆盖几乎全业务应用场景 主流成熟、可靠性高强大的后处理能强大的后处理能 解决深度学习到业务应用的最 后一公里 1750+数据处理与分析工具