摘要:基于卷积神经网络架构,针对遥感影像冰川识别问题中,因目标地物特征提取不足、受阴影遮挡、遥感影像信息利用不充分等因素导致的阴影区域下冰川识别不准确,冰川和水体不能准确区分等问题,本文从如何充分提取目标地物特征、充分利用遥感影像中包含的空间信息、光谱信息和上下文信息出发,展开分析和讨论,从而提出合适的解决方案,并根据实验流程进行验证。
第一章 绪论
1.1 研究背景及意义
冰川是环境气候变化的指示器,是全球水循环中的重要一员[1]。因此监测冰川的变化是监测环境气候变化的一项重要内容。冰川存储了地球上最多的淡水资源,然而随着全球温度的升高,冰川正在逐步融化,导致地球上的淡水资源变得越来越少。同时,冰川融化、冰盖坍塌、海平面上升[2, 3]会增加冰川湖突发洪水的风险,对生活在南极、北极及沿海地区的生物带来巨大的灾难[4]。因此,通过监测冰川变化,对冰川变化带来的一系列影响和反应及时做出预测,对保护生态环境,减少自然灾害所带来的损失具有重要意义。
1.1.1 遥感图像
遥感是大尺度监测地表信息变化的重要手段,例如监测冰川的变化,监测沙漠化程度,监测植被面积变化等。近年来,随着遥感技术的发展,多类型、高分辨率遥感图像的出现,使得提高监测地表信息变化的准确度变为可能。遥感图像是搭载在不同平台上的传感器对远距离地物进行探测而取得的电磁波谱数据,通过分析、解译这些数据,产生多种遥感影像,再通过后期技术的处理可以解译出我们想要的地表信息。因此,我们可以利用遥感图像来对地物进行识别和分割。典型的 Landsat(美国国家航空航天局的陆地卫星)系列为多波段遥感影像,且是公开免费数据,因此本文基于Landsat 8 遥感影像进行实验。Landsat 8 各个波段的波长范围和空间分辨率如表 1.1所示。
表 1.1 Landsat 8 波段参数 ...................
1.2 国内外研究现状及主要问题
针对基于遥感图像进行冰川识别的问题,学者们进行了广泛的研究。从传统冰川识别方法到基于神经网络进行冰川分割,从单特征提取到多特征提取,冰川识别精度有所提高,但依然存在一些问题亟待解决。本节主要介绍冰川识别方法和遥感图像语义分割及冰川分割存在的问题。
1.2.1 冰川识别方法
本文主要研究的是山岳冰川的识别与分割。山岳冰川是指附着在山体上的冰川,受山地地形影响较大。通过野外勘测的方法来监测山岳冰川的变化,难度非常大,需要专业的野外勘测人员花费很长时间进行测量,并且存在一定的安全隐患。
随着卫星遥感技术的发展,通过分析处理冰川遥感影像可以实现冰川监测。其中,比值法和雪盖指数法对于裸冰提取效果较好,但是对于包含水体和少量积雪的影像,容易出现错分,将水体和积雪识别成冰川。常用的比值波段有 Band3/Band5 或Band4/Band5。李成秀等[19]选用波段 3、波段 4 进行比值运算,冰川提取误差为±2.2﹪。KACHOUIE 等[20]提出一种结合 B62 和雪盖指数法的 NDTSI(Normalized DifferenceThermal Snow Index)方法进行冰川末端位置的识别,实验结果表明可以准确识别出冰川末端位置。付鹏[21]通过实验结果证明,可以利用非监督分类方法进行雪盖面积提取,效率高但分类精度不高。金姗姗等[22]以杂多县冰川为研究对象,利用各个地物之间的光谱差异和波段运算提取出最利于冰川提取的波段,再利用监督分类方法可以有效分离出冰川。刘梅[23]针对高山冰川进行冰川面积提取,发现首先利用面向对象分类方法进行冰川提取,再利用目视解译方法进行手动修改,得到的冰川提取效果最好;K 近邻(K-nearest Neighbors,KNN)非监督分类方法冰川提取效果最差。其中,在冰舌和阴影区等环境复杂区域最容易将冰川进行错分或漏分。赵健赟等[24]基于老虎沟冰川遥感图像进行冰川信息提取,发现面向对象分类方法能够综合利用遥感影像中的光谱信息和纹理信息等,提高了冰川总体分类精度,提取出的冰川边界也更加平滑。聂勇等[25]结合多期遥感数据,首先利用面向对象分类方法进行冰川分割与合并,再根据专家知识制定分类规则,从而实现冰川信息提取,用于分析冰川时空分布变化的原因。怀保娟等[26]对目视解译法及多种冰川自动识别方法在冰川分割中的分割效果进行对比分析,发现目视解译法适合所有类型的冰川分割,但是费时费力;比值法、雪盖指数法、非监督分类方法和监督分类方法对于裸冰的分割效果较好;面向对象分类方法能更好地利用地物特征来对图像进行分割。仲振雄等[27]基于遥感数据,分析冰川识别方法在阴影区和非阴影区的冰川识别效果。
..............................
第二章 相关基础知识
2.1 卷积神经网络的基本结构
深度学习最初在图像分类方面取得了优异的成果,后经过改进成功应用于图像分割领域,并经过学者们研究提出了许多不同的网络架构。本节主要介绍卷积神经网络包含的基本结构及反向传播过程和优化方法。
2.1.1 卷积层
卷积层的主要目的是提取图像中的目标特征。具体过程是卷积核与图像或图像特征图进行卷积运算,并定义滑动步长、填充(padding)大小,激活操作等参数得到新的特征图。卷积操作提取出邻近像素之间的关系和特征,在低层卷积操作中,提取出图像的边缘特征、纹理特征等。经过一步步地池化操作后,在高层卷积操作中,提取出图像的全局特征、抽象特征。
2.1.2 池化层
基本的池化层具有扩大感受野,减少显存开销的功能。池化操作会缩小特征图的大小,扩大卷积核的感受野。常用的池化方法有最大池化和平均池化。最大池化是通过滑动窗口遍历整个特征图,输出每个滑动窗口中的最大值;平均池化的过程与此相同,但输出的是平均值。现有的深度神经网络更多地使用最大池化方法。
反向传播过程就是网络权重进行学习更新的过程。其中用到损失函数,通过对损失函数求导,来更新网络参数。损失函数计算的是前向传播的输出值和真实值的差。当损失值调到最小时,参数更新也调到了最优值。总体而言,反向传播的过程就是求损失函数最小值的过程。
.............................
2.2 典型的卷积神经网络模型
本节主要介绍几种典型的用于语义分割的卷积神经网络模型,分别为 PSPNet、SegNet 和 UNet,以及它们不同的上采样方法。
2.2.1 PSPNet
在深度神经网络中,感受野的大小基本决定了网络可学习的信息的多少。感受野越大可学习到更多的上下文信息,即学到更多的抽象信息和全局信息。感受野越小则可学习到更多的细节信息和局部信息。金字塔池化模块就是为了融合上下文信息、全局信息和局部信息,使学习到的特征更丰富。图 2.1 为 2017 年 Zhao 提出的 PSPNet[8]总体框架图。首先将图像 (a) 输入到卷积神经网络 CNN 中,得到特征图 (b);再将特征图分别进行尺度为 1×1,2×2,3×3 和 6×6 的池化操作,中间用了一个卷积核大小为 1×1 的卷积层进行降维,维持了全局特征的权重;对降维后的四个特征图进行上采样(双线性插值)到和特征图 (b) 大小相同,然后和特征图 (b) 进行级联操作,得到最终的特征表达;最终经过一个卷积层输出分割图像。
PSPNet 上采样采用的是双线性插值运算,即将特征图扩大到和原图一样大小,然后和原始特征图进行级联,融合各个尺度的特征图,丰富特征图的信息。双线性插值运算利用目标像素周围的 4 个像素计算出目标像素的大小。如图 2.2 所示
图 2.1 PSPNet 架构 .............................................
第三章 技术方案和数据处理.................................... 21
3.1 实验流程................................................... 21
3.2 遥感影像处理与数据标注................................... 21
第四章 增强多尺度特征融合的阴影区域下冰川分割网络......................... 27
4.1 引言....................................... 27
4.2 金字塔池化模块...................................... 28
4.3 损失函数..................................... 28
第五章 融合注意力模块的冰水分割架构............................... 39
5.1 引言.............................................. 39
5.2 注意力模块........................................... 39
5.3 损失函数..................................... 40
第五章 融合注意力模块的冰水分割架构
5.1 引言
目前,传统冰川识别方法在冰川识别中区分冰水效果不好。其主要原因是没有充分利用遥感影像中的信息,没有充分提取目标地物的特征,以及目标地物和其它地物的特征差异性。在遥感影像中,水体和冰川的光谱信息相似,需要充分学习它们的特征,并根据上下文信息,找到它们的不同之处,才能很好地进行区分。比值法、雪盖指数法以及非监督分类方法没有充分利用遥感影像中的信息,提取出的目标地物特征不够充分;监督分类方法和面向对象分类方法虽然用到遥感影像中的空间信息、上下文信息和光谱信息等,但这些信息利用的还不够充分。文献[29]通过对比不同的冰川识别方法,发现神经网络分类方法区分水体和冰川的效果好于传统冰川识别方法,但区分精度还可进一步提高。
本章提出一种融合注意力模块的冰水分割架构,通过融合注意力模块来增强目标地物特征、增强不同地物之间的差异性,从而实现冰川和水体的区分。为了评估本章方法的性能,在数据集 2 上进行实验验证,并与 PSPNet、SegNet 和 UNet 进行对比。实验结果表明,本章方法可以有效地区分冰川和水体,其平均像素准确率为 90.18﹪,平均交并比为 84.67﹪,提高了总体冰川分割精度。
..........................
第六章 总结与展望
6.1 全文总结
本文基于卷积神经网络架构,针对遥感影像冰川识别问题中,因目标地物特征提取不足、受阴影遮挡、遥感影像信息利用不充分等因素导致的阴影区域下冰川识别不准确,冰川和水体不能准确区分等问题,本文从如何充分提取目标地物特征、充分利用遥感影像中包含的空间信息、光谱信息和上下文信息出发,展开分析和讨论,从而提出合适的解决方案,并根据实验流程进行验证。本文的主要工作总结如下:
(1)针对利用语义分割理论进行冰川分割,缺乏标注好的冰川数据集问题,本文制作了针对本文研究内容所需要的两套数据集:带阴影区域的冰川数据集和冰水数据集。
(2)针对遥感影像中阴影区域下冰川不易识别的问题,提出了在 UNet 架构中融合金字塔池化模块的 UPSPNet 网络架构。金字塔池化模块充分利用图像中的上下文信息,丰富提取出的目标地物特征。同时,UNet 架构适合小数据集的学习,它的跳跃连接结构也进一步丰富了特征信息。实验结果表明,该网络架构能够提取出阴影区域下的冰川,并且提高了冰川识别的准确率。
(3)针对遥感影像中冰、水不易区分的问题,提出了融合注意力模块和 UNet跳跃连接结构的 ResUNet-dan 网络架构。利用迁移学习方法将在 ImageNet 数据集上训练好的 ResNet-50 架构和权重应用在提出的网络架构中,用于提取目标特征。融合注意力模块用于增强目标特征,结合 UNet 跳跃连接结构充分利用图像信息及上下文信息、丰富特征图信息。实验结果表明,该网络架构能够区分冰和水,并提高了冰川分割的准确率。
参考文献(略)
相关文章:
审计论文:立信会计师事务所财务报表审计失败案例探讨04-26
MPA论文选题方法及20例题目案例04-26
地理标志侵权损害赔偿问题思考04-26
工程管理论文选题50例分享04-26
防御链路预测攻击的隐私保护方法思考04-26
医学论文如何写04-26
工程管理论文:西宁青藏高原科技馆主要工程地质问题分析04-26
护理论文怎么写04-26