发布信息

基于脉冲神经网络的合成孔径声呐图像目标检测方法 专利技术说明

作者:admin      2022-11-30 09:34:00     484



计算;推算;计数设备的制造及其应用技术1.本发明涉及声呐图像水下目标检测技术领域,尤其涉及一种基于脉冲神经网络的合成孔径声呐图像目标检测方法。背景技术:2.sas可在较宽的测绘带内实现高分辨率成像,sas图像的目标识别率可比传统声呐大幅提高,对水下搜救、掩埋物探测、军事目标探测、目标分类和识别等重要任务具有不可替代的优势。3.近些年来,卷积神经网络在大规模自然图像数据集(如imagenet,coco等)中获得了广泛应用,但对于水声图像的目标检测和识别的领域应用研究相对缺乏。由于声呐图像的目标检测和分类数据集缺乏,并且水下目标样本往往面临样本稀少,存在类别不平衡等问题。针对sas图像数据量少、现有的目标检测模型对水下目标的检测精度低,以及移动环境的系统能耗问题,亟需一种适用于合成孔径声呐图像的目标检测方法。技术实现要素:4.针对现有的目标检测模型对水下目标的检测精度低,以及移动环境的系统能耗问题,本发明提供一种基于脉冲神经网络的合成孔径声呐图像目标检测方法。5.本发明提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法,包括:6.步骤1:构建深度卷积神经网络,采用合成孔径雷达sar标注图像对所述深度卷积神经网络进行训练得到面向sar图像的目标检测模型dcnsar;7.步骤2:利用脉冲神经元将所述深度卷积神经网络转化为脉冲神经网络,以所述目标检测模型dcnsar的权重作为所述脉冲神经网络的初始权重,采用合成孔径声呐sas标注图像对所述脉冲神经网络进行训练得到面向sas图像的目标检测模型dsnsas;8.步骤3:获取待检测sas图像,采用所述目标检测模型dsnsas对所述待检测sas图像进行滑动检测,对其中的目标进行定位和标注。9.进一步地,步骤3中具体包括:10.步骤3.1:获取待检测sas图像,对所述待检测sas图像进行视觉显著性计算得到对应的显著图;11.步骤3.2:设定显著值阈值,截取显著图中大于所述显著值阈值的区域并将所述区域作为待检测目标区;12.步骤3.3:采用所述目标检测模型dsnsas对所述待检测目标区进行滑动检测。13.进一步地,步骤1中,所述深度卷积神经网络包括主干特征提取网络、加强特征提取网络、分类器和回归器。14.进一步地,步骤1中,在对所述深度卷积神经网络进行训练之前还包括:将其中步长为2的最大池化层修改为相同步长的卷积层,将其中步长为1的最大池化层删除,将其中的上采样层修改为反卷积层,将其中的leaky_relu激活函数修改为relu激活函数,将批标准化层修改为由卷积层和批标准化层组成的融合层。15.进一步地,步骤2中,所述利用脉冲神经元将所述深度卷积神经网络转化为脉冲神经网络,具体包括:将其中的relu激活函数替换为脉冲神经元,将其中的平均池化层设置为空间下采样层。16.进一步地,步骤3.1中,采用lc算法、hc算法、rc算法或gr算法进行视觉显著性计算。17.本发明的有益效果:18.本发明的基于脉冲神经网络的合成孔径声呐图像目标检测方法,利用了sas在成像原理上与sar非常相似的特点,先使用sar图像对深度卷积神经网络进行训练,然后采用迁移学习技术将学习到的深度卷积神经网络模型的权重迁移到由深度卷积神经网络模型转换的脉冲神经网络中,从而实现了脉冲神经网络的预训练;在此基础上,再使用sas图像对脉冲神经网络进行训练,如此即使在sas图像样本量稀少的情况下,也可提高sas图像目标检测的准确率;同时,还可解决现有的深度卷积神经网络在sas图像目标检测上存在的准确率较低、能耗过高以及大幅面sas图像检测时间过长的问题。本发明提升了海底声呐图像目标检测任务的准确率,并解决了实际应用中的低能耗需求问题,在无人自主移动设备上能够得到很好的应用。附图说明19.图1是本发明实施例提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法的流程示意图之一;20.图2是本发明实施例提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法的流程示意图之二;21.图3是本发明实施例提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法的流程示意图之三;22.图4为本发明实施例提供的采用本发明方法对sas图像进行的水下目标检测结果示例图。具体实施方式23.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。24.实施例125.如图1所示,本发明实施例提供一种基于脉冲神经网络的合成孔径声呐图像目标检测方法,包括以下步骤:26.s101:构建深度卷积神经网络,采用合成孔径雷达sar标注图像对所述深度卷积神经网络进行训练得到面向sar图像的目标检测模型dcnsar;27.s102:利用脉冲神经元将所述深度卷积神经网络转化为脉冲神经网络,以所述目标检测模型dcnsar的权重作为所述脉冲神经网络的初始权重,采用合成孔径声呐sas标注图像对所述脉冲神经网络进行训练得到面向sas图像的目标检测模型dsnsas;如图2所示。28.s103:获取待检测sas图像,采用所述目标检测模型dsnsas对所述待检测sas图像进行滑动检测,对其中的目标进行定位和标注。29.本发明实施例提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法,利用了sas在成像原理上与sar非常相似的特点,先使用sar图像对深度卷积神经网络进行训练,然后采用迁移学习技术将学习到的深度卷积神经网络模型的权重迁移到由深度卷积神经网络模型转换的脉冲神经网络中,从而实现了脉冲神经网络的预训练;在此基础上,再使用sas图像对脉冲神经网络进行训练,如此即使在sas图像样本量稀少的情况下,也可提高sas图像目标检测的准确率;同时,还可解决现有的深度卷积神经网络在sas图像目标检测上存在的准确率较低、能耗过高以及大幅面sas图像检测时间过长的问题。30.实施例231.在上述实施例的基础上,为了进一步降低大幅面sas图像检测时间过长的问题,本发明实施例还提供一种基于脉冲神经网络的合成孔径声呐图像目标检测方法,包括以下步骤:32.s201:构建深度卷积神经网络,采用合成孔径雷达sar标注图像对所述深度卷积神经网络进行训练得到面向sar图像的目标检测模型dcnsar;33.s202:利用脉冲神经元将所述深度卷积神经网络转化为脉冲神经网络,以所述目标检测模型dcnsar的权重作为所述脉冲神经网络的初始权重,采用合成孔径声呐sas标注图像对所述脉冲神经网络进行训练得到面向sas图像的目标检测模型dsnsas;34.s203:如图3所示,获取待检测sas图像,对所述待检测sas图像进行视觉显著性计算得到对应的显著图saliencymap;35.具体地,可以采用lc算法、hc算法、rc算法或gr算法进行视觉显著性计算。36.s204:设定显著值阈值,截取显著图中大于所述显著值阈值的区域并将所述区域作为待检测目标区,如图3所示;37.s205:采用所述目标检测模型dsnsas对所述待检测目标区进行滑动检测,将sas图像上大于检测阈值的位置进行定位和标注,实现水下目标的检测,如图3所示。38.本发明实施例提供的基于脉冲神经网络的合成孔径声呐图像目标检测方法,利用目标所在的区域的显著值较高的特点,通过对待检测sas图像进行显著性计算,截取显著值大于设定阈值的区域作为待检测目标区,从而可以提前过滤到大量的背景信息区域,而仅对该待检测目标区进行滑动检测,如此可以明显降低大幅面sas图像的检测时间。39.作为一种可实施方式,上述各实施例中,所述深度卷积神经网络包括主干特征提取网络、加强特征提取网络、分类器和回归器。40.具体地,利用分类器与回归器进行边界框预测,所述边界框对应四个参数(x,y,w,h),(x,y)代表预测边界框的中心坐标,w和h分别代表预测边界框的宽度和高度。根据预测边界框和真实边界框的交并比iou,取最大值作为对当前水下目标的检测结果。41.优选地,考虑到后续需要将该深度卷积神经网络转化为脉冲神经网络,需要在对该深度卷积神经网络训练之前,对其进行适当的裁剪或修改,具体为:将其中步长为2的最大池化层修改为相同步长的卷积层,将其中步长为1的最大池化层删除,将其中的上采样层修改为反卷积层,将其中的leaky_relu激活函数修改为relu激活函数,将批标准化层修改为由卷积层和批标准化层组成的融合层。42.作为一种可实施方式,所述利用脉冲神经元将所述深度卷积神经网络转化为脉冲神经网络,具体包括:将其中的relu激活函数替换为脉冲神经元,将其中的平均池化层设置为空间下采样层。43.具体地,对转换后的脉冲神经网络而言,多层脉冲神经网络的卷积层特征包含于每个时间步中,每个神经元对输入的脉冲与卷积核进行卷积操作以计算其输入电流,并将其整合到膜电位中,如果膜电位超过卷积阈值,则神经元会产生脉冲并复位膜电位,否则膜电位会发生衰减。其输入电流的计算公式可以表示为:[0044][0045]其中,t代表总时间步长,表示在时间t内累积到l+1层膜电位的总电流流入,nl表示第l层前神经元的总数量,xi(t)表示第i个前神经元在时间t内的脉冲之和。[0046]多层脉冲神经网络中的神经元可以用充电、放电、重置三个过程来描述,具体如下:[0047]h(t)=f(v(t-1),x(t))ꢀꢀ(2)[0048]s(t)=θ(h(t)-vthreshold)ꢀꢀ(3)[0049]v(t)=h(t)·(1-s(t))+vreset·s(t)ꢀꢀ(4)[0050]其中h(t)、s(t)、v(t)分别表示脉冲神经元的充电、放电、重置方程;h(t)是神经元的瞬时状态,是其将要发放脉冲前的瞬间电压,v(t)是神经元的膜电压,发放脉冲前,v(t)=h(t),vthreshold表示神经元的阈值,当膜电压超过这一阈值,脉冲神经元就会发放脉冲;x(t)是输入电压,例如电压的增量;f(v(t-1),x(t))代表的是神经元状态的更新,对于不同的神经元,其更新方程不同;θ(x)是一个阶跃函数,即s(t)的值非0即1,vreset表示重置后的电压,当神经元释放脉冲后s(t)=1,膜电压会被重置为vreset,即v(t)=vreset。[0051]对于leaky integrate and fire(lif)神经元,描述其未超过阈值时的动态微分方程,以及对应的差分方程:[0052][0053]τm(v(t)-v(t-1))=-(v(t-1)-vreset)+x(t)(6)[0054]对应的充电方程为[0055][0056]τm表示时间常数。[0057]此外,需要说明的是,上述各实施例中,在采用sar标注图像或sas标注图像训练各自的目标检测模型之前,应将不同的sar标注图像或sas标注图像的大小进行等比例调整,然后对调整之后的数据图像做背景填充操作。[0058]为了验证本发明方法的有效性,本发明还作了相关实验,针对缺乏sas图像检测数据集的问题,本次实验构建了一个可用于声呐图像目标检测的sas数据集,该数据集包括322张分辨率较高的图像(包含323个目标,其中266个沉船目标,57个飞机目标)。实验结果如表1所示。[0059]表1合成孔径声呐数据集目标检测准确率[0060]方法map@0.5map@0.5:0.95直接训练0.730.399预训练0.9120.574[0061]其中,使用map来判断整体检测结果的准确率,通常设定的iou阈值有0.5以及0.5:0.95。当阈值设定为0.5时,即map@0.5为对所有测试图检测结果iou大于0.5时计算每一类的所有图片的ap,然后对所有类别求平均,即map;当阈值设定为0.5:0.95时,即map@0.5:0.95表示在不同iou(阈值从0.5到0.95,步长为0.05),即(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均map。其中ap的计算方式为:[0062][0063]其中[0064][0065]其中是在recall为时对应的precision。[0066]如表1所示,通过对sas数据集进行水下目标检测,表明本发明方法通过采用预训练的方式,在合成孔径声呐图像数据集下可以取得较高的检测精度。图4为采用本发明方法进行水下目标的检测结果示例图。[0067]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部