发布信息

3D目标检测模型的训练方法、装置、设备及存储介质与流程 专利技术说明

作者:admin      2023-06-29 08:06:04     435



计算;推算;计数设备的制造及其应用技术3d目标检测模型的训练方法、装置、设备及存储介质技术领域::1.本技术涉及人工智能技术领域::,具体为深度学习、计算机视觉技术领域::,特别涉及一种3d目标检测模型的训练方法、装置、设备及存储介质。背景技术:::2.在自动驾驶领域里,一种常用的传感器是激光雷达,激光雷达通过发射和接收电磁波来测量周围物体的距离。利用激光雷达可以获取到点云数据(pointcloud),每个点云点记录了检测的物体的坐标,以及反射率等信息。3.在执行目标检测任务时,可以将激光雷达获取到点云作为输入目标检测模型,得到所感知的周围环境障碍物的信息,例如,目标对象的3d检测框的坐标、尺寸、朝向等信息。4.但是,目前用于目标检测模型学习或者识别的点云相关信息之间存在一定差异,导致模型难以学习到有效的点云信息。技术实现要素:5.本技术提供了一种3d目标检测模型的训练方法、装置、设备及存储介质,解决了目标检测模型的学习效果欠佳的问题,所述技术方案如下:第一方面,提供了一种3d目标检测模型的训练方法,所述方法包括:获取目标区域的点云的第一位置数据;根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据;利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;根据所述第二位置数据和第二距离数据,获得训练样本数据;利用所述训练样本数据,对待训练的3d目标检测模型进行训练,以获得训练完成的3d目标检测模型。6.在一种可能的实现方式中,所述利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据,包括:根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据,其中,所述预设的正弦对应关系是预设的第一位置数据和第二位置数据的正弦对应关系。7.在一种可能的实现方式中,所述第一位置数据包括3d坐标,所述根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据,包括:根据所述预设的正弦对应关系,对所述3d坐标进行正弦编码处理,以获得所述3d坐标的每个维度的正弦编码结果;根据所述3d坐标的每个维度的正弦编码结果,获得所述第二位置数据。8.在一种可能的实现方式中,所述利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,包括:获取所述第一距离数据对应的3d网格的尺寸数据;计算所述第一距离数据和所述第一距离数据对应的3d网格的尺寸数据的比值;根据所述比值,获得所述第二距离数据。9.在一种可能的实现方式中,所述3d网格的目标中心点包括3d网格的中心点或3d网格中指定对象的聚类中心点。10.在一种可能的实现方式中,所述根据所述第二位置数据和第二距离数据,获得训练样本数据,包括:对所述第二位置数据和第二距离数据进行拼接处理,以获得所述点云的空间数据;根据所述点云的空间数据,获得训练样本数据。11.第二方面,提供了一种3d目标检测的方法,所述方法包括:获取目标区域的待检测的点云的第一位置数据;根据所述第一位置数据和所述目标区域的预设的3d网格,获得所述待检测的点云与对应的3d网格的目标中心点之间的第一距离数据;利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据;将所述待检测的点云的空间数据,输入3d目标检测模型,以获得所述待检测的点云的3d目标检测结果,所述3d目标检测模型是利用根据上所述的方面和任一可能的实现方式的方法得到的。12.第三方面,提供了一种3d目标检测模型的训练装置,所述装置包括:数据获取单元,用于获取目标区域的点云的第一位置数据;第一获得单元,用于根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据;第一编码单元,用于利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;第二编码单元,用于利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;第二获得单元,用于根据所述第二位置数据和第二距离数据,获得训练样本数据;模型训练单元,用于利用所述训练样本数据,对待训练的3d目标检测模型进行训练,以获得训练完成的3d目标检测模型。13.第四方面,提供了一种3d目标检测的装置,所述装置包括:数据获取单元,用于获取目标区域的待检测的点云的第一位置数据;第一获得单元,用于根据所述第一位置数据和所述目标区域的预设的3d网格,获得所述待检测的点云与对应的3d网格的目标中心点之间的第一距离数据;第一编码单元,用于利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;第二编码单元,用于利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;第二获得单元,用于根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据;目标检测单元,用于将所述待检测的点云的空间数据,输入3d目标检测模型,以获得所述待检测的点云的3d目标检测结果,所述3d目标检测模型是利用根据第三方面所述的3d目标检测模型的训练装置得到的。14.第五方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上如上所述的方面和任一可能的实现方式的方法。15.第六方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。16.本技术提供的技术方案的有益效果至少包括:由上述技术方案可知,一方面,本技术实施例通过获取目标区域的点云的第一位置数据,根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,进而可以利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据并利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,使得能够利用根据所述第二位置数据和第二距离数据所获得训练样本数据,对待训练的3d目标检测模型进行训练,得到训练好的3d目标检测模型,由于分别对用于模型训练的点云的位置数据和距离数据进行编码处理,可以获得具有更加有效地点云的空间信息的训练样本数据,进而基于该训练样本数据进行模型训练,可以更加便于模型学到点云的空间信息,减少了学习的信息损失,从而增强了模型的性能和鲁棒性。17.由上述技术方案可知,另一方面,本技术实施例通过获取目标区域的待检测的点云的第一位置数据,根据所述第一位置数据和所述目标区域的预设的3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,进而可以利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据,并利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,使得能够根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据,并将所述待检测的点云的空间数据,输入预先训练好的3d目标检测模型,得到待检测的点云的3d目标检测结果,由于增强了用于检测的点云的空间数据可靠性,并利用检测性能更好地模型对待检测点云进行目标检测处理,从而提高了点云的目标检测结果的可靠性。18.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。附图说明19.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。20.图1是本技术一个实施例提供的3d目标检测模型的训练方法的流程示意图;图2是本技术另一个实施例提供的3d目标检测的方法的流程示意图;图3是本技术再一实施例提供的3d目标检测模型的训练装置的结构框图;图4是本技术再一实施例提供的3d目标检测的装置的结构框图。具体实施方式21.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。22.显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本技术保护的范围。23.需要说明的是,本技术实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(personaldigitalassistant,pda)、无线手持设备、平板电脑(tabletcomputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。24.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。25.通常,3d目标检测模型的训练样本数据中,点云相关信息可以包括点云的坐标和点云的坐标点到网格的目标中心点的距离。点云的坐标范围比较大,如在0米-60米的范围,而每个点云的坐标点到网格的目标中心点的距离通常比较小,如0米-0.3米的范围。可以看出,两种点云相关信息的尺度相差较大,同时被当作训练样本数据输入到目标检测模型时,会使得模型难以学习到有效的信息。26.目前,用于目标检测模型学习或者识别的点云相关信息之间存在一定差异,导致模型难以学习到有效的点云信息。27.因此,亟需提供一种3d目标检测模型的训练方法,能够使模型学到更加有效的点云信息,从而增强模型预测的鲁棒性。28.请参考图1,其示出了本技术一个实施例提供的3d目标检测模型的训练方法的流程示意图。该3d目标检测模型的训练方法,具体可以包括:步骤101、获取目标区域的点云的第一位置数据。29.步骤102、根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据。30.步骤103、利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据。31.步骤104、利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据。32.步骤105、根据所述第二位置数据和第二距离数据,获得训练样本数据。33.步骤106、利用所述训练样本数据,对待训练的3d目标检测模型进行训练,以获得训练完成的3d目标检测模型。34.需要说明的是,所述目标区域可以是自动驾驶车辆的激光雷达的采集范围对应的区域,例如,目标区域可以激光雷达的点云地图中的对应区域。35.具体地,可以预先利用网格划分策略,对点云地图中的目标区域进行划分,得到具有3d网格的目标区域。36.例如,对于一帧点云图,可以以自动驾驶车辆为坐标原点,目标区域的范围数据可以包括在三维空间xyz三个方向的距离范围[-l,l],[-w,w]和[-h,h],即目标区域的所有的点云在xyz三个方向对应的距离范围分别可以是[-l,l],[-w,w]和[-h,h]。[0037]需要说明的是,所述待训练的3d目标检测模型可以包括但不限于基于体素网络(voxelnet)算法的3d目标检测模型、以及基于点柱(pointpillar)算法的3d目标检测模型。[0038]需要说明的是,利用预设的位置编码算法,对所述第一位置数据进行编码处理,即是对第一位置数据进行归一化处理,得到归一化的第二位置数据。同样地,利用预设的距离编码算法,对所述第一距离数据进行编码处理,即是对第一距离数据进行归一化处理,得到归一化的第二距离数据。[0039]需要说明的是,步骤101~106的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的模型训练平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。[0040]可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。[0041]这样,可以通过获取目标区域的点云的第一位置数据,根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,进而可以利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据并利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,使得能够利用根据所述第二位置数据和第二距离数据所获得训练样本数据,对待训练的3d目标检测模型进行训练,得到训练好的3d目标检测模型,由于分别对用于模型训练的点云的位置数据和距离数据进行编码处理,可以获得具有更加有效地点云的空间信息的训练样本数据,进而基于该训练样本数据进行模型训练,可以更加便于模型学到点云的空间信息,减少了学习的信息损失,从而增强了模型的检测性能和鲁棒性。[0042]可选地,在本实施例的一个可能的实现方式中,所述3d网格的目标中心点包括3d网格的中心点或3d网格中指定对象的聚类中心点。[0043]在本实现方式中,指定对象可以是目标检测的对象,即目标障碍物。[0044]在该实现方式的一个具体实现过程中,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格的中心点可以是任意一个体素(voxel)网格的中心点。[0045]在该实现方式的另一个具体实现过程中,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格中指定对象的聚类中心点可以是任意一个voxel网格中的目标对象的点云聚类的中心点。例如,一帧点云图,任意一个voxel网格中,目标对象的点云聚类的中心点可以是一个目标检测框的中心点,目标对象是自行车的目标检测框的中心点。[0046]可选地,在本实施例的一个可能的实现方式中,在步骤103中,具体可以根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据。[0047]在本实现方式中,预设的位置编码算法可以包括预设的正弦函数算法。该预设的正弦对应关系是预设的第一位置数据和第二位置数据的正弦对应关系。[0048]在该实现方式的一个具体实现过程中,具体可以利用预设的正弦函数算法和第一位置数据,计算得到第一位置数据对应的第二位置数据。[0049]在本实现方式中,所述第一位置数据可以包括3d坐标。例如,任意一个点云的3d坐标可以是(x,y,z)。[0050]在该实现方式的另一个具体实现过程中,具体可以根据所述预设的正弦对应关系,对所述3d坐标进行正弦编码处理,以获得所述3d坐标的每个维度的正弦编码结果,进而可以根据所述3d坐标的每个维度的正弦编码结果,获得所述第二位置数据。[0051]在本具体实现过程中,在目标区域的范围数据是[-l,l],[-w,w]和[-h,h]的情况下,任意一个3d网格,其中任意一个点云pi的作为第一位置数据的3d坐标可以是(xi,yi,zi),该3d坐标的范围可以是范围是:,,。根据所述预设的正弦对应关系,对该3d坐标进行正弦编码处理后,获得的3d坐标的每个维度的正弦编码结果,即该点云pi对应的第二位置数据可以是(,,)。[0052]具体地,可以利用如下公式(1),计算得到该点云pi对应的第二位置数据(,,)。[0053](1)其中,xi,yi,zi分别为点云pi三个维度(xyz三个方向)的坐标值,即点云pi的第一位置数据(xi,yi,zi),l,w、h分别为目标区域的长度、宽度、高度,点云pi对应的第二位置数据(,,)的每个维度的数据范围分别可以是,,即第二位置数据的每个维度的数据范围均处于之间。[0054]这里,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格可以是voxel网格。对于基于pointpillar算法的待训练的3d目标检测模型,3d网格可以是pillar网格。[0055]可以理解的是,第一位置数据可以是点云的原始3d坐标,第二位置数据可以是对点云的原始3d坐标进行编码处理后得到的点云的3d坐标,即第二位置数据可以是点云的原始3d坐标进行归一化处理后的得到的点云的3d坐标。[0056]这样,通过对点云的原始3d坐标进行正弦编码处理,实现了对点云的原始3d坐标的归一化。由此,后续基于归一化处理后的点云的第二位置数据和第二距离数据,对待训练模型进行训练,可以使得模型学习到更加有效的点云空间信息。[0057]可以理解的是,预设的位置编码算法还可以包括用于数据归一化的其他现有的编码算法,例如,现有的神经网络的编码器算法、数据归一化算法等。[0058]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测模型的训练方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0059]可选地,在本实施例的一个可能的实现方式中,在步骤104中,具体可以获取所述第一距离数据对应的3d网格的尺寸数据,进而可以计算所述第一距离数据和所述第一距离数据对应的3d网格的尺寸数据的比值,使得能够根据所述比值,获得所述第二距离数据。[0060]在本实现方式中,3d网格的尺寸数据可以包括3d网格的长度、宽度和高度,例如,3d网格的尺寸数据为l,w,h。[0061]具体地,对于任意一个3d网格,可以利用如下公式(2),获得第二距离数据:(2)其中,l为3d网格的长度,w为3d网格的宽度,h为3d网格的高度,3d网格中,任意点云pi坐标是(xi,yi,zi),3d网格的目标中心的坐标是,则有任意点pi到中心的第一距离数据可以为,编码处理后的第二距离数据为,第二距离数据的每个维度的数据范围分别是,,,即第二距离数据的每个维度的数据范围均处于之间。[0062]可以理解的是,第一距离数据可以是点云与其对应的3d网格的目标中心点的之间的距离,第二距离数据可以是进行编码处理,即归一化处理后的距离数据。[0063]这样,通过对点云与其对应的3d网格的目标中心点的之间的距离进行编码处理,实现了对点云与其对应的3d网格的目标中心点的之间的距离的归一化。后续基于归一化处理后的点云的第二位置数据和第二距离数据,对待训练模型进行训练,可以使得模型学习到更加有效的点云空间信息。[0064]可以理解的是,预设的距离编码算法还可以包括现有的其他可以实现数据归一化的算法,在此可以不做具体限定。[0065]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测模型的训练方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0066]可选地,在本实施例的一个可能的实现方式中,在步骤105中,具体可以对所述第二位置数据和第二距离数据进行拼接处理,以获得所述点云的空间数据,进而可以根据所述点云的空间数据,获得训练样本数据。[0067]在本实现方式中,对于任意一个3d网格内的点云pi的空间数据可以记作。[0068]这里,点云pi的空间数据中的每个元素均归一化到之间,可以作为待训练的3d目标检测模型的训练样本数据。[0069]在本实现方式中,训练样本数据可以是具有标签信息的样本数据,或者,可以是无标签信息的样本数据。[0070]在该实现方式的一个具体实现过程中,还可以根据点云的空间数据和预先标注的标签信息,获得训练样本数据。[0071]可以理解的是,可以利用现有的数据拼接的方式,对所述第二位置数据和第二距离数据进行拼接处理,在此可以不做具体限定。[0072]示例性的,对于基于voxelnet算法的待训练的3d目标检测模型,目标区域的范围数据是[-l,l],[-w,w]和[-h,h],其中的任意一个voxel网格,该voxel网格长宽高可以分别为l,w,h,其内部包含的n个点云分别记作p1,p2,…,pn。[0073]首先,对于任意的一个点云pi的坐标可以记作(xi,yi,zi)。即该点云pi的原始坐标(xi,yi,zi),坐标的范围是:,,。其次,可以利用公式(1),对点云pi原始坐标进行重新编码得到点云pi新的坐标(,,),其中,新坐标的范围是:,,,进而可以实现对点云的坐标的归一化。再次,任意点pi到中心的距离数据可以为,可以利用公式(2),得到编码处理后的距离数据为,距离数据的每个维度的数值处于之间,进而可以实现对点云的坐标的归一化。再次,对点云pi新的坐标(,,)和编码处理后的距离数据进行拼接处理,可以得到voxel网格内的点云pi的空间数据。最后,将目标区域内的点云的空间数据作为训练样本数据,对基于voxelnet算法的待训练的3d目标检测模型进行训练,得到训练好的基于voxelnet算法的3d目标检测模型。[0074]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测模型的训练方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0075]图2是本技术另一个实施例提供的3d目标检测的方法的流程示意图,如图2所示。[0076]步骤201、获取目标区域的待检测的点云的第一位置数据。[0077]步骤202、根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述待检测的点云与对应的3d网格的目标中心点之间的第一距离数据。[0078]步骤203、利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据。[0079]步骤204、利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据。[0080]步骤205、根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据。[0081]步骤206、将所述待检测的点云的空间数据,输入3d目标检测模型,以获得所述待检测的点云的3d目标检测结果,所述3d目标检测模型是利用根据前述的3d目标检测模型的训练方法得到的。[0082]需要说明的是,所述待检测的点云可以是需要利用3d目标检测模型进行目标检测的点云。[0083]需要说明的是,所述3d目标检测模型可以包括但不限于基于voxelnet算法的3d目标检测模型、以及基于pointpillar算法的3d目标检测模型。[0084]需要说明的是,步骤201~步骤206的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,例如,网络侧的目标检测平台中的处理引擎或者分布式系统等,本实施例对此不进行特别限定。[0085]可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。[0086]这样,可以通过获取目标区域的待检测的点云的第一位置数据,根据所述第一位置数据和所述目标区域的预设的3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,进而可以利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据,并利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,使得能够根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据,并将所述待检测的点云的空间数据,输入预先训练好的3d目标检测模型,得到待检测的点云的3d目标检测结果,由于增强了用于检测的点云的空间数据可靠性,并利用检测性能更好地模型对待检测点云进行目标检测处理,从而提高了点云的目标检测结果的可靠性。[0087]可选地,在本实施例的一个可能的实现方式中,所述3d网格的目标中心点包括3d网格的中心点或3d网格中指定对象的聚类中心点。[0088]在本实现方式中,指定对象可以是目标检测的对象,例如,目标障碍物。[0089]在该实现方式的一个具体实现过程中,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格的中心点可以是任意一个体素(voxel)网格的中心点。[0090]在该实现方式的另一个具体实现过程中,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格中指定对象的聚类中心点可以是任意一个voxel网格中的目标对象的点云聚类的中心点。例如,一帧点云图,任意一个voxel网格中,目标对象的点云聚类的中心点可以是一个目标检测框的中心点,目标对象是自行车的目标检测框的中心点。[0091]可选地,在本实施例的一个可能的实现方式中,在步骤203中,具体可以根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据。[0092]在本实现方式中,所述预设的正弦对应关系是预设的第一位置数据和第二位置数据的正弦对应关系。[0093]在本实现方式中,所述第一位置数据可以包括3d坐标。例如,任意一个待检测的点云的3d坐标可以是(x,y,z)。[0094]在该实现方式的一个具体实现过程中,具体可以根据所述预设的正弦对应关系,对所述3d坐标进行正弦编码处理,以获得所述3d坐标的每个维度的正弦编码结果,进而可以根据所述3d坐标的每个维度的正弦编码结果,获得所述第二位置数据。[0095]可以理解的是,可以利用前述实施例中的公式(1),获得待检测的点云的第二位置数据,在此不在赘述。[0096]这里,对于基于voxelnet算法的待训练的3d目标检测模型,3d网格可以是voxel网格。对于基于pointpillar算法的待训练的3d目标检测模型,3d网格可以是pillar网格。[0097]可以理解的是,第一位置数据可以是待检测的点云的原始3d坐标,第二位置数据可以是进行编码处理后的待检测的点云的3d坐标。[0098]这样,通过对待检测的点云的原始3d坐标进行正弦编码处理,实现了对点云的原始3d坐标的归一化。由此,后续对归一化处理后的点云的第二位置数据和第二距离数据进行目标检测处理,可以提升了目标检测的准确性和可靠性。[0099]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测的方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0100]可选地,在本实施例的一个可能的实现方式中,在步骤204中,具体可以获取所述第一距离数据对应的3d网格的尺寸数据,进而可以计算所述第一距离数据和所述第一距离数据对应的3d网格的尺寸数据的比值,使得能够根据所述比值,获得所述第二距离数据。[0101]可以理解的是,可以利用前述实施例中的公式(2),获得待检测的点云的第二距离数据,在此不在赘述。[0102]这里,第一距离数据可以是待检测的点云与其对应的3d网格的目标中心点的之间的距离,第二距离数据可以是进行编码处理,即归一化处理后的距离数据。[0103]这样,通过对待检测的点云与其对应的3d网格的目标中心点的之间的距离进行编码处理,实现了对待检测的点云与其对应的3d网格的目标中心点的之间的距离的归一化。后续对归一化处理后的待检测的点云的第二位置数据和第二距离数据进行目标检测处理,可以提升目标检测的准确性和可靠性。[0104]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测的方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0105]可选地,在本实施例的一个可能的实现方式中,在步骤205中,具体可以对所述第二位置数据和第二距离数据进行拼接处理,以获得所述点云的空间数据。[0106]在本实现方式中,对于任意一个3d网格内的待检测的点云pi的空间数据可以记作。[0107]这样,待检测的点云pi,的空间数据中的每个元素均归一化到之间。[0108]需要说明的是,本实现方式中所提供的具体实现过程,可以结合前述实现方式中所提供的多种具体实现过程,来实现本实施例的3d目标检测的方法。详细的描述可以参见前述实现方式中的相关内容,此处不再赘述。[0109]可以理解的是,可以利用现有的数据拼接的方式,对所述第二位置数据和第二距离数据进行拼接处理,在此可以不做具体限定。[0110]需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。[0111]在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。[0112]图3示出了本技术一个实施例提供的3d目标检测模型的训练装置的结构框图,如图3所示。本实施例的3d目标检测模型的训练装置300可以包括数据获取单元301,第一获得单元302、第一编码单元303、第二编码单元304、第二获得单元305和模型训练单元306。其中,数据获取单元301,用于获取目标区域的点云的第一位置数据;第一获得单元302,用于根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据;第一编码单元303,用于利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;第二编码单元304,用于利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;第二获得单元305,用于根据所述第二位置数据和第二距离数据,获得训练样本数据;模型训练单元306,用于利用所述训练样本数据,对待训练的3d目标检测模型进行训练,以获得训练完成的3d目标检测模型。[0113]需要说明的是,本实施例的3d目标检测模型的训练装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,本实施例对此不进行特别限定。[0114]可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。[0115]可选地,在本实施例的一个可能的实现方式中,第一编码单元303,具体可以用于根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据,其中,所述预设的正弦对应关系是预设的第一位置数据和第二位置数据的正弦对应关系。[0116]可选地,在本实施例的一个可能的实现方式中,所述第一位置数据包括3d坐标,第一编码单元303,具体还可以用于根据所述预设的正弦对应关系,对所述3d坐标进行正弦编码处理,以获得所述3d坐标的每个维度的正弦编码结果,根据所述3d坐标的每个维度的正弦编码结果,获得所述第二位置数据。[0117]可选地,在本实施例的一个可能的实现方式中,第二编码单元304,具体可以用于获取所述第一距离数据对应的3d网格的尺寸数据,计算所述第一距离数据和所述第一距离数据对应的3d网格的尺寸数据的比值,以及根据所述比值,获得所述第二距离数据。[0118]可选地,在本实施例的一个可能的实现方式中,所述3d网格的目标中心点包括3d网格的中心点或3d网格中指定对象的聚类中心点。[0119]可选地,在本实施例的一个可能的实现方式中,第二获得单元305,具体可以用于对所述第二位置数据和第二距离数据进行拼接处理,以获得所述点云的空间数据,根据所述点云的空间数据,获得训练样本数据。[0120]本实施例中,通过数据获取单元获取目标区域的点云的第一位置数据,进而可以由第一获得单元根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,由第一编码单元利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据,由第二编码单元利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,由第二获得单元根据所述第二位置数据和第二距离数据,获得训练样本数据;使得模型训练单元能够利用所述训练样本数据,对待训练的3d目标检测模型进行训练,以获得训练完成的3d目标检测模型,由于分别对用于模型训练的点云的位置数据和距离数据进行编码处理,可以获得具有更加有效地点云的空间信息的训练样本数据,进而基于该训练样本数据进行模型训练,可以更加便于模型学到点云的空间信息,减少了学习的信息损失,从而增强了模型的性能和鲁棒性。[0121]图4示出了本技术一个实施例提供的3d目标检测的装置的结构框图,如图4所示。本实施例的3d目标检测的装置400可以包括数据获取单元401,第一获得单元402、第一编码单元403、第二编码单元404、第二获得单元405和目标检测单元406。其中,数据获取单元401,用于获取目标区域的待检测的点云的第一位置数据;第一获得单元402,用于根据所述第一位置数据和所述目标区域的预设的3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据;第一编码单元403,用于利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据;第二编码单元404,用于利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据;第二获得单元405,用于根据所述第二位置数据和所述第二距离数据,获得所述待检测的点云的空间数据;目标检测单元406,用于将所述待检测的点云的空间数据,输入3d目标检测模型,以获得所述待检测的点云的3d目标检测结果,所述3d目标检测模型是利用根据前述的3d目标检测模型的训练装置得到的。[0122]需要说明的是,本实施例的3d目标检测的装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit,sdk)等功能单元,本实施例对此不进行特别限定。[0123]可以理解的是,所述应用可以是安装在本地终端上的本地程序(nativeapp),或者还可以是本地终端上的浏览器的一个网页程序(webapp),本实施例对此不进行限定。[0124]可选地,在本实施例的一个可能的实现方式中,第一编码单元403,具体可以用于根据所述第一位置数据、以及所述目标区域中预设的正弦对应关系,对所述第一位置数据的进行正弦编码处理,以获得所述第二位置数据,其中,所述预设的正弦对应关系是预设的第一位置数据和第二位置数据的正弦对应关系。[0125]可选地,在本实施例的一个可能的实现方式中,所述第一位置数据包括3d坐标,第一编码单元403,具体还可以用于根据所述预设的正弦对应关系,对所述3d坐标进行正弦编码处理,以获得所述3d坐标的每个维度的正弦编码结果,根据所述3d坐标的每个维度的正弦编码结果,获得所述第二位置数据。[0126]可选地,在本实施例的一个可能的实现方式中,第二编码单元404,具体可以用于获取所述第一距离数据对应的3d网格的尺寸数据,计算所述第一距离数据和所述第一距离数据对应的3d网格的尺寸数据的比值,以及根据所述比值,获得所述第二距离数据。[0127]可选地,在本实施例的一个可能的实现方式中,所述3d网格的目标中心点包括3d网格的中心点或3d网格中指定对象的聚类中心点。[0128]可选地,在本实施例的一个可能的实现方式中,第二获得单元405,具体可以用于对所述第二位置数据和第二距离数据进行拼接处理,以获得所述点云的空间数据。[0129]本实施例中,通过数据获取单元获取目标区域的点云的第一位置数据,进而可以由第一获得单元根据所述第一位置数据和所述目标区域的预设的三维3d网格,获得所述点云与对应的3d网格的目标中心点之间的第一距离数据,由第一编码单元利用预设的位置编码算法,对所述第一位置数据进行编码处理,以获得第二位置数据,由第二编码单元利用预设的距离编码算法,对所述第一距离数据进行编码处理,以获得第二距离数据,由第二获得单元根据所述第二位置数据和第二距离数据,获得所述待检测的点云的空间数据,使得模型训练单元能够将所述待检测的点云的空间数据,输入3d目标检测模型,以获得所述待检测的点云的3d目标检测结果,所述3d目标检测模型是利用根据前述的3d目标检测模型的训练装置得到的,由于增强了用于检测的点云的空间数据可靠性,并利用检测性能更好地模型对待检测点云进行目标检测处理,从而提高了点云的目标检测结果的可靠性。[0130]本技术一个实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的3d目标检测模型的训练方法和3d目标检测的方法。[0131]本技术一个实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的3d目标检测模型的训练方法和3d目标检测的方法。[0132]本技术的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。[0133]需要说明的是:上述实施例提供的3d目标检测模型的训练装置在进行3d目标检测模型的训练时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将3d目标检测模型的训练装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的3d目标检测模型的训练装置与3d目标检测模型的训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。[0134]需要说明的是:上述实施例提供的3d目标检测的装置在进行3d目标检测时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将3d目标检测的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的3d目标检测的装置与3d目标检测的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。[0135]本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。[0136]以上所述并不用以限制本技术实施例,凡在本技术实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术实施例的保护范围之内。当前第1页12当前第1页12









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部