专利技术

一种基于深度学习的信息安全保密方法和装置与流程专利技术说明

 作者：admin  2023-07-07 13:05:42  793

电子通信装置的制造及其应用技术1.本发明涉及计算机技术领域，特别是涉及一种基于深度学习的信息安全保密方法和装置。背景技术：2.网络信息传输是现代化市场中信息传递与资源流通的主要方式之一，也是各单位数据信息交互的核心渠道。但是，网络的开放性较强，导致网络信息在传输数据与资源时存在一定的安全风险。为了降低此种风险对信息安全造成的影响，现有技术提出了多种针对数据传输安全的处理算法；但是传统算法综合使用性能较差，导致数据处理过程存在一定的漏洞。因此，为实现对网络传输数据信息的安全处理，保证交互终端中信息的稳定性和隐私性，需要实现传输数据的有效加密，全面保障数据的传输安全。3.随着深度学习在图像识别、文本翻译以及自动驾驶等领域取得的巨大成功，越来越多的研究者尝试将深度学习的模型和方法应用到信息加密领域。所以，如何利用深度学习来进行信息加密，是当前信息加密领域面临的一个大难题。技术实现要素：4.鉴于以上所述现有技术的缺点，本发明的目的在于提供一种基于深度学习的信息安全保密方法和装置，用于解决中无法利用深度学习进行信息加密的技术问题。5.为实现上述目的及其他相关目的，本发明提供一种基于深度学习的信息安全保密方法，包括以下步骤：6.获取传输样本信息以及与所述传输样本信息关联的流量数据；7.对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；8.对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；9.基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；10.将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；11.当所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。12.可选地，从过滤后的会话流量中提取传统时序特征的过程包括：13.将所述会话流量中对应会话的第一个数据包的方向作为对应会话的正方向；14.判断后续数据包的方向是否与所述正方向相同，并将与正方向相同的数据包的特征设置为+1，与正方向相反的数据包的特征设置为-1；15.对单个会话流量的数据包的特征进行正则化，并按照发送时间间隔将每个会话流量的数据包的方向特征值与数据包长度进行相乘，得到每个会话流量的传统时序特征；16.其中，当某个会话流量中的数据包的个数小于第一预设值时，将对应位置的传统时序特征用零填充。17.可选地，从过滤后的会话流量中提取头文本特征的过程包括：18.基于结构统一性和特征稳定性，从单个会话流量中提取通信协议结构网络层头部和传输层头部中前k个数据包头部所携带的文本特征；并在提取所述文本特征时，将所述网络层头部中的源ip地址和目的ip地址全部进行匿名化设置；19.将传输层中协议为用户数据报协议udp的数据包作为头文本数据包，并在用户数据报协议udp头部结尾进行字节填充，以及在完成填充后，将每个数据包从ip包头的第一个字节开始，提取长度为第二预设值的信息作为数据包头特征；20.对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的头文本特征。[0021]可选地，从过滤后的会话流量中提取载荷文本特征的过程包括：[0022]获取所述会话流量中对应会话的所有数据包的传输层载荷总长度，并在所述总长度小于m个字节时，记录对应会话所有传输层载荷后进行字节填充，直至会话长度大于或等于m个字节；[0023]截取所述会话流量中对应会话传输层载荷部分前m个字节的信息，对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的载荷文本特征。[0024]可选地，将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值的过程包括：[0025]将所述文本时序特征和空间特征进行两两组合，得到多个特征集；[0026]对所述多个特征集进行排序编号，并将排序编号后的特征集作为训练样本；[0027]从所述训练样本中随机选择一个特征集作为基准点，并基于所述基准点按照随机间隔选择特征集作为私钥；[0028]将所述私钥输入至神经网络中进行深度学习，并将同一个私钥筛选出的特征集合并成簇；[0029]对每个簇进行卷积，并计算簇间的相似距离，以及将所述相似距离作为深度学习过程中的训练损失值。[0030]可选地，在计算出训练损失值后，所述方法还包括：[0031]将所述训练损失值分别与预设范围的最大值和最小值进行比对，判断所述训练损失值是否大于或等于预设范围的最小值，且小于或等于预设范围的最大值；[0032]如果所述训练损失值大于或等于预设范围的最小值，且小于或等于预设范围的最大值，则输出此时的信息加密模型；[0033]如果所述训练损失值小于预设范围的最小值，或者打于预设范围的最大值，则进行簇间合并，并计算簇间合并后的相似距离，以及将对应的相似距离作为新的训练损失值。[0034]可选地，利用所述信息加密模型对待传输信息进行加密的过程还包括：[0035]将所述信息加密模型作为基础加密模型，并对所述基础加密模型进行增量识别，并计算增量识别加密模型的交叉熵损失；[0036]当所述交叉熵损失满足预设范围时，将此时的信息加密模型作为增强识别信息加密模型，并利用所述增强识别信息加密模型对待传输信息进行加密。[0037]可选地，所述神经网络包括以下至少之一：卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。[0038]本技术还提供一种基于深度学习的信息安全保密装置，该装置包括有：[0039]数据采集模块，用于获取传输样本信息以及与所述传输样本信息关联的流量数据；[0040]会话划分模块，用于对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；[0041]特征提取模块，用于对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；以及，基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；[0042]深度学习模块，用于将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；[0043]加密模块，用于在所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。[0044]可选地，所述神经网络包括以下至少之一：卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。[0045]如上所述，本发明提供一种基于深度学习的信息安全保密方法和装置，具有以下有益效果：本技术首先获取传输样本信息以及与所述传输样本信息关联的流量数据，然后对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；再对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；再然后基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；最后将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；当所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。由此可知，本技术通过以会话流量为基础识别单位，提取会话流量的传统时序特征和数据包头文本特征构成文本时序特征，也即加密流量时序特征，同时提取会话流量的载荷文本特征作为空间特征。再对加密流量时序特征和空间特征进行预训练，取各自的全连接网络中间层输出作为加密流量的新时序特征和新空间特征，拼接在一起得到会话流量的混合特征用于加密流量应用类型的识别和分类，从而能够根据不同环境下的加密流量数据情况，动态调整学习和特征提取的重心，始终保持极高的识别准确率。所以，本技术通过引入深度学习来进行信息加密，不仅能够丰富信息加密的业务能力，而且能够保证信息加密的准确性。附图说明[0046]图1为本技术中一实施例提供的基于深度学习的信息安全保密方法的流程示意图；[0047]图2为本技术中一实施例提供的基于深度学习的信息安全保密方法的原理框架示意图；[0048]图3为本技术中一实施例提供的提取头文字特征的示意图；[0049]图4为本技术中一实施例提供的卷积神经网络模型的整体框架示意图；[0050]图5为本技术中一实施例提供的基于深度学习的信息保密装置的硬件结构示意图。具体实施方式[0051]以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。[0052]需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。[0053]请参阅图1和图2所示，本发明提供一种基于深度学习的信息安全保密方法，该方法包括以下步骤：[0054]s110，获取传输样本信息以及与所述传输样本信息关联的流量数据；[0055]s120，对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；[0056]s130，对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；[0057]s140，基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；[0058]s150，将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；[0059]s160，当所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。[0060]根据上述记载，在一示例性实施例中，从过滤后的会话流量中提取传统时序特征的过程包括：将所述会话流量中对应会话的第一个数据包的方向作为对应会话的正方向；判断后续数据包的方向是否与所述正方向相同，并将与正方向相同的数据包的特征设置为+1，与正方向相反的数据包的特征设置为-1；对单个会话流量的数据包的特征进行正则化，并按照发送时间间隔将每个会话流量的数据包的方向特征值与数据包长度进行相乘，得到每个会话流量的传统时序特征；其中，当某个会话流量中的数据包的个数小于第一预设值时，将对应位置的传统时序特征用零填充。一个流量会话的传统时序特征包括该会话前n个数据包的长度，传输方向和发送时间间隔。将会话第一个数据包的方向设为该会话的正方向，对于后续的数据包，如果其方向与正方向相同，则方向特征设置为+1，反之则取-1。数据包长度的单位为字节，该特征值将除以1500进行正则化(互联网上绝大部分的数据包总长度小于1500b)。将数据包方向特征值与该数据包长度相乘，这样数据包长度值的正负可以代表数据包的方向，最终每个会话的传统时序特征的特征维度为(n1，2)，如果会话的实际数据包个数少于n1，则在特征向量的对应位置以0填充。[0061]在一示例性实施例中，从过滤后的会话流量中提取头文本特征的过程包括：基于结构统一性和特征稳定性，从单个会话流量中提取通信协议结构网络层头部和传输层头部中前k个数据包头部所携带的文本特征；并在提取所述文本特征时，将所述网络层头部中的源ip地址和目的ip地址全部进行匿名化设置；将传输层中协议为用户数据报协议udp的数据包作为头文本数据包，并在用户数据报协议udp头部结尾进行字节填充，以及在完成填充后，将每个数据包从ip包头的第一个字节开始，提取长度为第二预设值的信息作为数据包头特征；对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的头文本特征。具体地，数据包头文本特征提取情况如图3所示，一个流量会话的头文本特征选择的是该会话前n1个数据包头部所携带的文本特征。出于结构统一性和特征稳定性考虑，头文本特征提取的范围是tcp/ip四层结构中的网络层和传输层头部，同时为了避免模型将ip地址信息视为流量分类的关键特征，在特征提取过程中需要将网络层头部中的源ip地址和目的ip地址字段全部设置为0.0.0.0进行匿名化。由于网络层ip包头长度一般为20字节，传输层tcp协议包头长度一般为20个字节，udp协议包头长度一般为8字节，为了统一特征格式，对于传输层协议为udp的数据包，将在该数据包的udp头部结尾填充12个字节的0x00使其长度也为20字节。完成填充操作后，每个数据包从ip包头的第一个字节开始，提取长度为40个字节的信息作为数据包头特征，对于每一个字节的信息先将其转换成区间为[0，255]的10进制整数，然后除以255进行归一化。最终得到的流量会话数据包头文本特征维度为(n1，40)，如果该会话的数据包个数不足n1，则在特征向量的对应位置用0填充。此外，对于会话流量的传统时序特征和头文本特征，将以数据包为单位拼接在一起，得到维度为(n1，42)的新“时序特征”，即文本时序特征。[0062]在一示例性实施例中，从过滤后的会话流量中提取载荷文本特征的过程包括：获取所述会话流量中对应会话的所有数据包的传输层载荷总长度，并在所述总长度小于m个字节时，记录对应会话所有传输层载荷后进行字节填充，直至会话长度大于或等于m个字节；截取所述会话流量中对应会话传输层载荷部分前m个字节的信息，对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的载荷文本特征。具体地，一个会话的载荷文本特征提取的是该会话传输层载荷部分前n2个字节的信息。如果该会话所有数据包的传输层载荷总长度不足n2个字节，则在记录该会话所有传输层载荷的基础上填充0x00直到长度为n2字节；反之，则截取该会话前n字节的传输层载荷来构成特征向量。对于提取的载荷文本特征向量，同样需要先将每个字节的信息从16进制转换成区间为[0，255]的10进制整数，然后除以255进行归一化，最终一个会话的传输层载荷文本特征维度为(1，n2)。[0063]在一示例性实施例中，将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值的过程包括：将所述文本时序特征和空间特征进行两两组合，得到多个特征集；对所述多个特征集进行排序编号，并将排序编号后的特征集作为训练样本；从所述训练样本中随机选择一个特征集作为基准点，并基于所述基准点按照随机间隔选择特征集作为私钥；将所述私钥输入至神经网络中进行深度学习，并将同一个私钥筛选出的特征集合并成簇；对每个簇进行卷积，并计算簇间的相似距离，以及将所述相似距离作为深度学习过程中的训练损失值。此外，在计算出训练损失值后，本实施例还可以包括：将所述训练损失值分别与预设范围的最大值和最小值进行比对，判断所述训练损失值是否大于或等于预设范围的最小值，且小于或等于预设范围的最大值；如果所述训练损失值大于或等于预设范围的最小值，且小于或等于预设范围的最大值，则输出此时的信息加密模型；如果所述训练损失值小于预设范围的最小值，或者打于预设范围的最大值，则进行簇间合并，并计算簇间合并后的相似距离，以及将对应的相似距离作为新的训练损失值。[0064]具体地，假设在本轮增量识别流程开始前，原加密流量识别框架已经对m种已知类加密流量具备识别和分类能力，对应的加密流量数据为xm＝{(xi，yi)，yi∈[1，2，…，m]}；需要增量识别的未知类加密流量类型数为n，对应的加密流量数据为xn＝{(xi，yi)，yi∈[m+1，m+2，…，m+n]}。那么增量识别流程的目标是让模型快速具备对m+n种加密流量的识别和分类能力。[0065]在一示例性实施例中，利用所述信息加密模型对待传输信息进行加密的过程还包括：将所述信息加密模型作为基础加密模型，并对所述基础加密模型进行增量识别，并计算增量识别加密模型的交叉熵损失；当所述交叉熵损失满足预设范围时，将此时的信息加密模型作为增强识别信息加密模型，并利用所述增强识别信息加密模型对待传输信息进行加密。其中，常规交叉熵损失l计算公式如下：[0066][0067]式中，ly＝k为标签(labels)指示函数；pk(x)为模型判断样本x属于加密流量类型k的概率(1≤k≤m+n)；主要用于保持模型对已知类别的识别能力。[0068]根据上述记载，在一些示例性实施例中，所述神经网络包括以下至少之一：卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。作为示例，本实施例可以为卷积神经模型，例如为attention-cnn模型。其中，attention-cnn模型的整体框架如图4所示。[0069]综上所述，本发明提供一种基于深度学习的信息安全保密方法，首先获取传输样本信息以及与所述传输样本信息关联的流量数据，然后对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；再对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；再然后基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；最后将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；当所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。由此可知，本方法通过以会话流量为基础识别单位，提取会话流量的传统时序特征和数据包头文本特征构成文本时序特征，也即加密流量时序特征，同时提取会话流量的载荷文本特征作为空间特征。再对加密流量时序特征和空间特征进行预训练，取各自的全连接网络中间层输出作为加密流量的新时序特征和新空间特征，拼接在一起得到会话流量的混合特征用于加密流量应用类型的识别和分类，从而能够根据不同环境下的加密流量数据情况，动态调整学习和特征提取的重心，始终保持极高的识别准确率。所以，本方法通过引入深度学习来进行信息加密，不仅能够丰富信息加密的业务能力，而且能够保证信息加密的准确性。[0070]如图5所示，本技术还提供一种基于深度学习的信息安全保密装置，该装置包括有：[0071]数据采集模块510，用于获取传输样本信息以及与所述传输样本信息关联的流量数据；[0072]会话划分模块520，用于对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；[0073]特征提取模块530，用于对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；以及，基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；[0074]深度学习模块540，用于将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；[0075]加密模块550，用于在所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。[0076]根据上述记载，在一示例性实施例中，从过滤后的会话流量中提取传统时序特征的过程包括：将所述会话流量中对应会话的第一个数据包的方向作为对应会话的正方向；判断后续数据包的方向是否与所述正方向相同，并将与正方向相同的数据包的特征设置为+1，与正方向相反的数据包的特征设置为-1；对单个会话流量的数据包的特征进行正则化，并按照发送时间间隔将每个会话流量的数据包的方向特征值与数据包长度进行相乘，得到每个会话流量的传统时序特征；其中，当某个会话流量中的数据包的个数小于第一预设值时，将对应位置的传统时序特征用零填充。一个流量会话的传统时序特征包括该会话前n个数据包的长度，传输方向和发送时间间隔。将会话第一个数据包的方向设为该会话的正方向，对于后续的数据包，如果其方向与正方向相同，则方向特征设置为+1，反之则取-1。数据包长度的单位为字节，该特征值将除以1500进行正则化(互联网上绝大部分的数据包总长度小于1500b)。将数据包方向特征值与该数据包长度相乘，这样数据包长度值的正负可以代表数据包的方向，最终每个会话的传统时序特征的特征维度为(n1，2)，如果会话的实际数据包个数少于n1，则在特征向量的对应位置以0填充。[0077]在一示例性实施例中，从过滤后的会话流量中提取头文本特征的过程包括：基于结构统一性和特征稳定性，从单个会话流量中提取通信协议结构网络层头部和传输层头部中前k个数据包头部所携带的文本特征；并在提取所述文本特征时，将所述网络层头部中的源ip地址和目的ip地址全部进行匿名化设置；将传输层中协议为用户数据报协议udp的数据包作为头文本数据包，并在用户数据报协议udp头部结尾进行字节填充，以及在完成填充后，将每个数据包从ip包头的第一个字节开始，提取长度为第二预设值的信息作为数据包头特征；对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的头文本特征。具体地，数据包头文本特征提取情况如图3所示，一个流量会话的头文本特征选择的是该会话前n1个数据包头部所携带的文本特征。出于结构统一性和特征稳定性考虑，头文本特征提取的范围是tcp/ip四层结构中的网络层和传输层头部，同时为了避免模型将ip地址信息视为流量分类的关键特征，在特征提取过程中需要将网络层头部中的源ip地址和目的ip地址字段全部设置为0.0.0.0进行匿名化。由于网络层ip包头长度一般为20字节，传输层tcp协议包头长度一般为20个字节，udp协议包头长度一般为8字节，为了统一特征格式，对于传输层协议为udp的数据包，将在该数据包的udp头部结尾填充12个字节的0x00使其长度也为20字节。完成填充操作后，每个数据包从ip包头的第一个字节开始，提取长度为40个字节的信息作为数据包头特征，对于每一个字节的信息先将其转换成区间为[0，255]的10进制整数，然后除以255进行归一化。最终得到的流量会话数据包头文本特征维度为(n1，40)，如果该会话的数据包个数不足n1，则在特征向量的对应位置用0填充。此外，对于会话流量的传统时序特征和头文本特征，将以数据包为单位拼接在一起，得到维度为(n1，42)的新“时序特征”，即文本时序特征。[0078]在一示例性实施例中，从过滤后的会话流量中提取载荷文本特征的过程包括：获取所述会话流量中对应会话的所有数据包的传输层载荷总长度，并在所述总长度小于m个字节时，记录对应会话所有传输层载荷后进行字节填充，直至会话长度大于或等于m个字节；截取所述会话流量中对应会话传输层载荷部分前m个字节的信息，对每个字节的信息将其转换为区间为[0，255]的十进制整数，并对转换后的整数进行归一化处理，得到每个会话流量的载荷文本特征。具体地，一个会话的载荷文本特征提取的是该会话传输层载荷部分前n2个字节的信息。如果该会话所有数据包的传输层载荷总长度不足n2个字节，则在记录该会话所有传输层载荷的基础上填充0x00直到长度为n2字节；反之，则截取该会话前n字节的传输层载荷来构成特征向量。对于提取的载荷文本特征向量，同样需要先将每个字节的信息从16进制转换成区间为[0，255]的10进制整数，然后除以255进行归一化，最终一个会话的传输层载荷文本特征维度为(1，n2)。[0079]在一示例性实施例中，将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值的过程包括：将所述文本时序特征和空间特征进行两两组合，得到多个特征集；对所述多个特征集进行排序编号，并将排序编号后的特征集作为训练样本；从所述训练样本中随机选择一个特征集作为基准点，并基于所述基准点按照随机间隔选择特征集作为私钥；将所述私钥输入至神经网络中进行深度学习，并将同一个私钥筛选出的特征集合并成簇；对每个簇进行卷积，并计算簇间的相似距离，以及将所述相似距离作为深度学习过程中的训练损失值。此外，在计算出训练损失值后，本实施例还可以包括：将所述训练损失值分别与预设范围的最大值和最小值进行比对，判断所述训练损失值是否大于或等于预设范围的最小值，且小于或等于预设范围的最大值；如果所述训练损失值大于或等于预设范围的最小值，且小于或等于预设范围的最大值，则输出此时的信息加密模型；如果所述训练损失值小于预设范围的最小值，或者打于预设范围的最大值，则进行簇间合并，并计算簇间合并后的相似距离，以及将对应的相似距离作为新的训练损失值。[0080]具体地，假设在本轮增量识别流程开始前，原加密流量识别框架已经对m种已知类加密流量具备识别和分类能力，对应的加密流量数据为xm＝{(xi，yi)，yi∈[1，2，…，m]}；需要增量识别的未知类加密流量类型数为n，对应的加密流量数据为xn＝{(xi，yi)，yi∈[m+1，m+2，…，m+n]}。那么增量识别流程的目标是让模型快速具备对m+n种加密流量的识别和分类能力。[0081]在一示例性实施例中，利用所述信息加密模型对待传输信息进行加密的过程还包括：将所述信息加密模型作为基础加密模型，并对所述基础加密模型进行增量识别，并计算增量识别加密模型的交叉熵损失；当所述交叉熵损失满足预设范围时，将此时的信息加密模型作为增强识别信息加密模型，并利用所述增强识别信息加密模型对待传输信息进行加密。其中，常规交叉熵损失l计算公式如下：[0082][0083]式中，ly＝k为标签(labels)指示函数；pk(x)为模型判断样本x属于加密流量类型k的概率(1≤k≤m+n)；主要用于保持模型对已知类别的识别能力。[0084]根据上述记载，在一些示例性实施例中，所述神经网络包括以下至少之一：卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。作为示例，本实施例可以为卷积神经模型，例如为attention-cnn模型。其中，attention-cnn模型的整体框架如图4所示。[0085]综上所述，本发明提供一种基于深度学习的信息安全保密装置，首先获取传输样本信息以及与所述传输样本信息关联的流量数据，然后对所述流量数据进行格式转换，并根据预设五元组信息对完成格式转换后的流量数据进行会话划分，得到所述传输样本信息的会话流量；其中，所述预设五元组信息包括：源ip地址、源端口、目的ip地址、目的端口、网络协议；再对所述会话流量进行过滤，并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征；其中，所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔；所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征；载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息；再然后基于所述传统时序特征和所述头文本特征形成文本时序特征，以及基于所述载荷文本特征形成空间特征；最后将所述文本时序特征和空间特征输入至神经网络中进行深度学习，并计算深度学习过程中的训练损失值；当所述训练损失值满足预设范围时，输出信息加密模型，并利用所述信息加密模型对待传输信息进行加密。由此可知，本装置通过以会话流量为基础识别单位，提取会话流量的传统时序特征和数据包头文本特征构成文本时序特征，也即加密流量时序特征，同时提取会话流量的载荷文本特征作为空间特征。再对加密流量时序特征和空间特征进行预训练，取各自的全连接网络中间层输出作为加密流量的新时序特征和新空间特征，拼接在一起得到会话流量的混合特征用于加密流量应用类型的识别和分类，从而能够根据不同环境下的加密流量数据情况，动态调整学习和特征提取的重心，始终保持极高的识别准确率。所以，本装置通过引入深度学习来进行信息加密，不仅能够丰富信息加密的业务能力，而且能够保证信息加密的准确性。[0086]上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明：本文中引用的各种信息及资料（包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主体（包括但不限于公司、媒体、协会等机构）的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理！本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理，本文部分文字与图片资源来自于网络，部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益，请立即通知我们，情况属实，我们会第一时间予以删除，并同时向您表示歉意,谢谢!

关键词：电子通信装置的制造及其应用技术专利技术

专利技术

一种基于深度学习的信息安全保密方法和装置与流程专利技术说明

相关内容查看全部 

一种低温环境下的

仿生高黏附沥青改

一种汽车安全气囊

机床以及诊断方法

元器件料带计数装

一种折叠式多层线

一种矫形套装的制

一种旋转开合的庭

瓦楞纸用箱纸板的

一种电石块重型链

一种基于深度学习的信息安全保密方法和装置与流程 专利技术说明

相关内容 查看全部 

一种基于深度学习的信息安全保密方法和装置与流程专利技术说明

相关内容查看全部 