发布信息

交通流预测模型确定方法、设备、装置及可读存储介质与流程 专利技术说明

作者:admin      2023-07-18 17:37:57     684



计算;推算;计数设备的制造及其应用技术1.本发明属于车联网技术领域,特别涉及一种交通流预测模型确定方法、设备、装置及可读存储介质。背景技术:2.为了缓解交通拥堵、减少交通事故的发生,高速道路交通实行科学的规划、管理、疏导以及控制尤为重要。现有技术中针对高速公路场景下的交通流参数预测,包括统计学模型,机器学习和深度学习。但统计学模型,例如作为经典时序模型的季节性差分自回归滑动平均模型(seasonal autoregressive integrated moving average,sarima),只能对单变量预测,不同的应用场景要分别训练模型,不具备实际工程化意义。机器学习中,随机森林算法的历史数据和决策树的存储占用空间较大,并且训练时间和预测所需时间较长。深度学习模型中,长短期记忆网络模型(long short-term memory,lstm)受固定序列长度限制,对采用多变量进行参数预测的精确度较低。因此,现有技术中无法在采用多种因素对交通流参数进行预测的同时保证预测效率和预测精确度。技术实现要素:3.本发明实施例提供一种交通流预测模型确定方法、设备、装置及可读存储介质,解决了现有技术中无法在采用多种因素对交通流参数进行预测的同时保证预测效率和预测精确度的问题。4.第一方面,本发明的实施例提供一种交通流预测模型确定方法,包括:5.获取多个目标路段的历史交通流数据;6.通过随机森林算法对所述历史交通流数据进行处理,得到目标数据;7.将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型。8.进一步地,所述历史交通流数据包括以下至少一项:9.时间数据、空间数据、环境数据、交通事件数据以及交通流参数。10.进一步地,所述时间数据包括以下至少一项:年份、月份、日期、小时、节假日类型以及处于节假日第几天;11.所述空间数据包括:路段id,和/或,道路朝向;12.所述环境数据包括:路段湿滑度,和/或,路段能见度;13.所述交通事件数据包括:所述目标道路的交通事件持续总时间;14.所述交通流参数包括以下至少一项:所述目标道路的流量、速度、拥堵指数以及拥堵里程。15.进一步地,所述通过随机森林算法对所述历史交通流数据进行处理,得到目标数据,包括:16.通过随机森林算法对所述历史交通流数据进行降维处理,筛选出所述历史交通流数据中包含预设类型的数据;并对所述包含预设类型的数据进行分割,得到包括训练数据集和测试数据集的所述目标数据;17.所述目标数据包括:日期、小时、路段id以及道路朝向;或者,小时、路段id、道路朝向、节假日类型以及处于节假日第几天。18.进一步地,所述将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型,包括:19.将所述训练数据集作为输入,对所述基于注意力机制的长短期记忆网络模型进行训练,得到多个第一模型;20.通过所述测试数据集对所述第一模型进行性能评估,在多个所述第一模型中确定性能最优的模型作为所述目标模型。21.进一步地,所述通过所述测试数据集对所述第一模型进行性能评估,包括:22.将所述测试数据集作为输入,通过所述第一模型计算预测值;23.根据所述测试数据集以及所述预测值,计算所述第一模型的性能评估指标,所述性能评估指标包括以下至少一项:所述预测值与所述测试数据集之间的均方差、平均绝对误差、平均绝对百分比误差以及决定系数;24.根据所述性能评估指标对所述第一模型进行性能评估。25.进一步地,所述方法还包括:26.获取所述目标模型最后一次进行更新的第一时刻;27.在所述第一时刻与当前时刻的时间间隔大于预设时间的情况下,获取第一交通流数据,所述第一交通流数据为位于当前时刻之前的预设时间段内的交通数据流;28.通过随机森林算法对所述第一交通流数据进行处理,得到第一数据;29.将所述第一数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到第二模型;30.根据所述第二模型对所述目标模型进行更新。31.进一步地,所述通过随机森林算法对所述历史交通流数据进行处理之前,包括:32.剔除所述历史交通流数据中的重复数据、错误数据,并补全所述历史交通流数据中的缺失数据。33.进一步地,所述将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练之前,包括:34.对所述目标数据中的枚举类数据进行哑变量处理,对所述目标数据中的连续性数据进行标准化处理。35.第二方面,本发明的实施例提供一种交通流预测模型确定设备,包括:收发机、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的交通流预测模型确定方法的步骤。36.第三方面,本发明的实施例提供一种交通流预测模型确定装置,包括:37.获取模块,用于获取多个目标路段的历史交通流数据;38.处理模块,用于通过随机森林算法对所述历史交通流数据进行处理,得到目标数据;39.训练模块,用于将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型。40.第四方面,本发明的实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述的交通流预测模型确定方法的步骤。41.本发明的上述技术方案的有益效果是:42.本发明实施例的交通流预测模型确定方法,通过随机森林算法对历史交通流数据进行处理,能够对所述历史交通流数据进行处理,剔除对预测结果影响小的数据,从而减轻模型的计算压力;通过所述长短期记忆网络模型提取所述目标数据中时间序列特征,并利用注意力机制对所述目标数据中不同特征的相关性进行考量,解除了长短期记忆网络模型受序列长度影响的限制,能够采用采用多种因素对交通流的参数进行预测时同时保证预测效率和预测精确度。附图说明43.图1表示本发明实施例的交通流预测模型确定方法的步骤示意图;44.图2表示本发明实施例的基于注意力机制的随机森林和lstm预测模型的结构示意图;45.图3表示本发明实施例的模型训练方法的逻辑示意图之一;46.图4表示本发明实施例的模型训练方法的逻辑示意图之二;47.图5表示本发明实施例的交通流预测模型确定方法的逻辑示意图;48.图6表示本发明实施例的交通流预测模型确定装置的结构示意图;49.图7表示本发明实施例的终端的结构示意图。具体实施方式50.为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。51.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。52.在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。53.另外,本文中术语“系统”和“网络”在本文中常可互换使用。54.在本技术所提供的实施例中,应理解,“与a相应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其它信息确定b。55.在进行本发明实施例的说明时,首先对下面描述中所用到的一些概念进行解释说明。56.第一实施例57.如图1所示,本发明的实施例提供了一种交通流预测模型确定方法,包括如下步骤:58.步骤101,获取多个目标路段的历史交通流数据。59.可选地,所述获取多个目标路段的历史交通流数据,包括:60.从数据库中查询并获取特定时间段内多个目标路段的历史交通流数据。61.步骤102,通过随机森林算法对所述历史交通流数据进行处理,得到目标数据。62.可选地,所述通过随机森林算法对所述历史交通流数据进行处理之前,包括:63.剔除所述历史交通流数据中的重复数据、错误数据,并补全所述历史交通流数据中的缺失数据。64.可选地,所述补全所述历史交通流数据中的缺失数据,包括:65.对所述历史交通流数据中的缺失数据进行分布特征分析,得到分析结果;66.根据所述分析结果建立目标规则;67.根据所述目标规则补充所述缺失数据。68.步骤103,将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型。69.本发明实施例的交通流预测模型确定方法,通过随机森林算法对历史交通流数据进行处理,能够对所述历史交通流数据进行处理,剔除对预测结果影响小的数据,从而减轻模型的计算压力;通过所述长短期记忆网络模型提取所述目标数据中时间序列特征,并利用注意力机制对所述目标数据中不同特征的相关性进行考量,解除了长短期记忆网络模型受序列长度影响的限制,能够采用采用多种因素对交通流的参数进行预测时同时保证预测效率和预测精确度。70.可选地,所述历史交通流数据包括以下至少一项:71.时间数据、空间数据、环境数据、交通事件数据以及交通流参数。72.可选地,所述时间数据包括以下至少一项:年份、月份、日期、小时、节假日类型以及处于节假日第几天;73.所述空间数据包括:路段id,和/或,道路朝向;74.所述环境数据包括:路段湿滑度,和/或,路段能见度;75.所述交通事件数据包括:所述目标道路的交通事件持续总时间;76.所述交通流参数包括以下至少一项:所述目标道路的流量、速度、拥堵指数以及拥堵里程。77.需要说明的是,在模型训练的过程中,将所述时间数据、空间数据、环境数据以及交通事件数据中的至少一种数据作为特征数据,并将所述交通流参数作为标签对模型进行训练。78.可选地,确定所述目标模型之后,可以将预设时间点的时间数据、空间数据、环境数据以及交通事件数据作为所述目标模型的输入,得到预测的交通流参数。79.本发明实施例的交通流预测模型确定方法,充分考虑交通流数据中的潜在有效特征,融合时间维度(年份、月份、日期、小时、节假日类型、处于节假日第几天)、空间维度(路段id、道路朝向)、环境因素(路段湿滑度、路段能见度)、交通事件(路段交通事件持续总时间)等特征,采用多维特征融合分析,能够提高目标模型的预测精度。80.可选地,所述通过随机森林算法对所述历史交通流数据进行处理,得到目标数据,包括:81.通过随机森林算法对所述历史交通流数据进行降维处理,筛选出所述历史交通流数据中包含预设类型的数据;并对所述包含预设类型的数据进行分割,得到包括训练数据集和测试数据集的所述目标数据;82.所述目标数据包括:日期、小时、路段id以及道路朝向;或者,小时、路段id、道路朝向、节假日类型以及处于节假日第几天。83.由于从时间、空间、环境和交通事件等方面进行了多维特征分析,多维特征往往会带来模型的过拟合等问题,且在计算过程中不可避免地出现数据的冗余特征。利用随机森林算法对多特征进行降维处理,筛选多维特征中的重要特征,剔除重要性较低、对预测影响较小的特征,从而降低干扰因素,减轻后续模型计算的负担,加快预测时间,避免过拟合,增强模型的泛化能力。84.可选地,所述目标数据还包括所述交通流参数。85.本发明一实施例中,集合a表示基于注意力机制的随机森林和长短期记忆网络(long short-term memory,lstm)模型的输入时间序列,a=[s1,s2,s3,…,sn],si表示特征参数。[0086]法定节假日的交通流参数变化趋势与平日相比,易出现激增骤减等情况,存在较大差异。并且,不同类型的节假日受到高速收费、出行高峰等因素的影响,变化规律也有较大差别。[0087]具体地,法定节假日的交通流参数变化趋势与平日相比,易出现激增骤减等情况,与平日相比交通流存在较大差异。并且,不同类型的节假日受到高速收费、出行高峰等因素的影响,变化规律也有较大差别。如果对节假日交通流的预测和平日交通流的预测采用同一个预测模型,预测准确性有所局限。所以需要针对不同的时间特征,分为短期预测模型(针对平日交通流进行预测的模型)和法定节假日预测模型,对两个模型分别进行训练。[0088]本发明一实施例中,针对短期预测模型,集合a中n=9,且特征参数分别为年份、月份、日期、小时、路段id、道路朝向、路段湿滑度、路段能见度、路段交通事件持续总时间、流量、速度、拥堵指数以及拥堵里程;若为节假日预测模型,则集合a中n=8,且特征参数分别为年份、小时、节假日类型、处于节假日第几天、路段id、道路朝向、路段湿滑度以及路段能见度。[0089]可选地,对所述包含预设类型的数据进行分割,得到包括训练数据集和测试数据集的所述目标数据,包括:[0090]采用随机重采样技术和节点随机分裂技术构建若干决策树;[0091]所述包含预设类型的数据中被所述决策树选中的数据为所述训练数据集;所述包含预设类型的数据中未被选中的样本数据作为袋外数据,即所述测试数据集。[0092]本发明一实施例中,对随机森林模型进行评估,分析袋外样本误差,从而得到各特征重要性排序,选择重要性较高的最佳特征组合。经过随机森林筛选出的包含预设类型的数据可以记为b=[s1,s2,s3,…,sm],其中,m小于等于n。[0093]本发明实施例的交通流预测模型确定方法,通过随机森林算法能够对所述历史交通流数据进行降维处理,筛选多维特征中的重要特征,剔除重要性较低、对预测影响较小的特征,从而降低干扰因素,减轻预测模型计算的负担,加快预测时间,避免过拟合,增强模型的泛化能力。[0094]可选地,所述将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型,包括:[0095]将所述训练数据集作为输入,对所述基于注意力机制的长短期记忆网络模型进行训练,得到多个第一模型;[0096]通过所述测试数据集对所述第一模型进行性能评估,在多个所述第一模型中确定性能最优的模型作为所述目标模型。[0097]本发明一实施例中,基于注意力机制的随机森林和lstm预测模型的结构如图2所示。[0098]可选地,将所述训练数据集作为输入,对所述基于注意力机制的长短期记忆网络模型进行训练,包括:[0099]将所述训练数据集的时间序列进行升维处理,得到高维特征;[0100]将所述高维特征作为输入,对所述基于注意力机制的长短期记忆网络模型进行训练。[0101]可选地,将所述训练数据集作为输入,对所述基于注意力机制的长短期记忆网络模型进行训练,包括:[0102]将所述训练数据集作为长短期记忆网络模型的输入,得到输出向量;[0103]将所述输出向量作为注意力机制attention层的输入,并通过全连接层输出标签。[0104]本发明一实施例中,所述高维特征可以表示为:[0105]c=[s11,…,s1a,s21,…,s2b,…,smj];[0106]其中,时间序列c有p项,表示m维的重要特征分别经过特征提取后变为p维的高维特征,a、b……j为大于等于1的整数;[0107][0108]其中,xt表示时间序列c转为高维特征后的一个子集。可以通过t时刻前k个时间步长的片段预测t时刻的交通参数。[0109]可选地,所述lstm模型表示为:[0110]ft=σ(wf·[ht-1,xt]+bf);[0111]it=σ(wi·[ht-1,xt]+bi);[0112][0113][0114]ot=σ(wo·[ht-1,xt]+bo);[0115]ht=ot*tanh(ct);[0116]其中,ht-1、ht分别是t-1和t时刻的隐藏状态,ct、ct-1是t-1和t时刻的单元状态,w是权重,b是补偿参数,it是输入门,ft是遗忘门,ot是输出门,σ是激活函数sigmoid函数,tanh是激活函数双曲正切函数。[0117]经过lstm后,每一个输入xt对应得到lstm隐藏层输出ht,构成每个时间点的输出向量h=[h1,h2,…,hn]。[0118]本发明一实施例中,在attention层加权计算,也就是对这些时序数据之间进行相关性考量,使得预测结果对重要信息敏感度高,无关信息敏感度低。加入注意力机制可以实现全局时间范围内的并行计算,解决长依赖问题,突破lstm对固定长度向量计算的局限,提升预测准确率和预测速度。[0119]本发明一实施例中,通过以下方式计算时序数据之间的相关性:[0120](1)采用常见的dot-product方法计算每两个向量间的相关性。[0121]输入ht乘权重矩阵得到新向量:[0122][q1,q2,…,qn]=wq[h1,h2,…,hn],可以表示为q=wqh。[0123]同理,k=wkh,v=wvh;[0124]其中,wq、wk、wv为模型隐藏层对应的权重矩阵,q、k、v是每个输入向量ht构成的新向量表示形式。[0125](2)计算注意力得分。attention score的计算公式如下:[0126]s=ktq。[0127](3)将输出的注意力向量经过激活函数soft-max函数计算,得到各个样本与各条其他向量间的相关或相似程度分布:[0128]s′=softmax(s)。[0129](4)最后得到attention计算输出:[0130]o=[b1,b2,…,bn]=[v1,v2,…,vn]s′。[0131]可选地,通过所述全连接层输出的标签可以记为:[0132]y=[y1,y2,…,yn]。[0133]可选地,所述通过所述测试数据集对所述第一模型进行性能评估,包括:[0134]将所述测试数据集作为输入,通过所述第一模型计算预测值;[0135]根据所述测试数据集以及所述预测值,计算所述第一模型的性能评估指标,所述性能评估指标包括以下至少一项:所述预测值与所述测试数据集之间的均方差、平均绝对误差、平均绝对百分比误差以及决定系数;[0136]根据所述性能评估指标对所述第一模型进行性能评估。[0137]可选地,通过所述测试数据集以及所述预测值计算所述预测值与所述测试数据集之间的均方差,包括:[0138][0139]其中,f(si)预测值,yi是真实值。[0140]可选地,通过所述测试数据集以及所述预测值计算所述预测值与所述测试数据集之间的平均绝对误差,包括:[0141][0142]可选地,通过所述测试数据集以及所述预测值计算所述预测值与所述测试数据集之间的平均绝对百分比误差,包括:[0143][0144]可选地,通过所述测试数据集以及所述预测值计算所述预测值与所述测试数据集之间的决定系数,包括:[0145][0146]其中,所述决定系数(r-square,r2),r2的取值范围为[0,1]。[0147]具体地,所述平均绝对误差用于表征根据所述目标模型确定的预测值与所述和测试数据集中的真实值之间误差绝对值的平均值,且所述平均绝对误差越大,所述预测值与真实值的偏差越大;[0148]所述平均绝对百分比误差用于表征所述预测值与真实值偏离的相对大小情况,所述平均绝对百分比误差越大,所述预测值与真实值偏离相对所述真实值的偏离越大;[0149]所述决定系数用于表征所述目标模型的额拟程度,所述决定系数越大,所述目标模型的拟合效果越好。[0150]可选地,所述方法还包括:[0151]获取所述目标模型最后一次进行更新的第一时刻;[0152]在所述第一时刻与当前时刻的时间间隔大于预设时间的情况下,获取第一交通流数据,所述第一交通流数据为位于当前时刻之前的预设时间段内的交通数据流;[0153]通过随机森林算法对所述第一交通流数据进行处理,得到第一数据;[0154]将所述第一数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到第二模型;[0155]根据所述第二模型对所述目标模型进行更新。[0156]可选地,在所述目标模型为短期预测模型的情况下,所述预设时间以小时为单位;[0157]在所述目标模型为节假日预测模型的情况下,所述预设时间以月为单位。[0158]本发明一实施例中,在所述目标模型为短期预测模型的情况下,所述预设时间大于或者等于1个小时,所述预设时间段大于或者等于72个小时;[0159]在所述目标模型为节假日预测模型的情况下,所述预设时间大于或者等于1个月,所述预设时间段大于或者等于五年。[0160]需要说明的是,所述第一时刻与当前时刻的时间间隔小于预设时间,可以理解为可能是因为服务器中断重启,还没有到预设的定时更新时间,此时不进行模型更新。[0161]需要说明的是,若从数据库获取的所述第一交通流数据为空,则可能是因为路侧设备无监测数据,数据库中没有存入,此时不进行模型更新。[0162]本发明实施例的交通流预测模型确定方法,通过定期对所述目标模型进行更新,能够实时调整所述目标模型,进而提升所述目标模型的准确度。[0163]可选地,所述将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练之前,包括:[0164]对所述目标数据中的枚举类数据进行哑变量处理,对所述目标数据中的连续性数据进行标准化处理。[0165]如图3所示,在所述目标模型为短期预测模型的情况下,模型的训练步骤如下:[0166]步骤一:以小时为时间更新单位,每个整小时进行定时训练模型。[0167]步骤二:获取上一次模型更新的时间。(如果是首次执行该算法,则没有最新更新时间,此时需要初始化算法,在数据库中查询并获取最近72小时内目标路段的所有数据);如果最新更新时间与当前时间的时间间隔小于一个小时,可能是因为服务器中断重启,还没有到预设的定时更新时间,此时不进行更新模型;如果最新更新时间与当前时间的时间间隔大于或等于一个小时,则获取最新几个小时内的数据;构建数据集:{年份,月份,日期,小时,路段id,道路朝向,路段湿滑度,路段能见度,路段交通事件持续总时间,流量,速度,拥堵指数,拥堵里程}。其中,年份、月份、日期、小时为时间维度的特征,路段id、道路朝向为空间维度的特征,路段湿滑度、路段能见度为环境维度的特征,路段交通事件持续总时间是事件维度的特征,流量、速度、拥堵指数、拥堵里程为预测的交通流参数标签。[0168]具体地,道路朝向、路段湿滑度、路段能见度、路段交通事件持续总时间的分类及实际意义如表1所示。路段交通事件持续总时间为该路段预设的四类交通事件(异常停车、占用应急车道、车辆慢行、交通拥堵)在该小时内持续时间总和,表征了该路段交通事故严重情况。[0169]表1[0170][0171]步骤三:获取新时段的数据后,对数据库中近72小时数据进行增量处理。删除距当前时间大于72小时的数据,添加新时段数据,然后将历史信息按时间升序排序并保存到数据库中。[0172]步骤四:构建模型的输入数据格式。如果数据类型是枚举类,则进行哑变量处理0-1分布,短期预测模型的输入特征中,小时、路段id、道路朝向、路段湿滑度、路段能见度、路段交通事件持续总时间按枚举类特征处理。如果数据是非枚举类数据,则进行标准化处理,短期预测模型的输入特征中,年份、月份、日期、流量、速度、拥堵指数、拥堵里程按照非枚举类数据处理。将特征数据和标签数据分别分割成训练集和测试集。[0173]步骤五:将高维特征数据集作为模型的输入时间序列,对模型进行训练,并保存最优模型。[0174]如图4所示,在所述目标模型为节假日预测模型的情况下:[0175]步骤一:节假日预测模型以每月为时间更新单位,每月1号零点进行定时训练模型。[0176]步骤二:获取上一次模型更新的时间,(如果是首次执行该算法,则没有最新更新时间,此时需要初始化算法,在数据库中查询并获取最近5年所有节假日内目标路段的数据);如果最新更新时间与当前时间的时间间隔小于一个月,可能是因为服务器中断重启,还没有到预设的定时更新时间,此时不进行更新模型;如果最新更新时间与当前时间的时间间隔大于或等于一个月,则获取最新几个月内的数据,构建数据集:{年份,小时,节假日类型,处于节假日第几天,路段id,道路朝向,路段湿滑度,路段能见度,流量,速度,拥堵指数,拥堵里程}。其中,年份、小时、节假日类型、处于节假日第几天为时间维度的特征,路段id、道路朝向为空间维度的特征,路段湿滑度、路段能见度为环境维度的特征,流量、速度、拥堵指数、拥堵里程为预测的交通流参数标签。[0177]如果从数据库中获取的数据集为空,可能是因为路侧设备无监测数据,数据库中没有存入,此时不进行更新模型。[0178]步骤三:获取新时段的数据后,对数据库中近五年节假日数据进行增量处理。删除距目前时间大于五年的数据,添加新时段数据,然后按时间升序排列并保存到数据库中。[0179]步骤四:构建模型的输入数据格式。如果数据类型是枚举类,则进行哑变量处理0-1分布,节假日预测模型的输入特征中,小时、节假日类型、处于节假日第几天、路段id、道路朝向、路段湿滑度、路段能见度按枚举类特征处理。如果数据是非枚举类数据,则进行标准化处理,节假日预测模型的输入特征中,年份、流量、速度、拥堵指数、拥堵里程按照非枚举类数据处理。将特征数据和标签数据分别分割成训练集和测试集。[0180]步骤五:将高维特征数据集作为模型的输入时间序列,对模型进行训练,并保存最优模型。[0181]如图5所示,本发明实施例的交通流预测模型确定方法的步骤:[0182]获取历史交通流数据;[0183]剔除所述历史交通流数据中的异常数据,并补全缺失数据,得到处理后的历史交通流数据[0184]通过随机森林算法对处理后的所述历史交通流数据进行处理,得到训练集和测试集;[0185]采用训练集对模型进行训练,并采用测试集模型进行测试;[0186]在经过测试的模型准确度较低的情况下,优化流程、改进算法以及调整参数,重新对模型进行训练;[0187]在经过测试的模型准确度满足预设标准的情况下,确定目标模型。[0188]第二实施例[0189]如图6所示,本发明的实施例提供一种交通流预测模型确定装置600,包括:[0190]获取模块601,用于获取多个目标路段的历史交通流数据;[0191]处理模块602,用于通过随机森林算法对所述历史交通流数据进行处理,得到目标数据;[0192]训练模块603,用于将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型。[0193]本发明实施例的交通流预测模型确定装置,通过随机森林算法对历史交通流数据进行处理,能够对所述历史交通流数据进行处理,剔除对预测结果影响小的数据,从而减轻模型的计算压力;通过所述长短期记忆网络模型提取所述目标数据中时间序列特征,并利用注意力机制对所述目标数据中不同特征的相关性进行考量,解除了长短期记忆网络模型受序列长度影响的限制,能够采用采用多种因素对交通流的参数进行预测时同时保证预测效率和预测精确度。[0194]第三实施例[0195]本发明的实施例提供一种交通流预测模型确定设备,包括:收发机、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的交通流预测模型确定方法的步骤。[0196]本发明实施例的交通流预测模型确定设备,通过随机森林算法对历史交通流数据进行处理,能够对所述历史交通流数据进行处理,剔除对预测结果影响小的数据,从而减轻模型的计算压力;通过所述长短期记忆网络模型提取所述目标数据中时间序列特征,并利用注意力机制对所述目标数据中不同特征的相关性进行考量,解除了长短期记忆网络模型受序列长度影响的限制,能够采用采用多种因素对交通流的参数进行预测时同时保证预测效率和预测精确度。[0197]第四实施例[0198]为了更好的实现上述目的,如图7所示,本发明还提供了一种终端,该终端具体为第一终端,包括:处理器700;以及通过总线接口与所述处理器700相连接的存储器720,所述存储器720用于存储所述处理器700在执行操作时所使用的程序和数据,处理器700调用并执行所述存储器720中所存储的程序和数据。[0199]其中,收发机710与总线接口连接,用于在处理器700的控制下接收和发送数据;[0200]收发机710用于:[0201]获取多个目标路段的历史交通流数据;[0202]处理器700用于读取存储器720中的程序执行以下步骤:[0203]通过随机森林算法对所述历史交通流数据进行处理,得到目标数据;[0204]将所述目标数据作为输入,对基于注意力机制的长短期记忆网络模型进行训练,得到目标模型。[0205]其中,在图7中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器700代表的一个或多个处理器和存储器720代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机710可以是多个元件,即包括发送机和收发机,提供用于在传输介质上与各种其他装置通信的单元。针对不同的终端,用户接口730还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。处理器700负责管理总线架构和通常的处理,存储器720可以存储处理器700在执行操作时所使用的数据。[0206]本领域技术人员可以理解,实现上述实施例的全部或者部分步骤可以通过硬件来完成,也可以通过计算机程序来指示相关的硬件来完成,所述计算机程序包括执行上述方法的部分或者全部步骤的指令;且该计算机程序可以存储于一可读存储介质中,存储介质可以是任何形式的存储介质。[0207]另外,本发明具体实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的第一实施例中的方法的步骤。且能达到相同的技术效果,为避免重复,这里不再赘述。[0208]此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。[0209]因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。[0210]以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部