发布信息

一种商品转化率预测方法 专利技术说明

作者:admin      2022-12-06 20:36:45     879



计算;推算;计数设备的制造及其应用技术1.本发明属于互联网应用技术领域,具体涉及一种商品转化率预测方法。背景技术:2.随着互联网人口红利消退,用户规模增长放缓,促进用户活跃度和提高用户粘性已成为电商平台的未来重要发展方向。商品转化率是指用户在单击某个商品之后到最终购买下单的概率,是电商平台最重要的效益评估指标之一。对于商品转化率进行有效预测能够精准地建立用户与商品之间的偏好关系,通过对用户画像进而有效提高用户的实际购买体验,能大幅度提高平台收益。因此一个高效的转化率预测模型对于电商平台构建核心竞争力具有重要意义。3.近些年,许多学者对商品转化率(cvr)预测进行了大量的研究,例如,阿里妈妈团队在sigir’2018发表的论文《entire space multi-task model:an effective approach for estimating post-click conversion rate》中提出了一种cvr预估模型——esmm,该模型通过点击率和点击转化率作为商品转化率的辅助任务模型,使商品转化率基于全样本空间进行训练有效的解决了真实场景中商品转化率预测面临的数据稀疏以及样本选择偏差这两个关键问题。esmm虽然解决了cvr预估面临的数据稀疏以及样本选择偏差,但是esmm没有考虑到用户点击商品之后到商品被用户下单之间存在的延迟时间,导致商品转化率的预测结果准确度低,预测效果不好。技术实现要素:4.为了解决现有技术中存在没有考虑到用户点击商品之后到商品被用户下单之间存在的延迟时间,导致商品转化率的预测结果准确度低,预测效果不好的问题,本发明提出一种商品转化率预测方法,该方法包括以下步骤:5.s1:通过电商平台获取原始数据;所述原始数据包括:用户属性信息、商品属性信息、用户历史点击行为信息、用户历史转化行为信息;6.s2:对用户属性信息和商品属性信息进行特征处理得到用户特征矩阵和商品特征矩阵,并将用户特征矩阵和商品特征矩阵进行特征拼接得到用户商品交互特征矩阵;7.s3:根据用户历史点击行为信息和用户历史转化行为信息预估用户对商品的点击率、用户对商品的点击转化率和用户对商品的延迟转化率,并将用户对商品的点击率作为点击标签、用户对商品的点击转化率作为点击转化标签以及用户对商品的延迟转化率作为延迟转化标签;8.s4:构建多任务商品预测模型,并将用户商品交互特征矩阵中的用户商品交互特征作为多任务商品预测模型的输入对多任务商品预测模型进行训练,其中,所述多任务商品预测模型包括:点击率学习任务模型、点击转化率学习任务模型和延迟转化率学习任务模型;9.s5:获取目标用户和目标商品的属性信息,并对目标用户和目标商品的属性信息进行特征提取得到目标用户和目标商品的特征向量,将目标用户和目标商品的特征向量进行拼接,得到目标用户商品交互特征;10.s6:将目标用户商品交互特征输入训练好的多任务商品预测模型预测得到目标用户对目标商品的预测点击率、目标用户对目标商品的预测点击转化率、目标用户对目标商品的预测延迟转化率;11.s7:根据目标用户对目标商品的预测转化率、目标用户对目标商品的预测点击转化率、目标用户对目标商品的预测延迟转化率利用em算法计算得到目标用户对目标商品的最终转化率。12.本发明至少具有以下有益效果13.本发明采集用户属性信息、商品属性信息、用户历史点击行为信息记录、用户历史转化行为信息记录,并创建用户商品交互特征矩阵,能够准确的表达出用户和商品之间复杂的特征相关性,通过构建的多任务商品预测模型,能够基于点击率学习任务模型、点击转化率学习任务模型和延迟转化率学习任务模型作为商品转化率预测的辅助任务模型,能够使转化率在全样本空间上进行预测,解决了数据稀疏性问题,通过将延迟转化率学习任务模型作为转化率预测模型的辅助任务模型,充分的考虑了用户点击商品之后到商品被用户下单购买之间存在的延迟时间,提高商品转化率预测结果的准确性,通过对商品转化率的预测结果,将商品推荐给相应的用户,提高平台的成交量,节约用户的浏览时间。附图说明14.图1为本发明方案流程图。具体实施方式15.为了更好地阐述本发明的技术方案并使优点更加简明清晰,下面先对本发明要解决的问题进行具体解释,再参照说明书附图,对本发明的具体实施方式做进一步详细说明。16.请参阅图1,本发明提出一种商品转化率预测方法,所述方法包括:17.s1:通过电商平台获取原始数据;所述原始数据包括:用户属性信息、商品属性信息、用户历史点击行为信息、用户历史转化行为信息。18.所述用户属性信息包括:用户的性别、用户的年龄、用户的消费水平、用户的是否就业。19.所述商品属性信息包括:商品所属类目、商品所属店铺、商品所属品牌。20.所述用户历史点击行为信息包括:用户对商品的点击行为、用户对商品所属类目的点击行为、用户对商品所属店铺的点击行为、用户对商品所属品牌的点击行为、用户对商品点击后经过的时间。21.用户历史转化行为信息包括;用户对商品的转化行为;用户对商品点击到转化的时间。22.本发明为了方便叙述和理解做如下定义:23.其中,y∈{0,1}表示用户对商品是否发生点击;z∈{0,1}表示用户对商品是否发生转化;e∈[0,∞]表示用户对商品点击后经过的时间;d∈[0,∞]表示用户对商品点击到转化的时间;所述用户对商品的转化行为表示用户点击商品之后下单。[0024]s2:对用户属性信息和商品属性信息进行特征处理得到用户特征矩阵和商品特征矩阵,并将用户特征矩阵和商品特征矩阵进行特征拼接得到用户商品交互特征矩阵,其中,所述用户商品交互特征矩阵包括:[0025]uifeatur={userasic,itembasic}[0026]uifeatur表示用户商品交互特征矩阵,userasic表示用户特征,itembasic表示商品特征。[0027]优选地,对用户属性信息和商品属性信息进行特征处理得到用户特征矩阵和商品特征矩阵包括:[0028]s21:根据用户属性信息计算用户之间的相似度,将用户作为节点,将相似度超过设定阈值的用户作为相邻节点创建用户属性网络空间;根据商品属性信息计算商品之间的相似度,将商品作为节点,将相似度超过设定阈值的商品作为相邻节点创建商品属性网络空间;[0029]优选地,根据用户属性信息计算用户之间的相似度包括:[0030][0031]其中,inter(u,v)表示用户u和用户v的相似度;interactk(u,v)表示用户u和用户v具有相同的第k种行为的次数,maxinteract表示用户u和用户v的所有行为的数量,例如,用户a对商品a浏览了2次、用户a对商品b浏览了5次、用户a对商品c浏览了8次;用户b对商品a浏览了1次、用户b对商品b浏览了9次、用户b对商品c浏览了2次;[0032]interacta(a,b)=1,interactb(a,b)=5,interactb(a,b)=2[0033]maxinteract(a,b)=27[0034][0035]其中,用户u和用户v表示两个不同用户。[0036]优选地,根据用户属性信息计算用户之间的相似度包括:[0037]根据用户的性别、用户的年龄、用户的消费水平、用户是否就业计算用户之间的相似度。[0038]优选地,所述根据商品属性信息计算商品之间的相似度包括:[0039][0040]其中,sim(item1,item2)表示商品item1和商品item2的相似度;belongk(item1,item2)表示商品item1和商品item2是否存在第m类所属关系,存在则为1,不存在则为0,例如,item1属于店铺d,item2属于店铺d则sim(item1,item2)=1,itrm1属于店铺d,item2属于店铺e,则(item1,item2)=0,其中,item1和item2为两个不同的商品。[0041]s22:将用户属性网络空间输入uigraph模型进行特征处理计算得到用户特征矩阵,将商品属性网络空间输入uigraph模型进行特征处理计算得到商品特征矩阵,其中,所述uigraph模型为图神经网络。[0042]优选地,所述uigraph模型包括:输入层、聚合层,输出层。[0043]优选地,所述商品特征矩阵/用户特征矩阵的计算步骤包括:[0044]步骤1:通过输入层将用户属性网络空间/商品属性网络空间输入至聚合层;[0045]步骤2:聚合层对用户属性网络空间/商品属性网络空间中节点的邻居节点进行采样;[0046]优选地,所述对用户属性网络空间/商品属性网络空间中节点的邻居节点进行采样,得到节点的邻居节点采样结果包括:[0047][0048]其中,表示节点x的邻居节点采样结果,aggregatek表示聚合层第k层的最大化聚合函数,表示节点x的邻居节点,其中,x表示用户属性网络空间/商品属性网络空间中的节点。[0049]步骤3:将节点的邻居节点采样结果进行聚合并作为节点的节点特征表示,根据节点的节点特征表示构建用户特征矩阵/商品特征矩阵;[0050]优选地,所述将节点的邻居节点采样结果进行聚合包括:[0051][0052][0053]其中,σ表示非线程激活函数,wk则是聚合层第k层的参数,concat表示连接函数,表示节点x通过聚合层第k-1层输出的节点特征表示,表示节点x的邻居节点采样结果,xuser/xitem表示用户特征矩阵/商品特征矩阵,σ包括:relu激活函数。[0054]s3:根据用户历史点击行为信息和用户历史转化行为信息预估用户对商品的点击率、用户对商品的点击转化率和用户对商品的延迟转化率,并将用户对商品的点击率作为点击标签、用户对商品的点击转化率作为点击转化标签以及用户对商品的延迟转化率作为延迟转化标签;[0055]优选地,所述用户对商品的点击率包括:[0056]pctr’=p(y=1|x=x)[0057]pctr’表示用户对商品的点击率,y=1表示用户对商品发生点击,x表示商品和用户样本,x表示商品和用户的用户商品交互特征。[0058]优选地,用户对商品的点击转化率包括:[0059]pctcvr’=p(z=1,y=1|x=x)[0060]pctcvr’表示用户对商品的点击率,y=1表示用户对商品发生点击,z=1表示用户对商品发生转化,x表示商品和用户样本,x表示商品和用户的用户商品交互特征。[0061]优选地,所述用户对商品的延迟转化率包括:[0062]pdec’=p(d|z=1,y=1,e,x=x)[0063]pdec’表示用户对商品的延迟转化率,y=1表示用户对商品发生点击,z=1表示用户对商品发生转化,e∈[0,∞]表示用户对商品点击后经过的时间;d∈[0,∞]表示用户对商品点击到转化的时间。[0064]s4:构建多任务商品预测模型,并将用户商品交互特征矩阵中的用户商品交互特征作为多任务商品预测模型的输入对多任务商品预测模型进行训练,其中,所述多任务商品预测模型包括:点击率学习任务模型、点击转化率学习任务模型和延迟转化率学习任务模型。[0065]优选地,所述对多任务商品预测模型进行训练包括:[0066]将用户商品交互特征矩阵中的用户商品交互特征作为训练样本,将点击标签作为点击率学习任务模型的约束,对点击率学习任务模型进行训练;[0067]将用户商品交互特征矩阵中的用户商品交互特征作为训练样本,将点击转化标签作为点击转化率学习任务模型的约束,对点击转化率学习任务模型进行训练;[0068]将用户商品交互特征矩阵中的用户商品交互特征作为训练样本,将延迟转化标签作为延迟转化率学习任务模型的约束,对延迟转化率学习任务模型进行训练。[0069]优选地,所述点击率学习任务模型的训练过程包括:[0070]所述点击率学习任务模型基于dcn神经网络包括:第一输入层、第一隐藏层、第一输出层;[0071]所述第一输入层用于将用户商品交互特征矩阵中的用户商品交互特征输入至第一隐藏层;[0072]所述第一隐藏层包括:第一cross层、第一deep层、第一组合层;[0073]通过第一cross层对用户商品交互特征进行特征关联处理,得到第一关联特征;[0074]优选地,所述第一关联特征包括:[0075]ot0=x[0076][0077]其中,otm表示第一子关联特征,x表示用户商品交互特征矩阵中的用户商品交互特征;mtm-1表示第一cross层第m-1层的权重参数,btm-1表示第一cross层第m-1层的偏差参数。[0078]通过第一deep层对用户商品交互特征进行特征关联处理,得到第二关联特征;[0079]优选地,所述第二关联特征包括:[0080]ht0=x[0081]htm=f(wtm-1htm-1+btm-1)[0082]其中,htm表示第二子关联特征,x表示用户商品交互特征矩阵中的用户商品交互特征;wtm-1表示第一deep层第m-1层的权重,btm-1代表第一deep层第m-1层的偏差参数;f代表relu激活函数。[0083]通过第一组合层将第一关联特征和第二关联特征进行连接,并将连接后的特征通过激活函数计算得到用户对商品的预测点击率;[0084]优选地,所述用户对商品的预测点击率包括:[0085]pctr=σ([otm,htm]wlogitst)[0086]其中,pctr表示用户对商品的预测点击率,wlogitsv表示第一组合层的权重参数,σ表示sigmoid函数,htm表示第二子关联特征,otm表示第一子关联特征。[0087]根据用户对商品的预测点击率和点击标签对点击率学习任务模型的参数进行调整,完成模型的训练。[0088]优选地,根据用户对商品的预测点击率和点击标签对点击率学习任务模型的参数进行调整包括:根据用户对商品的预测点击率和点击标签的均方误差对学习任务模型的参数进行调整。[0089]优选地,根据用户对商品的预测点击率和点击标签计算对点击率学习任务模型的参数进行调整方法包括:根据交叉熵函数对点击率学习任务模型的参数进行调整。[0090]优选地,所述点击转化率学习任务模型的训练过程包括:[0091]所述点击转化率学习任务模型基于dcn神经网络包括:第二输入层、第二隐藏层、第二输出层;[0092]所述第二输入层用于将用户商品交互特征矩阵中的用户商品交互特征输入至第二隐藏层;[0093]所述第二隐藏层包括:第二cross层、第二deep层、第二组合层;[0094]通过第二cross层对用户商品交互特征进行特征关联处理,得到第一子关联特征;[0095]优选地,所述第一子关联特征包括:[0096]ov0=x[0097][0098]其中,ovm表示第一子关联特征,x表示用户商品交互特征矩阵中的用户商品交互特征;wvm-1表示第二cross层第m-1层的权重参数,bvm-1表示第二cross层第m-1层的偏差参数。[0099]通过第二deep层对用户商品交互特征进行特征关联处理,得到第二子关联特征;[0100]优选地,所述第二子关联特征包括:[0101]hv0=x[0102]hvm=f(mvm-1hvm-1+bvm-1)[0103]其中,hvm表示第二关联特征,x表示用户商品交互特征矩阵中的用户商品交互特征;mvm-1表示第二deep层第m-1层的权重参数,bvm-1表示第二deep层第m-1层的偏差参数;f表示relu激活函数。[0104]通过第二组合层将第一子关联特征和第二子关联特征进行连接,并将连接后的特征通过激活函数计算得到用户对商品的预测点击转化率;[0105]所述用户对商品的预测点击转化率包括:[0106]pctcvr=σ([ovm,hvm]wlogitsv)[0107]其中,pctcvr表示用户对商品的预测点击转化率,wlogitst表示第二组合层的权重参数,σ表示sigmoid函数,ovm表示第一子关联特征,hvm表示第二关联特征。[0108]根据用户对商品的预测点击转化率和点击转化标签对点击转化率学习任务模型的参数进行调整,完成模型的训练。[0109]优选地,所述根据用户对商品的预测点击转化率和点击转化标签对点击转化率学习任务模型的参数进行调整包括:根据用户对商品的预测点击转化率和点击转化标签的均方误差对学习任务模型的参数进行调整。[0110]优选地,所述延迟转化率学习任务模型的训练过程包括:[0111]所述延迟转化率学习任务模型基于dnn神经网络:包括输入层、隐藏层和输出层;[0112]所述输入层用于将用户商品交互特征矩阵中的用户商品交互特征输入至隐藏层;[0113]所述隐藏层用于将用户商品交互特征进行多个维度的特征提取,得到多维度特征向量,并根据多维度特征向量计算得到用户对商品的预测延迟转化率;[0114]优选地,所述用户对商品的预测延迟转化率包括:[0115]x0=x[0116]xm+1=σ(wm+1xm+bm+1)[0117]z=xm+1[0118][0119]其中,pdec表示用户对商品的预测延迟转化率,x表示原始用户商品交互特征矩阵中的用户商品交互特征向量,z等于隐藏层最后一层的输出,xm表示隐藏层第m层的输出,σ表示relu激活函数,wm+1表示隐藏层第m+1层的权重参数,bm+1表示隐藏层第m+1层的偏置参数。[0120]根据用户对商品的预测延迟转化率和延迟转化标签对延迟转化率学习任务模型的参数进行调整,完成模型的训练,通过延迟转化率学习模型能够准确的计算出用户对商品延迟转化天数,提高转化率的准确性,同时本发明设计的点击率学习任务模型、点击转化率学习任务模型和延迟转化率学习任务模型均是以全样本空间作为训练样本,没有数据稀疏性问题,通过本发明计算出的延迟转化率非常准确。[0121]优选地,所述根据用户对商品的预测延迟转化率和延迟转化标签对延迟转化率学习任务模型的参数进行调整包括:根据用户对商品的预测延迟转化率和延迟转化标签的均方误差对学习任务模型的参数进行调整。[0122]s5:获取目标用户和目标商品的属性信息,并对目标用户和目标商品的属性信息进行特征提取得到目标用户和目标商品的特征向量,将目标用户和目标商品的特征向量进行拼接,得到目标用户商品交互特征。[0123]s6:将目标用户商品交互特征输入训练好的多任务商品预测模型预测得到目标用户对目标商品的预测点击率、目标用户对目标商品的预测点击转化率、目标用户对目标商品的预测延迟转化率。[0124]s7:根据目标用户对目标商品的预测转化率、目标用户对目标商品的预测点击转化率、目标用户对目标商品的预测延迟转化率利用em算法计算得到目标用户对目标商品的最终转化率。[0125]优选地,所述目标用户对目标商品的最终转化率的计算步骤包括:[0126]s71:将目标用户对目标商品的预测转化率、目标用户对目标商品的预测点击转化率、目标用户对目标商品的预测延迟转化率作为em算法的初始参数,并通过em算法计算期望值。[0127]优选地,所述期望值包括:[0128][0129]其中,wi表示第i个目标用户对目标商品的期望值,i1表示目标用户对目标商品发生点击,i2表示目标用户未对目标商品未发生点击,pctcvri表示第i个目标用户对目标商品的预测点击转化率,pctri表示第i个目标用户对目标商品的预测转化率,pdeci(tj)表示第i个目标用户对目标商品在第j天的预测延迟转化率,t+1表示目标用户对目标商品延迟转化的最大天数,t表示时间,tj表示时间为第j天。[0130]s72:根据期望值构建em算法的对数似然损失函数。[0131]优选地,所述em算法的对数似然损失函数包括:[0132][0133]其中,wi表示第i个目标用户对目标商品的期望值,pctcvri表示第i个目标用户对目标商品的预测点击转化率,pctri表示第i个目标用户对目标商品的预测转化率,pdeci(tj)表示第i个目标用户对目标商品在第j天的预测延迟转化率,yi∈{0,1}表示第i个目标用户对目标商品是否发生点击,zi∈{0,1}表示第i个目标用户对目标商品是否发生转化,ei∈[0,∞]表示第i个目标用户对目标商品点击后经过的时间,di∈[0,∞]表示第i个目标用户对目标商品点击到转化经过的时间,t表示时间,pdeci(tj)表示第i个目标用户对目标商品在第j天的预测延迟转化率,t+1表示目标用户对目标商品延迟转化的最大天数。[0134]s73:对em算法的参数进行最大化收敛,当对数似然损失函数最大时,将期望值作为目标用户对目标商品的最终转化率。[0135]优选地,所述对em算法的参数进行最大化收敛包括:[0136]θ′=argmax(θ)[0137]其中,θ′表示em算法的最大参数,θ表示em算法的初始参数,θ=(pdeci(tj),pctcvri,pctri),pctcvri表示第i个目标用户对目标商品的预测点击转化率,pctri表示第i个目标用户对目标商品的预测转化率,pdeci(tj)表示第i个目标用户对目标商品在第j天的预测延迟转化率,argmax()表示最大化函数,通过em算法能够有效的去除目标用户和目标商品存在的特征噪声和多任务预测模型中存在的噪声,提高最终转化率的准确性。[0138]通过目标用户对目标商品的最终转化率预测结果,将商品推荐给相应的用户,提高平台的成交量,节约用户的浏览时间。[0139]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。[0140]应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部