发布信息

三维发型生成方法、装置、电子设备和存储介质与流程 专利技术说明

作者:admin      2022-11-30 10:23:49     203



计算;推算;计数设备的制造及其应用技术1.本公开涉及人工智能技术领域,具体为增强现实、虚拟现实、计算机视觉、深度学习等技术领域,可应用于虚拟数字人、元宇宙等场景,具体涉及一种三维发型生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。背景技术:2.人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。3.三维虚拟形象在社交、直播、游戏等用户场景具有广泛应用价值。基于人工智能的三维虚拟形象生成,通过单张人脸图像生成虚拟形象,为用户定制个性化的虚拟形象有效在满足用户的个性化需求,具有广泛的应用前景。4.在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。技术实现要素:5.本公开提供了一种三维发型生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。6.根据本公开的一方面,提供了一种三维发型生成方法,包括:获得与预设的第一头模对应的第一发型数据,所述第一发型数据包括第一发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;基于所述第一发丝集合对应的多个发丝数据进行编码,以获得所述第一发型数据对应的第一发型隐向量;以及基于所述第一发型隐向量,获得与所述第一头模对应的三维发型,所述三维发型包括第二发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标,其中,所述第一发丝集合不同于所述第二发丝集合。7.根据本公开的另一方面,提供了一种三维发型生成装置,包括:第一发型数据获取单元,被配置用于获得与预设的第一头模对应的第一发型数据,所述第一发型数据包括第一发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;第一编码单元,被配置用于基于所述第一发丝集合对应的多个发丝数据进行编码,以获得所述第一发型数据对应的第一发型隐向量;以及三维发型获取单元,被配置用于基于所述第一发型隐向量,获得与所述第一头模对应的三维发型,所述三维发型包括第二发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标,其中,所述第一发丝集合不同于所述第二发丝集合。8.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开的实施例所述的方法。9.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开的实施例所述的方法。10.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现根据本公开的实施例所述的方法。11.根据本公开的一个或多个实施例,可以实现数据驱动的三维发型生成技术,在发丝数据的数量较少的情况下,实现三维发丝的重建、不同类型的三维发型的生成等等。12.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明13.附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。14.图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;15.图2示出了根据本公开的实施例的三维发型生成方法的流程图;16.图3示出了根据本公开的实施例的三维发型生成方法中基于第一发丝集合对应的多个发丝数据进行编码的过程的流程图;17.图4示出了根据本公开的实施例的三维发型生成方法中发丝自编码器网络的示意图;18.图5示出了可以实现根据本公开的实施例的三维发型生成方法中基于第一发丝集合中的每一个发丝对应的发丝数据进行编码的过程的流程图;19.图6示出了根据本公开的实施例的三维发型生成方法中基于第一发丝集合对应的多个发丝隐向量进行编码的过程的流程图;20.图7示出了根据本公开的实施例的三维发型生成方法中发型自编码器网络的示意图;21.图8a和图8b分别示出了根据本公开的实施例的三维发型生成方法中发型自编码器网络的训练数据集对应的原始发型和根据发型自编码器网络生成的三维发型的示意图;22.图9示出了根据本公开的实施例的三维发型生成方法中基于第一发型隐向量,获得与第一头模对应的三维发型的过程的流程图;23.图10示出了根据本公开的实施例的三维发型生成方法的流程图;24.图11示出了根据本公开的实施例的三维发型生成方法中基于第一发型隐向量和第二发型隐向量,获得目标发型隐向量的过程的流程图;25.图12示出了根据本公开的实施例的三维发型生成装置的结构框图;26.图13示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。具体实施方式27.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。28.在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。29.在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。30.下面将结合附图详细描述本公开的实施例。31.图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。32.在本公开的实施例中,服务器120可以运行使得能够执行三维发型生成方法的一个或多个服务或软件应用。33.在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(saas)模型下提供给客户端设备101、102、103、104、105和/或106的用户。34.在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可以依次利用一个或多个客户端应用程序来与服务器120进行交互以利用这些组件提供的服务。应当理解,各种不同的系统配置是可能的,其可以与系统100不同。因此,图1是用于实施本文所描述的各种方法的系统的一个示例,并且不旨在进行限制。35.用户可以使用客户端设备101、102、103、104、105和/或106来接收所生成的三维发型。客户端设备可以提供使客户端设备的用户能够与客户端设备进行交互的接口。客户端设备还可以经由该接口向用户输出信息。尽管图1仅描绘了六种客户端设备,但是本领域技术人员将能够理解,本公开可以支持任何数量的客户端设备。36.客户端设备101、102、103、104、105和/或106可以包括各种类型的计算机设备,例如便携式手持设备、通用计算机(诸如个人计算机和膝上型计算机)、工作站计算机、可穿戴设备、智能屏设备、自助服务终端设备、服务机器人、游戏系统、瘦客户端、各种消息收发设备、传感器或其他感测设备等。这些计算机设备可以运行各种类型和版本的软件应用程序和操作系统,例如microsoft windows、apple ios、类unix操作系统、linux或类linux操作系统(例如google chrome os);或包括各种移动操作系统,例如microsoft windows mobile os、ios、windows phone、android。便携式手持设备可以包括蜂窝电话、智能电话、平板电脑、个人数字助理(pda)等。可穿戴设备可以包括头戴式显示器(诸如智能眼镜)和其他设备。游戏系统可以包括各种手持式游戏设备、支持互联网的游戏设备等。客户端设备能够执行各种不同的应用程序,例如各种与internet相关的应用程序、通信应用程序(例如电子邮件应用程序)、短消息服务(sms)应用程序,并且可以使用各种通信协议。37.网络110可以是本领域技术人员熟知的任何类型的网络,其可以使用多种可用协议中的任何一种(包括但不限于tcp/ip、sna、ipx等)来支持数据通信。仅作为示例,一个或多个网络110可以是局域网(lan)、基于以太网的网络、令牌环、广域网(wan)、因特网、虚拟网络、虚拟专用网络(vpn)、内部网、外部网、区块链网络、公共交换电话网(pstn)、红外网络、无线网络(例如蓝牙、wifi)和/或这些和/或其他网络的任意组合。38.服务器120可以包括一个或多个通用计算机、专用服务器计算机(例如pc(个人计算机)服务器、unix服务器、中端服务器)、刀片式服务器、大型计算机、服务器群集或任何其他适当的布置和/或组合。服务器120可以包括运行虚拟操作系统的一个或多个虚拟机,或者涉及虚拟化的其他计算架构(例如可以被虚拟化以维护服务器的虚拟存储设备的逻辑存储设备的一个或多个灵活池)。在各种实施例中,服务器120可以运行提供下文所描述的功能的一个或多个服务或软件应用。39.服务器120中的计算单元可以运行包括上述任何操作系统以及任何商业上可用的服务器操作系统的一个或多个操作系统。服务器120还可以运行各种附加服务器应用程序和/或中间层应用程序中的任何一个,包括http服务器、ftp服务器、cgi服务器、java服务器、数据库服务器等。40.在一些实施方式中,服务器120可以包括一个或多个应用程序,以分析和合并从客户端设备101、102、103、104、105和/或106的用户接收的数据馈送和/或事件更新。服务器120还可以包括一个或多个应用程序,以经由客户端设备101、102、103、104、105和/或106的一个或多个显示设备来显示数据馈送和/或实时事件。41.在一些实施方式中,服务器120可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器120也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。云服务器是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(vps,virtual private server)服务中存在的管理难度大、业务扩展性弱的缺陷。42.系统100还可以包括一个或多个数据库130。在某些实施例中,这些数据库可以用于存储数据和其他信息。例如,数据库130中的一个或多个可用于存储诸如音频文件和视频文件的信息。数据库130可以驻留在各种位置。例如,由服务器120使用的数据库可以在服务器120本地,或者可以远离服务器120且可以经由基于网络或专用的连接与服务器120通信。数据库130可以是不同的类型。在某些实施例中,由服务器120使用的数据库例如可以是关系数据库。这些数据库中的一个或多个可以响应于命令而存储、更新和检索到数据库以及来自数据库的数据。43.在某些实施例中,数据库130中的一个或多个还可以由应用程序使用来存储应用程序数据。由应用程序使用的数据库可以是不同类型的数据库,例如键值存储库,对象存储库或由文件系统支持的常规存储库。44.图1的系统100可以以各种方式配置和操作,以使得能够应用根据本公开所描述的各种方法和装置。45.在相关技术中,往往根据单张人脸图像生成虚拟形象的三维发型。为实现这一能力,需要对单张人脸图像进行图像解析。然而单张人脸图像缺乏大量信息,比如人脸图像通常不具备发型侧面、发型背面,以及存在被遮挡不可见发型区域,使得无法生成的完整、准确的三维发型。46.根据本公开的一方面,提供了一种三维发型生成方法。如图2所示,根据本公开的一些实施例的三维发型生成方法200包括:47.步骤s210:获得与预设的第一头模对应的第一发型数据,所述第一发型数据包括第一发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;48.步骤s220:基于所述第一发丝集合对应的多个发丝数据进行编码,以获得所述第一发型数据对应的第一发型隐向量;以及49.步骤s230:基于所述第一发型隐向量,获得与所述第一头模对应的三维发型,所述三维发型包括第二发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标,其中,所述第一发丝集合不同于所述第二发丝集合。50.通过基于第一发型数据中的发丝数据进行编码获得第一发型隐向量,并基于第一发型隐向量获得三维发型,该三维发型包括第二发丝集合中每一个发丝的发丝数据,实现三维发型的重建并且重建的三维发型是以发丝为表征的,即实现三维发丝的重建。51.同时,所生成的三维发型中的第二发丝集合不同于第一发丝集合,可以实现基于少量的发丝数据,生成包含更多发丝的三维发型,实现三维发丝的图像修复(inpainting)重建、超分辨率的三维发丝重建以及发型编辑等等。52.在一些实施例中,从开源数据库中获得第一发型数据,其中,预设的第一头模是可以是任意头部三维模型,例如,由用户确定的头模,其包括头部表面各个点的坐标。第一头模可以具有多种发型,例如长直发、长卷发、短发、中分、偏分等等,不同发型具有相应的发型数据。53.根据本公开的实施例,利用第一头模上某一特定发型的发型数据中的各个发丝数据在隐向量空间中的距离相近,提取发型的隐向量空间的特征,获得发型在隐向量空间的表达,生成发型隐向量,基于发型隐向量生成三维发型,令数据驱动的三维发丝生成成为可能,对单张人脸图像发丝信息缺失的弥补具有良好作用。54.在一些实施例中,第一发丝集合可以包括位于第一头模的正面的发丝,也可以是位于第一头模上其他部分的发丝或者包括第一头模上全部发丝。55.在一些实施例中,每一个发丝可以是由发丝上的多个节点按顺序排列构成的节点序列,每一个发丝的发丝数据包括由该节点序列中的各个节点的坐标构成的坐标序列。例如每一个发丝包括由m个节点按顺序排列构成的节点序列,其中,m为正整数;该发丝的发丝数据包括由这m个节点的坐标构成的坐标序列,即m个坐标按顺序排列构成的坐标序列。56.在一些实施例中,该多个节点包括位于头模的头皮位置的发根节点,位于发丝末尾的发梢节点。57.在一些实施例中,通过对将第一发丝集合对应的多个发丝数据直接进行编码,获得发型隐向量。58.上述过程可以用于对数据量较小的发型数据的处理中。然而,由于发型数据中的发丝数据的数据量往往较大。例如,1200根发丝的第一发丝集合,在每一个发丝具有20个节点的情况下,具有24000的数据量;在神经网络中,若构建全连接网络层则会形成24000x24000的超大矩阵,数据量处理过大,可能无法处理。同时,由于发丝与发丝的空间关系不具备一致性,无法使用卷积神经网络层来对网络进行简化处理大型数据;最终使得无法对发型数据进行处理,而得不到发型隐向量。59.在一些实施例中,如图3所示,步骤s220、基于所述第一发丝集合对应的多个发丝数据进行编码包括:60.步骤s310:基于所述第一发丝集合中的每一个发丝对应的发丝数据进行编码,以获得该发丝对应的发丝隐向量;以及61.步骤s320:基于所述第一发丝集合对应的多个发丝隐向量进行编码,以获得所述第一发型隐向量。62.通多对单根发丝的发丝数据进行编码,获得发丝隐向量,基于发丝隐向量获得发型隐向量,由于单根发丝的发丝数据的数据量较小,能够实现发型隐向量的获取,同时,由于同一发型下的各个发丝的发丝数据具有相似的特征,在隐向量空间相近,在实现通过提取发丝隐向量后基于发丝隐向量提取第一发型隐向量的同时,使得提取的发型隐向量准确。63.在一些实施例中,通过变分自编码器技术,实现基于所述第一发丝集合中的每一个发丝对应的发丝数据进行编码。64.参看图4,示出了根据本公开的一些实施例的发丝自编码器网络结构图。其中,发丝自编码器网络400包括发丝编码器410和发丝解码器420,通过将一个输入数据经过编码器410生成隐向量(latent code),并可再经由解码器420生成回原始数据,不需要数据标签便能无监督的进行训练。65.在根据本公开的实施例中,发丝编码器410的输入数据为发型数据x中的第i个发丝的发丝数据hairstrandx,i,输出数据为第i个发丝对应的发丝隐向量latentx,i。其中,hairstrandx,i包括发型数据x中第i个发丝上的各个节点的坐标,nodex,i,j,其中,i为发丝编号,并且0≤i≤n;j为第i个发丝上节点的编号,并且0≤j≤m;n为第一发丝集合中发丝的数量,并且n为正整数;m为第i个发丝上节点的数量,并且m为正整数。66.通过将发型数据中n个发丝的发丝数据分别输入发丝自编码器网络400,使得发丝自编码器网络400针对n个发丝预测n次,实现对发丝自编码器网络400的训练。其中,发丝编码器410和发丝解码器420初始状态下皆为随机初始化的网络,lastentx,i作为发型x下i发丝的特征表达,初始情况下不具备此数据,随着发丝编码器410和发丝解码器420的联合训练,隐向量空间会具有提取发型特征的能力,而逐渐具有latentx,i。67.在一些实施例中,针对所述第一发丝集合中的每一个发丝,对该发丝对应的发丝数据中的各个节点坐标进行编码,获得该发丝对应的发丝隐向量。68.在一些实施例中,所述第一发丝集合中的每一个发丝上的多个节点包括发根节点,如图5所示,步骤s310、基于所述第一发丝集合中的每一个发丝对应的发丝数据进行编码包括:69.步骤s510:针对所述多个发丝中的每一个发丝,基于该发丝的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及70.步骤s520:针对所述多个发丝中的每一个发丝,对该发丝对应的位置增强向量和该发丝的发丝数据进行编码,以获得该发丝对应的发丝隐向量。71.基于发根节点的坐标获得位置增强向量,实现位置编码,提升发丝数据在深度学习网络中的可学习性,同时,由于位置增强向量的维数大于坐标的维数,其包含更多的位置信息,增加信息量,使得基于该位置增强向量和发丝数据进行编码获得的发丝隐向量更加准确。72.继续参看图4,在发丝编码器410之前,还包括位置编码器(positional encoding)430,位置编码器430的输入数据为第i个发丝的发根节点的坐标rooti,输出数据为位置增强向量。73.在一些实施例中,在获得第一发丝集合中多个发丝对应的多个发丝隐向量之后,对该多个发丝隐向量进行编码,获得发型隐向量。74.在一些实施例中,所述第一发丝集合中的每一个发丝上的多个节点包括发根节点,如图6所示,步骤320、基于所述第一发丝集合对应的多个发丝隐向量进行编码包括:75.步骤s610:基于所述第一发丝集合中的每一个发丝的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及76.步骤s620:对所述第一发丝集合中对应的多个位置增强向量和多个发丝隐向量进行编码,以获得第一发型隐向量。77.基于发根节点的坐标获得位置增强向量,实现位置编码,提升发丝数据在深度学习网络中的可学习性,同时,由于位置增强向量的维数大于坐标的维数,其包含更多的位置信息,增加信息量,使得基于该位置增强向量和各个发丝隐向量进行编码获得的发型隐向量更加准确。78.在一些实施例中,通过变分自编码器技术,实现对所述第一发丝集合中对应的多个位置增强向量和多个发丝隐向量进行编码。79.参看图7,示出了根据本公开的一些实施例中的发型自编码器网络结构图,其中,发型自编码器网络700包括多个发丝编码器710、与多个发丝编码器710对应的多个位置编码器720和发型编码器730。80.其中,每一个发丝编码器710可以采用如图4中所示的发丝编码器网络400中的发丝编码器410。每一个位置编码器720的输入数据为相应发丝的发根节点的坐标,输出数据为位置增强向量。发型编码器730的输入数据为多个发丝中的每一个发丝的发丝隐向量与相应位置增强向量的融合向量,输出数据为发型隐向量latentx。81.在一些实施例中,步骤s130基于所述第一发型隐向量,获得与所述第一头模对应的三维发型包括:对第一发型隐向量进行解码,以获得三维发型。82.在一些实施例中,对第一发型隐向量进行解码包括:首先,对第一发型隐向量进行第一解码,获得与第二发丝集合中的每一个发丝对应的发丝隐向量;接着,对第一发丝集合对应的多个发丝隐向量中的每一个发丝隐向量进行第二解码,以获得每个发丝上的多个节点中的每一个节点的坐标。83.继续参看图7,发型自编码器网络700包括还包括发型解码器740、多个发丝解码器750。其中,每一个发丝解码器可以采用如图4中所示的发丝解码器。84.在获得第一发型隐向量之后,将第一发型隐向量输入至发型解码器740,获得多个发丝的多个发丝隐向量之后,将该多个发丝隐向量对应输入多个发丝解码器750,使得每一个发丝解码器对对应的发丝隐向量进行解码,以获得相应发丝的发丝数据hairstrandx,i′,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标。85.在根据本公开的一个实施例中,对发型自编码网络进行训练后,训练数据集经过发型自编码网络中的发丝编码器和发型编码器生成发型隐向量后,再经由发型解码器和发丝解码器反演出三维发型。如图8a和图8b所示,各个训练数据集对应的原始发型(如图8a所示)与由发型自编码网络得到的与该训练数据集对应的三维发型(如图8b所示)基本一致,达到了良好的自编码器性能。86.在一些实施例中,如图9所示,步骤s130、所述基于所述第一发型隐向量,获得与所述第一头模对应的三维发型包括:87.步骤s910:基于所述第一发型隐向量,获得目标发型隐向量;以及88.步骤s920:对所述目标发隐向量进行解码,以获得所述三维发型。89.基于第一发型隐向量,获得目标发型隐向量后,对目标发型隐向量进行解码,可以实现基于第一发型数据获得不同的三维发型,实现发型种类的扩充。90.在一些实施例中,目标发型隐向量可以是对第一发型隐向量进行修改后,获得的发型隐向量。例如,人为修改第一发型隐向量,以获得目标发型隐向量。91.在一些实施例中,如图10所示,根据本公开的三维发型生成方法还包括:92.步骤s1010:获得与所述第一头模对应的第二发型数据,所述第二发型数据包括来自所述第一头模的第三发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;以及93.步骤s1020:对所述第三丝集合对应的多个发丝数据进行编码,以获得所述第二发型数据对应的第二发型隐向量;以及其中,步骤s810:基于所述第一发型隐向量,获得目标发型隐向量包括:94.基于所述第一发型隐向量和所述第二发型隐向量,获得所述目标发型隐向量。95.由于同一头模下的各个发型的发型数据具有相似的特征,使获得的发型隐向量空间距离相近,且数据之间在隐向量空间具有连续性,使得发型隐向量具有可编辑、可插值的能力。通过获得同一头模下不同发型的发型数据(第一发型数据和第二发型数据),并获得不同发型数据对应的发型隐向量(第一发型隐向量和第二发型隐向量),基于不同发型隐向量获得目标发型隐向量,能够实现隐向量的插值,从而获得区别于第一发型数据对应的发型和第二发型数据对应的发型的更多类型的发型。96.在一些实施例中,将第一发型隐向量和第二发型隐向量进行融合以获得目标发型隐向量。97.在一些实施例,如图11所示,基于所述第一发型隐向量和所述第二发型隐向量,获得所述目标发型隐向量包括:98.步骤s1110:获得所述第一发型隐向量和所述第二发型隐向量各自对应的加权系数;以及99.步骤s1120:将所述第一发型隐向量和第二发型隐向量与各自对应的加权系数的乘积之和,确定为所述目标发型隐向量。100.通过获得所述第一发型隐向量和所述第二发型隐向量各自对应的加权系数,基于加权系数,获得目标发型隐向量,实现发型隐向量的插值的同时,减少数据处理量。101.在一些实施例中,第一发型隐向量对应的加权系数和第二发型隐向量对应的加权系数之和为1。102.在一些实施例中,对所述目标发隐向量进行解码,以获得所述三维发型包括:103.基于所述目标发型隐向量,获得所述第二发丝集合中的每一个发丝对应的发丝隐向量;以及104.针对所述第二发丝集合中的每一个发丝,基于该发丝对应的发丝隐向量,获得该发丝上的多个节点中的每一个节点的坐标。105.通过对目标发型隐向量进行解码,获得第二发丝集合中的每一个发丝对应的发丝隐向量,由于第二发丝集合不同于第一发丝集合,从而可以实现发丝数据的扩充。106.在一些实施例中,第一发丝集合中的发丝数量为1000,第二发丝集合中的发丝数量为10000。107.在一些实施例中,第一发丝集合为第一头模正面的发丝,第二发丝集合为第一头模上的所有的发丝。108.在一些实施例中,将目标发型隐向量输入到如图7所示的发型解码器740,获得第二发丝集合中每个发丝对应的发丝隐向量。109.在一些实施例中,所述第二发丝集合中的每一个发丝上的多个节点包括根节点,所述基于该发丝对应的发丝隐向量,获得该发丝上多个节点中的每一个节点的坐标包括:110.获得该发丝上的发根节点的坐标;111.基于该发丝上的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及112.基于该发丝对应的位置增强向量和发丝隐向量,获得该发丝上多个节点中的每一个节点的坐标。113.基于发根节点的坐标获得位置增强向量,实现位置编码,提升发丝数据在深度学习网络中的可学习性,同时,由于位置增强向量的维数大于坐标的维数,其包含更多的位置信息,增加信息量,使得基于该位置增强向量和相应发丝隐向量进行解码获得的相应发丝上的各个节点的坐标更加准确。114.在一些实施例中,基于第一头模上头皮部分的各个点的坐标,获得第二发丝集合中每一个发丝的发根节点的坐标。115.在一些实施例中,将每一个发丝对应的位置增强向量和发丝隐向量进行融合后获得融合向量,并输入到如图7所示的发丝解码器750获得该发丝的发丝数据,该发丝数据包括该发丝上各个节点的坐标。116.根据本公开的三维发型生成方法有效构建了理解三维发丝数据的深度学习能力,令数据驱动的三维发丝生成成为可能,对基于单张人脸图像生成的三维发型中的缺失的发丝信息具有良好弥补效果。针对三维发丝和深度学习开发者而言,本技术简单有效,令三维发丝数据与已有深度学习能力建立联系,大幅降低了三维发丝研发门槛。117.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。118.根据本公开的另一方面,还提供一种三维发型生成装置。如图12所示,装置1200包括:第一发型数据获取单元1210,被配置用于获得与预设的第一头模对应的第一发型数据,所述第一发型数据包括第一发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;第一编码单元1220,被配置用于基于所述第一发丝集合对应的多个发丝数据进行编码,以获得所述第一发型数据对应的第一发型隐向量;以及三维发型获取单元1230,被配置用于基于所述第一发型隐向量,获得与所述第一头模对应的三维发型,所述三维发型包括第二发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标,其中,所述第一发丝集合不同于所述第二发丝集合。119.在一些实施例中,所述第一编码单元包括:发丝编码单元,被配置用于基于所述第一发丝集合中的每一个发丝对应的发丝数据进行编码,以获得该发丝对应的发丝隐向量;以及发型编码单元,被配置用于基于所述第一发丝集合对应的多个发丝隐向量进行编码,以获得所述第一发型隐向量。120.在一些实施例中,所述第一发丝集合中的每一个发丝上的多个节点包括发根节点,所述发丝编码单元包括:第一增强单元,被配置用于针对所述多个发丝中的每一个发丝,基于该发丝的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及编码子单元,被配置用于被配置用于针对所述多个发丝中的每一个发丝,对该发丝对应的位置增强向量和该发丝的发丝数据进行编码,以获得该发丝对应的发丝隐向量。121.在一些实施例中,所述第一发丝集合中的每一个发丝上的多个节点包括发根节点,所述发型编码单元包括:第二增强单元,被配置用于基于所述第一发丝集合中的每一个发丝的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及编码子单元,被配置用于对所述第一发丝集合中对应的多个位置增强向量和多个发丝隐向量进行编码,以获得第一发型隐向量。122.在一些实施例中,所述三维发型获取单元包括:目标发型隐向量获取单元,被配置用于基于所述第一发型隐向量,获得目标发型隐向量;以及解码单元,被配置用于对所述目标发隐向量进行解码,以获得所述三维发型。123.在一些实施例中,还包括:第二发型数据获取单元,被配置用于获得与所述第一头模对应的第二发型数据,所述第二发型数据包括来自所述第一头模的第三发丝集合中的每一个发丝的发丝数据,该发丝数据包括该发丝上的多个节点中的每一个节点的坐标;以及第二编码单元,被配置用于对所述第三丝集合对应的多个发丝数据进行编码,以获得所述第二发型数据对应的第二发型隐向量;以及其中,所述目标发型隐向量获取单元包括:目标发型隐向量获取子单元,被配置用于基于所述第一发型隐向量和所述第二发型隐向量,获得所述目标发型隐向量。124.在一些实施例中,所述目标发型隐向量获取子单元包括:加权系数获取单元,被配置用于获得所述第一发型隐向量和所述第二发型隐向量各自对应的加权系数;以及获取子单元,被配置用于将所述第一发型隐向量和第二发型隐向量与各自对应的加权系数的乘积之和,确定为所述目标发型隐向量。125.在一些实施例中,所述解码单元包括:发型解码单元,被配置用于基于所述目标发型隐向量,获得所述第二发丝集合中的每一个发丝对应的发丝隐向量;以及发丝解码单元,被配置用于针对所述第二发丝集合中的每一个发丝,基于该发丝对应的发丝隐向量,获得该发丝上的多个节点中的每一个节点的坐标。126.在一些实施例中,所述第二发丝集合中的每一个发丝上的多个节点包括根节点,所述发丝解码单元包括:第三增强单元,被配置用于获得该发丝上的发根节点的坐标,基于该发丝上的发根节点的坐标,获得该发丝对应的位置增强向量,该位置增强向量的维数大于该发根节点的坐标的维数;以及解码子单元,被配置用于基于该发丝对应的位置增强向量和发丝隐向量,获得该发丝上多个节点中的每一个节点的坐标。127.根据本公开的实施例,还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。128.参考图13,现将描述可以作为本公开的服务器或客户端的电子设备1300的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。129.如图13所示,电子设备1300包括计算单元1301,其可以根据存储在只读存储器(rom)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(ram)1303中的计算机程序,来执行各种适当的动作和处理。在ram 1303中,还可存储电子设备1300操作所需的各种程序和数据。计算单元1301、rom 1302以及ram 1303通过总线1304彼此相连。输入/输出(i/o)接口1305也连接至总线1304。130.电子设备1300中的多个部件连接至i/o接口1305,包括:输入单元1306、输出单元1307、存储单元1308以及通信单元1309。输入单元1306可以是能向电子设备1300输入信息的任何类型的设备,输入单元1306可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元1307可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1308可以包括但不限于磁盘、光盘。通信单元1309允许电子设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙tm设备、802.11设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。131.计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如方法200。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由rom 1302和/或通信单元1309而被载入和/或安装到电子设备1300上。当计算机程序加载到ram 1303并由计算单元1301执行时,可以执行上文描述的方法200的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200。132.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。133.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。134.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。135.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。136.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。137.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。138.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。139.虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部