乐器;声学设备的制造及制作,分析技术1.本技术涉及人工智能技术领域,尤其涉及一种声控开关的声音识别方法和装置、计算机设备、存储介质。背景技术:2.声控开关是目前常用的能够实现自动开启关闭的功能载体,声控开关是根据是否生成声音信号来控制开关的开启,即只要声音消失并且持续保持开启状态的时间完成,声控开关就会自动关闭。这种开关非常方便实用,并且能够节省能源。但是,现有的声控开关的声音识别非常容易受到外界的干扰,只要外界噪音大于声控开关所设定的阈值,那么声控开关就会自动被激活,这样不仅浪费电源,还缩短了功能载体的使用寿命。因此,如何提高声控开关对不同声音信号的识别能力,从而有效达到节省能源的目的,成为了亟待解决的技术问题。技术实现要素:3.本技术实施例的主要目的在于提出了一种声控开关的声音识别方法和装置、计算机设备、存储介质,能够提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的。4.为实现上述目的,本技术实施例的第一方面提出了一种声控开关的声音识别方法,应用于声控开关,所述方法包括:5.接收待识别的目标声音信息;6.将所述目标声音信息发送到预设置的声音处理中心,所述声音处理中心与所述声控开关通信连接;7.接收所述声音处理中心根据所述目标声音信息发送的声音类别报文;8.对所述声音类别报文进行解析,确定所述目标声音信息的目标声音类别;9.根据所述目标声音类别确定所述声控开关的开关行为。10.在一些实施例中,所述根据所述目标声音类别确定所述声控开关的开关行为,包括:11.根据预设的噪声分类标准对所述目标声音类别进行归类处理,得到类别划分结果;12.根据所述类别划分结果确定所述声控开关的开关行为。13.在一些实施例中,所述类别划分结果包括正常声音信号和非正常声音信号,所述根据所述类别划分结果确定所述声控开关的开关行为,包括:14.当所述类别划分结果表示所述目标声音信息属于所述正常声音信号,控制所述声控开关进行开关行为;15.当所述类别划分结果表示所述目标声音信息属于所述非正常声音信号,控制所述声控开关保持当前开关状态。16.在一些实施例中,在所述根据所述目标声音类别确定所述声控开关的开关行为之后,所述方法还包括:17.当所述声控开关处于开启状态且开启时间满足预设的开启时间阈值,判断所述声控开关在开启过程中是否生成开启请求信号;18.当所述声控开关在开启过程中未生成所述开启请求信号,控制所述声控开关处于关闭状态,并实时监测所述声控开关是否生成所述开启请求信号;19.当所述声控开关在开启过程中生成所述开启请求信号,将生成所述开启请求信号的时间设置为开始时间以重新计算所述开启时间;20.根据所述开始时间和所述开启时间阈值控制所述声控开关的开关行为。21.本技术实施例的第二方面提出了一种声控开关的声音识别方法,应用于声音处理中心,所述声音处理中心与本技术实施例的第一方面所述的方法中的声控开关通信连接,所述方法包括:22.接收所述声控开关发送的目标声音信息;23.对所述目标声音信息进行声纹特征提取,得到目标声纹特征;24.根据预构建的声纹样本模型库对所述目标声纹特征进行噪声比对,得到相似度分数集合,其中,所述声纹样本模型库包括多个声纹样本模型,所述相似度分数集合用于表征每个所述声纹样本模型与所述目标声纹特征进行噪声比对后得到的相似度分数的集合;25.根据所述相似度分数集合和预设的类别选择阈值确定所述目标声音信息的目标声音类别;26.将所述目标声音类别进行报文封装,得到声音类别报文;27.将所述声音类别报文发送至所述声控开关。28.在一些实施例中,所述预构建的声纹样本模型库通过如下方法构建得到:29.构建声纹样本集,所述声纹样本集包括多个样本声音子集,每个所述样本声音子集包括多个样本声音数据,每个所述样本声音子集对应一个样本声音类别;30.对每个所述样本声音子集中的所述样本声音数据进行声纹特征提取,得到待处理声音子集,所述待处理声音子集包括多个待处理样本声纹特征;31.对每个所述待处理声音子集中的所述待处理样本声纹特征进行归一化处理,得到目标声音子集,所述目标声音子集包括多个目标样本声纹特征;32.根据每个所述样本声音子集的多个所述目标样本声纹特征进行模型训练,得到每个所述样本声音子集的声纹样本模型,所述声纹样本模型对应于所述样本声音子集的所述样本声音类别;33.根据多个所述声纹样本模型构建所述声纹样本模型库。34.本技术实施例的第三方面提出了一种声控开关的声音识别装置,应用于声控开关,所述装置包括:35.第一信息接收模块,用于接收待识别的目标声音信息;36.信息发送模块,用于将所述目标声音信息发送到预设置的声音处理中心,所述声音处理中心与所述声控开关通信连接;37.报文接收模块,用于接收所述声音处理中心根据所述目标声音信息发送的声音类别报文;38.报文解析模块,用于对所述声音类别报文进行解析,确定所述目标声音信息的目标声音类别;39.开关控制模块,用于根据所述目标声音类别确定所述声控开关的开关行为。40.本技术实施例的第四方面提出了一种声控开关的声音识别装置,应用于声音处理中心,所述声音处理中心与本技术实施例的第一方面所述的方法中的声控开关通信连接,所述装置包括:41.第二信息接收模块,用于接收所述声控开关发送的目标声音信息;42.特征提取模块,用于对所述目标声音信息进行声纹特征提取,得到目标声纹特征;43.噪声比对模块,用于根据预构建的声纹样本模型库对所述目标声纹特征进行噪声比对,得到相似度分数集合,其中,所述声纹样本模型库包括多个声纹样本模型,所述相似度分数集合用于表征每个所述声纹样本模型与所述目标声纹特征进行噪声比对后得到的相似度分数的集合;44.类别确定模块,用于根据所述相似度分数集合和预设的类别选择阈值确定所述目标声音信息的目标声音类别;45.报文封装模块,用于将所述目标声音类别进行报文封装,得到声音类别报文;46.报文发送模块,用于将所述声音类别报文发送至所述声控开关。47.本技术实施例的第五方面提出了一种计算机设备,所述计算机设备包括存储器和处理器,其中,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时所述处理器用于执行如本技术第一方面或第二方面实施例中任一项所述的声控开关的声音识别方法。48.本技术实施例的第六方面提出了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,在所述计算机程序被计算机执行时,所述计算机用于执行如本技术第一方面或第二方面实施例任一项所述的声控开关的声音识别方法。49.本技术实施例提出的声控开关的声音识别方法和装置、计算机设备、存储介质,由于声控开关的功能实现是根据是否生成声音信息来控制开关的开启,首先,接收待识别的目标声音信息,且通过对该目标声音信息进行识别判断,以确定是否需要屏蔽此声音信息。然后,将该目标声音信息发送到预设置的声音处理中心,该声音处理中心与声控开关通信连接,且该声音处理中心用于对目标声音信息进行识别判断,以确定是否需要屏蔽此声音信息。声控开关接收声音处理中心根据目标声音信息发送的声音类别报文,即通过声音处理中心对目标声音信息进行类别判断后,将识别出的声音类别报文发送至声控开关。之后,声控开关对该声音类别报文进行解析,确定目标声音信息的目标声音类别。最后,根据目标声音类别确定声控开关的开关行为。本技术实施例能够通过声音处理中心提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的。附图说明50.图1是本技术实施例提供的声控开关的声音识别方法的第一流程图;51.图2是图1中的步骤s150的流程图;52.图3是本技术实施例提供的声控开关的声音识别方法的第二流程图;53.图4是本技术实施例提供的声控开关的声音识别方法的第三流程图;54.图5是本技术实施例提供的声纹样本模型库的构建方法的流程图;55.图6是本技术实施例提供的声控开关的声音识别装置的第一模块结构框图;56.图7是本技术实施例提供的声控开关的声音识别装置的第二模块结构框图;57.图8是本技术实施例提供的计算机设备的硬件结构示意图。具体实施方式58.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。59.需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。60.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。61.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。62.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。63.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。64.首先,对本技术中涉及的若干名词进行解析:65.人工智能(artificial intelligence,ai):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。66.声控开关是目前常用的自动开启关闭的功能载体,声控开关的功能可以根据是否生成声音信号来控制开关的开启,只要声音消失并且持续保持开启状态的时间完成,声控开关就会自动关闭。这种开关非常方便实用,并且在一定程度上能够节省能源。但是,现有的声控开关的声音识别非常容易受到外界的干扰,只要外界噪音大于声控开关所设定的阈值,那么声控开关就会自动被激活,这样不仅浪费电源,还缩短功能载体的使用寿命。因此,如何提高声控开关对不同声音信号的识别能力,从而有效达到节省能源的目的,成为了亟待解决的技术问题。67.基于此,本技术实施例提出了一种声控开关的声音识别方法和装置、计算机设备、存储介质,能够提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的。68.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。69.本技术实施例提供的声控开关的声音识别方法,涉及人工智能领域。本技术实施例提供的声控开关的声音识别方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现声控开关的声音识别方法的应用等,但并不局限于以上形式。70.本技术实施例可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。71.请参照图1,图1是本技术实施例提供的声控开关的声音识别方法的一个可选的流程图,该方法应用于声控开关。本技术实施例的声控开关的声音识别方法可以具体包括但不限于包括步骤s110至步骤s150。72.步骤s110,接收待识别的目标声音信息;73.步骤s120,将目标声音信息发送到预设置的声音处理中心,声音处理中心与声控开关通信连接;74.步骤s130,接收声音处理中心根据目标声音信息发送的声音类别报文;75.步骤s140,对声音类别报文进行解析,确定目标声音信息的目标声音类别;76.步骤s150,根据目标声音类别确定所述声控开关的开关行为。77.在一些实施例的步骤s110中,为了避免声控开关被外界干扰或误触发的噪声信息对声控开关的频繁启动,首先,接收待识别的目标声音信息,则该目标声音信息可能为外界干扰产生的噪声信息,也可能为用于激活声控开关的有效声音信息。78.需要说明的是,声控开关上设置有至少一个声音接收器,通过声音接收器接收待识别的目标声音信息。79.在一些实施例的步骤s120中,为了准确地识别出有效的目标声音信息,将预设置的声音处理中心与声控开关通信连接,并将目标声音信息发送到预设置的声音处理中心,该声音处理中心用于对目标声音信息进行识别判断,以确定是否需要屏蔽此目标声音信息。本技术实施例能够通过声音处理中心提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的。80.需要说明的是,声音处理中心可以采用集中式处理语音信号的服务器,使得声音处理中心可以处理其可覆盖区域内的全部目标声音信息。81.需要说明的是,声控开关通过有线或者无线网络的方式发送目标声音信息到声音处理中心,则声音处理中心的安装只要满足可网络通信即可,在此不作具体限定。82.需要说明的是,声音处理中心可以连接多个声控开关,即可以同时接收多个声控开关发送的目标声音信息,从而将识别的目标声音类别发送到对应的声控开关。83.在一些实施例的步骤s130中,声控开关接收声音处理中心根据目标声音信息发送的声音类别报文。具体地,声音处理中心接收声控开关发送的目标声音信息后,对该目标声音信息进行声音识别,并将识别出的目标声音类别封装成声音类别报文发送给对应的声控开关。84.在一些实施例的步骤s140中,声控开关生成声音类别报文后,对该声音类别报文进行解析,以确定目标声音信息的目标声音类别。85.需要说明的是,声控开关中的报文解析模块根据声音类别报文的封装格式进行对应的解析操作,以得到声音处理中心识别的目标声音类别的信息。86.在一些实施例的步骤s150中,声控开关根据确定的目标声音类别判断该目标声音信息属于可屏蔽的声音信息还是有效的声音信息,从而确定声控开关当前的开关行为。87.需要说明的是,在一些应用场景中,由于高噪音环境下无法使用传统的声控开关,而本技术实施例通过声音处理中心对声控开关接收的目标声音信息进行筛选判断,提高了声控开关对声音信息的识别能力,能够避免误触发的噪声信号对声控开关的频繁启动,更好地适用于高噪音的工作环境。88.需要说明的是,具备本技术声音识别方法的声控开关可以应用到声控灯、声控报警器等具备声控开关的产品设备中。89.需要说明的是,在具体的实际应用中,声控报警器可以应用于以下场景,例如,对于天然气泄漏,当声控报警器接收到天然气泄漏的声音信息,则将接收到的声音信息发送至声音处理中心,在确定接收的声音属于天然气泄漏的声音类别后,声控报警器可以发出报警信号,以避免严重险情的发生。90.请参照图2,图2是本技术一些实施例的步骤s150的具体方法的流程图。在本技术的一些实施例中,步骤s150具体包括但不限于步骤s210和步骤s220,下面结合图2对这两个步骤进行详细介绍。91.步骤s210,根据预设的噪声分类标准对目标声音类别进行归类处理,得到类别划分结果;92.步骤s220,根据类别划分结果确定声控开关的开关行为。93.在一些实施例的步骤s210中,为了确定所接收的目标声音信息属于可屏蔽的声音信息还是有效的声音信息,根据预设的噪声分类标准对目标声音类别进行归类处理,得到类别划分结果。94.需要说明的是,本技术实施例预设的噪声分类标准将声音信息划分为两种噪音集合,包括第一噪音集合和第二噪音集合,其中,第一噪音集合包括打雷声音信息、下雨声音信息、动物鸣叫声音信息、机器引擎声音信息、汽车喇叭声音信息等非人类发出的声音信息,且第一噪音集合用于表示需要屏蔽的声音信息集合;第二噪音集合包括人的说话声音信息、拍掌声音信息、走路发出的声音信息等,该第二噪音集合用于表示不需要屏蔽的声音信息集合。95.在一些实施例的步骤s220中,在根据预设的噪声分类标准确定目标声音类别所属的噪音结合后,根据类别划分结果确定声控开关的开关行为。96.在本技术的一些实施例中,类别划分结果包括正常声音信号和非正常声音信号,步骤s220具体包括以下至少一种:97.当类别划分结果表示目标声音信息属于正常声音信号,控制声控开关进行开关行为;98.当类别划分结果表示目标声音信息属于非正常声音信号,控制声控开关保持当前状态。99.在一些具体地实施例中,类别划分结果包括正常声音信号和非正常声音信号,正常声音信号表示需要对声控开关产生作用的声音信息,该正常声音信号对应于第二噪音集合,即声控开关判断该目标声音信息不属于需要屏蔽的声音信息,则控制声控开关根据当前的状态进行开关行为操作;非正常声音信号表示不需要对声控开关产生作用的声音信息,该正常声音信号对应于第一噪音集合,即声控开关判断该目标声音信息属于需要屏蔽的声音信息,则控制声控开关保持当前开关状态。100.需要说明的是,当类别划分结果表示目标声音信息属于正常声音信号,控制声控开关进行开关行为,具体地,当声控开关判断所接收的目标声音信息不属于需要屏蔽的声音信息,则产生开启请求信息,声控开关根据生成的开启请求信息控制声控开关处于开启状态。101.需要说明的是,本技术实施例能够根据不同的噪音地区,设置不同的噪声分类标准,以对目标声音信息的识别可以得到不同的类别划分结果,能够更有效更直接更有针对性地降低噪音带来的电源浪费。102.请参照图3,图3是本技术实施例提供的声控开关的声音识别方法的另一个可选的流程图。在本技术的一些实施例中,在步骤s150之后,声控开关的声音识别方法具体还包括但不限于步骤s310至步骤s340。103.步骤s310,当声控开关处于开启状态且开启时间满足预设的开启时间阈值,判断声控开关在开启过程中是否生成开启请求信号;104.步骤s320,当声控开关在开启过程中未生成开启请求信号,控制声控开关处于关闭状态,并实时监测声控开关是否生成开启请求信号;105.步骤s330,当声控开关在开启过程中生成开启请求信号,将生成开启请求信号的时间设置为开始时间以重新计算开启时间;106.步骤s340,根据开始时间和开启时间阈值控制声控开关的开关行为。107.在一些实施例的步骤s310中,当声控开关当前处于开启状态且开启时间满足预设的开启时间阈值,即声控开关即将转变为关闭状态,判断声控开关在开启过程中是否生成开启请求信号,以确定声控开关是保持当前的开启状态或转变为关闭状态,从而有效达到节省能源的目的。108.需要说明的是,为了节省能源以避免不必要的浪费,本技术实施例设置了开启时间阈值,例如,可以设置为一分钟或两分钟,即具体的开启时间阈值可以根据实际需求进行设定,在此不再赘述。109.在一些实施例的步骤s320中,当声控开关在开启过程中未生成开启请求信号,即当声控开关处于开启状态且开启时间满足预设的开启时间阈值时,声控开关并未再生成新的开启请求信号,则控制声控开关转变为关闭状态,并实时监测声控开关是否生成开启请求信号,从而有效地实现声控开关自动开启关闭的功能。110.在一些实施例的步骤s330中,当声控开关在开启过程中生成开启请求信号,即当声控开关处于开启状态且开启时间满足预设的开启时间阈值时,声控开关再次生成新的开启请求信号,则将生成新的开启请求信号的时间设置为开始时间以重新计算开启时间,并进行新一轮对声控开关状态的判断。111.在一些实施例的步骤s340中,根据开始时间和开启时间阈值控制声控开关的开关行为,具体地,当声控开关处于开启状态且开启时间满足预设的开启时间阈值,再次判断声控开关在开启过程中是否生成开启请求信号。112.本技术实施例提供的声控开关的声音识别方法,首先,接收待识别的目标声音信息,且通过对该目标声音信息进行识别判断,以确定是否需要屏蔽此声音信息。然后,将该目标声音信息发送到预设置的声音处理中心,该声音处理中心与声控开关通信连接,且该声音处理中心用于对目标声音信息进行识别判断,以确定是否需要屏蔽此声音信息。声控开关接收声音处理中心根据目标声音信息发送的声音类别报文,即通过声音处理中心对目标声音信息进行类别判断后,将识别出的声音类别报文发送至声控开关。之后,声控开关对该声音类别报文进行解析,确定目标声音信息的目标声音类别。最后,根据预设的噪声分类标准对目标声音类别进行归类处理,得到类别划分结果。当类别划分结果表示目标声音信息属于正常声音信号,控制声控开关进行开关行为;当类别划分结果表示目标声音信息属于非正常声音信号,控制声控开关保持当前状态。声控开关处于开启状态且开启时间满足预设的开启时间阈值,判断声控开关在开启过程中是否生成开启请求信号。当声控开关在开启过程中未生成开启请求信号,控制声控开关处于关闭状态,并实时监测声控开关是否生成开启请求信号;当声控开关在开启过程中生成开启请求信号,将生成开启请求信号的时间设置为开始时间以重新计算开启时间,并根据开始时间和开启时间阈值控制声控开关的开关行为。本技术实施例能够通过声音处理中心提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的,同时,根据预设的声纹样本模型库对接收的声音信息进行筛选比对,能够提高声控开关在不同噪声环境的适用能力。113.请参照图4,图4是本技术实施例提供的声控开关的声音识别方法的另一个可选的流程图,该方法应用于声音处理中心,且声音处理中心与声控开关通信连接。在本技术的一些实施例中,声控开关的声音识别方法具体包括但不限于步骤s410至步骤s460。114.步骤s410,接收声控开关发送的目标声音信息;115.步骤s420,对目标声音信息进行声纹特征提取,得到目标声纹特征;116.步骤s430,根据预构建的声纹样本模型库对目标声纹特征进行噪声比对,得到相似度分数集合,其中,声纹样本模型库包括多个声纹样本模型,相似度分数集合用于表征每个声纹样本模型与目标声纹特征进行噪声比对后得到的相似度分数的集合;117.步骤s440,根据相似度分数集合和预设的类别选择阈值确定目标声音信息的目标声音类别;118.步骤s450,将目标声音类别进行报文封装,得到声音类别报文;119.步骤s460,将声音类别报文发送至声控开关。120.在一些实施例的步骤s410和步骤s420中,声音处理中心与声控开关通信连接,声控开关将接收到的目标声音信息通过网络传送到声音处理中心。声音处理中心接收到声控开关发送的目标声音信息后,对目标声音信息进行声纹特征提取,得到目标声纹特征。121.在一些实施例的步骤s430中,为了提高声音处理中心对目标声音信息的声音类别判断的准确性,声音处理中心预构建了声纹样本模型库,该声纹样本模型库中包括多个声纹样本模型,每个声纹样本模型对应一种样本声音类别。具体地,声音处理中心根据该预构建的声纹样本模型库对目标声纹特征进行噪声比对,即将每个声纹样本模型对应的样本声音类别下的样本声音数据与目标声音信息进行特征比对,得到每个声纹样本模型与目标声纹特征进行噪声比对后得到的相似度分数,则根据比对得到的多个相似度分数可以构成相似度分数集合。122.例如,当声纹样本模型库中包括n个声纹样本模型,每个声纹样本模型与目标声纹特征进行噪声比对后,得到相似度分数sn,n表示其中的一个声纹样本模型的编号,n为整数且对应的取值区间为[1,n],则构成相似度分数集合{s1,s2,s3,...,sn}。[0123]在一些实施例的步骤s440中,为了准确地判断出目标声音信息所属的声音类别,根据相似度分数集合和预设的类别选择阈值确定目标声音信息的目标声音类别,即根据预设的类别选择阈值在得到的相似度分数集合中进行数值筛选,当相似度分数大于该类别选择阈值,则可以判断样本声音数据与目标声音信息可能属于同一类别,即确定了目标声音信息对应的目标声音类别。[0124]需要说明的是,当根据类别选择阈值在相似度分数集合中筛选至少两个相似度分数,则将筛选出的相似度分数进行数值比较,将相似度分数最大的样本声音类别确定为目标声音类别。[0125]在一些实施例的步骤s450中,声音处理中心判断出目标声音信息对应的目标声音类别后,将目标声音类别进行报文封装,得到声音类别报文。具体地,声音处理中心可以基于json、xml等数据表示格式对目标声音类别进行报文封装,得到一个包括声音类别报文的网络包。[0126]在一些实施例的步骤s460中,声音处理中心将该网络包通过网络发送给声控开关,则声控开关对接收的包括声音类别报文的网络包进行解析,以确定目标声音信息的目标声音类别。[0127]请参照图5,图5是本技术实施例提供的声纹样本模型库的构建方法的流程图。在本技术的一些实施例中,声纹样本模型库的构建方法具体包括但不限于步骤s510至步骤s550。[0128]步骤s510,构建声纹样本集,声纹样本集包括多个样本声音子集,每个样本声音子集包括多个样本声音数据,每个样本声音子集对应一个样本声音类别;[0129]步骤s520,对每个样本声音子集中的样本声音数据进行声纹特征提取,得到待处理声音子集,待处理声音子集包括多个待处理样本声纹特征;[0130]步骤s530,对每个待处理声音子集中的待处理样本声纹特征进行归一化处理,得到目标声音子集,目标声音子集包括多个目标样本声纹特征;[0131]步骤s540,根据每个样本声音子集的多个目标样本声纹特征进行模型训练,得到每个样本声音子集的声纹样本模型,声纹样本模型对应于样本声音子集的样本声音类别;[0132]步骤s550,根据多个声纹样本模型构建声纹样本模型库。[0133]在一些实施例的步骤s510中,为了准确地判断出目标声音信息所属的声音类别,声音处理中心预构建的声纹样本模型库中包括多个声纹样本模型。具体地,构建声纹样本集,声纹样本集包括多个样本声音子集,每个样本声音子集包括多个样本声音数据,每个样本声音子集对应一个样本声音类别。[0134]需要说明的是,本技术实施例对不同的声音信息预先采集大量的样本声音数据,例如,对于打雷声音对应的样本声音子集,采集大量不同环境状态下的打雷声音信息;对于动物鸣叫声音对应的样本声音子集,采集大量不同动物在不同状态下的鸣叫声音信息。[0135]在一些实施例的步骤s520中,对每个样本声音子集中的样本声音数据进行声纹特征提取,得到待处理声音子集,且每个待处理声音子集包括多个待处理样本声纹特征。[0136]在一些实施例的步骤s530中,由于对声音数据采集时存在很多不同的因素,则生成的声纹特征之间也有差异,为了使不同的声音特征数据之间具有可比性,则对每个待处理声音子集中的待处理样本声纹特征进行归一化处理,以得到待处理声音子集,待处理声音子集包括多个待处理样本声纹特征。具体地,根据不同的声音信息的特征,对提取后的每个待处理声音子集中的待处理样本声纹特征进行归一化处理,得到目标声音子集,目标声音子集包括多个目标样本声纹特征。[0137]在一些实施例的步骤s540中,根据每个样本声音子集的多个目标样本声纹特征进行模型训练,以构建每个样本声音子集对应的声纹样本模型,即得到根据不同的样本声音类别生成的声纹样本模型。[0138]在一些实施例的步骤s550中,根据得到的多个声纹样本模型构建声纹样本模型库,本技术实施例通过构建由多个声纹样本模型组成的声纹样本模型库,且可以根据实际需求采集样本声音信息以更新声纹样本模型库,有效地提高了声控开关对声音信息的识别能力。[0139]本技术实施例提供的声控开关的声音识别方法,声音处理中心通过接收声控开关发送的目标声音信息,并对目标声音信息进行声纹特征提取,得到目标声纹特征。为了提高声音处理中心对目标声音信息的声音类别判断的准确性,声音处理中心根据预构建的声纹样本模型库对目标声纹特征进行噪声比对,得到相似度分数集合,其中,声纹样本模型库包括多个声纹样本模型,相似度分数集合用于表征每个声纹样本模型与目标声纹特征进行噪声比对后得到的相似度分数的集合。然后,根据预设的类别选择阈值在得到的相似度分数集合中进行筛选,当相似度分数大于该类别选择阈值,则可以判断样本声音数据与目标声音信息可能属于同一类别,即确定了目标声音信息对应的目标声音类别。之后,将目标声音类别进行报文封装,得到声音类别报文。最后,声音处理中心将封装声音类别报文的网络包通过网络发送给声控开关,则声控开关对接收的包括声音类别报文的网络包进行解析,以确定目标声音信息的目标声音类别。本技术实施例能够通过声音处理中心提高声控开关对不同声音信号的识别能力,避免误触发的噪声信号对声控开关的频繁启动,从而有效达到节省能源的目的,同时,根据预设的声纹样本模型库对接收的声音信息进行筛选比对,提高了声控开关在不同噪声环境的适用能力。[0140]请参照图6,图6是本技术实施例提供的声控开关的声音识别装置的一个模块结构示意图,该装置应用于声控开关,可以实现上述声控开关的声音识别方法。该装置包括:第一信息接收模块610、信息发送模块620、报文接收模块630、报文解析模块640和开关控制模块650。[0141]第一信息接收模块610,用于接收待识别的目标声音信息;[0142]信息发送模块620,用于将目标声音信息发送到预设置的声音处理中心,声音处理中心与声控开关通信连接;[0143]报文接收模块630,用于接收声音处理中心根据目标声音信息发送的声音类别报文;[0144]报文解析模块640,用于对声音类别报文进行解析,确定目标声音信息的目标声音类别;[0145]开关控制模块650,用于根据目标声音类别确定声控开关的开关行为。[0146]本技术实施例的声控开关的声音识别装置用于执行上述实施例中的声控开关的声音识别方法,其具体处理过程与上述实施例中的声控开关的声音识别方法相同,此处不再一一赘述。[0147]请参照图7,图7是本技术实施例提供的声控开关的声音识别装置的另一个模块结构示意图,该装置应用于声音处理中心,该声音处理中心与声控开关通信连接,可以实现上述声控开关的声音识别方法。该装置包括:第二信息接收模块710、特征提取模块720、噪声比对模块730、类别确定模块740、报文封装模块750和报文发送模块760。[0148]第二信息接收模块710,用于接收声控开关发送的目标声音信息;[0149]特征提取模块720,用于对目标声音信息进行声纹特征提取,得到目标声纹特征;[0150]噪声比对模块730,用于根据预构建的声纹样本模型库对目标声纹特征进行噪声比对,得到相似度分数集合,其中,声纹样本模型库包括多个声纹样本模型,相似度分数集合用于表征每个声纹样本模型与目标声纹特征进行噪声比对后得到的相似度分数的集合;[0151]类别确定模块740,用于根据相似度分数集合和预设的类别选择阈值确定目标声音信息的目标声音类别;[0152]报文封装模块750,用于将目标声音类别进行报文封装,得到声音类别报文;[0153]报文发送模块760,用于将声音类别报文发送至声控开关。[0154]本技术实施例的声控开关的声音识别装置用于执行上述实施例中的声控开关的声音识别方法,其具体处理过程与上述实施例中的声控开关的声音识别方法相同,此处不再一一赘述。[0155]本技术实施例还提供了一种计算机设备,该计算机设备包括存储器和处理器,其中,存储器中存储有计算机程序,计算机程序被处理器执行时处理器用于执行上述实施例中的声控开关的声音识别方法。[0156]下面结合图8对计算机设备的硬件结构进行详细说明。该计算机设备包括:处理器810、存储器820、输入/输出接口830、通信接口840和总线850。[0157]处理器810,可以采用通用的中央处理器(central processin unit,cpu)、微处理器、应用专用集成电路(application specific integrated circuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本技术实施例所提供的技术方案;[0158]存储器820,可以采用只读存储器(read only memory,rom)、静态存储设备、动态存储设备或者随机存取存储器(random access memory,ram)等形式实现。存储器820可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器820中,并由处理器810来调用执行本技术实施例的声控开关的声音识别方法;[0159]输入/输出接口830,用于实现信息输入及输出;[0160]通信接口840,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信;[0161]总线850,在设备的各个组件(例如处理器810、存储器820、输入/输出接口830和通信接口840)之间传输信息;[0162]其中处理器810、存储器820、输入/输出接口830和通信接口840通过总线850实现彼此之间在设备内部的通信连接。[0163]本技术实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机程序,在计算机程序被计算机执行时,计算机用于执行本技术实施例的声控开关的声音识别方法。[0164]存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。[0165]本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。[0166]本领域技术人员可以理解的是,图1至图5中示出的技术方案并不构成对本技术实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。[0167]以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。[0168]本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。[0169]本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。[0170]应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。[0171]在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。[0172]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0173]另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。[0174]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序的介质。[0175]以上参照附图说明了本技术实施例的优选实施例,并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本技术实施例的权利范围之内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
声控开关的声音识别方法和装置、计算机设备、存储介质与流程
作者:admin
2022-10-12 09:16:55
691
- 下一篇: 一种通过级联三组分反应有效制备乙烯基硅烷衍生物的方法
- 上一篇: 一种计算机硬件收纳装置的制作方法