计算;推算;计数设备的制造及其应用技术1.本技术涉及自然语言处理技术领域,尤其涉及一种多标签定性词识别方法、装置、电子设备及存储介质。背景技术:2.在语音质检系统中,通常需要对语句中的多标签定性词进行识别,以此来对通话质量进行评估。多标签定性词是指在不同语境下语义不同但类别属性相同的词语。例如,文本“先生,您自己的问题,您还去投诉?这没道理呀。”、“先生,您可以去投诉,但是您给我方造成的问题,还是得解决。”、“先生,有错的是您,您还去投诉我,投诉我这事就能算了吗?”、“您去投诉吧,这是您的事。”这四句文本均含有多标签定性词“去投诉”,该词的类别属性为不专业用语,但该词在第一个文本和第三个文本中并未隐含有责的意思,但在第二个文本和第四个文本中隐含了有责的意思。所谓有责是指讲话人带有不好情绪,对因此产生的后续问题负有责任,有责或者无责这种表述通常在客服和用户通话过程中使用。3.相关技术中,对于多标签定性词的识别通常采用命名实体识别(named entity recognition,ner)方法,预先在样本文本中标注出多标签定性词及其在样本文本中的语义等,然后利用样本文本及其携带的标注信息训练命名实体识别模型,进而将待识别文本输入训练后的命名实体识别模型,即可输出待识别文本中的多标签定性词及其在待识别文本中的语义。4.但是,这种方式存在识别边界问题,比如误将“电视台”识别成了“电视”,且由于命名实体识别模型具备一定的泛化能力,因而会识别出没有被标注的词,影响识别准确率。技术实现要素:5.本技术实施例的目的提供一种多标签定性词识别方法、装置及电子设备,用于解决相关技术中的多标签定性词识别方法存在的识别准确率低的问题。6.为了实现上述目的,本技术实施例采用下述技术方案:第一方面,本技术实施例提供一种多标签定性词识别方法,包括:获取待识别文本;通过文本分类模型对所述待识别文本进行分类,以得到所述待识别文本对应的文本标签属性,所述文本标签属性用于表示所述待识别文本在目标应用场景中所反映的情感倾向;所述文本分类模型是基于样本文本以及所述样本文本对应的样本文本属性标签训练得到的,且所述样本文本属性标签是基于所述样本文本中多标签定性词的词标签属性确定的,所述多标签定性词是指在不同语境下语义不同但类别属性相同的词语,所述词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;将预设的多个多标签定性词与所述待识别文本中的词语进行匹配;若匹配确定所述待识别文本中包括目标多标签定性词,基于所述待识别文本对应的文本标签属性,确定所述待识别文本中的多标签定性词对应的词标签属性。7.第二方面,本技术实施例提供一种多标签定性词识别装置,包括:获取单元,用于获取待识别文本;分类单元,用于通过文本分类模型对所述待识别文本进行分类,以得到所述待识别文本对应的文本标签属性,所述文本标签属性用于表示所述待识别文本在目标应用场景中所反映的情感倾向;所述文本分类模型是基于样本文本以及所述样本文本对应的样本文本属性标签训练得到的,且所述样本文本属性标签是基于所述样本文本中多标签定性词的词标签属性确定的,所述多标签定性词是指在不同语境下语义不同但类别属性相同的词语,所述词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;识别单元,用于将预设的多个多标签定性词与所述待识别文本中的词语进行匹配;所述识别单元,还用于若匹配确定所述待识别文本中包括目标多标签定性词,基于所述待识别文本对应的文本标签属性,确定所述待识别文本中的多标签定性词对应的词标签属性。8.第三方面,本技术实施例提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的方法。9.第四方面,本技术实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的方法。10.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:采用文本分类任务加后处理任务的技术思路,先利用文本分类技术从整体上对待识别文本进行文本分类识别,得到用于表示待识别文本在目标应用场景中所反映的情感倾向的文本标签属性;在此基础上,利用预设的多个多标签定性词与待识别文本中的词语进行匹配,即可识别出待识别文本中的目标多标签定性词,由于预设的多个多标签定性词明确了词语边界,基于词语匹配的方式进行多标签定性词识别,可以避免识别边界问题导致的误识别和模型泛化能力导致的未标注词被识别等问题,有利于提高识别准确率;进一步,由于多标签定性词的词标签属性能够表示多标签定性词在所属的样本文本中的语义,在预先进行文本分类模型的训练时,用于为模型训练过程提供监督信号的样本文本属性标签是参考样本文本中多标签定性词的词标签属性确定的,进而基于样本文本及其对应的样本文本属性标签训练得到的文本识别模型,在对待识别文本进行文本分类时,也会考虑待识别文本中各词语在该文本中的语义而准确识别该文本所反映的情感倾向,得到待识别文本对应的文本标签属性,由此基于待识别文本对应的文本标签属性即可准确确定出目标多标签定性词的语义,得到目标多标签定性词对应的词标签属性。附图说明11.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1为本技术的一个实施例提供的一种多标签定性词识别方法的流程示意图;图2为本技术的另一个实施例提供的一种多标签定性词识别方法的流程示意图;图3为本技术的又一个实施例提供的一种多标签定性词识别方法的流程示意图;图4为本技术的一个实施例提供的一种多标签定性词识别装置的结构示意图;图5为本技术的一个实施例提供的一种电子设备的结构示意图。具体实施方式12.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。13.本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解,这样使用的数据在适当情况下可以互换,以便本技术实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本说明书和权利要求书中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。14.部分概念说明:ner(named entity recognition):命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。15.lstm(long short-term memory):长短期记忆网络,是一种时间循环神经网络,是为了解决一般循环神经网络存在的长期依赖问题而设计的,能够在更长的序列中有更好的表现。16.bilstm(bi-directional long short-term memory):双向lstm,是由前向lstm与后向lstm组合而成。17.bert:一种预训练语言模型,它使用transformer的双向编码器表示。预训练的bert表示可以通过一个额外的输出层进行微调,适用于广泛任务的最先进模型的构建。18.如背景技术中所述,相关技术中,对于多标签定性词的识别通常采用命名实体识别ner方法,预先在样本文本中标注出多标签定性词及其在样本文本中的语义等,然后利用样本文本及其携带的标注信息训练命名实体识别模型,进而将待识别文本输入训练后的命名实体识别模型,即可输出待识别文本中的多标签定性词及其在待识别文本中的语义。但是,这种方式存在识别边界问题,比如误将“电视台”识别成了“电视”,且由于命名实体识别模型具备一定的泛化能力,因而会识别出没有被标注的词,影响识别准确率。19.有鉴于此,本技术实施例旨在提出一种多标签定性词识别方法,采用文本分类任务加后处理任务的技术思路,先利用文本分类技术从整体上对待识别文本进行文本分类识别,得到用于表示待识别文本在目标应用场景中所反映的情感倾向的文本标签属性;在此基础上,利用预设的多个多标签定性词与待识别文本中的词语进行匹配,即可识别出待识别文本中的目标多标签定性词,由于预设的多个多标签定性词明确了词语边界,基于词语匹配的方式进行多标签定性词识别,可以避免识别边界问题导致的误识别和模型泛化能力导致的未标注词被识别等问题,有利于提高识别准确率;进一步,由于多标签定性词的词标签属性能够表示多标签定性词在所属的样本文本中的语义,在预先进行文本分类模型的训练时,用于为模型训练过程提供监督信号的样本文本属性标签是参考样本文本中多标签定性词的词标签属性确定的,进而基于样本文本及其对应的样本文本属性标签训练得到的文本识别模型,在对待识别文本进行文本分类时,也会考虑待识别文本中各词语在该文本中的语义而准确识别该文本所反映的情感倾向,得到待识别文本对应的文本标签属性,由此基于待识别文本对应的文本标签属性即可准确确定出目标多标签定性词的语义,得到目标多标签定性词对应的词标签属性。20.应理解,本技术实施例提出的多标签定性词识别方法可以由电子设备或安装在电子设备中的软件执行。此处所谓的电子设备可以包括终端设备,比如智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等;或者,电子设备还可以包括服务器,比如独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。21.以下结合附图,详细说明本技术各实施例提供的技术方案。22.请参见图1,为本技术的一个实施例提供的一种多标签定性词识别方法的流程示意图,该方法可以包括如下步骤:s102,获取待识别文本。23.其中,待识别文本是指需要进行多标签定性词识别的文本。待识别文本可以是任何场景中产生的文本或者由语音转换得来的文本,比如,待识别文本可以是坐席客服与用户通话过程中产生的语音转换而来的,或者待识别文本还可以是一份合同中任意一段文本。24.s104,通过文本分类模型对待识别文本进行分类,以得到待识别文本对应的文本标签属性。25.其中,文本标签属性用于表示待识别文本在目标应用场景中所反映的情感倾向。也就是说,文本标签属性根据目标应用场景的不同而不同。示例地,若目标应用场景为语音质检场景,文本标签属性可以分为有责和无责两类;有责所反映的情感倾向是负面情感,无责所反映的情感倾向是正面或者是中立的;又如,若目标应用场景为情感分类场景为例,文本标签属性可以分为正向和负向两类,等等。26.其中,文本分类模型是指具有文本分类能力的模型,该模型能够用于对任一文本进行分类,以得到该文本对应的文本标签属性。也就是说,上述s104中,将待识别文本输入文本分类模型,即可得到待识别文本对应的文本标签属性。本技术实施例中,文本分类模型为基于样本文本以及样本文本对应的文本标签属性进行训练得到。值得说明的是,对文本分类模型的训练是基于样本文本及其对应的文本标签属性预先进行的,后续在多标签定性词的识别过程中,无需每次对文本分类模型进行训练,或者可以周期性地基于新的样本文本及其对应的文本标签属性对该文本分类模型进行更新。27.具体地,对文本分类模型的训练方法包括:获取样本文本以及样本文本对应的样本文本标签属性,样本文本标签属性用于表示对应的样本文本的语义;基于样本文本以及样本文本对应的样本文本标签属性,对文本分类模型进行训练。其中,样本文本对应的样本文本标签属性用于表示样本文本的语义。示例地,仍以目标应用场景为语音质检场景为例,样本文本标签属性可以分为有责和无责两类,下述表1示出了部分样本文本及其对应的样本文本标签属性。28.表1本技术实施例中,样本文本及其对应的样本文本标签属性可以通过各种适当的方式获取,具体可根据实际需要您进行选择,本技术实施例对此不作限定。29.在一种可选的实现方式中,样本文本对应的样本文本标签属性是基于样本文本中多标签定性词的词标签属性确定的。具体地,获取样本文本以及样本文本对应的样本文本标签属性,包括:获取包含预设的多标签定性词的样本文本以及预设的多标签定性词对应的样本词标签属性,其中,样本词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;进一步,将样本文本中的多标签定性词对应的样本词标签属性作为样本文本对应的样本文本标签属性。其中,多标签定性词是指在不同语境下语义不同但类别属性相同的词语。词语的类别属性用于表示词语在目标应用场景下所属的类别。示例地,以语音质检场景为例,类别属性可以例如包括但不限于:高危、风险、不专业用语、严重态度等。30.示例地,以表2示出了部分样本文本以及样本文本中的多标签词信息。针对每个样本文本,将其包含的多标签定性词对应的样本词标签属性作为该样本文本对应的样本文本标签属性,即可得到上述表1所示的样本文本及其对应的样本文本标签属性。31.表2可以理解的是,通过将样本文本中的多标签定性词对应的样本词标签属性作为样本文本对应的样本文本标签属性,不仅使得样本文本对应的样本文本标签属性能够准确反映出样本文本中的多标签定性词的语义,进而便于后续基于文本分类任务和后处理任务能够准确识别出文本中的多标签定性词及其对应的词标签属性,而且相较于相关技术中利用bio在样本文本中标注多标签定性词及其在样本文本中的语义等的方式,简单快捷,标注准确率高。32.在其他一些可选的实现方式中,还可通过人工对样本文本标注相应的样本文本标签属性。在该实现方式下,同样只需考虑样本文本的语义,而不需要考虑样本文本中的多标签定性词,因而标注简单快捷、标注准确率高。33.本技术实施例中,在得到样本文本及其对应的样本文本标签属性之后,可进行格式转换,得到预设格式的训练数据;进一步,使用机器学习算法对预设格式的训练数据进行训练,得到文本分类模型。34.示例地,以上述表1中的第一条样本文本和第二条样本文本为例,经过格式转换后可得到如下训练数据:训练数据1:你在售后部门上班是不是?t 无责训练数据2:我要找你们售后。t 有责其中,上述训练数据中的t表示空格。35.另外,上述机器学习算法可以例如包括但不限于如下算法中的至少一种:bert、robert、lstm、bilstm等。36.s106,将预设的多个多标签定性词与待识别文本中的词语进行匹配。37.可选地,为了提高对待识别文本的识别效率和准确性,上述s106可以包括如下步骤:s161,对待识别文本进行分词处理,得到待识别文本中的词语。38.示例地,可采用本领域常用的各种分词工具,比如jieba分词工具等,对待识别文本进行分词处理,得到待识别文本中的词语。39.s162,将预设词表中的多个多标签定性词与待识别文本中的词语进行匹配。40.其中,预设词表中记录有预设的多个多标签定性词,目标多标签定性词为预设的多个多标签定性词中的任一个。41.s163,将预设词表中与待识别文本中的词语相匹配的多标签定性词,确定为待识别文本中包含的目标多标签定性词。42.具体地,可循环遍历预设词表直至预设词表中的所有多标签定性词匹配完毕。在遍历过程中,将当前遍历到的多标签定性词与待识别文本中的词语进行匹配,若待识别文本中的词语与当前遍历到的多标签定性词相匹配,则确定待识别文本中包含当前匹配到的多标签定性词。43.示例地,假设预设词表keyword= [‘售后’,ꢀ‘合适’,ꢀ‘不讲道理’,ꢀ‘你都对’,ꢀ…],该预设词表中包括“售后”、“合适”、“不讲道理”、你都对”等预设的多个多标签定性词,假设待识别文本为“我找你们售后解决。”,该待识别文本对应的样本文本标签属性为“有责”,通过将该预设词表中的多标签词定性词与待识别文本中的词语进行匹配,可以确定出该待识别文本中包括的目标多标签定性词为“售后”。[0044]可以理解的是,在上述实施方式中,由于预设的多个多标签定性词明确了词语边界,基于词语匹配的方式进行多标签定性词识别,可以避免识别边界问题导致的误识别和模型泛化能力导致的未标注词被识别等问题,有利于提高识别准确率。另外,通过词语匹配进行多标签定性词识别的方式,无需经过复杂的多标签定性词标注、实体识别模型训练等处理,便捷高效,有利于提高多标签定性词的识别效率。[0045]本技术实施例在此示出了上述s106的一种具体实现方式。当然,应理解,上述s106也可以通过其他方式实现,本技术实施例对此不作限定。[0046]s108,若匹配确定待识别文本中包括目标多标签定性词,则基于待识别文本对应的文本标签属性,确定待识别文本中的目标多标签定性词对应的词标签属性。[0047]由于多标签定性词的词标签属性能够表示多标签定性词在所属的样本文本中的语义,在预先进行文本分类模型的训练时,用于为模型训练过程提供监督信号的样本文本属性标签是参考样本文本中多标签定性词的词标签属性确定的,进而基于样本文本及其对应的样本文本属性标签训练得到的文本识别模型,在对待识别文本进行文本分类时,也会考虑待识别文本中各词语在该文本中的语义而准确识别该文本所反映的情感倾向,得到待识别文本对应的文本标签属性,由此基于待识别文本对应的文本标签属性,即可准确确定出待识别文本中的目标多标签定性词的语义,得到目标多标签定性词对应的词标签属性。具体地,可将待识别文本对应的文本标签属性确定为待识别文本中的目标多标签定性词对应的词标签属性。[0048]示例地,仍以上述待识别文本“我找你们售后解决。”为例,该待识别文本对应的样本文本标签属性为“有责”,在识别出该待识别文本包含多标签定性词ꢀ“售后”之后,可确定多标签定性词ꢀ“售后”对应的词标签属性为“有责”。[0049]可选地,待识别文本对应的多标签定性词识别结果还可以包括待识别文本中的目标多标签定性词对应的属性类别。在此情况下,在上述s106之后,本技术实施例提供的多标签定性词识别方法还可以包括:s110,若匹配确定待识别文本包含目标多标签定性词,则从预设词典中查询目标多标签定性词对应的类别属性。[0050]其中,预设词典中记录有上述多个多标签定性词各自对应的类别属性。实际应用中,预设词典可以根据预设词表中的多个多标签定性词及每个多标签定性词对应的类别属性预先构建。示例地,表3示出了预设词表中的部分多标签定性词及每个多标签定性词对应的类别属性。[0051]表3基于上述表3,可构建出预设词典keyword_dict ={‘售后’: 高危,ꢀ‘合适’: 风险,ꢀ‘不讲道理’: 不专业用语,ꢀ‘你都对’: 严重态度,ꢀ…}。示例地,仍以上述待识别文本为“我找你们售后解决。”为例,在确定出该待识别文本包括多标签定性词“售后”之后,可通过查询预设词典,确定出该多标签词“售后”对应的属性类别为“高危”。[0052]可选地,待识别文本对应的多标签定性词识别结果还可以包括待识别文本中的目标多标签定性词的位置。在上述s106之后,本技术实施例提供的多标签定性词识别方法还可以包括:若匹配确定待识别文本中包括目标多标签定性词,则基于目标多标签定性词中各字符在待识别文本中的排列顺序,确定目标多标签定性词在待识别文本中的位置。[0053]其中,多标签定性词的位置可以包括多标签定性词的首字符在待识别文本中的排列顺序以及尾字符在待识别文本中的排列顺序。示例地,仍以上述待识别文本为“我找你们售后解决。”为例,通过上述多标签定性词识别方法,可以得到如下多标签定性词识别结果:[[‘售后’,ꢀ‘高危’,5,6]],其中,‘电视台’表示待识别文本中的多标签定性词,‘高危’表示该多标签定性词对应的类别属性,5表示该多标签定性词的首字符为待识别文本中的第5个字符,6表示该多标签定性词的尾字符为待识别文本中的第6个字符。[0054]本技术的上述实施例提供的多标签定性词识别方法,采用文本分类任务加后处理任务的技术思路,先利用文本分类技术从整体上对待识别文本进行文本分类识别,得到用于表示待识别文本在目标应用场景中所反映的情感倾向的文本标签属性;在此基础上,利用预设的多个多标签定性词与待识别文本中的词语进行匹配,即可识别出待识别文本中的目标多标签定性词,由于预设的多个多标签定性词明确了词语边界,基于词语匹配的方式进行多标签定性词识别,可以避免识别边界问题导致的误识别和模型泛化能力导致的未标注词被识别等问题,有利于提高识别准确率;进一步,由于多标签定性词的词标签属性能够表示多标签定性词在所属的样本文本中的语义,在预先进行文本分类模型的训练时,用于为模型训练过程提供监督信号的样本文本属性标签是参考样本文本中多标签定性词的词标签属性确定的,进而基于样本文本及其对应的样本文本属性标签训练得到的文本识别模型,在对待识别文本进行文本分类时,也会考虑待识别文本中各词语在该文本中的语义而准确识别该文本所反映的情感倾向,得到待识别文本对应的文本标签属性,由此基于待识别文本对应的文本标签属性即可准确确定出目标多标签定性词的语义,得到目标多标签定性词对应的词标签属性。[0055]进一步,针对本技术实施例提供的多标签定性词识别方法进行了相关对比实验,对比参数及实验结果如下:相关技术方案:ner,模型bert;本技术方案:文本分类+后处理,模型bert;实验数据:训练集1539条;验证集170条;测试集170条;实验参数:训练轮数、学习率、最大文本长度等参数全部保持一致;实验结果:实验结论:相比相关技术方案,本技术技术方案,精准率提升了6个点,f1值提升了3个点。[0056]本技术实施例提供的多标签定性词识别方法可应用于各种需要进行多标签定性词识别的场景,比如语音质检、情感分类等,本技术实施例对此不作限定。下面以语音质检场景为例,对本技术实施例提供的多标签定性词识别方法进行说明。[0057]在目标应用场景为语音质检场景的情况下下,文本对应的文本标签属性可以分为有责和无责两类,多标签定性词对应的词标签属性可以分为有责和无责两类,多标签定性词对应的类别属性可以分为高危、风险、不专业用语以及严重态度等多个类别。待识别文本为待质检服务对话中的任一个用户对话文本,待质检服务对话为客服与用户之间的任一通历史对话。[0058]请参见图2,为本技术的又一个实施例提供的一种多标签定性词识别方法的流程示意图,该方法可以包括如下步骤:s202,获取待识别文本。[0059]示例地,可以遍历待质检服务对话,将当前遍历到的用户对话文本作为待识别文本。[0060]s204,通过文本分类模型对待识别文本进行分类,以得到待识别文本对应的文本标签属性。[0061]若待识别文本对应的文本标签属性表示待识别文本在语音质检场景下未反映预设情感倾向,则输出空值[],并继续获取下一个待识别文本;若待识别文本对应的文本标签属性表示待识别文本在语音质检场景下反映了预设情感倾向,则执行下述步骤s206。[0062]示例地,预设情感倾向可以包括有责。也就是说,若待识别文本对应的文本标签属性为“无责”,则输出空值[],并继续获取下一个待识别文本;若待识别文本对应的文本标签属性为“有责”,则执行下述步骤s206。上述s204的具体实现过程与前文s104的具体实现方式类似,可参见前文对s104的详细说明,不再赘述。[0063]s206,将预设的多个多标签定性词与待识别文本中的词语进行匹配。[0064]若待识别文本不包含多标签定性词,则输出空值[],并继续获取下一个待识别文本;若待识别文本包含多标签定性词,则执行下述步骤s208~s210。上述s206的具体实现过程与前文s106的具体实现方式类似,可参见前文对s106的详细说明,不再赘述。[0065]s208,基于待识别文本对应的文本标签属性,确定待识别文本中的目标多标签定性词对应的词标签属性。[0066]上述s208的具体实现过程与前文s108的具体实现方式类似,可参见前文对s108的详细说明,不再赘述。[0067]s210,从预设词典中查询待识别文本中的多标签定性词对应的类别属性。[0068]上述s210的具体实现过程与前文s110的具体实现方式类似,可参见前文对s110的详细说明,不再赘述。[0069]可以理解的是,在语音质检场景下,在语音质检场景下反映了预设情感倾向的用户对话文本能够在一定程度上反映出客服的服务质量,因而在此应用场景下通常只关注反映了预设情感倾向的用户对话文本,比如语义为“有责”的用户对话文本,基于此,在用户对话文本反映了预设情感倾向的情况下进行后处理,有利于减少对处理资源的消耗,进一步提高对待识别文本的多标签定性词识别效率。[0070]请参见图3,为本技术的又一个实施例提供的一种多标签定性词识别方法的流程图,该方法可以包括如下步骤:s302,获取待识别文本。[0071]示例地,可以遍历待质检服务对话,将当前遍历到的用户对话文本作为待识别文本。[0072]s304,通过文本分类模型对待识别文本进行分类,以得到待识别文本对应的文本标签属性。[0073]若待识别文本对应的文本标签属性在语音质检场景下未反映预设情感倾向,则输出空值[],并继续获取下一个待识别文本;若待识别文本对应的文本标签属性表示待识别文本在语音质检场景下反映了预设情感倾向,则执行下述步骤s306。[0074]示例地,预设情感倾向可以包括有责。也就是说,若待识别文本对应的文本标签属性为“无责”,则输出空值[],并继续获取下一个待识别文本;若待识别文本对应的文本标签属性为“有责”,则执行下述步骤s306。[0075]s306,将预设的多个多标签定性词与待识别文本中的词语进行匹配。[0076]若待识别文本不包含多标签定性词,则输出空值[],并继续获取下一个待识别文本;若待识别文本包含多标签定性词,则执行下述步骤s308~s314。s308,基于待识别文本对应的文本标签属性,确定待识别文本中的目标多标签定性词对应的词标签属性。[0077]上述s308的具体实现过程与前文s108的具体实现方式类似,可参见前文对s108的详细说明,不再赘述。[0078]s310,从预设词典中查询待识别文本中的多标签定性词对应的类别属性。[0079]上述s310的具体实现过程与前文s110的具体实现方式类似,可参见前文对s110的详细说明,不再赘述。[0080]s312,如果待识别文本在语音质检场景下反映了预设情感倾向,则将待识别文本添加至异常文本集。[0081]其中,异常文本集中用于存储多个在语音质检场景下具有预设情感倾向的用户对话文本。[0082]示例地,仍以上述待识别文本ꢀ“我找你们售后解决。”为例,通过上述s304~s310识别出该待识别文本反映了预设情感倾向“有责”,则将该待识别文本添加至异常文本集中。由此,异常文本集中的用户对话文本均具有预设语义(比如“有责”)。[0083]可选地,在上述s312之后,本技术实施例提供的多标签定性词识别方法还可以包括:s314,响应于质检评估事件,基于异常文本集对待质检服务对话进行质检处理。[0084]其中,质检评估事件指示用于触发质检处理的事件。实际应用中,质检评估事件可以根据实际需要进行设置,比如接收到来自用户的质检评估请求等,本技术实施例对此不作限定。[0085]具体地,若异常文本集中用户对话文本的数量小于预设数量阈值,则表明用户对客服的服务质量较为满意,进而可确定待质检服务对话通过质检。[0086]若异常文本集中用户对话文本的数量大于或等于预设数量阈值,则基于异常文本集中的各用户对话文本以及待质检服务对话中与各用户对话文本关联的客服对话文本,评估待质检服务对话的服务质量。[0087]其中,对于每个用户对话文本而言,待质检服务对话中与该用户对话文本关联的客服对话文本,可以包括与该用户对话文本相邻的前后客户对话文本。由于异常文本集中的用户对话文本能够在一定程度上反映出用户对客服服务质量不满意,而与这些用户对话文本关联的客服对话文本能够反映出客服在服务过程中的态度,进而结合异常文本集中的各用户对话文本以及待质检服务对话中与各用户对话文本关联的客服对话文本,即可准确评估出待质检服务对话的服务质量。[0088]更具体地,待质检服务对话的服务质量可通过如下方式评估:基于目标用户对话文本中的多标签定性词对应的类别属性,确定目标用户对话文本对应的异常等级,其中,目标用户对话文本为异常文本集中的任一个用户对话文本;接着,基于预设质检策略对目标客服对话文本进行评分,得到目标客服对话文本的质量分值,目标客服对话文本为待质检服务对话中与目标用户对话文本关联的客服对话文本;基于异常文本集中各用户对话文本对应的异常等级,对异常文本集中各用户对话文本关联的客服对话文本的质量分值进行加权求和,以确定待质检服务对话的服务质量。其中,预设质检策略可以根据实际需要进行设置,比如预设质检策略可以包括多个评估指标的指标值与质量分值之间的预设映射关系等,本技术实施例对此不作限定。[0089]示例地,以上述表3所示的多标签定性词及其对应的类别属性为例,假设各类别属性对应的异常等级为:高危》风险》严重态度》不专业用语,进而可按照各类别属性对应的异常等级,为各类别属性设置相应的权重,其中,异常等级高的类别属性对应的权重较高。在此基础上,在确定出目标用户对话文本中的多标签定性词对应的类别属性之后,可将该类别属性对应的权重确定为目标客服对话文本的权重;进一步,基于异常文本集中各用户对话文本关联的客服对话文本对应的权重,对异常文本集中各用户对话文本关联的客服对话文本的质量分值进行加权求和,即可得到待质检服务对话的质量分值,若该质量分值超过预设分值,则确定待质检服务通过质检;若该质量分值未超过预设分值,则确定待质检服务未通过质检。[0090]本技术的上述实施例提供的多标签定性词识别方法,采用文本分类任务加后处理任务的技术思路,先利用文本分类技术从整体上对待识别文本进行文本分类识别,得到用于表示待识别文本在目标应用场景中所反映的情感倾向的文本标签属性;在此基础上,利用预设的多个多标签定性词与待识别文本中的词语进行匹配,即可识别出待识别文本中的目标多标签定性词,由于预设的多个多标签定性词明确了词语边界,基于词语匹配的方式进行多标签定性词识别,可以避免识别边界问题导致的误识别和模型泛化能力导致的未标注词被识别等问题,有利于提高识别准确率;进一步,由于多标签定性词的词标签属性能够表示多标签定性词在所属的样本文本中的语义,在预先进行文本分类模型的训练时,用于为模型训练过程提供监督信号的样本文本属性标签是参考样本文本中多标签定性词的词标签属性确定的,进而基于样本文本及其对应的样本文本属性标签训练得到的文本识别模型,在对待识别文本进行文本分类时,也会考虑待识别文本中各词语在该文本中的语义而准确识别该文本所反映的情感倾向,得到待识别文本对应的文本标签属性,由此基于待识别文本对应的文本标签属性即可准确确定出目标多标签定性词的语义,得到目标多标签定性词对应的词标签属性;在此基础上,从待质检服务对话中选取的具有预设语义且具有多标签定性词的用户对话文本,即可准确评估待质检服务对话是否通过质检。[0091]上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。[0092]与上述图1所示的多标签定性词识别方法相对应地,本技术实施例还提出一种多标签定性词识别装置。请参见图4,为本技术的一个实施例提供的一种多标签定性词识别装置400的结构示意图,该装置400包括:获取单元410,用于获取待识别文本;分类单元420,用于通过文本分类模型对所述待识别文本进行分类,以得到所述待识别文本对应的文本标签属性,所述文本标签属性用于表示所述待识别文本在目标应用场景中所反映的情感倾向;所述文本分类模型是基于样本文本以及所述样本文本对应的样本文本属性标签训练得到的,且所述样本文本属性标签是基于所述样本文本中多标签定性词的词标签属性确定的,所述多标签定性词是指在不同语境下语义不同但类别属性相同的词语,所述词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;识别单元430,用于将预设的多个多标签定性词与所述待识别文本中的词语进行匹配;所述识别单元430,还用于若匹配确定所述待识别文本中包括目标多标签定性词,基于所述待识别文本对应的文本标签属性,确定所述待识别文本中的多标签定性词对应的词标签属性。[0093]可选地,所述识别单元430还用于在将预设的多个多标签定性词与所述待识别文本中的词语进行匹配之后,若匹配确定所述待识别文本中包括目标多标签定性词,则基于所述目标多标签定性词中各字符在所述待识别文本中的排列顺序,确定所述目标多标签定性词在所述待识别文本中的位置。[0094]可选地,所述识别单元430还用于:在将预设的多个多标签定性词与所述待识别文本中的词语进行匹配之后,若匹配确定所述待识别文本包含目标多标签定性词,则从预设词典中查询所述目标多标签定性词对应的类别属性,其中,所述预设词典中记录有所述多个多标签定性词各自对应的类别属性。[0095]可选地,所述目标应用场景为语音质检场景,所述待识别文本为待质检服务对话中的任一个用户对话文本,所述待质检服务对话为客服与用户之间的任一通历史对话;所述识别单元430还用于:在将预设的多个多标签定性词与所述待识别文本中的词语进行匹配之前,基于所述待识别文本对应的文本标签属性,确定所述待识别文本在所述语音质检场景中是否反映了预设情感倾向;所述识别单元430在将预设的多个多标签定性词与所述待识别文本中的词语进行匹配时,执行如下步骤:若所述待识别文本在所述语音质检场景中反映了所述预设情感倾向,则将预设的多个多标签定性词与所述待识别文本中的词语进行匹配。[0096]所述装置400还包括:添加单元,用于在所述识别单元430如果所述待识别文本在所述语音质检场景下反映了所述预设情感倾向,则将所述待识别文本添加至异常文本集;所述异常文本集中用于存储多个在所述语音质检场景下具有预设情感倾向的用户对话文本。[0097]可选地,所述装置400还包括:质检单元,用于在所述添加单元将所述待识别文本添加至异常文本集之后,响应于质检评估事件,基于所述异常文本集对所述待质检服务对话进行质检处理。[0098]可选地,所述质检单元在基于所述异常文本集对所述待质检服务对话进行质检处理时,执行如下步骤:若所述异常文本集中用户对话文本的数量小于预设数量阈值,则确定所述待质检服务对话通过质检。[0099]可选地,所述质检单元在基于所述异常文本集对所述待质检服务对话进行质检处理时,执行如下步骤:若所述异常文本集用户对话文本的数量大于或等于预设数量阈值,则基于所述异常文本集中的各用户对话文本以及所述待质检服务对话中与各用户对话文本关联的客服对话文本,评估所述待质检服务对话的服务质量。[0100]可选地,所述质检单元在基于所述异常文本集中的各用户对话文本以及所述待质检服务对话中与各用户对话文本关联的客服对话文本,评估所述待质检服务对话的服务质量时,执行如下步骤:基于目标用户对话文本中的多标签定性词对应的类别属性,确定所述目标用户对话文本对应的异常等级,其中,所述目标用户对话文本为所述异常文本集中的任一个用户对话文本;基于预设质检策略对目标客服对话文本进行评分,得到所述目标客服对话文本的质量分值,所述目标客服对话文本为所述待质检服务对话中与所述目标用户对话文本关联的客服对话文本;基于所述异常文本集中各用户对话文本对应的异常等级,对所述异常文本集中各用户对话文本关联的客服对话文本的质量分值进行加权求和,以确定所述待质检服务对话的服务质量。[0101]显然,本技术实施例提供的多标签定性词识别装置能够作为图1所示的多标签定性词识别方法的执行主体,例如图1所示的多标签定性词识别方法中,步骤s102可由图4所示的多标签定性词识别装置中的获取单元410执行,步骤s104可由图4所示的多标签定性词识别装置中的分类单元420执行,步骤s106和s108可由图4所示的多标签定性词识别装置中的识别单元430执行。[0102]根据本技术的另一个实施例,图4所示的多标签定性词识别装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本技术实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本技术的其他实施例中,多标签定性词识别装置也可以包括其他单元,在实际应用中,这些功能也可以由其他单元协助实现,并且可以由多个单元协作实现。[0103]根据本技术的另一个实施例,可以通过在包括中央处理单元(central processing unit,cpu)、随机存取存储介质(random access memory,ram)、只读存储介质(read-only memory,rom)等处理元件和存储元件的例如计算机的通用计算设备上,运行能够执行如图1所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图4中所示的多标签定性词识别装置,以及来实现本技术实施例的多标签定性词识别方法。所述计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质转载于电子设备中,并在其中运行。[0104]图5是本技术的一个实施例电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。[0105]处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。[0106]存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。[0107]处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成多标签定性词识别装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:获取待识别文本;通过文本分类模型对所述待识别文本进行分类,以得到所述待识别文本对应的文本标签属性,所述文本标签属性用于表示所述待识别文本在目标应用场景中所反映的情感倾向;所述文本分类模型是基于样本文本以及所述样本文本对应的样本文本属性标签训练得到的,且所述样本文本属性标签是基于所述样本文本中多标签定性词的词标签属性确定的,所述多标签定性词是指在不同语境下语义不同但类别属性相同的词语,所述词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;将预设的多个多标签定性词与所述待识别文本中的词语进行匹配;若匹配确定所述待识别文本中包括目标多标签定性词,基于所述待识别文本对应的文本标签属性,确定所述待识别文本中的多标签定性词对应的词标签属性。[0108]上述如本技术图1所示实施例揭示的多标签定性词识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。[0109]该电子设备还可执行图1的方法,并实现多标签定性词识别装置在图1、图2、图3所示实施例的功能,本技术实施例在此不再赘述。[0110]当然,除了软件实现方式之外,本技术的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。[0111]本技术实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:获取待识别文本;通过文本分类模型对所述待识别文本进行分类,以得到所述待识别文本对应的文本标签属性,所述文本标签属性用于表示所述待识别文本在目标应用场景中所反映的情感倾向;所述文本分类模型是基于样本文本以及所述样本文本对应的样本文本属性标签训练得到的,且所述样本文本属性标签是基于所述样本文本中多标签定性词的词标签属性确定的,所述多标签定性词是指在不同语境下语义不同但类别属性相同的词语,所述词标签属性用于表示对应的多标签定性词在所属的样本文本中的语义;将预设的多个多标签定性词与所述待识别文本中的词语进行匹配;若匹配确定所述待识别文本中包括目标多标签定性词,基于所述待识别文本对应的文本标签属性,确定所述待识别文本中的多标签定性词对应的词标签属性。[0112]总之,以上所述仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。[0113]上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。[0114]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。[0115]还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。[0116]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
多标签定性词识别方法、装置、电子设备及存储介质与流程 专利技术说明
作者:admin
2023-06-29 16:03:52
581
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术