发布信息

一种生成定义词条的方法、装置、电子设备和存储介质与流程

作者:admin      2022-07-30 22:40:43     791



计算;推算;计数设备的制造及其应用技术1.本技术涉及数据查询技术领域,具体而言,涉及一种生成定义词条的方法、装置、电子设备和存储介质。背景技术:2.词条是对各种概念、事物、现象及最新发现等概念的概括性解释,可以帮助人们对某一词汇进行快速理解。用户在不了解某个词汇或者某个短语时,通常是直接在查询框中输入待查询内容,得到跟该待查询内容相关的解释和定义。3.发明人在研究中发现,现有技术通常是针对用户询问的每个词汇、文本、问题,都需要由人工构建和编辑,构建精度取决于编辑人的知识储备、构建时间和更新时间取决于人工是否看到该问题,若没有人看到,或是看到之后不想回答,则该待查询内容会长时间无法得到回复,因此词条生成效率较低。技术实现要素:4.有鉴于此,本技术实施例提供了一种生成定义词条的方法、装置、电子设备和存储介质,以提高词条的生成效率。5.第一方面,本技术实施例提供了一种生成定义词条的方法,所述方法包括:6.从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;所述描述词基于所述待查询实体指向查询结果;7.从数据库中筛选出用于解释所述待查询实体的描述文本;8.基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;所述第一属性表征所述待查询实体的特征,所述第二属性表征所述待查询实体与第一实体之间关联关系;所述限定作用是对所述描述词进行语义分析之后得到的;9.根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果;所述属性为所述第一属性,或者所述第二属性。10.在一个可行的实施方案中,从数据库中筛选出用于解释所述待查询实体的描述文本,包括:11.根据所述数据库中预先存储的所述待查询实体与目标词汇的对应关系,从所述数据库中确定包含所述目标词汇的目标文本;12.针对每个所述目标词汇,根据所述目标词汇在所述目标文本中的出现频率、所述目标词汇对应的第二实体在所述目标文本中的特征,计算所述目标文本与所述待查询实体之间的相关度数值;13.若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本。14.在一个可行的实施方案中,从所述数据库中确定包含所述目标词汇的目标文本,包括:15.从所述数据库中确定包含所述目标词汇的至少一个目标段落;16.通过预先训练好的识别模型识别所述目标段落中是否存在目标内容;所述目标内容用于:解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系;17.将包含所述目标内容的文本确定为所述目标文本。18.在一个可行的实施方案中,在若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本之前,所述方法还包括:19.针对每个目标文本,获取发表所述目标文本的平台的权威等级、所述目标文本的被引用次数;20.根据所述权威等级和所述被引用次数,确定所述目标文本的质量数值;21.根据所述质量数值,调整所述相关度数值。22.在一个可行的实施方案中,在从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词之后,所述方法还包括:23.从所述数据库中查找是否存在所述待查询实体的原始定义词条;24.若存在所述原始定义词条,且所述原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔大于预设数值,则获取用于生成所述原始定义词条的原始知识子图;所述原始知识子图是预先为每个实体生成并存储到所述数据库中的;所述待查询实体、所述第一实体均属于所述实体;25.若所述原始知识子图中包含每个所述属性,或者所述时间间隔小于或等于所述预设数值,则将所述原始定义词条确定为所述目标定义词条。26.在一个可行的实施方案中,在获取用于生成所述原始定义词条的原始知识子图之后,所述方法还包括:27.若原始知识子图中缺少任一所述属性,则将缺少的所述属性补充到所述原始知识子图中,并将所述目标定义词条作为新的原始定义词条更新到所述数据库中。28.在一个可行的实施方案中,从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词,包括:29.确定所述待查询内容中的每个词汇和每个所述词汇的词性;30.根据所述词性对所述待查询内容中的语句结构进行划分,并根据划分出的所述语句结构确定所述待查询内容中任意两个词汇之间的描述关系;31.根据所述描述关系确定每个词汇的被描述次数,将所述待查询内容中被描述次数最多的词汇确定为所述待查询实体;32.将与所述待查询实体产生所述描述关系的词汇确定为所述描述词。33.第二方面,本技术实施例还提供了一种生成定义词条的装置,所述装置包括:34.第一提取单元,用于从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;所述描述词基于所述待查询实体指向查询结果;35.筛选单元,用于从数据库中筛选出用于解释所述待查询实体的描述文本;36.第二提取单元,用于基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;所述第一属性表征所述待查询实体的特征,所述第二属性表征所述待查询实体与第一实体之间关联关系;所述限定作用是对所述描述词进行语义分析之后得到的;37.生成单元,用于根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果;所述属性为所述第一属性,或者所述第二属性。38.在一个可行的实施方案中,所述筛选单元用于:39.根据所述数据库中预先存储的所述待查询实体与目标词汇的对应关系,从所述数据库中确定包含所述目标词汇的目标文本;40.针对每个所述目标词汇,根据所述目标词汇在所述目标文本中的出现频率、所述目标词汇对应的第二实体在所述目标文本中的特征,计算所述目标文本与所述待查询实体之间的相关度数值;41.若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本。42.在一个可行的实施方案中,所述筛选单元在从所述数据库中确定包含所述目标词汇的目标文本时,还用于:43.从所述数据库中确定包含所述目标词汇的至少一个目标段落;44.通过预先训练好的识别模型识别所述目标段落中是否存在目标内容;所述目标内容用于:解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系;45.将包含所述目标内容的文本确定为所述目标文本。46.在一个可行的实施方案中,所述装置还包括:47.获取单元,用于在若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本之前,针对每个目标文本,获取发表所述目标文本的平台的权威等级、所述目标文本的被引用次数;48.质量评定单元,用于根据所述权威等级和所述被引用次数,确定所述目标文本的质量数值;49.调整单元,用于根据所述质量数值,调整所述相关度数值。50.在一个可行的实施方案中,所述装置还包括:51.查找单元,用于在从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词之后,从所述数据库中查找是否存在所述待查询实体的原始定义词条;52.判断单元,用于若存在所述原始定义词条,且所述原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔大于预设数值,则获取用于生成所述原始定义词条的原始知识子图;所述原始知识子图是预先为每个实体生成并存储到所述数据库中的;所述待查询实体、所述第一实体均属于所述实体;53.确定单元,用于若所述原始知识子图中包含每个所述属性,或者所述时间间隔小于或等于所述预设数值,则将所述原始定义词条确定为所述目标定义词条。54.在一个可行的实施方案中,所述装置还包括:55.补充单元,用于在获取用于生成所述原始定义词条的原始知识子图之后,若原始知识子图中缺少任一所述属性,则将缺少的所述属性补充到所述原始知识子图中,并将所述目标定义词条作为新的原始定义词条更新到所述数据库中。56.在一个可行的实施方案中,所述第一提取单元用于:57.确定所述待查询内容中的每个词汇和每个所述词汇的词性;58.根据所述词性对所述待查询内容中的语句结构进行划分,并根据划分出的所述语句结构确定所述待查询内容中任意两个词汇之间的描述关系;59.根据所述描述关系确定每个词汇的被描述次数,将所述待查询内容中被描述次数最多的词汇确定为所述待查询实体;60.将与所述待查询实体产生所述描述关系的词汇确定为所述描述词。61.第三方面,本技术实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面中任一项所述的方法的步骤。62.第四方面,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面中任一项所述的方法的步骤。63.本技术实施例提供的一种生成定义词条的方法、装置、电子设备和存储介质,通过从用户输入的待查询内容中提取待查询实体,确定该待查询内容的待查询实体,从而在数据库中查找解释所述待查询实体的描述文本,通过从待查询内容中提取描述词,使得该描述词影响最终的查询结果;通过注重描述词对待查询实体的限定作用,从描述文本中提取基于该限定作用的第一属性和第二属性,从而根据该第一属性和第二属性生成用于定义该待查询实体的目标定义词条。64.与现有技术中人工编辑词条的方案相比,本技术实施例能够在用户查询时,根据数据库中的内容自动生成待查询实体的定义词条,提高了词条生成的效率,避免了用户查询时由于没人回答造成的词条生成速度慢的问题。65.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明66.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。67.图1示出了本技术实施例所提供的一种生成定义词条的方法的流程图。68.图2示出了本技术实施例所提供的一种筛选描述文本的方法的流程图。69.图3示出了本技术实施例所提供的一种生成定义词条的装置的结构示意图。70.图4示出了本技术实施例所提供的一种电子设备的结构示意图。具体实施方式71.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,应当理解,本技术中附图仅起到说明和描述的目的,并不用于限定本技术的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本技术中使用的流程图示出了根据本技术的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本技术内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。72.另外,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。73.需要提前说明的是,本技术实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。74.需要提前说明的是,本技术实施例涉及到的装置或电子设备等可以执行在单个服务器上,也可以执行在服务器组。服务器组可以是集中式的,也可以是分布式的。在一些实施例中,服务器相对于终端,可以是本地的,也可以是远程的。例如,服务器可以经由网络访问存储在服务请求方终端、服务提供方终端、或数据库、或其任意组合中的信息和/或数据。作为另一示例,服务器可以直接连接到服务请求方终端、服务提供方终端和数据库中至少一个,以访问存储的信息和/或数据。在一些实施例中,服务器可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。75.图1示出了本技术实施例所提供的一种生成定义词条的方法的流程图,如图1所示,所述方法包括以下步骤:76.步骤101,从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;所述描述词基于所述待查询实体指向查询结果。77.具体的,待查询内容中包括用户输入的查询文本,查询文本可以是短文本、长文本、单字、词语。当待查询内容中的文本为短文本或长文本时,待查询实体和描述词是对待查询内容进行语义分析、语义识别等方法对待查询内容进行分析之后确定的,在确定之后根据文本提取等功能进行提取之后得到的。描述词是用来形容待查询实体的,能够体现待查询实体的特征,能够体现待查询实体功能、实现方式,能够限定查询实体的使用场景等等,包括但不限于:形容词、量词等限定词。通过提取待查询内容中的描述词,限定待查询实体的使用场景、具体特征等情况,缩小查找范围,根据该描述词指向最终的查询结果,使得查询结果与待查询内容匹配度更高。78.例1,输入的待查询内容为“燃气热水器”。79.则“热水器”为待查询实体,“燃气”用来对“热水器”的加热方式进行限定,表明该“热水器”的类型不是电加热而是燃气加热。则在该待查询内容中,“燃气”是“热水器”的描述词。80.例2,输入的待查询内容为“燃气热水器的功能是什么”。81.则,“热水器”为待查询实体,“燃气”为其中一个描述词,“功能”是另一个描述词。“功能”用来询问该燃气热水器的作用。因此,通过将“功能”确定为另一个描述词,能够进一步缩小查找范围,通过该描述词查找该燃气热水器的功能性定义、描述和概况。82.需要注意的是,本技术实施例中当输入的待查询内容为词汇时,对该词汇中的每个词汇按照最小词汇单位进行划分,例如“燃气热水器”是一个词汇,但是划分之后得到“燃气”、“热水器”两个词汇,对此识别待查询实体和描述词;例如:“笔记本电脑”,划分为“笔记本”、“电脑”。当输入的待查询词汇已经无法细化为多个最小词汇时,可以认定当前待查询内容中描述词为空描述词,或者将查询到的任意词汇对待查询实体的限定作用都符合该空描述词对待查询实体的限定作用,即该空描述词对待查询实体不起作用。83.步骤102,从数据库中筛选出用于解释所述待查询实体的描述文本。84.具体的,数据库中存储有各类文献、知识图谱等多种公开数据,当从步骤101中提取出待查询实体之后,从数据库中查找所有包含该待查询实体的资料,从中筛选出用于解释待查询实体的描述文本。筛选方式可以是判断文献的类型、主题、是否包含对该待查询实体的解释内容等多种方式。85.步骤103,基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;所述第一属性表征所述待查询实体的特征,所述第二属性表征所述待查询实体与第一实体之间关联关系;所述限定作用是对所述描述词进行语义分析之后得到的。86.具体的,在根据步骤101提取出待查询实体和描述词之后,通过语义分析等方式判断该描述词对待查询实体的限定作用,例如例2中,描述词为“燃气”、“功能”,则描述词对待查询实体的限定作用表现为在数据库中查找与“燃气”类型“热水器”的“功能”相关的属性。87.第一属性表示待查询实体本身具有的与其他物品构成区别的特征、特质、特点;第二属性表示待查询实体与外界其他任意实体产生的相互关联关系。例如“热水器”的第一属性为:在一定时间内使冷水温度升高变成热水的一种装置,加热、排水、水流动等各种特征;第二属性可以包括:“热水器”与“厨房”、“卫生间”等实体之间存在使用关系,“热水器”与“水泵”和“水管”等实体之间存在使用关系,“热水器”和“加热原理”存在关联关系等等,则第一实体为“厨房”、“卫生间”、“加热原理”、“水泵”和“水管”。88.在根据步骤102筛选出解释待查询实体的描述文本之后,从该描述文本中提取出与待查询实体相关的所有的第一属性和第二属性。89.例如,根据例2查找到的第一属性为:能够加热水、燃料为燃气、热传递;第二属性为:属于燃气用具、包括阀体、主燃烧器、小火燃烧器、热交换器、安全装置、强排装置等第一实体。90.步骤104,根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果;所述属性为所述第一属性,或者所述第二属性。91.具体的,在根据步骤103从描述文本中提取出的每个属性,将每个属性组合成定义该待查询实体的目标定义词条,将该目标定义词条作为查询结果返回到查询端,从而使得用户根据该目标定义词条,了解跟待查询内容相关的解释和释义,知晓待查询实体的特征、特点以及待查询实体与其他实体之间的关系。生成目标定义词条的方式可以是根据预先训练好的模型将多个属性自动组合成一段文本,或者生成视频、语音等方式。本技术不对生成目标定义词条的方式进行限定。92.本技术实施例提供的一种生成定义词条的方法,通过从用户输入的待查询内容中提取待查询实体,确定该待查询内容的待查询实体,从而在数据库中查找解释所述待查询实体的描述文本,通过从待查询内容中提取描述词,使得该描述词影响最终的查询结果;通过注重描述词对待查询实体的限定作用,从描述文本中提取基于该限定作用的第一属性和第二属性,从而根据该第一属性和第二属性生成用于定义该待查询实体的目标定义词条。93.与现有技术中人工编辑词条的方案相比,本技术实施例能够在用户查询时,根据数据库中的内容自动生成待查询实体的定义词条,提高了词条生成的效率,避免了用户查询时由于没人回答造成的词条生成速度慢的问题。94.需要注意的是,在将所述目标定义词条确定为所述查询结果之后,还可以将查询结果发送到用户终端、查询终端、图形用户界面,供用户查看查询结果。95.在一个可行的实施方案中,图2示出了本技术实施例所提供的一种筛选描述文本的方法的流程图,如图2所示,在执行步骤102从数据库中筛选出用于解释所述待查询实体的描述文本时,所述方法还包括以下步骤:96.步骤201,根据所述数据库中预先存储的所述待查询实体与目标词汇的对应关系,从所述数据库中确定包含所述目标词汇的目标文本。97.具体的,待查询实体和目标词汇的对应关系预先存储在数据库中,一个待查询实体可能对应多个目标词汇,例如,待查询实体为“电路板”,则该待查询实体对应的目标词汇包括“电路板”、“线路板”、“印刷线路板”等;多个待查询实体也可能对应同一个目标词汇,例如目标词汇为“笔记本”,则该目标词汇对应“纸质笔记本”这个实体,也对应“电脑”这个实体。98.确定数据库中与待查询实体对应的至少一个目标词汇,从数据库中确定包含每个目标词汇的目标文本。99.步骤202,针对每个所述目标词汇,根据所述目标词汇在所述目标文本中的出现频率、所述目标词汇对应的第二实体在所述目标文本中的特征,计算所述目标文本与所述待查询实体之间的相关度数值。100.具体的,在根据步骤201从数据库中确定出包含目标词汇的目标文本之后,针对每个目标词汇,确定包含该目标词汇的一个或多个目标文本,确定该目标词汇在每个目标文本中的出现次数和频率、目标词汇对应的第二实体在该目标文本中对应的特征。第二实体与待查询实体可以是相同的,也可以是不同的,当第二实体与待查询实体不同时,二者代表的含义或实质是相同的(相关度超过某个阈值);当其他条件不变时,目标词汇在目标文本中的出现频率越高,则该相关度数值越高;当其他条件不变时,当目标词汇对应的第二实体的特征越多,则目标文本中解释第二实体(相当于解释待查询实体)的内容越多,则目标文本与待查询实体的相关度数值越高。101.步骤203,若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本。102.具体的,相关度阈值是预设的,相关度阈值越高,目标文本越能解释该待查询实体,则将相关度数值超过相关度阈值的目标文本确定为描述文本。103.通过上述方法,能够对数据库中与待查询实体相关的文献、文章、资料筛选并进行相关度排序,保证最终筛选得到的描述文本与待查询内容和待查询实体相关度超过相关度阈值,提高了生成定义词条的精度。104.在一个可行的实施方案中,在执行步骤201从所述数据库中确定包含所述目标词汇的目标文本时,所述方法还包括以下步骤:105.步骤210,从所述数据库中确定包含所述目标词汇的至少一个目标段落;通过预先训练好的识别模型识别所述目标段落中是否存在目标内容;所述目标内容用于:解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系。106.具体的,从数据库中筛选包含所述目标词汇的每个目标段落,通过预先训练好的识别模型识别出目标段落中是否存在目标内容,目标内容用于解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系。107.例如,目标内容可以是“a是一种b,其包含c等,可应用于d”的描述性文本。其中,a指代目标词汇,b、c、d分别用于解释目标词汇的特征、含义、特点、与其他实体的关联关系等。确定所述待查询实体与至少一个第三实体的关联关系包括但不限于:直接定义、规定、描述或解释待查询实体与第三实体的关联关系。108.步骤212,将包含所述目标内容的文本确定为所述目标文本。109.具体的,当目标段落中包含至少一个目标内容时,将该目标段落所在的文本确定为目标文本。110.通过上述方法,能够根据目标文本包含的目标内容,找到实质性能够定义或解释该待查询实体的目标文本。111.在一个可行的实施方案中,在执行步骤203之前,所述方法还包括以下步骤:112.步骤220,针对每个目标文本,获取发表所述目标文本的平台的权威等级、所述目标文本的被引用次数。113.具体的,针对每个目标文本,获取发表该目标文本的平台,该平台的权威等级和该目标文本的被引用次数。其中,平台可以是网络公开平台、期刊、文献资源库等线上线下多个平台,根据每个平台在行业内的权威程度、发表文本的难易程度确定该平台的权威等级。114.步骤221,根据所述权威等级和所述被引用次数,确定所述目标文本的质量数值。115.具体的,根据步骤221中获取的每个目标文本的被引用次数和发表该目标文本的平台的权威等级,对每个目标文本进行排序得到每个目标文本的质量数值;或者针对每个目标文本,根据该被引用次数、权威等级和预设的质量公式,单独计算每个目标文本的质量数值,以便根据该质量数值确定该目标文本中的内容是否正确。在本技术实施例中,若发表该目标文本的平台还包括其他用户的赞同次数和反对次数,也可以根据该赞同次数和反对次数,适应性调高/调低质量数值。116.步骤222,根据所述质量数值,调整所述相关度数值。117.具体的,当得出每个目标文本的质量数值之后,根据该质量数值调整相关度数值。例如,当文本一、文本二与待查询实体的相关度数值分别为98、80的时候,若文本一的质量数值为0,文本二的质量数值为99,则说明文本一的可信度不高,根据质量数值调低该文本一的相关度数值,根据文本二的质量数值调高文本二的相关度数值,使得调整之后的文本一的相关度数值低于文本二的相关度数值。118.在一个可行的实施方案中,在执行步骤101之后,所述方法还包括以下步骤:119.步骤230,从所述数据库中查找是否存在所述待查询实体的原始定义词条;若存在所述原始定义词条,且所述原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔大于预设数值,则获取用于生成所述原始定义词条的原始知识子图;所述原始知识子图是预先为每个实体生成并存储到所述数据库中的;所述待查询实体、所述第一实体均属于所述实体。120.具体的,原始定义词条是在执行步骤101之前(即此次输入待查询内容查询之前)对该待查询实体生成的旧定义词条。在通过步骤101获取到待查询实体之后,在数据库中查找是否存在原始定义词条,如果存在原始定义词条,并且该原始定义词条的更新时间与待查询内容的发送时间之间的时间间隔较长,则获取在生成原始定义词条时整理的原始知识子图,原始知识子图包括待查询实体与第一实体之间的关联关系,待查询实体的特征、第一属性、第二属性等。121.步骤231,若所述原始知识子图中包含每个所述属性,或者所述时间间隔小于或等于所述预设数值,则将所述原始定义词条确定为所述目标定义词条。122.具体的,如果原始知识子图包含每个属性,则确定该原始知识子图虽然更新时间较久,但没有特征遗漏,根据该原始知识子图生成的原始定义词条能够根据数据库中的内容全面解释或定义该待查询实体,则将原始定义词条确定为目标定义词条;若原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔小于或等于预设数值,说明该原始定义词条更新时间较短,直接将原始定义词条确定为目标定义词条。123.通过上述方法,当数据库中存在原始定义词条时,可以通过判断该原始定义词条的时间,快速的确定是否需要重新生成新的目标定义词条,当不需要生成新的词条的时候,直接调用原始定义词条,提高词条生成效率。124.在一个可行的实施方案中,在执行步骤230获取用于生成所述原始定义词条的原始知识子图之后,所述方法还包括以下步骤:125.步骤240,若原始知识子图中缺少任一所述属性,则将缺少的所述属性补充到所述原始知识子图中,并将所述目标定义词条作为新的原始定义词条更新到所述数据库中。126.具体的,根据步骤103获取到每个属性之后,判断该原始知识子图中是否包含每个所述属性,若原始知识子图中缺少任一所述属性,则认为该原始知识子图需要更新,将缺少的属性补充到原始知识子图中,并将根据步骤104生成的目标定义词条作为新的原始定义词条更新到所述数据库中。127.通过上述方法,能够保证当原始定义词条需要更新时,能够及时根据步骤102-104中的内容对该原始定义词条进行更新。128.在一个可行的实施方案中,在执行步骤101从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词时,包括以下步骤:129.步骤250,确定所述待查询内容中的每个词汇和每个所述词汇的词性。130.具体的,通过识别、划分等方式确定出待查询内容中的每个词汇,通过词性识别、语义识别或在数据库中查找每个词汇对应的词性等方法确定出每个词汇的词性。131.步骤251,根据所述词性对所述待查询内容中的语句结构进行划分,并根据划分出的所述语句结构确定所述待查询内容中任意两个词汇之间的描述关系。132.具体的,在确定出待查询内容中的每个词汇和每个词汇的词性之后,对该待查询内容中的语句结构进行划分,得到该待查询内容中的宾语、主语、谓语、状语、补语、定语等。通过划分语句结构,能够确定出任意两个词汇之间的描述关系或依存关系。133.步骤252,根据所述描述关系确定每个词汇的被描述次数,将所述待查询内容中被描述次数最多的词汇确定为所述待查询实体。134.具体的,根据所述描述关系,确定每个词汇描绘别的词汇的描述次数,也即获取到每个词汇被别的词汇描述的被描述次数。将被描述次数最多的词汇确定为待查询实体。135.如例2中,“燃气”、“热水器”、“功能”,“燃气”描述“热水器”,“功能”描述“热水器”,则“燃气”的描述次数为1,被描述次数为0;热水器”的描述次数为0,被描述次数为2;“功能”的描述次数为1,被描述次数为0。将“热水器”确定为待查询词汇。其中,“燃气”与“功能”分别与热水器”存在描述关系。136.步骤253,将与所述待查询实体产生所述描述关系的词汇确定为所述描述词。137.具体的,在确定出待查询实体之后,将与待查询实体存在描述关系的其他词汇确定为描述词。138.图3示出了本技术实施例所提供的一种生成定义词条的装置的结构示意图,如图3所示,所述装置包括:第一提取单元301、筛选单元302,第二提取单元303,生成单元304。139.第一提取单元301,用于从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词;所述描述词基于所述待查询实体指向查询结果。140.筛选单元302,用于从数据库中筛选出用于解释所述待查询实体的描述文本。141.第二提取单元303,用于基于所述描述词对所述待查询实体的限定作用,从所述描述文本中提取所述待查询实体在所述限定作用下的第一属性、第二属性;所述第一属性表征所述待查询实体的特征,所述第二属性表征所述待查询实体与第一实体之间关联关系;所述限定作用是对所述描述词进行语义分析之后得到的。142.生成单元304,用于根据提取的每个属性,生成定义所述待查询实体的目标定义词条,以将所述目标定义词条确定为所述查询结果;所述属性为所述第一属性,或者所述第二属性。143.在一个可行的实施方案中,所述筛选单元用于:144.根据所述数据库中预先存储的所述待查询实体与目标词汇的对应关系,从所述数据库中确定包含所述目标词汇的目标文本。145.针对每个所述目标词汇,根据所述目标词汇在所述目标文本中的出现频率、所述目标词汇对应的第二实体在所述目标文本中的特征,计算所述目标文本与所述待查询实体之间的相关度数值。146.若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本。147.在一个可行的实施方案中,所述筛选单元在从所述数据库中确定包含所述目标词汇的目标文本时,还用于:148.从所述数据库中确定包含所述目标词汇的至少一个目标段落。149.通过预先训练好的识别模型识别所述目标段落中是否存在目标内容;所述目标内容用于:解释所述待查询实体的含义,或者描述所述待查询实体的特征,或者确定所述待查询实体与至少一个第三实体的关联关系。150.将包含所述目标内容的文本确定为所述目标文本。151.在一个可行的实施方案中,所述装置还包括:152.获取单元,用于在若所述目标文本的相关度数值超过相关度阈值,则将所述目标文本确定为所述描述文本之前,针对每个目标文本,获取发表所述目标文本的平台的权威等级、所述目标文本的被引用次数。153.质量评定单元,用于根据所述权威等级和所述被引用次数,确定所述目标文本的质量数值。154.调整单元,用于根据所述质量数值,调整所述相关度数值。155.在一个可行的实施方案中,所述装置还包括:156.查找单元,用于在从用户输入的待查询内容中提取待查询实体以及描述所述待查询实体的描述词之后,从所述数据库中查找是否存在所述待查询实体的原始定义词条。157.判断单元,用于若存在所述原始定义词条,且所述原始定义词条的更新时间与所述待查询内容的发送时间之间的时间间隔大于预设数值,则获取用于生成所述原始定义词条的原始知识子图;所述原始知识子图是预先为每个实体生成并存储到所述数据库中的;所述待查询实体、所述第一实体均属于所述实体。158.确定单元,用于若所述原始知识子图中包含每个所述属性,或者所述时间间隔小于或等于所述预设数值,则将所述原始定义词条确定为所述目标定义词条。159.在一个可行的实施方案中,所述装置还包括:160.补充单元,用于在获取用于生成所述原始定义词条的原始知识子图之后,若原始知识子图中缺少任一所述属性,则将缺少的所述属性补充到所述原始知识子图中,并将所述目标定义词条作为新的原始定义词条更新到所述数据库中。161.在一个可行的实施方案中,所述第一提取单元用于:162.确定所述待查询内容中的每个词汇和每个所述词汇的词性。163.根据所述词性对所述待查询内容中的语句结构进行划分,并根据划分出的所述语句结构确定所述待查询内容中任意两个词汇之间的描述关系。164.根据所述描述关系确定每个词汇的被描述次数,将所述待查询内容中被描述次数最多的词汇确定为所述待查询实体。165.将与所述待查询实体产生所述描述关系的词汇确定为所述描述词。166.图4示出了本技术实施例所提供的一种电子设备的结构示意图,包括:处理器401、存储介质402和总线403,所述存储介质402存储有所述处理器401可执行的机器可读指令,当电子设备运行如实施例中的生成定义词条的方法时,所述处理器401与所述存储介质402之间通过总线403通信,所述处理器401执行所述机器可读指令,以执行如实施例中的步骤。167.在实施例中,所述存储介质402还可以执行其它机器可读指令,以执行如实施例中其它所述的方法,关于具体执行的方法步骤和原理参见实施例的说明,在此不再详细赘述。168.本技术实施例提供的一种生成定义词条的装置,通过从用户输入的待查询内容中提取待查询实体,确定该待查询内容的待查询实体,从而在数据库中查找解释所述待查询实体的描述文本,通过从待查询内容中提取描述词,使得该描述词影响最终的查询结果;通过注重描述词对待查询实体的限定作用,从描述文本中提取基于该限定作用的第一属性和第二属性,从而根据该第一属性和第二属性生成用于定义该待查询实体的目标定义词条。169.与现有技术中人工编辑词条的方案相比,本技术实施例能够在用户查询时,根据数据库中的内容自动生成待查询实体的定义词条,提高了词条生成的效率,避免了用户查询时由于没人回答造成的词条生成速度慢的问题。170.本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行,以执行如实施例中的步骤。171.在本技术实施例中,该计算机程序被处理器运行时还可以执行其它机器可读指令,以执行如实施例中其它所述的方法,关于具体执行的方法步骤和原理参见实施例的说明,在此不再详细赘述。172.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。173.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。174.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。175.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。176.以上仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部