发布信息

一种客服机器人学习系统及学习方法与流程 专利技术说明

作者:admin      2022-11-30 09:05:57     789



计算;推算;计数设备的制造及其应用技术1.本发明属于机器人计算机系统技术领域,具体涉及一种客服机器人学习系统及学习方法。背景技术:2.客服机器人作为一套自动对话系统,已逐渐成为很多企业售后环节的标配产品,它能够在一定程度上减轻客服人员的接待压力。对于客服机器人而言, 如何正确识别用户意图并给出合适的答案,始终是摆在面前的核心任务。而机器人识别率,正是其中最重要的衡量指标之一。当前工业界的机器人系统,需要依赖大量提前准备好的知识图谱(包括领域特定的知识), 实际接待中不可避免地会遇到识别不准/无法识别的问题。3.因此,一个完善的客服机器人,需要一个对应的学习系统,以对一些识别不准/无法识别的常见问题进行学习。目前市面上常见的客服机器人,采用的学习机制比较原始: 收集用户反馈上来的未识别/识别不准(不满意)的问题, 管理员进行归类并调整后将其再次添加到知识图谱。 对于此类系统而言,其应对识别率低情形时存在诸多问题:(1)不能及时发现未识别/识别不准的情况,常常依赖于客户反馈;(2)对未识别问题的学习不够及时,通常依赖于管理员后台手动配置/调整;(3)管理员后台手动配置的方式难以应对大量的待学习任务;通过以上问题不难发现: 现有的系统存在许多需要人为介入的操作, 严重缺乏自动化。 也难以实现对大量待学习问题的持续迭代学习, 随着后续业务的持续增长, 这些问题会进一步放大。技术实现要素:4.本发明的目的在于:为解决现有技术中的难以对大量问题进行持续迭代学习的问题,提供一种客服机器人学习系统及学习方法。5.本发明采用的技术方案如下:一种客服机器人学习系统,包括:问题收集模块:用于知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时, 将问题自动添加到未识别问题库;自动聚类模块:用于以后台的形式提供服务,自动对未识别问题做机器学习自动分类, 形成分类整理后的结果;学习管理模块:用于进行人机交互操作,人机交互操作包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话。6.一种客服机器人学习系统学习方法,包括如下步骤:a、问题收集:通过问题收集模块的收集,当知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时,将问题自动添加到未识别问题库;b、问题自动聚类:问题收集模块以后台服务的形式,采用聚类single-pass 算法,自动对未识别问题做机器学习自动分类,将一个问题的多个相似问法分为一类,将零散的问题经过分类后呈现为较分类前更少的分类结果;c、系统学习管理:通过管理员操作学习管理模块,对学习系统进行包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话的操作,将无效问题忽略,将有效问题重新添加至知识图谱,实现对知识图谱的知识补充。7.进一步地,所述步骤b中的聚类single-pass 算法包括如下步骤:(1)以第一篇文档为种子,建立一个分类;(2)将文档 d 向量化;(3)将文档 d 与已有的所有分类均以single-link 策略做相似度计算,采用欧氏距离或余弦距离作为距离度量方法;(4)找出与文档 d 具有最大相似度的已有分类;(5)根据聚类的需求设置相似度阈值θ,阈值θ在[0,1]之间,阈值θ设置得越高,得到的簇粒度越小,簇内文本数量越少,簇的个数越多;相反地,阈值θ设置得越低,簇粒度越大,则簇内文本数量越多,簇的个数越少;(6)若相似度值大于阈值θ,则把文档d加入到有最大相似度的分类中,跳转至步骤(8);(7)若相似度值小于阈值θ,则文档d不属于任一已有分类,需创建新的分类,同时将当前文本归属到新创建的分类中;(8)聚类结束,等待下一篇文档进入。[0008]综上所述,由于采用了上述技术方案,本发明的有益效果是:1.通过机器学习自动聚类,对大量未识别问题进行分类,极大地提高了学习系统的自动化程度和学习效率。[0009]2.自动聚类模块支持多算法架构,可以对不同行业的 saas 企业使用不同的分类算法。[0010]3.学习管理模块功能丰富、界面友好,同时提供了生命周期管理,实现了更加智能的学习管理操作。附图说明[0011]图1为本发明学习系统结构图;图2为本发明自动聚类流程图。[0012]其中,cn为第n个已存在分类;sn为问题文本与分类cn中心文本相似度。具体实施方式[0013]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。[0014]一种客服机器人学习系统,其结构图如图1所示,包括:问题收集模块:用于知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时, 将问题自动添加到未识别问题库;自动聚类模块:用于以后台的形式提供服务,自动对未识别问题做机器学习自动分类, 形成分类整理后的结果,自动聚类的流程原理如图2所示,其算法处理过程为:对每个待分类问题文本依次计算其与已存在分类的中心文本相似度;如果最大相似度值为sn且sn超过某个阈值,则将该问题归入分类cn;如果最大相似度值为sm但sm小于阈值,将该问题独立成一个新分类;其中,cn为第n个已存在分类;sn为问题文本与分类cn中心文本相似度。[0015]学习管理模块:用于进行人机交互操作,人机交互操作包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话。[0016]一种客服机器人学习系统学习方法,包括如下步骤:a、问题收集:通过问题收集模块的收集,当知识图谱产生未识别问题时或者访客对识别不准或不符合期望的问题进行上报时,将问题自动添加到未识别问题库;b、问题自动聚类:问题收集模块以后台服务的形式,采用聚类single-pass 算法,自动对未识别问题做机器学习自动分类,将一个问题的多个相似问法分为一类,将零散的问题经过分类后呈现为较分类前更少的分类结果;c、系统学习管理:通过管理员操作学习管理模块,对学习系统进行包括搜索问题、查看问题列表、查看问题详情、忽略问题、批量操作和查看问题关联的历史对话的操作,将无效问题忽略,将有效问题重新添加至知识图谱,实现对知识图谱的知识补充。[0017]本发明的系统从学习自动化、操作易用性等方面着手实现了更智能的问题收集系统,更自动化的待学习问题处理系统,能支撑业务持续增长的机器人学习系统。考虑到识别率问题将是一个长期迭代优化的过程,新的学习系统以组合多个部件的方式完成学习任务,可以做到后续使用更优的实现替代其中的某些部件。[0018]进一步地,所述步骤b中的聚类single-pass 算法包括如下步骤:(1)以第一篇文档为种子,建立一个分类;(2)将文档 d 向量化;(3)将文档 d 与已有的所有分类均以single-link 策略做相似度计算,采用欧氏距离或余弦距离作为距离度量方法;(4)找出与文档 d 具有最大相似度的已有分类;(5)根据聚类的需求设置相似度阈值θ,阈值θ在[0,1]之间,阈值θ设置得越高,得到的簇粒度越小,簇内文本数量越少,簇的个数越多;相反地,阈值θ设置得越低,簇粒度越大,则簇内文本数量越多,簇的个数越少;(6)若相似度值大于阈值θ,则把文档d加入到有最大相似度的分类中,跳转至步骤(8);(7)若相似度值小于阈值θ,则文档d不属于任一已有分类,需创建新的分类,同时将当前文本归属到新创建的分类中;(8)聚类结束,等待下一篇文档进入。[0019]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部