计算;推算;计数设备的制造及其应用技术1.本发明涉及数据特征筛选分析领域,尤其涉及一种多源数据特征筛选分析方法、装置、介质及设备。背景技术:2.在现存医疗领域存在着各种各样的多源数据,这些数据能够以不同方式呈现,如ct图像,mri图像,通过对这些多源数据进行特征筛选,可以得到表征病情的关键点。在现有的特征筛选技术中,通常分为两类:一是将原始特征投影至低维空间,得到相应的低维空间特征,二是依据一定的规则对原始特征进行评分,并选择得分较高的特征子集作为结果。3.可见,现有技术中往往使用其中一种特征筛选技术完成特征筛选,从而难以同时保留原始特征的物理意义和低维空间特征。技术实现要素:4.为了解决上述技术问题,本发明实施例提出了一种多源数据特征筛选分析方法、装置、介质及设备,能够有效兼顾原始特征的低维空间特征和物理意义的提取,保留更多特征信息。5.为了实现上述目的,本发明实施例提供了一种多源数据特征筛选分析方法,包括:6.获取原始多源数据;7.对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵;8.整合所述视图内亲和矩阵,得到三阶张量;9.对所述三阶张量进行张量计算,得到多源数据特征分析结果。10.进一步的,所述特征筛选包括特征提取和特征选择;则,所述对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵,具体包括:通过低维嵌入学习对所述原始多源数据进行特征提取;以及,通过软阈值嵌入学习对所述原始多源数据进行特征选择。11.进一步的,所述对所述三阶张量进行张量计算,得到多源数据特征分析结果,具体包括:对所述三阶张量进行分解,得到视图间亲和张量;融合所述视图间亲和张量,得到相似矩阵;对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。12.进一步的,所述对所述三阶张量进行分解,得到视图间亲和张量,具体包括:通过张量低秩分解学习对所述三阶张量进行分解,得到视图间亲和张量。13.进一步的,所述对所述相似矩阵执行聚类操作,得到多源数据特征分析结果,具体包括:采用谱聚类算法对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。14.本发明还提供了一种多源数据特征筛选分析装置,包括:15.数据获取模块,用于获取原始多源数据;16.视图内亲和矩阵获取模块,用于对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵;17.矩阵整合模块,用于整合所述视图内亲和矩阵,得到三阶张量;18.张量计算模块,用于对所述三阶张量进行张量计算,得到多源数据特征分析结果。19.进一步的,所述特征筛选包括特征提取和特征选择;则,所述视图内亲和矩阵获取模块,具体用于:通过低维嵌入学习对所述原始多源数据进行特征提取;以及,通过软阈值嵌入学习对所述原始多源数据进行特征选择。20.进一步的,所述张量计算模块,具体用于:对所述三阶张量进行分解,得到视图间亲和张量;融合所述视图间亲和张量,得到相似矩阵;对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。21.本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的多源数据特征筛选分析方法的步骤。22.本发明实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的多源数据特征筛选分析方法的步骤。23.综上,本发明具有以下有益效果:24.本发明实施例能够有效结合软阈值嵌入学习和低维嵌入学习,以对原始多源数据进行协同学习,从而兼顾从原始空间以及低维空间中分别得到的亲和图,保留更丰富的特征信息并实现无监督的特征筛选,再结合张量计算,能够更好地保持亲和图的空间结构,并为探索不同亲和图之间的一致性提供一个多视图的观察,此外,能够实现更高的准确率和召回率。附图说明25.图1是本发明提供的一种多源数据特征筛选分析方法的一个实施例的流程示意图;26.图2是本发明提供的一种多源数据特征筛选分析装置的一个实施例的结构示意图。具体实施方式27.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。28.参见图1,是本发明提供的多源数据特征筛选分析方法的一个实施例的流程示意图,该方法包括步骤s1至s4,具体如下:29.s1,获取原始多源数据;30.s2,对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵;31.优选地,所述特征筛选包括特征提取和特征选择;则,所述对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵,具体包括:通过低维嵌入学习对所述原始多源数据进行特征提取;以及,通过软阈值嵌入学习对所述原始多源数据进行特征选择。32.示例性的,对于每个视图,协同软阈值嵌入学习和低维嵌入学习对视图内亲和图进行学习,这种双嵌入学习方案丰富了特征当中所保留的信息,可以同时从原始空间和低维空间学习得到鲁棒亲和图。33.s3,整合所述视图内亲和矩阵,得到三阶张量;34.s4,对所述三阶张量进行张量计算,得到多源数据特征分析结果。35.优选地,所述对所述三阶张量进行张量计算,得到多源数据特征分析结果,具体包括:对所述三阶张量进行分解,得到视图间亲和张量;融合所述视图间亲和张量,得到相似矩阵;对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。36.示例性的,所有的视图内亲和图被堆叠成一个三阶张量,从中通过张量低秩分解学习得到一个视图间亲和张量。张量计算的相关处理为探索亲和图之间的视图间的一致性提供了一个多视图的观察。37.作为上述方案的改进,所述对所述三阶张量进行分解,得到视图间亲和张量,具体包括:通过张量低秩分解学习对所述三阶张量进行分解,得到视图间亲和张量。38.作为上述方案的改进,所述对所述相似矩阵执行聚类操作,得到多源数据特征分析结果,具体包括:采用谱聚类算法对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。39.实施例一:40.1)首先,从原始数据经过特征提取(通过低维嵌入学习low-dimensional graph learning的方式)和特征选择(通过软阈值嵌入学习soft-threshold graph learning的方式)两种方式进行特征筛选,利用图学习得到视图内亲和矩阵;41.2)将上述两种方式分别得到的视图内亲和矩阵进行整合,堆叠成一个三阶张量;42.3)通过张量分解学习得到视间亲和张量;43.4)对融合视间亲和张量所得到的相似矩阵进行谱聚类得到最后的多源数据特征分析结果。44.参见图2,是本发明提供的多源数据特征筛选分析装置的一个实施例的结构示意图,包括101至104:45.数据获取模块101,用于获取原始多源数据;46.视图内亲和矩阵获取模块102,用于对所述原始多源数据进行特征筛选后,执行图学习操作,得到若干个视图内亲和矩阵;47.优选地,所述特征筛选包括特征提取和特征选择;则,所述视图内亲和矩阵获取模块102,具体用于:通过低维嵌入学习对所述原始多源数据进行特征提取;以及,通过软阈值嵌入学习对所述原始多源数据进行特征选择。48.示例性的,对于每个视图,协同软阈值嵌入学习和低维嵌入学习对视图内亲和图进行学习,这种双嵌入学习方案丰富了特征当中所保留的信息,可以同时从原始空间和低维空间学习得到鲁棒亲和图。49.矩阵整合模块103,用于整合所述视图内亲和矩阵,得到三阶张量;50.张量计算模块104,用于对所述三阶张量进行张量计算,得到多源数据特征分析结果。51.优选地,所述张量计算模块104,具体用于:对所述三阶张量进行分解,得到视图间亲和张量;融合所述视图间亲和张量,得到相似矩阵;对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。52.示例性的,所有的视图内亲和图被堆叠成一个三阶张量,从中通过张量低秩分解学习得到一个视图间亲和张量。张量计算的相关处理为探索亲和图之间的视图间的一致性提供了一个多视图的观察。53.作为上述方案的改进,所述张量计算模块104,具体用于:通过张量低秩分解学习对所述三阶张量进行分解,得到视图间亲和张量。54.作为上述方案的改进,所述张量计算模块104,具体用于:采用谱聚类算法对所述相似矩阵执行聚类操作,得到多源数据特征分析结果。55.本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的多源数据特征筛选分析方法实施例的步骤。56.本发明实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的多源数据特征筛选分析方法实施例的步骤。57.该实施例的计算机设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如多源数据特征筛选分析程序。所述处理器执行所述计算机程序时实现上述各个多源数据特征筛选分析方法实施例中的步骤,例如图1所示的步骤s1至s4。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如101至104。58.示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。例如,所述计算机程序可以被分割成101至104。59.所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可包括,但不仅限于,处理器、存储器。60.所述处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分。61.所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。62.其中,所述计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。63.综上,本发明具有以下有益效果:64.本发明实施例能够有效结合软阈值嵌入学习和低维嵌入学习,以对原始多源数据进行协同学习,从而兼顾从原始空间以及低维空间中分别得到的亲和图,保留更丰富的特征信息并实现无监督的特征筛选,再结合张量计算,能够更好地保持亲和图的空间结构,并为探索不同亲和图之间的一致性提供一个多视图的观察,此外,能够实现更高的准确率和召回率。65.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。66.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种多源数据特征筛选分析方法、装置、介质及设备 专利技术说明
作者:admin
2023-06-29 08:34:26
338
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术