计算;推算;计数设备的制造及其应用技术1.本发明属于数据处理技术领域,尤其涉及一种文档结构描述转换方法、装置及存储介质。背景技术:2.随着计算机网络技术的不断发展,信息以爆炸式的速度飞速增长,数据形式变得更加的多样化,现行通用的数据交换基本都是基于xml结构文档,而xsd作为描述xml结构的描述文档,可以作为交换的规范,实现各个软件开发商的数据都能够满足行业的规范。3.在xsd数据转换过程中需要针对xsd文件进行解析,由于xsd文件格式信息多种多样,在实际操作时每次都需要针对不同格式的xsd文件进行手工编写代码,以对所述的xsd文件进行解析,此过程费时费力,工作效率低。4.针对此,现有技术的为了提高xsd文件解码效率的方法,首先获取xsd文件格式信息,调取数据库中与该文件格式信息匹配的预设解码程序,通过该预设解码程序进行解码,虽然能够避免手工解码,但是因其首先需要和数据库进行交互,在数据库中查找匹配的解码规则后再将解码规则解析最后再进行解码,和数据库的来回交互读取解析效率较低,并且需要提供额外的数据库服务器资源。技术实现要素:5.本发明所解决的技术问题在于提供一种文档结构描述转换方法、装置及存储介质,将文档结构描述形成实体,通过对实体进行编码,解决现有技术中要通过数据库来回交互读取,解析效率低的问题。6.本发明提供的基础方案:一种文档结构描述转换方法,包括:7.由构件输入层通过xstream读取输入的文档结构描述xsd文件内,并将文档结构描述文件以字节流的方式读取到内存中;8.由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构;9.由构件转换层根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;10.由构件输出层将实体结构按字节流形式输出存储至数据库。11.本发明的原理及优点在于:在现有技术的xsd文件解码中,首先获取xsd文件格式信息,调取数据库中与该文件格式信息匹配的预设解码程序,通过该预设解码程序进行解码,虽然能够避免手工解码,但是因其首先需要和数据库进行交互,在数据库中查找匹配的解码规则后再将解码规则解析最后再进行解码,和数据库的来回交互读取解析效率较低,并且需要提供额外的数据库服务器资源。12.因此,为解决现有技术中所述的相关问题,本技术的一种文档结构描述转换方法,首先由构件输入层通过xstream读取输入的文档结构描述xsd文件内,通过xstream不需要进行映射,节省读取资源,读取完成后并将文档结构描述文件以字节流的方式读取到内存中,内存相对数据库来说读写效率大大提高;接着由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构,通过构件解析层从内存中读取字节流并解析,解析时是对文档结构描述文件的元素直接解析,相较于现有技术需要从数据库中查找匹配的解码规则来说,不需要占用数据库的服务器资源,接着由构件转换层根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构,最后由构件输出层将实体结构按字节流形式输出存储至数据库。13.因此,本技术的优点在于,通过xstream将文档结构描述文件按照字节流的方式读取至内存中,再从内存中进行解析,不会过多占用数据库的服务器资源,同时解析效率大大提高。14.进一步,所述文档结构描述文件中的元素包括annotation、complexcontent、complextype、element、extension、restriction、sequence、simpletype。15.有益效果:annotation、complexcontent、complextype、element、extension、restriction、sequence、simpletype都是文档结构描述文件中涉及的相关元素类。16.进一步,由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构包括:17.通过解析包获取内存中xsd文件字节流的每个标签,并实例化对应的对象;18.按照字节流顺序加载形成dom树。19.有益效果:将文档结构描述文件的元素通过dom4j进行解析,加载成树结构,便于后续构件转换层组装成实体类结构。20.进一步,所述由构件输入层通过xstream读取输入的文档结构描述xsd文件内,并将文档结构描述文件以字节流的方式读取到内存中还包括:将内存中保存的文档结构描述文件的字节流同时存储进数据库中,匹配数据库中存储的实体类结构,并判断是否需要生成实体类结构。21.有益效果:通过与数据库中的实体类结构进行匹配相似度,即使不完全相同,也可以直接进行解码,节省解析资源。22.进一步,所述将内存中保存的文档结构描述文件的字节流同时存储进数据库中,并匹配数据库中存储的实体类结构具体为:根据预设的相似度阈值比对数据库中存储的实体结构的子元素的属性、数据类型以及语义,若达到相似度阈值则直接使用数据库中存储的实体类结构进行解码,反之则传输至构件解析层。23.有益效果:在构件输入层读取新的xsd文件时就将其存储到数据库中,在构件解析前首先读取数据库中是否存在相似度较高的实体类结构,存在时就按照相同的解码规则直接进行解码,不需要再重复进行构件解析和转换,节省内存资源。24.一种文档结构描述转换装置,包括:25.构件输入模块:用于通过xstream读取输入的文档结构描述xsd文件,并将文档结构描述文件以字节流的方式读取到内存中;26.构件解析模块:用于通过dom4j进行解析,读取内存中存储的文档结构描述文件,并进行解析;27.构件转换模块:用于根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;28.构件输出模块:用于将实体结构按字节流形式输出存储至数据库。29.本发明的原理及优点在于:在现有技术的xsd文件解码中,首先获取xsd文件格式信息,调取数据库中与该文件格式信息匹配的预设解码程序,通过该预设解码程序进行解码,虽然能够避免手工解码,但是因其首先需要和数据库进行交互,在数据库中查找匹配的解码规则后再将解码规则解析最后再进行解码,和数据库的来回交互读取解析效率较低,并且需要提供额外的数据库服务器资源。30.因此,为解决现有技术中所述的相关问题,本技术的一种文档结构描述转换装置,首先由构件输入模块通过xstream读取输入的文档结构描述xsd文件内,通过xstream不需要进行映射,节省读取资源,读取完成后并将文档结构描述文件以字节流的方式读取到内存中,内存相对数据库来说读写效率大大提高;接着由构件解析模块通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构,通过构件解析模块从内存中读取字节流并解析,解析时是对文档结构描述文件的元素直接解析,相较于现有技术需要从数据库中查找匹配的解码规则来说,不需要占用数据库的服务器资源,接着由构件转换模块根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构,最后由构件输出模块将实体结构按字节流形式输出存储至数据库。31.因此,本技术的优点在于,通过xstream将文档结构描述文件按照字节流的方式读取至内存中,再从内存中进行解析,不会过多占用数据库的服务器资源,同时解析效率大大提高。32.进一步,所述构件解析模块包括解析单元以及加载单元,所述解析单元用于通过解析包获取内存中xsd文件字节流的每个标签,并实例化对应的对象;所述加载单元用于按照字节流顺序加载形成dom树。33.有益效果:将文档结构描述文件的元素通过dom4j进行解析,加载成树结构,便于后续构件转换模块组装成实体类结构。34.进一步,所述构件输入模块包括构件判断模块,所述构件判断模块用于将内存中保存的文档结构描述文件的字节流同时存储进数据库中,匹配数据库中存储的实体类结构,并判断是否需要生成实体类结构。35.有益效果:通过与数据库中的实体类结构进行匹配相似度,即使不完全相同,也可以直接进行解码,节省解析资源。36.进一步,所述构件判断模块包括构件比对单元,所述构件比对单元用于根据预设的相似度阈值比对数据库中存储的实体结构的子元素的属性、数据类型以及语义,若达到相似度阈值则直接使用数据库中存储的实体类结构进行解码,反之则传输至构件解析层。37.有益效果:在构件输入层读取新的xsd文件时就将其存储到数据库中,在构件解析前首先读取数据库中是否存在相似度较高的实体类结构,存在时就按照相同的解码规则直接进行解码,不需要再重复进行构件解析和转换,节省内存资源。38.一种文档结构描述转换存储介质,所述存储介质存储有文档结构描述转换程序,所述文档结构描述转换程序被处理器执行时实现上述所述的一种文档结构描述转换方法。附图说明39.图1为本发明实施例的流程框图;40.图2为本发明实施例的功能框图。具体实施方式41.下面通过具体实施方式进一步详细说明:42.实施例基本如图1所示:一种文档结构描述转换方法,包括:43.步骤一:由构件输入层通过xstream读取输入的文档结构描述xsd文件内,并将文档结构描述文件以字节流的方式读取到内存中;文档结构描述文件中的元素包括annotation、complexcontent、complextype、element、extension、restriction、sequence、simpletype。44.在本实施例中,通过xstream不需要进行映射,节省读取资源,读取完成后并将文档结构描述文件以字节流的方式读取到内存中,内存相对数据库来说读写效率大大提高。45.在步骤一中,还包括将内存中保存的文档结构描述文件的字节流同时存储进数据库中,匹配数据库中存储的实体类结构,并判断是否需要生成实体类结构,具体为:根据预设的相似度阈值比对数据库中存储的实体结构的子元素的属性、数据类型以及语义,若达到相似度阈值则直接使用数据库中存储的实体类结构进行解码,反之则传输至构件解析层;46.在本实施例中,所设的相似度阈值根据实体类结构内的每个标签的相似度判断,相似度阈值为95%,例如,标签为“heading”的语义与标签为“tittle”语义相同,因此其相似度上浮,每个标签按照其重要性划分相似度上浮的权重,可根据用户自行设定,以此类推,若相似度达到95%,则将其视为同类型实体类结构。47.步骤二:由构件解析层通过dom4j进行解析,读取内存中存储的文档结构描述文件,并将文档结构描述文件中的元素按照字节流顺序进行加载形成dom树结构;具体为:48.通过解析包获取内存中xsd文件字节流的每个标签,并实例化对应的对象;49.按照字节流顺序加载形成dom树。50.在本实施例中,解析包为document.getelementbyid和document.body。51.步骤三:由构件转换层根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;52.步骤四:由构件输出层将实体结构按字节流形式输出存储至数据库。53.具体实施方式:以一个名为“note.xsd”文件为例,“note.xsd”文件的详细文本内容通过xstream读取生成的字节流为:“george”、“john”、“reminder”以及“don’t forget the meeting”,xsd文件中的元素包括complextype和sequence,通过dom4j对其进行解析,解析后的标签包括《to》、《from》、《herding》、以及《body》,将其实例化对象,并将字节流按照顺序加载成dom树结构即可。54.如图2所示,在本实施例的另一实施例中,还包括一种文档结构描述转换装置,包括:55.构件输入模块:用于通过xstream读取输入的文档结构描述xsd文件,并将文档结构描述文件以字节流的方式读取到内存中;文档结构描述文件中的元素包括annotation、complexcontent、complextype、element、extension、restriction、sequence、simpletype;构件输入模块包括构件判断模块,构件判断模块用于将内存中保存的文档结构描述文件的字节流同时存储进数据库中,匹配数据库中存储的实体类结构,并判断是否需要生成实体类结构;构件判断模块包括构件比对单元,构件比对单元用于根据预设的相似度阈值比对数据库中存储的实体结构的子元素的属性、数据类型以及语义,若达到相似度阈值则直接使用数据库中存储的实体类结构进行解码,反之则传输至构件解析层。56.构件解析模块:用于通过dom4j进行解析,读取内存中存储的文档结构描述文件,并进行解析;构件解析模块包括解析单元以及加载单元,解析单元用于通过解析包获取内存中xsd文件字节流的每个标签,并实例化对应的对象;加载单元用于按照字节流顺序加载形成dom树。57.构件转换模块:用于根据dom树结构的元素解析出的构件,按照层次进行组装,形成实体类结构;58.构件输出模块:用于将实体结构按字节流形式输出存储至数据库,构件输出模块还包括构件比对单元,构件比对单元用于比对数据库中存储的实体结构的子元素的属性、数据类型以及语义,并根据预设的相似度阈值删除实体类结构。59.在本实施例的另一实施例中,还包括一种文档结构描述转换存储介质,所述存储介质存储有文档结构描述转换程序,所述文档结构描述转换程序被处理器执行时实现上述的一种文档结构描述转换方法。60.以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本技术给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本技术的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本技术要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种文档结构描述转换方法、装置及存储介质与流程
作者:admin
2022-07-30 18:40:34
571
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术
- 下一篇: 一种高纯铜系靶材的焊接方法与流程
- 上一篇: 一种车辆的视觉测距方法、装置及存储介质与流程