计算;推算;计数设备的制造及其应用技术1.本公开涉及数据分析技术领域,尤其涉及一种基于大规模语料的新兴技术识别方法和装置。背景技术:2.技术现状识别与感知动态一直是技术预测领域理论和实践研究的重要内容。随着技术演变加速和知识体系复杂性的提升,从涌现的技术热点中快速识别出具有较大发展潜力的新兴技术难度提升。新兴技术是建立在科学基础上的创新性技术,具备新颖性、快速增长性、不确定性等特性,可能存在创立一个新行业或改变某个老行业的潜力,对新兴技术进行识别和评估对发展战略制定和技术迭代更新具关键意义。3.当前,复杂、多变的技术环境对潜在新兴技术预测研究提出了更高要求。面对技术垄断化、技术国界化等当前国际环境,国内知识密集型企业及政府部门能否有效识别技术机会、突破技术壁垒将直接影响企业、产业及整个国家的技术创新竞争力。面对世界经济增长持续放缓,创新是新一轮科技革命中重要策略,是重要的经济增长发动机。把握好全球科技发展趋势,动态评估全球新兴技术,是建设世界科技强国,抓住科技创新的突破口。在谋划国家科技战略布局的过程中紧随科技领域前沿、探测新兴研究发展防线公式制定发展政策、引领科研方向的重要科学依据。从国家层面来讲,加强新兴技术识别有助于整体科研布局优化以及做好长期规划;从企业层面来讲,加强新兴技术识别有助于确定研发重点、投资方向以及降低投资风险。4.国内外已有众多学者开展了新兴技术识别、预测的方法探索。初期的研究与探索多聚焦新兴技术的概念与定义。例如乔治·戴,保罗·休梅克·沃顿.《论新兴技术管理》[m].(石莹,译.北京:华夏出版社,2002.)使新兴技术受到了广泛的关注,相关学者将新兴技术定义为一种基于科学的创新,有可能建立新的行业或改造现有行业的技术。现有技术中有从新颖性(novelty)、持续性(persistence)、社会关注度(community)、成长性(growth)4个维度定义了新兴技术的特征属性;也有从极具新颖性(radical novelty)、快速成长性(relatively fast growth)、一致性(coherence)、突出影响力(prominent impact)、不确定性(uncertainty ambiguity)5个新兴技术的特征属性,将新兴技术定义为科学研究过程中产生的短时间内能够聚集大量资源且成长速度较快,具有影响未来经济和社会发展潜力的创新技术。面向新兴技术的理论研究从技术演化的角度进行剖析,为进一步开展技术识别和预测奠定了基础。[0005]随着文献计量学和人工智能的发展,基于大数据构建科学、有效的技术评估与预测模型,有助于提升技术创新管理能力。近几年,将科学评估研究经典理论与新一代信息技术相结合的新兴技术挖掘成果不断涌现。现有技术中的新兴技术挖掘成果例如包括使用在线媒体wikipedia预测新兴趋势,研究与新兴hadoop市场相关的技术趋势和生命周期;对可再生能源领域多个在线社区数据进行文本挖掘,通过分析社区成员的讨论内容预测该领域的未来发展趋势;提出确定技术出现的关键属性,即新颖性、持久性、成长性和关注度为新兴技术的概念辨析和预测角度提供了参考,但该方法对关键术语进行“一视同仁”的处理方法,没有考虑到出版物权威度的影响(顶级期刊和顶级会议上的文献应该具有更高的权重),同时,研究缺乏针对专利数据的分析;黄璐朱一鹤,张嶷.《基于加权网络链路预测的新兴技术主题识别研究》([j].情报学报,2019,38(4):335-341)提出了基于加权网络链路预测的新兴话题识别方法,并从技术新颖性和技术影响力两个角度入手识别出新兴技术,该方法只是针对专利数据进行评估,在分析维度方面只考虑了技术的新颖性和影响力,而没有衡量其成长性和持久性。同时,当前在新兴技术评估领域,研究者多聚焦于单一数据源,深度融合多源数据的研究仍较为少见。[0006]另外在科技评估相关工作中,存在一个现象:科研工作者在撰写论文和专利时不可避免需要引用经典技术,这就会导致经典技术一直有很高的引用频率。这也会导致在候选术语中经典技术通常处于top10中,很大概率上将长期占据新兴技术榜单前列。另一方面,当前通用的领域划分方法更偏向于宏观分类,对于大领域中细粒度的研究方向获取不足(例如计算机科学领域最多可以细分到ai,但是ai在目前又是可以细分到自然语言处理nlp和计算机视觉cv两大类)。通常热门的领域会出现很多相似的候选术语,就这就导致传统的依据于词频的方法会使得结果初选候选技术扎堆的现象,候选技术的多样性不够,存在大量的冗余和重复。综上已有的新兴技术识别方法的技术识别结果的精准度有待提高。技术实现要素:[0007]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。[0008]为此,本公开的第一个目的在于提出一种基于大规模语料的新兴技术识别方法,以提高新兴技术识别的准确度。[0009]本公开的第二个目的在于提出一种基于大规模语料的新兴技术识别装置。[0010]本公开的第三个目的在于提出一种电子设备。[0011]为达上述目的,本公开第一方面实施例提出了一种基于大规模语料的新兴技术识别方法,包括:[0012]确定研究领域,构建所述研究领域的候选文献集,并对所述候选文献集进行关键词提取,以获得候选关键词数据集;[0013]根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集;[0014]计算所述候选关键词过滤集中各关键词的新兴分数值;[0015]基于所述各关键词的新兴分数值和设定的新兴分数阈值对所述候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;[0016]采用动态回溯法对所述候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。[0017]本公开实施例的方法,确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算候选关键词过滤集中各关键词的新兴分数值;基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。在这种情况下,利用候选文献集中候选文献数量、关键词的相关信息、各关键词的新兴分数值、设定的新兴分数阈值对关键词进行筛选,并采用动态回溯法对筛选后的关键词进行处理,降低了关键词集合中传统技术关键词的霸榜问题,从而提高了新兴技术识别准确度。[0018]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:确定研究时间范围,基于所述研究时间范围确定基础期、近期和活跃期;计算所述候选关键词数据集中的各关键词分别在所述活跃期的第一出现次数;计算所述候选关键词数据集中的各关键词分别在所述基础期的第二出现次数,基于各关键词的所述第一出现次数和所述第二出现次数,确定各关键词的第一评估比值;计算所述候选关键词数据集中的各关键词分别被使用的机构数量;基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集。[0019]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:基于所述候选文献数量确定第一活跃阈值和第二活跃阈值,并计算所述活跃期时所有关键词的第三出现次数和所述基础期时所有关键词的第四出现次数,基于所述第三出现次数和所述第四出现次数获得第二评估比值,基于所述第二评估比值和所述第二活跃阈值获得评估阈值;将所述第一出现次数小于所述第一活跃阈值的关键词、所述第一评估比值小于所述评估阈值的关键词和所述机构数量小于预设数量阈值的关键词进行滤除,从而获得候选关键词过滤集。[0020]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述计算所述候选关键词过滤集中各关键词的新兴分数值,包括:计算所述候选关键词过滤集中的各关键词分别在所述近期的第一变化趋势;计算所述候选关键词过滤集中的各关键词分别在所述活跃期的第二变化趋势;计算所述候选关键词过滤集中的各关键词分别在所述研究时间范围的第三变化趋势;设置质量参数,基于所述质量参数、所述第一变化趋势、所述第二变化趋势和所述第三变化趋势,获得各关键词的新兴分数值。[0021]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述设置质量参数,包括:确定所述候选关键词过滤集中各关键词所在候选文献对应的发布期刊和发布机构;基于所述发布期刊的期刊影响力平均值和所述发布机构的研究机构排名平均值获得所述质量参数。[0022]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述采用动态回溯法对所述候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集,包括:基于不同的研究领域设置对应的年份回溯参数和次序下调参数;选择所述候选文献集所属的研究领域对应的年份回溯参数和次序下调参数,利用动态回溯法对所述候选新兴技术关键词数据集进行降序操作,获得目标新兴技术关键词数据集。[0023]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,利用最大边界相关算法对所述目标新兴技术关键词数据集进行优化处理。[0024]在本公开第一方面实施例的一种基于大规模语料的新兴技术识别方法中,所述对所述候选文献集进行关键词提取,以获得候选关键词数据集,包括:采用自动短语挖掘算法和词频-逆文档频率算法对所述候选文献集进行关键词提取,以获得候选关键词数据集。[0025]为达上述目的,本公开第二方面实施例提出了一种基于大规模语料的新兴技术识别装置,包括:[0026]获取模块,用于确定研究领域,构建所述研究领域的候选文献集,并对所述候选文献集进行关键词提取,以获得候选关键词数据集;[0027]过滤模块,用于根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集;[0028]计算模块,用于计算所述候选关键词过滤集中各关键词的新兴分数值;[0029]筛选模块,用于基于所述各关键词的新兴分数值和设定的新兴分数阈值对所述候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;[0030]处理模块,用于采用动态回溯法对所述候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。[0031]本公开实施例的装置,获取模块确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;过滤模块根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算模块计算候选关键词过滤集中各关键词的新兴分数值;筛选模块基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;处理模块采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。在这种情况下,利用候选文献集中候选文献数量、关键词的相关信息、各关键词的新兴分数值、设定的新兴分数阈值对关键词进行筛选,并采用动态回溯法对筛选后的关键词进行处理,降低了关键词集合中传统技术关键词的霸榜问题,从而提高了新兴技术识别准确度。[0032]为达上述目的,本公开第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面实施例的基于大规模语料的新兴技术识别方法。[0033]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。附图说明[0034]本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:[0035]图1为本公开实施例所提供的一种基于大规模语料的新兴技术识别方法的流程示意图;[0036]图2为本公开实施例所提供的基础期、近期和活跃期的划分示意图;[0037]图3为本公开实施例提供的一种基于大规模语料的新兴技术识别装置的结构示意图;[0038]图4为本公开实施例提供的一种电子设备的结构示意图。具体实施方式[0039]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开实施例的一些方面相一致的装置和方法的例子。[0040]在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。[0041]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。还应当理解,本公开中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。[0042]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。[0043]图1为本公开实施例所提供的一种基于大规模语料的新兴技术识别方法的流程示意图。如图1所示,该基于大规模语料的新兴技术识别方法包括以下步骤:[0044]步骤s101,确定研究领域,构建研究领域的候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集。[0045]在步骤s101中,研究领域至少有一个,针对各研究领域,从大规模语料中获取对应研究领域的候选文献构建对应的候选文献集。其中候选文献集包括多个候选文献,多个候选文献可以包括论文文献和专利数据等不同类型的技术文献。关键词也可以称为术语,候选关键词数据集包括论文文献的术语和专利数据的术语。[0046]在步骤s101中,对候选文献集进行关键词提取,以获得候选关键词数据集,包括:采用自动短语挖掘算法和词频-逆文档频率算法对候选文献集进行关键词提取,以获得候选关键词数据集。由此,采用改进的autophrase(自动短语挖掘算法)和tf-idf(term frequency-inverse document frequency,词频-逆文档频率算法)相结合的关键词预处理方式对专利数据和论文文献的关键词进行处理,构建候选关键词数据集,为后续新兴技术评估提供了重要的基础和依据。另外相较现有方法中的关键词而言,将论文文献和专利数据相结合得到的候选关键词数据集,具有更加全面的数据源,使得后续开展新兴技术的发现与识别的评价结果更为可信(即准确度更高)。[0047]具体地,对候选文献集进行关键词提取统计包括专利数据的术语抽取和论文文献的术语抽取,其中针对专利数据的术语抽取:由于专利数据中本身并不提供关键词,步骤s101中采用业界广泛使用的autophrase进行专利数据的关键词提取,autophrase是知识挖掘专家韩家炜团队2018年在国际顶级期刊tkde(ieee transactions on knowledge and data engineering,ieee知识与数据工程汇刊)上面发表的关键词抽取算法;对于抽取到的关键词还需要采用tf-idf进行初步过滤,另外以英文术语为例,考虑到术语的词性构成通常是名词和形容词的组合,术语长度通常为1-3个单词组成,因此还可以对初步过滤后的结果首先筛选出词组长度在1-3的关键词,然后进行词性匹配过滤后得到的结果作为专利数据的候选术语,由此,通过词性匹配和词组长度的预处理方式对关键词进行初步过滤,能够确保抽取结果的可靠性。[0048]针对论文文献的术语抽取:为了有效避免常用词对关键词的影响,提高了关键词与文章之间的相关性为了避免常用词影响指标计算,步骤s101中可以采用tf-idf对论文文献的术语进行抽取,其中tf-idf是一种针对关键词的统计分析方法,用于评估一个词对一个文件集或者一个语料库的重要程度,一个词的重要程度跟它在文章中出现的次数成正比,跟它在语料库出现的次数成反比。采用tf-idf抽取时主要是计算术语的idf值,将idf值低于预设值(预设值例如为1)的术语都过滤掉,并将剩余的术语当作论文文献的术语。另外,由于论文文献中也自带关键词,这些关键词能够全面、准确的反映文献主题,可以将自带关键词和通过tf-idf过滤后的关键词一并作为论文文献的关键词。[0049]在一些实施例中,步骤s101中的各研究领域对应的候选文献集,可以从web of scinence(科学网)和uspto(united states patent and trademark office,美国专利商标局)中获取。具体地,确定研究领域和研究时间范围,从web of scinence和uspto中收集对应研究领域和研究时间范围的专利数据和论文文献,组成候选文献集d,从候选文献集d中经过预处理后,采用autophrase抽取专利数据的术语,并将tf-idf筛选结果和关键词相结合获得论文文献的术语,从而得到候选关键词数据集。[0050]在本实施例中,研究领域可以涉及各个领域,研究时间范围可以根据需要进行动态的调整。由此,本公开的方法具有领域和时间尺度的自适应性,能够对全领域、任意时间段新兴术语进行抽取、评估和筛选。[0051]在一些实施例中,研究领域例如可以是计算机科学领域(computer science),该研究领域对应的分类号为g06。在另一些实施例中,基于调研结论可知,研究时间范围的取值可以为十年。例如可以选择2011-2020年,则首先在web of science上下载2011-2020年的论文文献,然后在uspto中检索分类号为g06的2011-2020年间的专利数据并下载,利用下载的专利数据和论文文献组成候选文献集d。[0052]在一些实施例中,可以按照年份对候选关键词数据集中的术语进行排列,并对各术语的次数等进行统计计数。[0053]在一些实施例中,若术语为英文,为了减少单词格式不统一问题,可以将单词统一成小写来降低单词重复度问题(即减小语义重复问题)。[0054]步骤s102,根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集。[0055]在步骤s102中,根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集,包括:确定研究时间范围,基于研究时间范围确定基础期、近期和活跃期;计算候选关键词数据集中的各关键词分别在活跃期的第一出现次数;计算候选关键词数据集中的各关键词分别在基础期的第二出现次数,基于各关键词的第一出现次数和第二出现次数,确定各关键词的第一评估比值;计算候选关键词数据集中的各关键词分别被使用的机构数量;基于第一出现次数、第一评估比值、机构数量和候选文献数量,对候选关键词数据集进行过滤,得到候选关键词过滤集。[0056]在步骤s102中,候选关键词数据集的研究时间范围即为候选文献集中候选文献的研究时间范围,研究时间范围为一个时间段,可以用符号t表示。图2为本公开实施例所提供的基础期、近期和活跃期的划分示意图。如图2所示,可以将时间段t进行划分,分别得到基础期a、活跃期b和近期c,其中基础期a为时间段t中最开始30%的时间;活跃期b为时间段t中最近的70%的时间;近期c为时间段t中最近的40%的时间。活跃期b包括近期c,基础期a和活跃期b组成整个时间段t。如用时间t表示,基础期a对应的时间t(即第t年)的范围为0.1t-0.3t,活跃期b对应的时间t的范围为0.4t-t和近期c对应的时间t的范围为0.7t-t。时间段t和时间t一般以年为单位。若研究时间范围t为10年,则基础期a为3年(即第一年到第三年),活跃期b为7年(即第四年到第十年),近期c为4年(即第七年到第十年)。若研究时间范围选择2011-2020年,则基础期为2011-2013年,活跃期为2014-2020年,近期为2017-2020年。在这种情况下,由于较短的时间段会产生噪音更大的结果(即对特定处理过于敏感),而更长的时期与寻求当前新兴技术的目标背道而驰,研究时间范围取10年时时间适中,有利于提高后续对新兴技术关键词的识别的准确性。[0057]划分三个时期后,还需要对各个时期的候选文献进行数量统计,例如活跃期的候选文献数量可以用符号nactive表示,近期的候选文献数量可以用符号nrecent表示。[0058]在步骤s102中,基于第一出现次数、第一评估比值、机构数量和候选文献数量,对候选关键词数据集进行过滤,得到候选关键词过滤集,包括:基于候选文献数量确定第一活跃阈值和第二活跃阈值,并计算活跃期时所有关键词的第三出现次数和基础期时所有关键词的第四出现次数,基于第三出现次数和第四出现次数获得第二评估比值,基于第二评估比值和第二活跃阈值获得评估阈值;将第一出现次数小于第一活跃阈值的关键词、第一评估比值小于评估阈值的关键词和机构数量小于预设数量阈值的关键词进行滤除,从而获得候选关键词过滤集。[0059]在步骤s102中,上述基于第一出现次数、第一评估比值、机构数量和候选文献数量,对候选关键词数据集进行过滤,主要从技术持久性、成长性和关注度三个维度进行评估,从而获得候选关键词过滤集。[0060]具体地,对于技术持久性而言,主要通过候选关键词数据集中的各关键词分别在活跃期的第一出现次数和第一活跃阈值进行评估。由于持久性的基本思想是术语在时间段t内出现的次数越多,表明这个术语在时间段t的活跃度很好。若每个术语用符号i表示,则在时间t时该术语的出现次数用符号nit表示,在时间t时所有术语的出现次数用符号nt表示。对于每一个术语i,计算该术语在每年出现的次数,然后计算该关键词(即该术语)在活跃期的第一出现次数,并结合第一活跃阈值判断该术语的持久性是否满足要求,其中第一活跃阈值基于活跃期的候选文献数量确定。若该关键词在活跃期的第一出现次数大于或等于第一活跃阈值,则该关键词满足持久性指标,保留该关键词并进行成长性指标的判断,否则该关键词不满足持久性指标,删除该关键词。即评估技术持久性需要满足:[0061][0062]其中,术语i的第一出现次数为第一活跃阈值可以由7×nactive÷100000获得,由于不同领域的候选文献的发表数量有差异,故本实施例中的第一活跃阈值可以根据所选研究领域的活跃期的候选文献数量总数来进行动态调整。由此,能够实现针对不同的研究领域的术语的评估指标的阈值自动匹配适应。例如在计算机科学领域,研究时间范围为10年,由于该研究领域的每年论文文献和专利数据的数量很多,故设置的第一活跃阈值例如为14,即[0063]对于成长性而言,主要通过第一评估值和评估阈值进行评估。由于成长性一般考虑两种增长。一种是绝对增长,其通过包含新兴技术术语的平均记录数来衡量;另一种是相对增长,其通过总数据集中包含新兴术语的记录的占比来衡量。相对增长较高的术语比其他术语占更大的比例;此外,将相对增长较高的术语作为真正感兴趣的新兴技术更有前途和价值。对于每一个术语i(即关键词i),判断该术语在基础期和活跃期间的增速是否大于或等于对应时期的所有术语的增速的一个动态倍数值,若大于或等于则该关键词满足成长性指标,保留该关键词并进行关注度指标的判断,否则该关键词不满足成长性指标,删除该关键词。其中,基础期和活跃期间的增速指的是活跃期的出现次数与基础期的出现次数的比值。即评估成长性需要满足:[0064][0065]其中,关键词i的第二出现次数为所有关键词的第三出现次数为所有关键词的第四出现次数为基于第三出现次数和第四出现次数得到评估比值。β表示第二活跃阈值,关键词i的第一评估值由获得,评估阈值由获得。[0066]在一些实施例中,根据统计经验,第二活跃阈值β的基本值可以设置为1.5。具体地第二活跃阈值满足β=1.5×nactive÷100000。通过第二活跃阈值可以体现不同时间、不同研究领域活跃程度(即领域繁荣度)。由于不同领域的候选文献的发表数量有差异,故本实施例中的第二活跃阈值可以根据所选研究领域的活跃期的候选文献数量总数来进行动态调整。由此,能够实现针对不同的研究领域的术语的评估指标的阈值自动匹配适应。例如在计算机科学领域,第一活跃阈值为14时,对应的第二活跃阈值为3。对于关注度而言,主要是判断术语是不是很流行,是不是被多个机构认可,考虑到采用社区网络的广度作为标准对待新兴技术话题,因为随着网络覆盖更多的用户,网络变得更有价值。网络效应是新兴技术的一个特征,这意味着新兴技术的价值随着参与其学者数量的增加而增加,社区可以被视为一个网络。与特定技术相关的网络拓展预示着未来的活动和进一步发展。基本思想是确定的新兴研究比技术领域内的其他研究主题更具吸引力。因此可以通过机构数量和预设数量阈值进行关注度评估。其中,预设数量阈值为一个动态的阈值,该阈值的取值与研究领域有关。评估关注度需要,判断术语i被几个组织(即机构)使用过,首先需要先定义术语i是否被组织m使用,使用结果用ymi表示,即:[0067][0068]然后判断术语i的关注度是否满足要求,即:[0069][0070]其中,m为组织m的集合。考虑到即使是不同的领域,一个新兴技术的术语也应该被多个组织使用,因此可以将预设数量阈值设置为2,若某年的关键词的出现次数超过两万条,那么可以适当加大预设数量阈值,例如可以设置预设数量阈值为5。[0071]经过上述三个维度的过滤后的术语集合(即候选关键词过滤集)可以被初步认定是具有新兴度(即满足新兴术语的基本条件)的术语集合,然后对候选关键词过滤集中的术语进行评分,以筛选出该研究领域中代表当前最新兴热点的技术的候选新兴技术关键词数据集。[0072]步骤s103,计算候选关键词过滤集中各关键词的新兴分数值。[0073]在步骤s103中,计算候选关键词过滤集中各关键词的新兴分数值,包括:计算候选关键词过滤集中的各关键词分别在近期的第一变化趋势;计算候选关键词过滤集中的各关键词分别在活跃期的第二变化趋势;计算候选关键词过滤集中的各关键词分别在研究时间范围的第三变化趋势;设置质量参数,基于质量参数、第一变化趋势、第二变化趋势和第三变化趋势,获得各关键词的新兴分数值。由此,能够通过新兴分数值量化关键词的新兴度,以便达到高效准确计算对应领域的新兴技术的目的。[0074]在步骤s103中,关键词i的第一变化趋势具体是比较关键词i在近期的最近2年(即对应的时间t的范围为0.9t-t)和近期的前2年(即对应的时间t的范围为0.7t-0.8t)的变化,关键词i的第一变化趋势也可以称为关键词i的近期趋势分数(recent trendi),关键词i的第一变化趋势满足:[0075]在步骤s103中,关键词i的第二变化趋势具体是比较关键词i在活跃期的最近3年(即对应的时间t的范围为0.8t-t)到活跃期的前3年(即对应的时间t的范围为0.4t-0.6t)的变化,关键词i的第二变化趋势也可以称为关键词i的活跃期趋势分数(active trendi),关键词i的第二变化趋势满足:[0076]在步骤s103中,关键词i的第三变化趋势具体是整个时间段t的变化,第三变化趋势为平均变化趋势,可以通过斜率来体现。关键词i的第三变化趋势也可以称为关键词i的平均变化趋势分数(slopei)关键词i的第三变化趋势满足:其中,nit表示t的取值为t时关键词i的出现次数,ni0.7t表示t的取值为0.7t时关键词i的出现次数,nt表示t的取值为t时所有关键词的出现次数,n0.7t表示t的取值为0.7t时所有关键词的出现次数。例如针对2011-2020年的计算机科学领域时,第三变化趋势满足:[0077]在步骤s103中,计算新兴分数值时考虑到高质量期刊论文上的术语应该具有更高的置信度,因此还设置一个质量参数,该质量参数能够反映关键词所在文献的公布期刊的影响因子的平均值和所在文献的公布发布机构的研究机构排名平均值,通过该质量参数动态变化,能够充分体现高质量期刊上的技术具有更高的新兴技术代表性,同时也符合人们的认知,即高质量的机构所在的研究一般都是开创性研究。具体地,设置质量参数包括:确定候选关键词过滤集中各关键词所在候选文献对应的发布期刊和发布机构;基于发布期刊的期刊影响力平均值和发布机构的研究机构排名平均值获得质量参数。其中,关键词i的质量参数可以用αi表示。关键词i的质量参数αi满足:[0078]αi=2*发布期刊的期刊影响力平均值*发布机构的研究机构排名平均值[0079]其中发布机构的研究机构排名平均值例如可以为机构的qs(quacquarelli symonds,世界大学排名)排名的平均值。[0080]在步骤s103中,设置质量参数,基于质量参数、第一变化趋势、第二变化趋势和第三变化趋势,获得关键词i的新兴分数值(scorei),即[0081]scorei=αi×(activetrendi+recenttrendi+slopei)。[0082]在另一些实施例中,考虑到更需要关注活跃期趋势分数,故关键词i的新兴分数值(scorei)也可以满足:[0083]scorei=αi×activetrendi+recenttrendi+slopei。[0084]在步骤s103中,计算得到各关键词的新兴分数值后,还可以基于新兴分数值对候选关键词过滤集进行降序排列。[0085]步骤s104,基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集。[0086]在步骤s104中,经过观察各关键词的新兴分数值,发现各关键词的新兴分数值呈现近似正态分布且符合步骤s102中的三重筛选后仍有很多术语满足,所以还需要进一步筛选,筛选方式包括阈值筛选和排名筛选。[0087]在一些实施例中,对于阈值筛选而言,考虑不同研究领域的分数差距,设置对应的新兴分数阈值,将新兴分数值小于设定的新兴分数阈值的关键词去掉,剩下的关键词集合即为候选新兴技术关键词数据集。例如在计算机科学领域的新兴分数阈值可以为设置为10,即将满足scorei≥10的关键词保留,得到候选新兴技术关键词数据集。[0088]在另一些实施例中,对于排名筛选而言,考虑到不同研究领域的差距,对应的新兴分数阈值也差距很大,可以利用排列顺序对进行降序排列后的候选关键词过滤集进行筛选,例如以新兴分数值排名前20%作为评判标准,去除排名后于前20%,将新兴分数值排名前20%的关键词作为候选新兴技术关键词数据集。此时候选新兴技术关键词数据集也可以称为候选新兴技术关键词表。[0089]步骤s105,采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。[0090]在步骤s105中,采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集,包括:基于不同的研究领域设置对应的年份回溯参数和次序下调参数;选择候选文献集所属的研究领域对应的年份回溯参数和次序下调参数,利用动态回溯法对候选新兴技术关键词数据集进行降序操作,获得目标新兴技术关键词数据集。其中,年份回溯参数即为研究时间范围。[0091]其中,考虑到不同领域的实际情况差异(例如文献数量的差异),按照领域实际情况设置年份回溯参数t和次序下调参数z对术语的排名进行降序操作,从而降低经典技术对新兴技术的干扰。[0092]在一些实施例中,以候选新兴技术关键词表为对象,用x表示当年年份,t表示年份回溯参数(即研究时间范围,则x-t表示回溯年份,lx表示当前年份候选新兴技术关键词表,lx-t表示回溯年份候选新兴技术关键词表,z表示次序下调参数,则动态回溯法的具体实现算法如下:[0093]输入:x、t、z、当前年份候选新兴技术关键词表lx和回溯年份候选新兴技术关键词表lx-t;[0094]输出:当前年份调整后候选新兴技术关键词表lx;[0095]步骤1:按照降序遍历lx中的预设排名(例如top10)的关键词,判断该关键词是否出现在lx-t中,若是进入步骤2,反之进入步骤3;[0096]步骤2:将该关键词在现有词表中的排名次序下降z个名次后返回新的lx,再次执行步骤1进行判断;[0097]步骤3:将该关键词保留在lx中,再次执行步骤1,直到lx中所有新兴技术关键词均不存在于lx-t中,令lx=lx,得到当前年份调整后候选新兴技术关键词表lx。[0098]在步骤s105中,通过动态回溯法去除经典术语(即传统技术关键词),得到经典术语去除后的关键词列表,解决了传统技术关键词的霸榜问题(即传统技术关键词的关键词列表中排列考前的问题),为进一步的筛选和分析奠定基础。[0099]在一些实施例中,考虑到现在的术语存在大量的语义重复和冗余问题,这些问题会降低用户的使用体验,严重情况下会使得获取的目标新兴技术关键词数据集毫无意义,因此,基于大规模语料的新兴技术识别方法还包括:利用最大边界相关算法对目标新兴技术关键词数据集进行优化处理。优化处理具体是指:首先是将候选术语用simcse(simple contrastive learning of sentence embeddings,句子嵌入的简单对比学习算法)预训练模型进行向量嵌入,得到向量化表示,然后再使用mmr算法(maximal marginal relevance,最大边界相关算法)对目标新兴技术关键词数据集中的候选新兴术语(即目标新兴技术关键词)进行过滤,以提高目标新兴技术关键词数据集的多样性,提高用户的使用体验。由此,创新性地采用simcse词嵌入和最大边界相关算法对候选术语进行去重,解决了候选术语语义扎堆问题(即语义去重问题),进一步细化新兴术语,提高了新兴技术列表多样性。[0100]具体地,最大边界相关算法是用于计算查询文本和搜索文档之间的相似度,然后对搜索文档进行排序。算法公式为:[0101][0102]式中,q表示查询文本,c表示搜索文档集合,k为一个已经求得的以相关度为基础的初始集合,ck表示搜索文档集合c和初始集合k的总集合,ci表示总集合中的一个元素(即某个句子),cj表示初始集合k中的一个元素,λsim(ci,q)指的是总集合中的某个句子和查询文本的相似度,指的是总集合中的某个句子和初始集合k中的某个句子(即已经抽取的摘要句子)的相似度。λ是控制多样性的一个超参数。[0103]若将最大边界相关算法具体到新兴技术的术语多样性表达,即搜索文档集合c对应采用动态回溯法后得到的目标新兴技术关键词数据集,初始集合k对应是已经抽取的新兴术语集合,则句子ci对应术语i,句子cj对应术语j,可以令λ=0,将公式简化为:[0104][0105]考虑到bert(bidirectional encoder representations from transformers,基于transformer算法的双向编码表征算法)的文本嵌入向量表达不准确,故在进行mmr算法之前先采用普林斯顿大学的simcse对所有术语进行词嵌入,并取pooler_output最后一层做为其向量表达。是指术语i和术语j之间的相似度,这里采用余弦相似度来表示术语i和术语j的相似程度。[0106]在一些实施例中,mmr算法的流程如下:[0107]1)对所有候选术语(包括采用动态回溯法后得到的目标新兴技术关键词数据集和已经抽取的新兴术语集合中的所有术语)进行嵌入,并取pooler_output最后一层做为其向量表达,并将结果用[术语,对应向量]保存,做为输入,送到mmr算法中;[0108]2)初始时c表示采用动态回溯法后得到的目标新兴技术关键词数据集,k表示已经抽取的术语集合,初始时术语集合k为空;[0109]3)将第一个术语的相似度得分设置为1,并送入术语集合k中,并用[术语1,1]这种列表形式进行保存;[0110]4)对第二到最后一个术语做以下操作;[0111]5)对术语i进行mmr计算:将术语i和术语集合k中的术语进行余弦相似度计算,取最高相似度做为其相似度得分,以[术语i,相似度得分]形式保存。[0112]6)对所有候选术语计算完之后,设置一个阈值,对相似度得分低于阈值的进行过滤,由此,能够得到一个最大多样性的新兴技术术语列表。[0113]在一些实施例中,考虑到专利数据所蕴含的技术商业潜力,本公开的方法可以看作一种综合多源科技数据与人工智能算法的新兴技术快速评估方法,该方法通过识别模型进行新兴技术快速评估,给定一个时间范围后,该识别模型的输入是一个指定领域的多源异构数据,包括论文文献和专利数据,输出是该领域的新兴技术术语。另外考虑到不同领域文献数量的不同,故识别模型中评价阈值随着领域文献数量的动态变化而变化,由此,能够增强识别模型的适应性。[0114]本公开实施例提出的基于大规模语料的新兴技术识别方法,确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算候选关键词过滤集中各关键词的新兴分数值;基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。在这种情况下,利用候选文献集中候选文献数量、关键词的相关信息、各关键词的新兴分数值、设定的新兴分数阈值对关键词进行筛选,并采用动态回溯法对筛选后的关键词进行处理,降低了关键词集合中传统技术关键词的霸榜问题,从而提高了新兴技术识别准确度。本公开的方法将自然语言处理技术与科技评估理论相结合,以科技大数据为依据,首先构建新兴技术评估数据集,通过autophrase、tf-idf对论文文献和专利数据进行术语抽取;然后通过持久度、成长性和关注度“三维”标准(指标)对术语进行过滤,然后对过滤后的候选术语进行新兴分数量化计算,通过排序得到候选新兴技术关键词数据集;最后,采用动态回溯法对经典技术进行降低排名设置,来解决新兴技术中传统技术的霸榜问题,并采用simcse词嵌入和最大边界相关算法对新兴技术列表进行语义去重和多样化处理,以进一步优化新兴技术列表,提高了新兴技术列表多样性。[0115]为了验证上述基于大规模语料的新兴技术识别方法,以computer science领域为例进行了实验,具体过程如下:[0116](1)针对wos(web of science)中的领域为computer science的文章构建候选文献,进行计算出新兴术语。其中数据分布如表1。[0117]表12011年-2020年各年份候选文献数量[0118]年份领域数据量2011computer science1266982012computer science1328682013computer science1426912014computer science1682122015computer science1913572016computer science1959322017computer science2043262018computer science2090792019computer science2212032020computer science167651[0119]基于表1中这样一个大数量级的数据上验证本方法的效率。从结果上来看,只需要花费0.0001秒就可以得出所需的新兴技术术语集合。[0120](2)基于表1中的候选文献得到的候选新兴技术关键词数据集如表2。其中,表2的候选新兴技术关键词数据集中的术语为英文术语。[0121]表2候选新兴技术关键词数据集[0122][0123]从最近深度学习和人工智能的浪潮来看,本公开的方法能够很好的总结出近几年的新兴技术。另外结合高德纳公司发布的技术成熟度曲线,本公开中的术语iot(internet of things)、术语blockchain都符合高德纳的报告。另外从2018年bert发布以来,大规模预训练模型也开始流行起来。上图中的术语training、data models、deep learning、machine learning、optimization和mathematical model都很符合大规模预训练模型的特征。因此实验表明,本公开的方法可以很好的对一个领域进行新兴技术总结。另外本公开的方法还可以通过微信公众号的报道进一步佐证所得出的新兴术语的可靠性。[0124]本公开对2020年computer science领域的文献进行新兴技术评估。同时筛选出自2020年以来高被引的500篇文献里面的关键词进行词频统计分析,如表3所示的关键词对比表,基于表3可发现两者具有高度重合性。高被引论文证明该论文属于高质量论文,其关键词也是当前新兴热点技术,这从侧面佐证了本发明提出的新兴技术评估模型的有效性。[0125]表3关键词对比表[0126][0127][0128]综上,本公开依托相关装置对算法进行验证后证明,在例如8000万篇论文文献和5000万专利数据中实现了新兴技术快速、高效评估。该方法具备支持技术语义多样性和支持动态调整评价阈值,具备领域自适应特点,能够对指定时间范围内的论文、专利进行高效处理和识别(进行评估与分析),同时可以解决领域经典技术词霸榜。同时还解决了候选技术的多样性和冗余问题,提高了用户的使用体验。[0129]为了实现上述实施例,本公开还提出一种基于大规模语料的新兴技术识别装置。图3为本公开实施例提供的一种基于大规模语料的新兴技术识别装置的结构示意图。如图3所示,该基于大规模语料的新兴技术识别装置10包括获取模块11、过滤模块12、计算模块13、筛选模块14和处理模块15,其中:[0130]获取模块11,用于确定研究领域,构建研究领域的候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;[0131]过滤模块12,用于根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;[0132]计算模块13,用于计算候选关键词过滤集中各关键词的新兴分数值;[0133]筛选模块14,用于基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;[0134]处理模块15,用于采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。[0135]本公开实施例提出的基于大规模语料的新兴技术识别装置,获取模块确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;过滤模块根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算模块计算候选关键词过滤集中各关键词的新兴分数值;筛选模块基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;处理模块采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集。在这种情况下,利用候选文献集中候选文献数量、关键词的相关信息、各关键词的新兴分数值、设定的新兴分数阈值对关键词进行筛选,并采用动态回溯法对筛选后的关键词进行处理,降低了关键词集合中传统技术关键词的霸榜问题,从而提高了新兴技术识别准确度。[0136]需要说明的是,前述对基于大规模语料的新兴技术识别方法实施例的解释说明也适用于该实施例的基于大规模语料的新兴技术识别装置,此处不再赘述。[0137]根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。[0138]图4为本公开实施例提供的一种电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴电子设备和其它类似的计算装置。本公开所示的部件、部件的连接和关系、以及部件的功能仅仅作为示例,并且不意在限制本公开中描述的和/或者要求的本公开的实现。[0139]如图4所示,电子设备20包括计算单元21,其可以根据存储在只读存储器(rom)22中的计算机程序或者从存储单元28加载到随机存取存储器(ram)23中的计算机程序,来执行各种适当的动作和处理。在ram 23中,还可存储电子设备20操作所需的各种程序和数据。计算单元21、rom 22以及ram 23通过总线24彼此相连。输入/输出(i/o)接口25也连接至总线24。电子设备20中的多个部件连接至i/o接口25,包括:输入单元26,例如键盘、鼠标等;输出单元27,例如各种类型的显示器、扬声器等;存储单元28,例如磁盘、光盘等,存储单元28与计算单元21通信连接;以及通信单元29,例如网卡、调制解调器、无线通信收发机等。通信单元29允许电子设备20通过诸如因特网的计算机网络和/或各种电信网络与其他电子设备交换信息/数据。[0140]计算单元21可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元21的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元21执行上述所描述的各个方法和处理,例如执行基于大规模语料的新兴技术识别方法。例如,在一些实施例中,执行基于大规模语料的新兴技术识别方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元28。在一些实施例中,计算机程序的部分或者全部可以经由rom 22和/或通信单元29而被载入和/或安装到电子设备20上。当计算机程序加载到ram 23并由计算单元21执行时,可以执行上述描述的执行基于大规模语料的新兴技术识别方法的一个或多个步骤。备选地,在其他实施例中,计算单元21可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于大规模语料的新兴技术识别方法。[0141]本公开中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑电子设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。[0142]用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。[0143]在本公开中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或电子设备使用或与指令执行系统、装置或电子设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或电子设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存电子设备、磁储存电子设备、或上述内容的任何合适组合。[0144]为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。[0145]可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网和区块链网络。计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。[0146]应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本公开在此不进行限制。[0147]上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
基于大规模语料的新兴技术识别方法和装置
作者:admin
2022-08-31 15:18:19
711
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术
- 下一篇: 一种防误吸头部固定装置的制作方法
- 上一篇: 光伏热水器的加热处理方法、装置及存储介质与流程