发布信息

一种数据质检方法、装置、设备及存储介质与流程 专利技术说明

作者:admin      2023-06-29 07:37:10     204



计算;推算;计数设备的制造及其应用技术1.本发明涉及人工智能技术领域,特别涉及一种数据质检方法、装置、设备及存储介质。背景技术:2.人工智能技术主要包含3个要素:数据、算法、算力。在进行人工智能算法开发的过程中,数据集的质量是至关重要的,由于数据里面蕴含了很多知识,ai(artificial intelligence,人工智能)通过错误的数据会学习到错误的知识,通过正确的数据可以学习到正确的知识,因此如何提升数据的质量就是重中之重的问题。传统的提升数据质量的方法就是人工手动的对所有样本进行标注,然后进行抽样检查,大量的数据需要消耗大量的人力去做标注,且人工标注是存在误差的,抽样也只能随机检查部分数据的质量,并不能筛查出所有有问题的数据,因此难以对数据进行有效的质检。3.综上,如何筛查出所有有问题的数据,对这些数据进行重点处理,提升数据质量是目前有待解决的问题。技术实现要素:4.有鉴于此,本发明的目的在于提供一种数据质检方法、装置、设备及存储介质,能够筛查出所有有问题的数据,对这些数据进行重点处理,提升数据质量。其具体方案如下:5.第一方面,本技术公开了一种数据质检方法,包括:6.获取待质检样本数据;7.对所述待质检样本数据进行初始化标注,以得到初始化标签;8.利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;9.利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;10.根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。11.可选的,所述对所述待质检样本数据进行初始化标注,以得到初始化标签,包括:12.对所述待质检样本数据进行人工手动标注,以得到初始化标签;13.或,获取所述待质检样本数据的伪标签,以得到所述初始化标签;14.或,基于预设标注规则对所述待质检样本数据进行批量标注,以得到所述初始化标签。15.可选的,所述利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型,包括:16.对标注有所述初始化标签的所述待质检样本数据进行预处理,以得到预处理后数据;17.将所述预处理后数据划分为训练集和验证集;18.利用所述训练集对基于预设分类算法构建的模型进行训练,并利用所述验证集对训练后的模型进行验证,以得到目标质检模型。19.可选的,所述利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型,包括:20.将标注有所述初始化标签的所述待质检样本数据输入至基于预设分类算法构建的模型进行前向计算,以确定出误差值;21.基于所述误差值对所述基于预设分类算法构建的模型进行反向传播,以得到所述基于预设分类算法构建的模型的权重值;22.基于预设更新规则对所述权重值进行迭代更新以得到目标权重值;23.将所述目标权重值作为所述基于预设分类算法构建的模型的当前权重值,以得到目标质检模型。24.可选的,所述根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果之后,还包括:25.对所述错误数据重新标注标签,并根据重新标注后的标签更新与所述错误数据对应的初始化标签,以得到更新后标签;26.利用标注有所述更新后标签的所述待质检样本数据对所述目标质检模型进行训练,并将训练后的目标质检模型作为当前质检模型;27.重新执行所述利用所述目标质检模型输出所述待质检样本数据的置信度矩阵的步骤,以得到当前质检结果。28.可选的,所述利用所述目标质检模型确定出若干个待认证错误数据,包括:29.将所述待质检数据输入至所述目标质检模型,以通过所述目标质检模型输出预测结果;30.将所述初始化标签与所述预测结果进行对比,并筛选出所述初始化标签与所述预测结果不一致的若干个数据,以得到待认证错误数据。31.可选的,所述根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果之后,还包括:32.当所述当前质检结果中不存在所述错误数据时,根据当前的置信度矩阵确定出质检后样本数据的当前第一位置信度与当前第二位置信度之间的当前置信度差值;33.若所述当前置信度差值小于预设阈值,则重新对所述当前置信度差值小于所述预设阈值对应的质检后样本数据进行质检,以对所述质检后样本数据进行校验。34.第二方面,本技术公开了一种数据质检装置,包括:35.数据获取模块,用于获取待质检样本数据;36.数据标注模块,用于对所述待质检样本数据进行初始化标注,以得到初始化标签;37.模型训练模块,用于利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;38.置信度矩阵输出模块,用于利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;39.质检模块,用于根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。40.第三方面,本技术公开了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如前所述的数据质检方法。41.第四方面,本技术公开了一种计算机可读存储介质,用于存储计算机程序;其中所述计算机程序被处理器执行时实现如前所述的数据质检方法。42.本技术提供了一种数据质检方法,该方法包括:获取待质检样本数据;对所述待质检样本数据进行初始化标注,以得到初始化标签;利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。可见,对于待质检样本数据,提出一种基于人工智能的方法,首先利用标注有初始化标签的待质检样本数据训练出用于质检的质检模型,然后利用质检模型筛查出所有可能有问题的数据,输出其置信度矩阵。基于置信度矩阵对这些问题数据进行重点处理。进一步的,创新性的通过置信度差值的方式计算得到数据质量的错误程度,根据这个值可以对排查设定优先级,筛选出待认证错误数据中预设数量的错误数据,达到快速定位出有问题的数据。相对于传统的只能通过人工抽样的方式,既费时间也不容易做到全量筛查,该方案不仅能识别出所有有问题的数据,还对这些“问题数据”进行重点优先检查,从而极大的提升了数据质检的效率。43.此外,本技术提供的一种数据质检装置、设备及存储介质,与上述数据质检方法对应,效果同上。附图说明44.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。45.图1为本技术公开的一种数据质检方法流程图;46.图2为本技术公开的一种初始化标注得到初始化标签示意图;47.图3为本技术公开的一种模型训练示意图;48.图4为本技术公开的一种数据质检中间步骤示意图;49.图5为本技术公开的一种具体的数据质检方法流程图;50.图6为本技术公开的一种具体的模型训练示意图;51.图7为本技术公开的一种数据质检良性闭环循环示意图;52.图8为本技术公开的一种数据质检方法示意图;53.图9为本技术公开的一种数据质检装置结构示意图;54.图10为本技术公开的一种电子设备结构图。具体实施方式55.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。56.当前,传统的提升数据质量的方法就是人工手动的对所有样本进行标注,然后进行抽样检查,大量的数据需要消耗大量的人力去做标注,且人工标注是存在误差的,抽样也只能随机检查部分数据的质量,并不能筛查出所有有问题的数据,因此难以对数据进行有效的质检。57.为此,本技术提供了一种数据质检方案,能够筛查出所有有问题的数据,对这些数据进行重点处理,提升数据质量。58.本发明实施例公开了一种数据质检方法,参见图1所示,该方法包括:59.步骤s11:获取待质检样本数据。60.本技术实施例中,首先收集需要进行质检的样本数据。需要指出的是,样本数据之间的分类具有明确的定义,遵循各个分类对应的样本数据之间没有交集,没有上下级关系。61.步骤s12:对所述待质检样本数据进行初始化标注,以得到初始化标签。62.本技术实施例中,对待质检样本数据进行初始化标注。在第一种具体的实施方式中,对所述待质检样本数据进行人工手动标注,以得到初始化标签;通过该种方式标注效率低,但是准确率相对较高。在第二种具体的实施方式中,获取所述待质检样本数据的伪标签,以得到所述初始化标签;也即,如果待质检样本数据存在现有标签,则直接取数据集已有的伪标签,一般这种方式获得的标签准确率都比较低。在第三种具体的实施方式中,基于预设标注规则对所述待质检样本数据进行批量标注,以得到所述初始化标签;可以理解的是,针对不同的待质检样本数据存在各自的可以对其进行分类标注标签的规则,通过基于规则的方式对待质检样本数据进行初始批量化标注。虽然通过以上方式获得的标签不可能百分百准确,但是进行初始化标注的主要目的是得到一个初始化的标签,用于获取后续的质检模型的初始化版本,进而可以进行后续的迭代升级。其中,对待质检样本数据进行初始化标注的标注方式包括但不限于以上三种方式,也可以采用其他的标注标签的方式。63.如图2所示为确定出初始化标签的示意图,收集待质检样本数据后主要采用三种方式确定出初始化标签:通过人工标注、通过已有的伪标签以及通过基于规则的标签。64.步骤s13:利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型。65.申请实施例中,当对待质检样本数据进行初始化标注得到初始化标签后,将标注好的待质检样本数据进行预处理以得到预处理后数据,如对待质检样本数据进行数据清洗、将数据向量化等,如果待质检样本数据中含有文本信息,还可以对其进行分词等预处理。66.进一步的,将所述预处理后数据划分为训练集和验证集,利用所述训练集对基于预设分类算法构建的模型进行训练,这个分类算法可以是任意一种分类算法,可以是传统的机器学习模型,也可以是深度学习算法,喂入划分出来的训练集,进行前向计算确定出误差值;基于所述误差值对所述基于预设分类算法构建的模型进行反向传播得到权重值,然后根据预设更新规则对所述权重值进行迭代更新以得到目标权重值。可以理解的是,基于预设更新规则对权重值进行迭代更新时,可以在损失值趋于稳定而不再下降时停止训练,可以在模型连续迭代一定次数后的准确率不再提高时停止训练,也可以设置迭代更新的次数,在模型迭代更新的次数达到设定的值时停止训练,在此不作具体限定。67.可以理解的是,在利用训练集对基于预设分类算法构建的模型进行训练后并不知道该模型的表现如何,因此利用所述验证集对训练后的模型进行验证,同时通过调整超参数让模型处于最好的状态,最后将所述目标权重值作为所述基于预设分类算法构建的模型的当前权重值,以得到目标质检模型。如图3所示,将待质检样本数据对应的特征输入模型中,结合标注的初始化标签前向计算得到误差,反向传播更新权重值,经过不断的迭代训练得到第一个版本的算法模型权重值。68.步骤s14:利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵。69.可以理解的是,由于初始化标签不是百分百准确,因此基于人工智能的算法得到的质检模型在进行数据质检时的准确率也存在对样本分类错误的情况出现,此时,将不断更新得到的目标权重值作为目标质检模型的权重值,利用目标质检模型对待质检样本数据进行质检,通过输入的初始化标签和输出的预测结果进行对比,筛选出初始化标签与预测结果不一致的若干个数据,也即,待认证错误数据,同时输出所述待认证错误数据的置信度矩阵。70.如图4所示为通过质检模型筛选出待认证错误数据与置信度矩阵的示意图,将待质检样本数据作为特征与标注的初始化标签一起输入至质检模型中,确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵。71.步骤s15:根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。72.本技术实施例中,对质检模型输出的置信度矩阵进行统计分析,确定出待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,也即,对输出的置信度矩阵取top2进行相减。然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。如表一所示为一种所有样本数据输出的置信度矩阵,对待认证错误数据进行标记并将其筛选出来。例如,如果样本x1的输出应为type b,但是却输出type a,则将其筛选出来;同理,如果样本x2的输出应为type b,但是却输出type a,则将其筛选出来。然后根据置信度矩阵确定出第一位置信度和第二位置信度,样本x1的置信度前两个分类,其中分类a的置信度为0.6,分类b的置信度为0.3;样本x2的置信度前两个分类,其中分类a的置信度为0.75,分类b的置信度为0.25。将样本x1和x2各自的top2置信度进行相减,即得到x1相减后的值为0.6-0.3=0.3,x2相减后的值为0.75-0.25=0.5。可以理解的是,在用样本估计整体的时候,置信度是对所得结论的一个量化的概率评价,表示所得到的结论的“可信程度”,由于本技术实施例中的置信度矩阵是筛选出的待认证错误数据的置信度矩阵,因此top2置信度的差越大说明模型更“自信”的将样本分类错了,即这类样本对算法模型的学习有更大的负面影响,进而可以得出x2样本错误的程度更高。73.表一74.数据idtype atype btype ctype dtype e是否正确x10.60.30.030.030.04否x20.750.25000否x30.30.50.130.030.04是x40.450.250.10.150.05是x5………………x6………………x7………………75.进一步的,将所有的待质检样本数据的top2求置信度差值,并按照差值进行倒序排序,排名越靠前的,数值质量问题越严重,如此一来,该方案不仅能识别出有问题的数据,甚至创新性的通过置信度差值的方式计算得到数据质量的错误程度,根据这个值可以对排查设定优先级筛选出预设数量的错误数据,得到错误结果。这样就实现了通过人工智能的方式筛查出有问题的数据,再进行人工检查。76.本技术提供了一种数据质检方法,该方法包括:获取待质检样本数据;对所述待质检样本数据进行初始化标注,以得到初始化标签;利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。可见,对于待质检样本数据,提出一种基于人工智能的方法,首先利用标注有初始化标签的待质检样本数据训练出用于质检的质检模型,然后利用质检模型筛查出所有可能有问题的数据,输出其置信度矩阵。基于置信度矩阵对这些问题数据进行重点处理。进一步的,创新性的通过置信度差值的方式计算得到数据质量的错误程度,根据这个值可以对排查设定优先级,筛选出待认证错误数据中预设数量的错误数据,达到快速定位出有问题的数据。相对于传统的只能通过人工抽样的方式,既费时间也不容易做到全量筛查,该方案不仅能识别出所有有问题的数据,还对这些“问题数据”进行重点优先检查,从而极大的提升了数据质检的效率。77.本技术实施例公开了一种具体的数据质检方法,参见图5所示,该方法包括:78.步骤s21:对所述错误数据重新标注标签,并根据重新标注后的标签更新与所述错误数据对应的初始化标签,以得到更新后标签。79.本技术实施例中,根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果之后,重新对错误数据标注标签,然后更新初始化标签得到更新后标签。80.步骤s22:利用标注有所述更新后标签的所述待质检样本数据对所述目标质检模型进行训练,并将训练后的目标质检模型作为当前质检模型。81.步骤s23:重新执行所述利用所述目标质检模型输出所述待质检样本数据的置信度矩阵的步骤,以得到当前质检结果。82.本技术实施例中,不断循环迭代的利用更新后标签训练模型对数据进行质检,需要指出的是,每一次循环可以随机选择不同的分类算法模型。如图6所示,每次迭代质检的时候都可以随机选择一种分类算法模型结构,这样做的好处是经过多种算法验证的数据质量更好,相当于有多个质检员对数据进行交叉验证数据的质量。83.可以理解的是,如果待质检样本本身有很多错误,那么人工智能的算法就会学习到很多错误的信息,对模型的准确率影响非常大。本技术实施例中,提出了一种良性循环结构,通过算法筛选出错误数据,对这些数据进行重点处理,对其修改提升数据质量,又利用修改后的数据重新训练用于质检的质检模型,模型的识别能力更强,并且重新筛查出一批问题数据进行重新标注,从而通过数据质量提升算法准确率,形成一个良性循环闭环,如图7所示,两者相辅相成,这样就在算法的整个生命周期不断循环提升数据的质量,最终达到可以无限优化提升模型准确率的目的。84.步骤s24:当所述当前质检结果中不存在所述错误数据时,根据当前的置信度矩阵确定出质检后样本数据的当前第一位置信度与当前第二位置信度之间的当前置信度差值。85.本技术实施例中,当不断循环优化算法最终没有错误数据的时候,此时输出的置信度矩阵全部为正确数据的置信度矩阵,将当前置信度矩阵下的质检后样本的置信度取分类正确的数据的top2分类置信度做差值,差值越小说明这个数据样本在这两类上混淆度越高,模型不易对该样本针对这两类进行区分,存在错误的可能。86.步骤s25:若所述当前置信度差值小于预设阈值,则重新对所述当前置信度差值小于所述预设阈值对应的质检后样本数据进行质检,以对所述质检后样本数据进行校验。87.本技术实施例中,取分类正确的数据的top2分类置信度做差值,如果当前置信度差值小于预设阈值,则重新对其对应的样本数据进行质检,校验数据的准确性,继续提升数据的质量。88.另外,如图8所述,在形成良性的闭环对数据进行质检后,最终应用到生产环境的算法模型可以是该闭环中的算法模型,如图8中的算法模型训练2,也可以是不同于质检过程中的算法模型,如图8中的算法模型训练1。89.可见,对于待质检样本数据,提出一种基于人工智能的方法,首先利用标注有初始化标签的待质检样本数据训练出用于质检的质检模型,然后利用质检模型筛查出所有可能有问题的数据,输出其置信度矩阵。基于置信度矩阵对这些问题数据进行重点处理。进一步的,创新性的通过置信度差值的方式计算得到数据质量的错误程度,根据这个值可以对排查设定优先级,筛选出待认证错误数据中预设数量的错误数据,达到快速定位出有问题的数据。相对于传统的只能通过人工抽样的方式,既费时间也不容易做到全量筛查,该方案不仅能识别出所有有问题的数据,还对这些“问题数据”进行重点优先检查,从而极大的提升了数据质检的效率。另外,提出了一种良性循环结构,通过算法提升数据质量,又通过数据质量提升算法准确率,两者相辅相成,形成良性循环闭环,最终达到可以无限优化提升模型准确率的目的。90.相应的,本技术实施例还公开了一种数据质检装置,参见图9所示,该装置包括:91.数据获取模块11,用于获取待质检样本数据;92.数据标注模块12,用于对所述待质检样本数据进行初始化标注,以得到初始化标签;93.模型训练模块13,用于利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;94.置信度矩阵输出模块14,用于利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;95.质检模块15,用于根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。96.其中,关于上述各个模块更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。97.由此可见,通过本实施例的上述方案,本技术提供了一种数据质检方法,该方法包括:获取待质检样本数据;对所述待质检样本数据进行初始化标注,以得到初始化标签;利用标注有所述初始化标签的所述待质检样本数据对基于预设分类算法构建的模型进行训练以得到目标质检模型;利用所述目标质检模型确定出若干个待认证错误数据,并输出所述待认证错误数据的置信度矩阵;根据所述置信度矩阵确定出所述待认证错误数据的第一位置信度与第二位置信度之间的置信度差值,然后根据所述置信度差值的倒序排序结果筛选出所述待认证错误数据中预设数量的错误数据,以得到当前质检结果。可见,对于待质检样本数据,提出一种基于人工智能的方法,首先利用标注有初始化标签的待质检样本数据训练出用于质检的质检模型,然后利用质检模型筛查出所有可能有问题的数据,输出其置信度矩阵。基于置信度矩阵对这些问题数据进行重点处理。进一步的,创新性的通过置信度差值的方式计算得到数据质量的错误程度,根据这个值可以对排查设定优先级,筛选出待认证错误数据中预设数量的错误数据,达到快速定位出有问题的数据。相对于传统的只能通过人工抽样的方式,既费时间也不容易做到全量筛查,该方案不仅能识别出所有有问题的数据,还对这些“问题数据”进行重点优先检查,从而极大的提升了数据质检的效率。98.进一步的,本技术实施例还公开了一种电子设备,图10是根据一示例性实施例示出的电子设备20结构图,图中内容不能认为是对本技术的使用范围的任何限制。99.图10为本技术实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的数据质检方法中的相关步骤。另外,本实施例中的电子设备20具体可以为计算机。100.本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本技术技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。101.另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222及数据223等,数据223可以包括各种各样的数据。存储方式可以是短暂存储或者永久存储。102.其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是windows server、netware、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的数据质检方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。103.进一步的,本技术实施例还公开了一种计算机可读存储介质,这里所说的计算机可读存储介质包括随机存取存储器(random access memory,ram)、内存、只读存储器(read-only memory,rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、磁碟或者光盘或技术领域内所公知的任意其他形式的存储介质。其中,所述计算机程序被处理器执行时实现前述数据质检方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。104.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。105.结合本文中所公开的实施例描述的数据质检或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。106.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。107.以上对本发明所提供的一种数据质检方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部