计算;推算;计数设备的制造及其应用技术1.本发明实施例涉及计算机技术领域,具体涉及一种信用评分模型的调优方法及装置。背景技术:2.传统银行等金融机构对于贷款申请大多采取人工审批的方式,根据业务信审人员的个人经验进行主观的审批判断,决策结果易受各种主观因素的影响,导致审批结果不一致,不能够量化风险级别,无法实现风险的分级管理,而且会使得审批过程成本高、效率低。信用评分模型可以根据银行等金融机构的客户的信用历史资料、业务活动记录等信息,利用评分模型,得到不同等级的信用分数。通过分析客户按时还款的可能性决定是否准予授信、授信额度、利率等,大大提升处理效率、风险把控等。3.评分模型是较常用的重要的信用评分模型,现有技术在确定信用评分模型时,如直接将初步建立的评分模型应用于业务中,导致模型的区分能力、稳定性等不高,模型的可解释性较差;或者,依据建模人员的自身经验进行人工主观的模型调优,如人工手动进行一些变量的增减操作。但这种调优方式受限于调整经验、调整成本等方面的因素,最终得到的模型结果也未能达到相对最优状态,且受主观因素影响较大,不同的建模人员调整的模型会有所差别,不能很好的实现模型的最佳效果及应用的稳定性。技术实现要素:4.鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的信用评分模型的调优方法及装置。5.根据本发明实施例的一个方面,提供了一种信用评分模型的调优方法,方法包括:6.获取步骤,获取用于信用评分模型调优的多个信用指标;其中,多个信用指标包括预设信用评分模型使用的入模信用指标及未入模信用指标;7.逐步回归步骤,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,计算得到多个模型区分能力评估指标ks值;获取多个模型区分能力评估指标ks值中的最大模型区分能力评估指标ks值,并判断最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标是否为预设信用评分模型使用的入模信用指标;若是,执行差值比较步骤;若否,则将最大模型区分能力评估指标ks值对应的信用评分模型更新为预设信用评分模型,并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行逐步回归步骤,直至最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标为预设信用评分模型使用的入模信用指标;8.差值比较步骤,基于信用指标的训练集和测试集的样本数据,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,分别基于训练集和测试集计算得到训练集和测试集的模型区分能力评估指标ks差值比例;判断模型区分能力评估指标ks差值比例是否小于预设差值阈值,若是,则从小于预设差值阈值的模型区分能力评估指标ks差值比例对应的信用评分模型中,选取最大模型区分能力评估指标ks值对应的信用评分模型为调优后的信用评分模型,若否,则确定最小模型区分能力评估指标ks差值比例,将最小模型区分能力评估指标ks差值比例对应的信用评分模型更新为预设信用评分模型;并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行差值比较步骤,直至模型区分能力评估指标ks差值比例小于预设差值阈值。9.根据本发明实施例的另一方面,提供了一种信用评分模型的调优装置,其包括:10.获取模块,适于获取用于信用评分模型调优的多个信用指标;其中,多个信用指标包括预设信用评分模型使用的入模信用指标及未入模信用指标;11.逐步回归模块,适于根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,计算得到多个模型区分能力评估指标ks值;获取多个模型区分能力评估指标ks值中的最大模型区分能力评估指标ks值,并判断最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标是否为预设信用评分模型使用的入模信用指标;若是,执行差值比较模块;若否,则将最大模型区分能力评估指标ks值对应的信用评分模型更新为预设信用评分模型,并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行逐步回归模块,直至最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标为预设信用评分模型使用的入模信用指标;12.差值比较模块,适于基于信用指标的训练集和测试集的样本数据,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,分别基于训练集和测试集计算得到训练集和测试集的模型区分能力评估指标ks差值比例;判断模型区分能力评估指标ks差值比例是否小于预设差值阈值,若是,则从小于预设差值阈值的模型区分能力评估指标ks差值比例对应的信用评分模型中,选取最大模型区分能力评估指标ks值对应的信用评分模型为调优后的信用评分模型,若否,则确定最小模型区分能力评估指标ks差值比例,将最小模型区分能力评估指标ks差值比例对应的信用评分模型更新为预设信用评分模型;并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行差值比较模块,直至模型区分能力评估指标ks差值比例小于预设差值阈值。13.根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;14.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述信用评分模型的调优方法对应的操作。15.根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述信用评分模型的调优方法对应的操作。16.根据本发明实施例的提供的信用评分模型的调优方法及装置,基于预设信用评分模型的入模信用指标及未入模信用指标,通过逐步回归循环删减任一入模信用指标和/或逐步回归循环添加任一未入模信用指标进行建模,逐步挑选入模信用指标,实现信用评分模型对信用指标的自动化选择,替代人工经验调整,完成对信用评分模型的调优,并大大提升调优效率。17.上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。附图说明18.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:19.图1示出了根据本发明一个实施例的信用评分模型的调优方法的流程图;20.图2示出了根据本发明一个实施例的信用评分模型的调优装置的结构示意图;21.图3示出了根据本发明一个实施例的一种计算设备的结构示意图。具体实施方式22.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。23.首先,对本技术一个或多个实施例涉及的名词术语进行解释。24.逐步回归:逐步回归分析的基本思路是自动从大量可供选择的变量中选取最重要的变量,建立回归分析的预测或者解释模型。具体的,将自变量逐个引入,引入的条件是其偏回归平方和经检验后是显著的。同时,每引入一个新的自变量后,要对旧的自变量逐个检验,剔除偏回归平方和不显著的自变量,边引入边剔除,直到既无新变量引入也无旧变量删除为止。25.ks值(模型区分能力评估指标):用以评估模型对好、坏客户的判别区分能力,计算累计坏客户与累计好客户百分比的最大差距。ks值范围在0%-100%。ks值的计算包括:计算每个评分区间的好坏账户数,计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good%-累计bad%),取绝对值的最大值即模型的ks值。ks值较大时,模型预测效果较好,ks值过大时,如大于75%,需要进一步验证模型。26.woe(weight of evidence,证据权重):假设g为好样本,b为坏样本。woe计算公式如下:[0027][0028]其中,bi表示第i箱中坏样本数量,bt表示坏样本总数,gi表示第i箱中好样本数量,gt表示好样本总数。分箱即对各个特征进行分箱,每个箱中包含好/坏样本。[0029]iv(information value,信息值):用来衡量模型中某一特征的预测能力,并据此进行特征筛选。iv的计算公式如下:[0030][0031]其中,n表示分箱的箱数,i表示第i箱中坏样本数量,bt表示坏样本总数,gi表示第i箱中好样本数量,gt表示好样本总数。[0032]图1示出了根据本发明一个实施例的信用评分模型的调优方法的流程图,如图1所示,该方法包括如下步骤:[0033]步骤s101,获取用于信用评分模型调优的多个信用指标,多个信用指标包括预设信用评分模型使用的入模信用指标及未入模信用指标。[0034]信用评分模型可以用于如银行等金融机构,用来对如贷款申请者的信用进行评分等,以便根据评分高低预测贷款申请者逾期风险等。信用评分模型的准确度越高,越能有效规避逾期风险,因此,对信用评分模型的调优显得尤为重要。[0035]现有技术中大多采用人工调优,其无法达到信用评分模型的最优效果,且存在调优后的信用评分模型的稳定性无法保障,模型效果和模型可解释性也无法兼顾等问题,基于上述问题,本实施例采用自动化方式来对信用评分模型进行调优。[0036]具体的,先获取用于信用评分模型调优的多个信用指标,信用指标与贷款申请者相关,信用指标包括如年龄、收入、固定资产价值、无形资产价值、历史最大逾期天数、失信执行次数等,此处收入可以如月收入等。多个信用指标中包括预设信用评分模型使用的入模信用指标,也包括了未入模信用指标。预设信用评分模型即初始的信用评分模型,如采用评分卡模型等,本实施例在预设信用评分模型的基础上,进行调优,得到调优后的可使用的信用评分模型。[0037]进一步,基于信用评分模型的模型可解释性、模型指标维度丰富度等角度出发,本实施例基于多个信用指标可以划分确定对应的各信用指标维度,各信用指标维度包括如基本信息、偿债能力、偿债意愿、负面信息等。如年龄可以对应基本信息,收入、固定资产价值、无形资产价值可以对应偿债能力,历史最大逾期天数可以对应偿债意愿,失信执行次数可以对应负面信息等。对各信用指标维度还预设了入模指标个数区间阈值,以保障模型可解释性、模型指标维度丰富度等,以上述信用指标维度为例,考虑到信用评分模型的入模指标总个数可以设置在如10-15个之间,因此设置每个信用指标维度的入模指标个数区间阈值在如1-4个,最小入模指标个数如1个,最大入模指标个数如4个等,信用评分模型中可以包含多个信用指标维度,如可以包含基本信息、偿债能力、偿债意愿、负面信息4个信用指标维度,也可以包含少于4个或者其他更多个信用指标维度,通过设置各信用指标维度的入模指标个数区间阈值,可以保障信用评分模型的指标维度丰富度,同时,也可以与业务相关联,提升模型可解释性。以上为举例说明,具体可以根据实施情况设置,此处不做限定。[0038]步骤s102,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,计算得到多个ks值。[0039]在进行调优前,可以针对各个信用指标,收集各信用指标的样本数据,样本数据包括了正样本数据和负样本数据,正负样本数据可以预先标注,将不同标注结果的样本数据输入至调优过程中的信用评分模型,根据预测结果来调优信用评分模型。此处,收集到的信用指标的样本数据也可以分为训练集和测试集,训练集和测试集的比例可以根据实施情况设置,如7:3等,可以仅使用训练集的样本数据进行调优,也可以同时使用训练集和测试集的样本数据进行调优,此处不做限定。[0040]本实施例基于预设信用评分模型,预设信用评分模型可以根据实施情况选取,如初始的评分卡模型等,进行调优,对于本实施例的多个信用指标,预设信用评分模型使用的为入模信用指标,未使用的为未入模信用指标。预设信用评分模型使用的入模信用指标如包括年龄、收入、固定资产价值、失信执行次数等4个信用指标,未入模信用指标则包括如无形资产价值、历史最大逾期天数等2个信用指标。本实施例针对以上各个信用指标,采用如非线性规划方式,基于逐步回归方式,循环删减预设信用评分模型中的任一入模信用指标来重新进行建模,如循环删减其中的年龄、收入、固定资产价值、失信执行次数等入模信用指标,利用剩下未删减的入模信用指标来建模,根据建模结果来计算得到循环删减入模信用指标建模对应的多个ks值。ks值即模型区分能力评估指标,ks值计算可以通过先统计正样本数据的正预测数量tp、正样本数据的负预测数量fp、负样本数据的正预测数量fn,以及,负样本数据的负预测数量tn,根据tp、fp、fn、tn,可以计算得到对应的ks值。ks值根据tp在tp和fn之和的占比,与fp在fp和tn之和的占比的差值得到。即ks=tp/(tp+fn)-fp/(fp+tn)。除循环删减预设信用评分模型中的任一入模信用指标来重新进行建模,还可以根据预设信用评分模型,基于逐步回归循环添加任一未入模信用指标来重新进行建模,如循环增加无形资产价值和历史最大逾期天数2个未入模信用指标,根据增加的未入模信用指标和已经入模信用指标重新进行建模,根据建模结果来计算得到循环添加任一未入模信用指标建模对应的多个ks值,ks值的计算根据上述ks=tp/(tp+fn)-fp/(fp+tn)得到,此处不再赘述。以上循环删减预设信用评分模型中的任一入模信用指标、循环添加任一未入模信用指标不限定具体的先后顺序,可以根据实施情况设置,循环删减、循环添加,得到各入模信用指标和未入模信用指标多种组合,以从中找到最优组合,来对预设信用评分模型进行调优。[0041]进一步,在循环删减任一入模信用指标或者循环添加任一未入模信用指标进行建模时,建模使用的指标个数需要符合对应的信用指标维度的入模指标个数区间阈值,如以入模指标个数区间阈值为1-4为例,即在调优过程中,建模使用的各个信用指标,对应各自的信用指标维度,每个信用指标维度预设了入模指标个数区间阈值,信用指标的个数需要符合信用指标维度的入模指标个数区间阈值,如信用指标维度为基本信息,入模指标个数区间阈值为1-4个,则建模使用的年龄、收入等属于基本信息的信用指标的个数应大于1小于4,一方面增加模型的信用指标丰富度,另一方面模型可解释性较佳。具体根据实施情况设置,本实施例可以将信用指标维度预设的入模指标个数区间阈值作为本步骤信用评分模型的目标函数来进行调优等,此处不做限定。[0042]进一步,为避免预设信用评分模型在调优过程中过拟合,还设置了多个条件,以约束信用评分模型,避免过拟合等,如建模使用的各信用指标的显著性水平值符合预设第一条件,建模使用的各信用指标的模型系数值符合预设第二条件,信息值iv大于等于预设信息阈值等。具体的,各信用指标的显著性水平值可以以pi表示,即第i个信用指标的显著性水平值,根据标注的样本数据和预测结果可以计算得到,预设第一条件可以根据实施情况设置,以建模使用了n个信用指标为例,预设第一条件如以下公式所示:[0043][0044]其中,α为显著性水平阈值,如设置为0.05,b()函数可以采用布尔函数,其输出结果为0或1。[0045]各信用指标的模型系数值可以以ci表示,即第i个信用指标的模型系数值,模型系数值可以如信用指标的特征权重系数,基于信用评分模型获取,预设第二条件可以根据实施情况设置,以建模使用了n个信用指标为例,预设第二条件如以下公式所示:[0046][0047]其中,b()函数可以采用布尔函数,其输出结果为0或1。[0048]信息值iv大于等于预设信息阈值,预设信息阈值可以设置为如0.02,信息值iv可以根据现有的计算方式计算得到,对信用指标进行分箱时,可以根据实施情况设置,如划分不同年龄段进行分箱、不同收入区间分箱等,此处不做展开说明。[0049]以上各约束条件对信用评分模型的调优过程进行约束,以获取信用评分模型表现最优的模型,各约束条件为举例说明,具体根据实施情况设置,此处不做限定。[0050]步骤s103,获取多个ks值中的最大ks值,并判断最大ks值对应的信用评分模型使用的入模信用指标是否为预设信用评分模型使用的入模信用指标。[0051]在获取到多个ks值后,可以对多个ks值进行如排序、两两比对等,获取多个ks值中的最大ks值。[0052]根据最大ks值,判断最大ks值对应的信用评分模型中所使用的入模信用指标是否为预设信用评分模型使用的入模信用指标,即入模信用指标的组合是否已经发生变化,与预设信用评分模型中使用的入模信用指标组合是否相同,若是,则执行步骤s105,即可以确定调优得到的信用评分模型中使用的入模信用指标组合已经是最优组合,信用评分模型的预测准确度更高、预测结果最优;若否,则说明当前调优得到的信用评分模型还不稳定,还需要继续调优,则执行步骤s104。选取最大ks值可以作为信用评分模型的目标函数来进行调优等,此处不做限定。[0053]步骤s104,将最大ks值对应的信用评分模型更新为预设信用评分模型,并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标。[0054]将此时最大ks值对应的信用评分模型更新为预设信用评分模型,使用更新后的预设信用评分模型来继续调优。同时,根据更新后的预设信用评分模型,更新后的预设信用评分模型使用的信用指标更新为入模信用指标,未使用的信用指标更新为未入模信用指标。此时,由于最大ks值对应的信用评分模型中所使用的入模信用指标与预设信用评分模型使用的入模信用指标不一致,则更新后的入模信用指标、未入模信用指标已经不同于步骤s102未更新前的预设信用评分模型的入模信用指标、未入模信用指标。[0055]根据更新后的预设信用评分模型,循环执行步骤s102-s104,直至最大ks值对应的信用评分模型使用的入模信用指标与预设信用评分模型使用的入模信用指标一致,即最大ks值对应的信用评分模型不再变化,确定调优得到的信用评分模型中使用的入模信用指标组合为最优组合。[0056]步骤s105,基于信用指标的训练集和测试集的样本数据,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,分别基于训练集和测试集计算得到训练集和测试集的模型区分能力评估指标ks差值比例。[0057]在通过逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,对筛选出的预设信用评分模型进一步调优,此处,以训练集和测试集的样本数据分别来进行调优,训练集和测试集的比例可以根据实施情况设置,如7:3等,此处不做限定。根据前面调优更新后的预设信用评分模型,以及更新后的入模信用指标、未入模信用指标进一步对信用评分模型的稳定性进行调优,具体的,可以针对更新后的预设信用评分模型、入模信用指标、未入模信用指标,基于逐步回归循环删减任一入模信用指标、循环添加任一未入模信用指标进行建模,此处具体描述可以参照步骤s102的描述,区别在于循环删减任一入模信用指标、循环添加任一未入模信用指标后,对预设信用评分模型重新进行建模,输入训练集的样本数据进行训练调优,以及输入测试集的样本数据进行训练调优,统计得到训练集中正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量、负样本数据的负预测数量,以及,统计得到测试集中正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量、负样本数据的负预测数量,按照步骤s102步骤中描述的ks值的计算方式,分别计算得到训练集的ks值kstrain和测试集的ks值kstest,此处不再赘述。[0058]根据训练集的ks值kstrain和测试集的ks值kstest,先计算训练集的ks值kstrain与测试集的ks值的差值kstest,在根据差值计算与训练集的ks值的比值kstrain,得到训练集和测试集的ks差值比例,具体如下公式所示:abs((kstrain-kstest)/kstrain),abs为绝对值函数,若ks差值比例为负值,取ks差值比例的绝对值。此处,训练集的ks值kstrain和测试集的ks值kstest均是根据调优过程中的同一预设信用评分模型计算得到的。以上循环删减预设信用评分模型中的任一入模信用指标、循环添加任一未入模信用指标不限定具体的先后顺序,可以根据实施情况设置。通过循环删减预设信用评分模型中的任一入模信用指标、循环添加任一未入模信用指标,得到多个信用指标的组合,针对多个信用指标的组合对应的信用评分模型,分别计算ks差值比例,即可以得到多个ks差值比例。[0059]进一步,在循环删减任一入模信用指标或者循环添加任一未入模信用指标进行建模时,建模使用的指标个数需要符合对应的信用指标维度的入模指标个数区间阈值,此处可以参照步骤s102的描述,此处不再赘述,本实施例可以将信用指标维度预设的入模指标个数区间阈值作为本步骤信用评分模型的目标函数来进行调优等,此处不做限定。[0060]进一步,为避免预设信用评分模型在调优过程中过拟合,还设置了多个条件,以约束信用评分模型,避免过拟合等,如建模使用的各信用指标的显著性水平值符合预设第一条件,建模使用的各信用指标的模型系数值符合预设第二条件,信息值iv大于等于预设信息阈值等。以上可以参照步骤s102的描述,此处不再赘述。[0061]步骤s106,判断ks差值比例是否小于预设差值阈值。[0062]根据上述计算得到的ks差值比例进行判断,判断ks差值比例是否小于预设差值阈值γ,预设差值阈值可以根据实施情况设置,如设置为如10%,即判断abs((kstrain-kstest)/kstrain)《γ是否成立,对于计算得到的多个ks差值比例,若其中存在小于预设差值阈值的ks差值比例,则执行步骤s108,若不存在,则执行步骤s107。[0063]本实施例中可以将判断ks差值比例小于预设差值阈值作为信用评分模型的目标函数来进行调优等,此处不做限定。[0064]步骤s107,确定最小ks差值比例,将最小ks差值比例对应的信用评分模型更新为预设信用评分模型,并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标。[0065]若判断ks差值比例不小于预设差值阈值,则从中确定最小ks差值比例,将最小ks差值比例对应的信用评分模型更新为预设信用评分模型,即根据最小ks差值比例对应的信用评分模型再进行调优。根据更新后的预设信用评分模型,更新后的预设信用评分模型使用的信用指标更新为入模信用指标,未使用的信用指标更新为未入模信用指标。由于在步骤s105中基于逐步回归循环删减任一所述入模信用指标、循环添加任一所述未入模信用指标重新进行建模,已经不是更新前的预设信用评分模型,因此,更新后的入模信用指标、未入模信用指标已经不同于步骤s105未更新前的预设信用评分模型的入模信用指标、未入模信用指标。[0066]根据更新后的预设信用评分模型,循环执行步骤s105-s106,直至判断ks差值比例小于预设差值阈值,再从小于预设差值阈值的ks差值比例对应的信用评分模型中,选取最大ks值对应的信用评分模型为调优后的信用评分模型。[0067]步骤s108,从小于预设差值阈值的ks差值比例对应的信用评分模型中,选取最大ks值对应的信用评分模型为调优后的信用评分模型。[0068]当判断ks差值比例小于预设差值阈值γ,调优得到的信用评分模型相对稳定,可以从小于预设差值阈值的ks差值比例对应的信用评分模型中,选取调优过程中最大ks值对应的信用评分模型为调优后的信用评分模型。最大ks值可以采用训练集的ks值,如从小于预设差值阈值的ks差值比例对应的信用评分模型中,计算基于训练集的样本数据对应的ks值,通过如排序、大小值比较等,确定其中最大ks值,最大ks值对应的信用评分模型为调优后的信用评分模型,即最大ks值对应的信用评分模型使用的信用指标的组合可以建立最终的信用评分模型,从而得到的调优后的信用评分模型即包含了丰富的信用指标,且信用评分模型的预测准确性高、稳定性强。[0069]本实施例采用如python语言实现,有效降低技术门槛,且易推广,移植性较好,可扩展性较佳,更易于与实际情况结合,应用于信用评分模型。[0070]根据本发明实施例提供的信用评分模型的调优方法,基于预设信用评分模型的入模信用指标及未入模信用指标,通过逐步回归循环删减任一入模信用指标和/或逐步回归循环添加任一未入模信用指标进行建模,逐步挑选入模信用指标,实现信用评分模型对信用指标的自动化选择,替代人工经验调整,完成对信用评分模型的调优,并大大提升调优效率。进一步,在对信用评分模型调优时,通过设置各种条件,可以避免调优过程中模型过拟合,也保障了信用评分模型中入模信用指标的维度丰富,通过设置信用指标维度,也便于信用评分模型在业务方面的可解释性。[0071]图2示出了本发明实施例提供的信用评分模型的调优装置的结构示意图。如图2所示,该装置包括:[0072]获取模块210,适于获取用于信用评分模型调优的多个信用指标;其中,多个信用指标包括预设信用评分模型使用的入模信用指标及未入模信用指标;[0073]逐步回归模块220,适于根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,计算得到多个模型区分能力评估指标ks值;获取多个模型区分能力评估指标ks值中的最大模型区分能力评估指标ks值,并判断最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标是否为预设信用评分模型使用的入模信用指标;若是,执行差值比较模块230;若否,则将最大模型区分能力评估指标ks值对应的信用评分模型更新为预设信用评分模型,并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行逐步回归模块220,直至最大模型区分能力评估指标ks值对应的信用评分模型使用的入模信用指标为预设信用评分模型使用的入模信用指标;[0074]差值比较模块230,适于基于信用指标的训练集和测试集的样本数据,根据预设信用评分模型,基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模,分别基于训练集和测试集计算得到训练集和测试集的模型区分能力评估指标ks差值比例;判断模型区分能力评估指标ks差值比例是否小于预设差值阈值,若是,则从小于预设差值阈值的模型区分能力评估指标ks差值比例对应的信用评分模型中,选取最大模型区分能力评估指标ks值对应的信用评分模型为调优后的信用评分模型,若否,则确定最小模型区分能力评估指标ks差值比例,将最小模型区分能力评估指标ks差值比例对应的信用评分模型更新为预设信用评分模型;并根据更新后的预设信用评分模型,更新入模信用指标及未入模信用指标;根据更新后的预设信用评分模型,循环执行差值比较模块230,直至模型区分能力评估指标ks差值比例小于预设差值阈值。[0075]可选地,装置还包括:[0076]维度模块240,适于基于多个信用指标确定对应的各信用指标维度;其中,各信用指标维度预设入模指标个数区间阈值;多个信用指标包括:年龄、收入、固定资产价值、无形资产价值、历史最大逾期天数和/或失信执行次数,各信用指标维度包括:基本信息、偿债能力、偿债意愿和/或负面信息。[0077]可选地,逐步回归模块220进一步适于:[0078]基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模时,建模使用的指标个数符合对应的信用指标维度的入模指标个数区间阈值,且建模使用的各信用指标的显著性水平值符合预设第一条件,建模使用的各信用指标的模型系数值符合预设第二条件,信息值iv大于等于预设信息阈值。[0079]可选地,差值比较模块230进一步适于:[0080]基于逐步回归循环删减任一入模信用指标和/或循环添加任一未入模信用指标进行建模时,建模使用的指标个数符合对应的信用指标维度的入模指标个数区间阈值,且建模使用的各信用指标的显著性水平值符合预设第一条件,建模使用的各信用指标的模型系数值符合预设第二条件,信息值iv大于等于预设信息阈值。[0081]可选地,装置还包括:[0082]收集模块250,适于收集各信用指标的样本数据;样本数据包括正样本数据和负样本数据;[0083]逐步回归模块220进一步适于:[0084]建模时,统计正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量,以及,负样本数据的负预测数量;[0085]根据正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量,以及,负样本数据的负预测数量,计算得到多个模型区分能力评估指标ks值;模型区分能力评估指标ks值根据正样本数据的正预测数量在正样本数据的正预测数量和负样本数据的正预测数量之和的占比,与正样本数据的负预测数量在正样本数据的负预测数量和负样本数据的负预测数量之和的占比的差值得到。[0086]可选地,差值比较模块230进一步适于:[0087]基于训练集和测试集,统计得到训练集中正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量、负样本数据的负预测数量,计算得到训练集的模型区分能力评估指标ks值,以及,统计得到测试集中正样本数据的正预测数量、正样本数据的负预测数量、负样本数据的正预测数量、负样本数据的负预测数量,计算得到测试集的模型区分能力评估指标ks值;[0088]计算训练集的模型区分能力评估指标ks值与测试集的模型区分能力评估指标ks值的差值与训练集的模型区分能力评估指标ks值的比值,得到训练集和测试集的模型区分能力评估指标ks差值比例。[0089]可选地,装置根据python语言实现。[0090]以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。[0091]本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的信用评分模型的调优方法。[0092]图3示出了根据本发明实施例的一种计算设备的结构示意图,本发明实施例的具体实施例并不对计算设备的具体实现做限定。[0093]如图3所示,该计算设备可以包括:处理器(processor)302、通信接口(communications interface)304、存储器(memory)306、以及通信总线308。[0094]其特征在于:[0095]处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。[0096]通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。[0097]处理器302,用于执行程序310,具体可以执行上述信用评分模型的调优方法实施例中的相关步骤。[0098]具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。[0099]处理器302可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。[0100]存储器306,用于存放程序310。存储器306可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。[0101]程序310具体可以用于使得处理器302执行上述任意方法实施例中的信用评分模型的调优方法。程序310中各步骤的具体实现可以参见上述信用评分模型的调优实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。[0102]在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的较佳实施方式。[0103]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。[0104]类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其特征在于每个权利要求本身都作为本发明的单独实施例。[0105]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。[0106]此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。[0107]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。[0108]应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
信用评分模型的调优方法及装置与流程 专利技术说明
作者:admin
2023-07-19 13:39:25
447
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术