评分卡模型构建介绍
发布网友
发布时间:2024-10-21 22:29
我来回答
共1个回答
热心网友
时间:2024-11-01 01:43
评分卡模型的构建流程是银行和P2P行业常用的一种方法,主要分为申请、行为和催收评分卡。以下是构建流程的详细梳理:
首先,变量选择至关重要,包括客户的基本属性(如逾期、余额)、贷前贷中的表现,以及根据业务需求构造的衍生变量,例如x、y和z的系数组合。因变量通常选择90天以上舆情标记为坏客户的0,其余为1的好客户。
在变量筛选阶段,涉及单变量处理如归一化、离散化和缺失值处理,以及多变量方法如降维、相关系数分析、卡方检验和信息增益。常用IV值和WOE值进行筛选,IV值是WOE加权求和,消除数量差异带来的影响。
离散化是logistics模型的常见要求,通过合并和切割进行,以满足模型的最佳性能。对于非等级字符串变量,通常使用哑变量法将其转化为0和1的组合。
构建评分卡时,拟合logistics模型,然后将变量离散化的WOE值代入公式生成评分卡,设定基础分和分值规则。模型优化可通过调整阈值,如根据KS值图调整P值来提升模型性能。
模型检验涉及KS值图、ROC曲线(包括TPR、FPR、Precision和TNR)和Lift曲线。这些图示能帮助评估模型的准确性和效果,如AUC值和Lift曲线的提升程度。
总结来说,构建评分卡模型是一个不断迭代的过程,包括与业务需求对话、特征工程设计、模型训练与优化,直至达到满意的性能。