【风控】申请评分卡(A卡)模型
一、A卡模型概述
- 定义
A卡即申请评分卡(Application Score Card),主要用于贷前信用准入,将每笔新申请的贷款/信用卡用户转化为一个分值,预测其在放款后一定表现期内发生逾期的概率。- 观察点:申请时点
- 表现期:通常为6–12个月内是否逾期(如逾期≥60天)
- 目标变量Y:0/1二分类,1表示在表现期内逾期
- 应用场景
- 信用卡或消费贷产品的初审
- 线上现金分期、信用贷平台的准入决策
- 决定是否放款、授信额度及初始利率
二、A卡模型的构建流程
-
数据采集与样本构造
- 正负样本:所有申请样本,正样本(Bad)为表现期内逾期客户,负样本(Good)为无逾期客户。
- 数据源:客户填写的申请信息、央行征信报告、第三方征信数据以及互联网金融平台自有数据等
-
变量特征工程
- 分箱与WOE变换:对连续/类别变量进行分箱,计算每个分箱的WOE(Weight of Evidence),保证WOE值单调性;
- IV筛选:依据IV(Information Value)指标筛除预测能力弱或不稳定的变量;
- 交叉特征:如收入×年龄、职业×贷款用途等业务驱动交叉项;
- 外部数据融合:如反欺诈打分(F卡变量)、社保/公积金验证、运营商数据等。
-
模型训练与评估
- 算法选择:以逻辑回归最为常见,兼顾可解释性;也可尝试随机森林、XGBoost以提升区分度
- 阈值与评估指标:重点监控KS值、AUC、FPR/FNR曲线;进行交叉验证与时间切分验证,校验模型时序稳定性。
-
分数卡转换
- 分数映射:将Logit输出转换为易于理解的分值(如600分为基准),采用“基准分+PDO”体系:
- 基准分:Score₀,对应Odds₀
- PDO(Points to Double Odds):分值翻倍所需点数
- 计算公式:
Score = Offset – Factor × ln( Odds )
- 上线与监控:部署于风控平台后,需持续监控模型稳定性、分布漂移、样本覆盖率等。
- 分数映射:将Logit输出转换为易于理解的分值(如600分为基准),采用“基准分+PDO”体系:
三、互联网金融场景下的特色与挑战
- 海量且多样的申请量
- 互联网金融单笔金额低、订单量大、客户分散,要求模型能高效处理千万级申请并快速打分。
- 丰富的非传统数据源
- 设备指纹:采集设备型号、Canvas指纹、IP地理位置等,构建设备风险模型,提高反欺诈能力。
- 行为轨迹:注册―登录―浏览―提交的完整点击流,用以剔除脚本攻击和僵尸网络。
- 社交/网络关系:基于图算法分析账号之间的隐秘关联,为A卡模型提供补充信号。
- 合规与隐私保护
- 随着《网络安全法》实施,灰色数据来源受限,更加依赖脱敏的合法行为数据与平台自有数据
- 线上实时风控
- 线上模型需与反欺诈(F卡)、行为评分(B卡)无缝衔接,形成“全流程一体化”风控。
四、落地实践与优化思路
- 多模型融合:在A卡打分基础上,可并行训练F卡/欺诈模型,对高风险样本进行二次审查;
- Reject Inference:对被拒样本进行推断打分,补齐样本偏差;
- 动态阈值调整:结合业务节奏、限额使用情况,对放款率与坏账率的平衡点进行定期校正;
- 增量学习:定期基于最新放款与回收数据微调模型,保证模型响应市场环境变化。