天天投资理财

来源:天投网  作者:投资达人  时间:2019-12-20 09:12:35  浏览:87

我们经常会听到银行的同事说征信报告发生了连三累六就不会下款了,这里大概就是一个黑名单的定义,它属于一个风控规则,命中就会被决策引擎拒绝,那么这个连三累六是怎么定义的呢?随着互联网金融,大数据的崛起,黑名单的数据源和规则定义更加多元广泛,产生了更多的风控黑名单规则因子,如何对黑名单更加深入的了解呢?

(尤其现在市场合规持牌银行机构,持牌消费金融公司,保险公司,头部p2p,小贷公司,大量不知名的游击借贷公司一同面向借款人,加之借款人信用意识,资金需求,政策导向,就业环境等导致借款人还款具有较大不稳定性:同一个人只还上征信的话,会发生不还p2p,小贷的借款;在p2p还款良好的个人,一旦听闻p2p监管退出后,开始建群集体恶意逃债。显然这里的一个人是相对的黑名单也是相对的非黑名单)

内部黑名单的定义

企业通过客户周期数据表现,建立自身的黑名单数据库,一般不同的产品带来的是不同的风险客群,数据表现也尽不相同,所以如果一个黑名单规则在不同的产品上采用相同的使用策略是不合理的。本人是一名数据分析师,遵守经验主义更崇尚数据分析量化结果,因为一切的最后结果都在最后的收益量化上呈现。

一般类似于风控建模中目标GB的确认可以利用滚动率、迀徙率来定义黑名单。例如,像银行通常为90天,也就是连续3次30天,银行有银监会下发的贷款指导分类原则指导。像本人之前从事的现金贷PDL短周期PD10就很难再有回款了,黑名单的规则定义就是逾期天数大于10,回款不到1 %。更早的PDL—般是到PD7回款率就几乎没有了,这也是很多复借规则有一条策略规则(上一次订单逾期天数)所在的原因,这个规则的阈值没有设置为5,也没有设置为13,而设置为7,从迁徙报表可以一眼看出,这就是量化的魅力。

黑名单的维护

既然定义好了目标就会一直不变了么。

不是这样的,像银行体系虽然大周期,最近也看到很多微文说银行部分也开始用M2了,说明整体资产恶化,任何事情都是永恒变化着的,随着经济结构发展的变化,人民信用意识形态迀移,市场金融产品布局渗透,政策监管对资金流向的影响,对产品的风险表现影响很大,所以这个黑名单的定义也要维护。

如果我的客户不断下沉,上文说到的7天就要改变5天(举例,需要通过数据分析),因为从数据上逾期6, 7天的客户我是损失的,给我不能带来收益。客户复借的时候我们就没有再有必要给他下款,如果我们风控部门还在悠闲的用着之前一套定义准则,那只有等着公司的钱流外人田了,或者更严重的就是风控走人,团队换人,这个我说的一点都不严重,我之前呆的两个公司都遇到了,一个是整体风控团队走人,一个是负责人走人。

外部黑名单-三方黑名单的收集来源

行业共享:典型的af就是合作了同业的p2p,进行共享,他会给你返回具体逾期天数等级,产品,风险等级等字段;

爬虫收集:例如公检法执行信息,很多公司会爬虫的相关网站抓取数据产生规则;

公共库直连:例如某公司产品宣传的公安库直连,近3个月到20年内的时间切片数据,类别有在逃、涉毒、吸毒、前科;

支付数据:近几年兴起的支付公司为主要数据对外提供风控解决方案,他们自身的黑名单就是通过对支付数据的挖掘进行定义的;

设备数据:通过设备数据(短信,定位,设备指纹等)来定义好坏客户,其中短信的挖掘厂商产品比较成熟,因为黑名单客户都被短信催收过,而且从短信的内容你大致可以看出这个客户是在入催,中期,处置的大概哪个阶段。

其他:催收公司合作,数据交换(合不合规,反正是有的),这个肯定区分度很强哈,直接就是被催收的客户,这是我两年前接触到的,不知道现在还有没有。

其实内部黑名单没有什么好说的,外部黑名单就很有意思了,在北京工作这3年多,接触了太多的三方数据,几乎每家都有黑名单的输出,短信的,支付的,人法公安的,设备的,银行的等等,很多类别种类,很丰富。

面对这种黑名单,本人的经验建议不要直接急于上规则,拿来就用,前几年很多公司不太注意数据质量,我在的三家公司就是拿来就用,那时候也很少有专业的分析人员。懂数学的不懂业务,懂业务的不懂数学,大部分分析人员还在用excel,很难搞出令人开心的分析。

原因主要有:首先你不了解这个数据收集来源,特指底层数据,第二个是不知道真实性,第三个也不知道在你的产品上是否有区分度。当然数据方会说的天花乱坠,这时候作为一名策略分析师是我最喜欢的事了,我们回溯下,或者最好我们线上跑一跑,就是那种空跑不决策,数据先调用着,然后等待有表现的时候我们在去分析。说的再天花乱坠,也要等效果出来,我们合同再走起。

外部黑名单-效用评估

三方的黑名单就不需要自己定义了,因为三方已经定义好了,大部分给的是字段,剩下的就是需要我们做评估,回溯测试也好,线上测试也罢,后续就是需要我们分析这个因子。

那么这个因子命中多少的首逾,表现多少的坏账,有多少的回款(其实这三指标相辅相成的)我们才会觉得合适作为黑名单规则呢。例如坏账;100%没得说必须用哈,60%呢,50%呢,其实我这个也有很多的思考疑虑,高了完美,低了不谨慎,其实还是从盈亏的角度或者风控kpi的角度来定义,我觉得没问题的。

假如我风控kpi的PD20是15%。那么这个时候这个因子PD20的表现是30%,我觉得定义黑名单是没问题的,大于15%也没问题。记得之前接触过r3的规则定义,就是坏账的2倍作为拒绝阈值。对于没有作为黑名单定义但是有一定的区分度,也可用在模型中作为变量,就像模型中,我们通过的客户最底分数段中的坏账肯定比整体坏账高很多的,但是我们并没有拒绝这一部分人群,因为这里考虑了通过率,成本,转化,收益很多因素的。

移动
网站
收藏
本页
回到
顶部