导读:
本文的主题是存量客户的风控与运营。选择本主题的原因主要有以下几点:
第一点,从2020年年初到现在的新冠疫情,加速了客户向头部机构的流动。我们分析了一些P2P、无牌的小贷、持牌的小贷、消金、银行等机构客户的流动情况。图中箭头代表不同机构之间客户流动的方向,粗细代表了流动的速度。在疫情爆发之后,流动的速度在加速。随后,在相关的监管文件落地以后,流动的速度有大幅度的增加。
第二点,政策和监管环境一直在变化。政策和监管环境发生变化以后,短期内欺诈类的风险在上升。
第三点,客户恶化速度在加快,我们和部分机构做过一些尝试和探索。发现一个特点,以往存量客户触发贷中的预警之后,他恶化的周期大概是在一个月到两个月。但是从去年开始,触发预警之后发生恶化的人群恶化周期大部分转移到了1-2周。
还有一点是存量客户的分层和运营压力增加。也是受政策因素的影响,主要在于监管对定价的标准以及定价的展示的要求。对客群的影响会比较大,严重的影响到了客户的借款意愿。以致一部分客群因为利率的一些调整和变化而流失。
所以本文的两个子主题,一个是存量客户的风控,如何及时的发现风险客户并且进行处理。另一个是存量客户的运营,如何去构建一套运营体系,同时完成相应的交叉营销。
01存量客户风控
这部分主要介绍两块内容:一块是存量客户的预警,另外一块是存量客户的行为模型。这里着重介绍的是存量客户的行为模型,里面会介绍到一些新的方法。
1. 存量客户风险预警流程
我们之前和很多金融机构做过一些存量客户的预警。基本的预警流程是规则+模型,预警的策略和处置的策略这三大块。首先说预警规则,它和贷前规则会有一些差异。一般情况下贷中的预警规则会比贷前的预警规则略微松一些。核心的原因是客户的信用风险是呈周期性,它受不可控、不稳定的因素影响会比较多。在这种情况下,很可能我们的存量客户也会发生一定的变动。如果频繁的对这些客群进行拒绝、冻卡、冻资等动作的话,会导致客户的体验比较差。因此,在这里我们的一些强制手段的规则要求会比较松,至少比贷前的规则略松。但是这样会产生一些弊端,当我们发现近期的客群风险波动比较大,想要做一些处置的时候,需要上一些新的规则,同时不利于整体的监控。所以会把规则分为两部分,一部分是强规则。强规则里面包含了一些类似于公安、法院这样一些内容。另一部分是弱规则。弱规则就是目前来看还达不到强拒或者是冻结账户、提前回收这样一些动作的时候,需要做的一些监控性的规则,一旦发现风险上浮,或者近期需要调整风控策略,弱规则可以直接切换为强规则。
2. 全量B卡策略
对于B卡模型,后续会有一个详细的介绍,这里就不做赘述。通过规则和模型,可以对客户进行分层,分为低风险、中风险、高风险客户。实际上我们在做业务的时候,风险分群要比这张图上写到的内容要更细。针对高风险和中风险客户可能会做一系列的调查,包括像可联状态的变化核查、资质的核查,甚至电话的访。通过对可联性的排查之后,确认后续的预警动作。举个简单的例子,比如说我们发现有部分客群突然变成了高风险人群。这些高风险人群我们需要根据实际情况采取不同的措施。首先看他的额度使用率和外债情况,额度使用率如果非常高,下一步的动作就需要慎重。因为在这种情况下,有可能因为我们的风控策略或者后续的处置动作,导致客户加速逾期。从而使整个存量客户的风险迅速的提升。在这种情况下,我们可以用另外一套相对比较柔和的策略。例如催促客户提前还款或者引导他提前结清。另外,可以做一些征信宣传,以保证这个客户不会快速的发生恶化。当额度使用率比较低时,我们可以直接进行账户冻结、降额、提息等动作。如果是低风险人群,我们可以做一些额度提升、定价调整,或者做交叉营销,以保证存量客户的黏性。以上就是做存量客户预警的时候能做的一些工作。此外,还可以做一些新的探索。比如说在额度使用率比较高、在贷额度比较高的这部分客群上重新开发一个模型——止损模型,用来预测未来一段时间这部分客群如果做一些催收、额度调整、提前结清,还有冻结支付,这样的一些内容或者手段,看他是否会发生迅速恶化的情况。如果是迅速发生,那么我们可以对这组人群实施一些柔和的策略。
3. 行为模型
B卡模型也叫行为模型。我把行为模型分成两大块,一块叫经典B卡,一块叫高频B卡,这两块略有区别。经典B卡就是我们金融机构日常所做的B卡。一般情况下,它是逐月来跑批的,每个月客户至少会有一次还款行为,基于这些历史的借还款行为数据,以及其他的一些基础信息构建B卡模型。但是这样的B卡模型有一些不太好的地方,第一依赖的数据维度相对比较单一,在这类B卡里面整个的数据贡献度主要集中在历史的借款关系里,其他数据的有效性相对较弱。这会导致一个问题,历史借还款正常的人群,我们会推断他未来一段时间依然是比较好的客户。数据的惯性比较强,很难发现其他类型风险。第二这类数据的相关性比较高,所以这部分数据所做出来的模型,它会集中在1-2个分段。也就是说我们做出来的模型集中度会很高,不利于后面的策略调整。并且它对尾部的识别能力相对偏弱,因此需要引入一些高频数据来进行模型的迭代,也就是在这里提到的高频B卡模式。高频B卡模型,对数据的更新频率有要求。所以在这个信息里面,很有可能用到的是我们的app 埋点的信息,以及一些外部的数据,通过这些数据来构建新的B卡模型。与原有的经典B卡进行融合,融合之后的B卡可以实现按日、按周、按月来进行跑批。这个模型的好处就在于能及时的发现风险,以规避之前提到的有部分存量客户风险恶化速度极快的风险。高频B卡和经典B卡结合,能保证我们的模型从效果和效率上双重的提升,这就是全量B卡的一个策略。
在行为模型当中,我们还可以用哪些方法来提升呢?也有一些新的算法,我可以给大家简单的分享两个。
① LSTM
LSTM算法的一个好处在于能挖掘一部分时间序列型数据变量。这些数据对客户行为的预测和行为的变量衍生当中有一定的价值。我们在做B卡的时候,用这个算法可以提升一定的模型效果。普遍来说要比传统的评分卡的效果能更好。如果涉及到一些模型部署、难度等等各方面的考量,我们也可以考虑在历史的数据当中挖掘一些趋势性的变量,来保证这个评分卡模型或者机器学习的模型变量的选择,也可以提升一定的模型效果。但从目前来看的话呢,LSTM模型的KS要比评分卡高3-5个点。这个算法的具体内容我做我就不做赘述了。如果大家感兴趣,可以自行查询资料。
② 生存模型
另外一个是行为模型新的探索方向,叫做生存分析模型或者生存模型。生存模型以往更多的是用到医药行业,之前它的主要用途是研究特定的药物对病人的治愈效果。它的应用方式和场景一般是这样的,在药品上市之前会做大量的试验,但往往是通过定期的追访来获取治疗的一些信息。起点是做一些服药、治疗、手术这样一些动作。终点就看这些使用的人群是否会出现死亡、痊愈或者复发,预测未来一段时间之内病人的存活率。所以,它的一个预测目标是什么呢?预测的是未来什么时间段内,病人的存活率是多少?我们把它放到了信贷的行业里面来,它能做的事情是什么呢?比如说我们研究的对象要变成了特定因素对借款人违约的影响。主要是通过积累的一些还款信息来预测违约概率。起点是贷款发放,终点就是违约或者正常还款。我们的目标,是预测一定时间内这个人违约率的变化情况,所以它的价值就出来了。它和传统的模型不一样,传统的模型我们要确定表现期、观察期,确定以后再做模型。也就说我的模型其实是预测未来6个月或者未来12个月时客户违约的可能性。这样的一个特点就会导致如果我们想预测未来一定时间之内,3个月或者是5个月的违约率的时候要重新构建一个模型。
生存模型的一个基本的概念,就是这张图上的。如果我们假设在时间T前发生的违约概率是PB。那么T到T+t这个时间发生违约的概率是Pr。我们就可以得T前违约,或者T到T+t 发生违约的一个概率,就是HT调用T。风险概率大致了解一下,我们能拿到新的风险概率的函数。同时,我们也能推出违约的概率是多少,T之前违约的概率是PG= 1-PB 。细项就不展开了,大家如果感兴趣可以自行查询资料。在这个生存模型当中,有一个比较有意思的就是以往这一开始大家研究的可能就是用药或者不用药,对这个人存活率的变化情况。但是随着医学的发展,包括这个实验的复杂程度提升,可能要求的就是,探讨多变量的情况下如何来做这个生存模型?
Cox模型:
于是有了Cox模型。Cox模型能分析在多种因素下人的存活率或者说存活模型的一些特点。我们可以利用Cos 模型来做一个行为模型。它的一个特点是我们可以看到它的输入数据和输出数据。可以简单看一下,这里我们可以看到0、1、2、3、4、5 共6个不同的客户。我们能看到这些客户有不同的变量,还有时间。这个时间点表明他在什么时间点发生的逾期,这个就是我们的目标变量。正常情况下,这个目标变量应该全是1,因为这个地方是有值的。逻辑回归模型、评分卡输出的结果是一个违约的概率。生存模型输出的是什么呢?存活率。我们可以把它定义成违约率,不同的时间点或者期数的违约率。这个案例当中是样本1-样本6。样本1在第一期存活的概率是多少,第二、三、四期存活的概率一直到后面的第五、六期,所以它输出的是一个取胜的概率。如果我们把这个客户单一的去看一期,例如说我们看第六期,它的这个结果很像逻辑回归的结果。因此,我们在应用的过程当中又有一些新应用方法,比如说在存量客户当中,不同期数或者未来不同月客户的违约概率的变化情况。可以推断未来一段时间之内,这一部分存量客户整体的坏账率、坏账金额分布变化情况,以方便我们做一些贷中的策略调整,以及前端客户进件的策略调整,保证大盘的风险情况,满足整体的风险偏好。以上就是对生存模型的简单介绍。这个里面,当然也还有一些模型,就是像我们传统的评分卡模型、Xgboost、GBM(梯度提升)等,它们依然是目前的主流模型。这两个新模型,LSTM和生存模型供大家做参考。
02存量客户运营
主要包括三部分:① 存量客户运营体系;② 信贷业务存量客户挖掘;③ 信贷客户交叉营销。
1. 存量客户价值提升体系
存量客户运营体系,贯穿了后台、中台和前台:
后台包括了客户的智能中枢。这里面有很多信息可以做,或者说有很多的数据可供选择。能做一些数据的整合,内部数据的挖掘,客户画像的整合,也可以做一些大数据平台的整体建设。这些都是后台的基础。
当在中台的时候,我们可以做的是客户的智能中枢和客户的分析中心。智能中枢主要是用来做一些决策、行动协同和评估。而分析中心的话,主要是对这些信息进行深度的挖掘。对客户的需求偏好进行深入的分析。两者的差别是什么呢?客户的智能中枢是软硬件平台,客户的分析中心主要是对客户进行深度挖掘,包括需求偏好、推荐和洞察。以此为基础,我们才能实现客户的精准识别、需求挖掘和营销线索的分析,以及对整体流程的优化和体验优化,从而保证客户的整体体验和便捷使用。
再往上面走就是前台。前台是我们在后台的数据审核完了以后、在中台进行深度的分析找到我的潜在客户,对潜在客户进行交叉营销,或者运营的一些工作。这个里面就包括了H5的引流、电话的销售、app 的个性推荐、线下的活动推广和线上的广告投放。通过销售线索的梳理和管理,最终形成整个的运营体系。
这就是衡量客户价值提升或者运营体系的初步框架图。
2. 存量客户运营的核心能力地图
如果我们要想实现以上的这些功能。需要具备哪些能力?主要分为五大块。
数据采集的能力:接收到它的后台的时候,需要有一些内部数据的整合、外部数据的整合和对接,以及数据采集工具的应用和使用,比如说在app、H5、WEB和小程序上面做一些埋点。
特征工程:特征工程是在数据采集,数据审核结束之后我们再做的一块信息整合和处理。
数据挖掘:包括一系列的营销模型和决策模型。
决策工具:也就是关系图谱模型、部署平台、BI分析平台等等的一系列平台支撑。
数据的应用:我们可能会对全流程进行监控和梳理,也会对生命周期进行一系列的管控。还有智能活动以及营销。在这里会有一些包括目标的客户筛选、精准触达和活动项目管理。最终实现获客、持续经营和客户挽留等功能。
3. 存量客户运营的场景应用
从整体上来看,如果我们要做运营,或者说整体的分析,会涉及到三大块。
客户的基础价值挖掘,发现一部分相对比较优质的目标客户。
客户价值的分层,分成低价值一直到高价值客户。
客户的需求分析,或者是需求识别。比如说有部分客群没有信贷需求,但有理财、交易等等这样的一些需求;有一部分客户他是有贷款需求。通过这样的一些把控,最终做到精准的识别客户需求,进行运营管理以及对全生命周期的把控。
4. 信贷业务存量客户定义
在信贷业务当中,我们会把客户分成两大类。一类叫做可经营户,另一类叫可挖掘户。可经营户包括了结清复贷户、未结清加贷户、未结清无加贷户。可挖掘客户是注册断点户(在注册的过程当中走了几步,但是后面没有继续来申请)、申请未动支户(申请已授信,但是未动支用信)、假睡眠客户(有授信额度,曾经用过信的客户,近期没有任何使用登录行为)。假睡眠客户中有一部分人群是真的没有信贷需求,有一部分人群是有信贷需求,但是非本机构的使用客户。在这里我们更关注的是信贷业务的一个生命周期。
5. 信贷业务生命周期
一般来说,我们会把客户分成了潜客、新客、稳客、休眠和流失,休眠期就是上面提到的睡眠客户。我们要不断的把潜在客户转换成新客户,让新客户保持一个比较高的使用频率变成稳客,另外就是尽量的唤起休眠客户,降低流失客户,这就是生命周期当中需要做的几大块。
6. 信贷业务运营关注重点
运营的一个重点在于不断的增加客户的交互频率,提升动支率,提升客户的额度使用率。最终,实现在全生命周期客户黏性比较高,同时对单一客户的运营成本降低的目标。我们要保证的是有合适的额度,找到他偏好的利率,实现高效的响应和优质的体验。
7. 营销模型建模流程
在存量的信贷客户当中,如果我们要做营销的话呢,如何来做呢?其实涉及到几大块。
一块就是在前端,比如说在渠道下载注册这个阶段有一些注册的断点客户,我们可以从里面去找到一部分优质客户进行捞回。这里面可能有很大一部分人群是因为我们前期的获客流程太长,体验差导致的流失。
另外一块就是新客户激活。这一部分客群是授信客户,但是他一直没有用信。如何来做激活,一般的建议是初期就应该做一些营销的活动和或者激活的活动。因为激活的概率和授信的时间是有关系的。通常授信时间较长且一直未激活这部客群,后期激活的难度会非常大。
还有一块就是存量客户的复贷。有部分存量客户已经进入到休眠期,如何提升这一部分人群的复贷率?如何对他进行一些激励?如何防止它进行流失?这都是在存量客户运营当中比较重要的点。还有一个就是睡眠客户激活。如果发现部分客户已经是睡眠客户,应该去营销其中哪一部分能获得更大的收益。目前来说比较有效的手段是使用营销模型。
8. 营销模型应用场景
在做营销模型的时候,一般会将客户分成两类,老客和新客。老客有一部分历史的借还款的信息,而新客的话是没有任何信息。所以在做模型的时候应该分开,因为他们的数据维度是不同的。我们在做模型的时候有两种思路。一种是找到那些响应率高的客户。这种情形下可能会出现什么情况呢?我们在做这个营销响应分的时候,更多的关注是他的营销的成功率。但是这时会导致逆向选择的出现,也就是资质越差的客户信贷欲望是越强的,资质越好的信贷需求是越弱的。此时,后端的风控压力就会比较大,而且拒绝率会比较高,前期的获客成本会比较高。
9. 营销模型评估和使用
所以我们在做这一块的时候,更倾向于做一个成单模型。它的目标是找到那些有响应并且会成功放贷的这部分人群,它能兼顾营销响应率和风险两个维度的。当然我们还可以做一些初步的因素测算。如果我们做了一个正常的模型,它的点击注册的比例和做这个营销成单分的点击注册的比例最高的时候差了三倍,就是非常大的一个场景。当然我们在做存量客户的过程当中,可以结合贷中的B卡和营销模型共同来使用。也就是说,除了做这个营销成单分之外,也可以通过B卡筛选一部分白名单客户。然后对这些客户进行营销模型的识别,找到一些营销的白名单,再对白名单客户进行营销。这样能适当降低因逆向选择带来的一些影响,同时能提升一定的客户体验。为什么要做营销模型,而不是全量去营销?我们之前做过一些测试,一般来说营销四次以后,客户的触达率会降低到的首次触达率的40%。一般情况存量客户的触达率在60%左右,也就是说如果我连续四次营销都没成功,第五次再去营销的时候,你联系到他的可能性就会降到24%。这是一个非常难看的数据,并且客户体验也会很差。所以在营销方面,更建议大家做一些有效的精准营销。
今天的分享就到这里,谢谢大家。
分享嘉宾:
分享嘉宾:韩士渊 百融云创 风控总监
编辑整理:邹彤 飞贷金融科技
出品平台:DataFunSummit