互联网金融,尤其小额现金贷是当前非常热的话题,最显著的特点就是小额快速分散,如何构建好的数据和风控体系来满足互联网金融的特点是本期演讲所要探讨的主要问题。本演讲主要介绍高性能决策引擎技术架构和技术实践,以及在智能决策方面的一些探索。
天创信用CTO高少峰分享了以“金融科技引领金融变革”为主题的演讲,介绍了互联网金融的数据和风控体系。
最开始我们先看三个关键词,这三个关键词应该是贯穿了我们整个2017年,一个是现金贷,这个是前几天在风口浪尖上的一个词,尤其是小额现金贷,不管是当前国家的监管还是一些公司赴美上市的热潮都颇受关注,那助贷其实是在17年包括16年已经火了有一段时间的这样一些机构,像闪银这样的公司,有在做助贷的业务。那赋能这样的一个词也是随着互联网技术的发展,尤其是金融科技背景下产生的一些新兴的领域,有一些公司专门是给金融机构做这样一个产业,所以说这三个关键词主要是应对了我们有三类的产业和业务,不管是金融机构还是助贷的机构,还是最后的这种金融科技的一些公司,那主要是这三类公司。
11月21号,国家监管部门紧急下发了一个监管文件,这个文件是什么呢?就是中国已经停止发放互联网小贷牌照。这个文件的下发对我们整个互联网金融的影响是什么?我从个人的角度解读一下,有三个层面,第一个层面其实大家今年一直在喊得比较多的就是监管越来越严,不管是数据层面还是对金融层面,数据层面其实在6月份的时候国家就出台了一个最严格的数据法规,那就是超过5条个人隐私数据的泄露,就可以判刑,这是最严厉的一个数据法规的形态。包括到11月21号互联网小贷牌照的停发,其实当前市场对互联网金融的严格的准入条件以及对数据市场的迁移其实就是反映了国内对市场监管的严格。
第二就是高收益时代可能会终结,其实之前有很多人会说小贷公司高收益的情况,一些小贷公司可能年收益就是净利润就达到了15个亿,不好意思上市,只能偷偷地赚钱,这是整个现代互联网小贷行业的很现实的状况,但是随着监管趋严,必然的结果就是高收益时代会终结,利率国家可能会控制,控制后的利率可能在36%以下,但是具体的数字国家的新闻还没有出,但是我们可以看到就是高收益的500%这样收益的利润时代是已经终结了。
第三个就是随着监管的出台,其实助贷也已经慢慢地成为历史,我们的监管机构会要求金融机构必须拥有风控的能力、必须拥有风控平台的能力。
所以说这个是监管出台之后我思考的三个点,一是未来产生的一个变化,二是用什么来去改变这个环境?三是怎么去适应这个市场的变化?其实小额信贷也好,或者是互联网金融的现金贷也好,那它最重要的本质还是在于市场需求,当前整个市场的需求是有的,不管监管政策如何变化,市场需求一定在那,关键在于我们怎么去适应市场。
风控
想要适应市场,最重要的一点还是——风控。
我们把风控体系主要分成五层,最底层是数据,数据其实是风控的基础,我们在聊风控的时候会谈到这个数据,那这个其实是我们做风控最基础的能力,即我们拥有完整的数据才能做好风控。
再往上层是系统层,系统层其实是支撑我们的数据以及支撑我们上面模型层的这样一个系统平台,传统的可能有决策引擎,有各种各样的一些数据接入的平台,有运算的平台来支撑上层模型的运算。
再往上就是模型层,模型层其实是很多公司在重点打造的一层,会高薪聘请很多风控项目的人员,去建设我们的模型体系。
其实在风控体系里面还包含了两层就是业务层和管理层,有些放贷机构其实在做业务尤其是线下业务的时候,人员的风控是非常复杂的,我怎么去管控人的突发情况或者是员工内外勾结的这种风险问题,所以说这是整个风控管理体系的五个层级。
金融科技怎么去变革风控的体系呢?
主要从这四个方面来看,第一是大数据,其实大数据已经火了很多年了,但是对金融科技来说它仍然是非常重要的一个点,数据如何更加全面?如何更加完整地去建设数据体系?第二是模型,第三是决策引擎,第四是业务系统。
大数据我们要求是全面的,模型我们要求是更加精准的,我们如何更加精准的去分析一个人?他的各个维度,他有没有还款意愿?他的还款能力在哪里?第三个就是决策引擎要求更加智能,就是说我的模型在上线的过程中能不能很好的去满足我线上的服务?第四个就是我们的业务系统,业务系统要求更加高效,尤其小额现金贷这种场景下,那我们的客户在申请贷款的时候他可能就是秒级的申请和秒级的放贷,所以说你的业务系统是要求非常高效且运作体验非常良好,这是整个金融科技大的一个背景。
那我们看,最重要的一点还是风控,风控下面我会着重展开讲一下,风控其实最重要的本质还是离不开产品,你做任何产品都需要有对应的风控体系去支撑,像第一位携程的刘总讲的,就是他做的可能就是支付的风控,那我们在做金融风控的时候也是需要根据产品来做,小额现金贷500到1000到3000到5000,可能到一万、两万不同额度的数据产品那它需要的风控能力也是不一样的。现在我就以我们市面上最火的这种小额现金贷的场景来举例,小额现金贷的产品特征是什么呢?第一个小额,最小的额度到多少?100,就是有很多人在线上申请的贷款的额度只有100块钱,第二个就是快速,就像我刚才说的业务系统需要快速地响应、快速地支撑,它的贷款的时间就是秒贷。
风控刚才也说了有五个特征,但是我们前两个因素像企业的架构,还有你的人员配备,在此就不详细说明了,主要讲下面三个结构,一个是数据,第二个是模型,第三个是平台,从这三个层次来看,我们怎么去做这个风控体系,来满足我们整个互联网小贷也好,或者是大的贷款也好,整个的一个信贷的支撑。
那我们来看第一个数据,数据其实刚才也说了,就是央行征信它需要的数据对互联网金融上的小额信贷的客户也好,这种纯信贷的客户也好,它是非常不全的,是包含不了这种客户的。那么我们需要做的是什么?就是要拿到央行征信以外的更加全面的数据。
第二个是模型,模型其实传统的信贷领域更多的是抵押贷,或者是线下系统,现在搬到线上之后我不知道屏幕后方是一个什么样的人,那这个时候我需要做的更多的是依赖于数据,就是基于数据驱动的模型体系的建设不断去迭代和优化。
第三个是平台,平台的要求其实跟之前风控体系也是一样的,风控搬到线上之后,模型调整频率,模型的运算效率等都提出了更高的要求。下面会对数据、模型和平台做分别的介绍。
模型其实是整个金融风控的一个核心,就是我们怎么基于数据去构建风控体系、模型体系?这个其实最重要的就是基于数据驱动的这样一个理念,数据驱动的理念,这个在国外有一家公司Capital One,这家公司在美国是非常成功的一家银行,那它成功的关键因素就在于数据驱动,它在很早的时候就把款放给了那些信用维度并不是很好的人,它为什么敢放这个款?就是我的模型的建设以及模型的实践到模型的优化这整个的过程,都是基于这个理念去做的
其实风控的金融风险主要分三个方面,一个就是欺诈风险,第二个是信用风险,第三就是操作风险,操作风险更多的是人的层面,期诈风险和信用风险就是我们在数据系统的时候更多地需要去做的一个事情,整个流程从数据需求的提出,在我们构建这个模型之前可能我们要提出我们数据的需求是什么?整个数据的需求需要有一个预先的评判,之后我们再基于拿到的数据去做整个基础数据的分析,包括变量的加工,包括模型的选择、适用,是用这种评分卡模型还是用其他的等等一系列模型的选择,第三个我们根据业务需要建立整个的数据驱动的一个模型,然后再进行整个指标的设定,比如说我这个模型预计我可以让你达到10%,那我设定这样一个指标再进行整个模型的实践,我可能放一点相关的款,去验证我们的模型是不是真正达到了我们想要的结果,在模型的运算过程中我需要对整个模型的应用实施进行一个监控,这是整个量化分布解决的一个风险流程。那我们看在这个体系当中我们主要用到的一些分析的方法,主要有这六类方法,ANOVA分析、回归分析、多元分析、生存分析、机器学习,时间序列这六类去做一些实践,其实最终模型的优和差跟你是否使用机器学习,是否使用人工智能没有任何关系,关键在于是否适合你的业务、场景。
现在的金融机构大部分的情况下是没有使用机器学习这样一个模型算法的,更多的还是在评分卡或者是一些经营模型上再去做迭代和使用,为什么会这样?其实在金融机构使用模型的时候经常用到的一个点就是可解释性,就是说我一个用户到你这里来贷款,我贷不到那你是否要告诉我为什么贷不到款?我的模型的这些变量和指标里面你要告诉我,我哪个指标是不好的?我的征信报告里面哪个地方是差的?央行会告诉你,你有三个月的逾期那我就不贷你款了。而对于现在的小额信贷来说,那我的模型和指标变量里面可能就不仅仅是三个月逾期了,可能是你的手机号经常变,或者是运营商的手机号经常有停机的行为,所以说它会基于这些指标的模型来去看这个人适不适合贷款?这个时候如果是机器学习的话可能就很难解释了,因为客户在来的时候他就是一个黑盒子,每来一个客户我就告诉你过还是不过,信用分是多少?但是具体你们怎么去得到这个功能其实你很难去解释,所以说在这个方面更多的还是基于这个模型的方式来去做。但是机器学习现在主要的使用方向有两个,第一个方式就是像我刚才说的就是黑盒子方式去解决模型的问题,还有一个方式也是现在国外也在探索,包括咱们国内、包括天创也在积极探索的一个部分,就是智能模型的输出。
数据平台其实也是现在各个金融机构正在建设的一个东西,就是我们怎么能把各类数据通过很好的方式把它连接起来,这个都有很成熟的一些大数据平台的技术去支撑,不管是用它惯用的那一套还是很多金融机构依赖数据库来做的一些事情。我们在上层这个中间的风控平台要做的事情其实就是把数据对接进来,把你的模型和方案配置起来,然后把我们的策略在上面进行一个执行,包括对整个模型的运算的结果进行很好的统计分析,来提供上层的一个服务,这是整个平台的一个应用层的一个定位。
那我们来看整个技术层面,技术层面其实它主要的运算分了三块,一个是数据调动的规则法,第二个是风控的角色对接的模块,第三个就是业务策略规格。为什么要分为这三个模块呢?因为数据是风控的核心,高效地把数据接进来是非常重要的一点,包括业务系统它需要传下来的数据,其实这些数据都需要接到这个风控平台上,那怎么有效的接入?需要有一个数据调动的规则平台去做这样的事情。
就是整个数据的接入以及模型的发布,都用一个配置文件去实行,这个配置文件里定义了每一个源数据,以及数据的接入地址和相互关系。这个模型可能是一个R包,也可能是其它的一个包或者其它的一个架构,这都没关系。模型人员建的任何一个包如何发布,如何有效地利用这些数据都是在配置文件里实现的。
这种方法有效地解决了一定的问题,就是模型在上线、发布以及校对过程中对数据的时候不再那么复杂,只需要模型人员在了解数据后,再让配备人员做一些配比就可以,不需要技术人员追着修改代码。在这个系统里面我们可以把很好地把数据引入,再把模型包发布上去,这是最根本的一个问题。
另外整个过程对于这个平台来说,还有两个重要的模块就是可拖拽的实现,这是市面上很多风控系统平台都在实现的逻辑,但是对于风控要求非常高的金融机构来说,很难满足他们的需求。当前,风控人员越来越专业化,对于写脚本和语言已经非常熟悉,已经不需要去拖拽一些公式,因此这种逻辑会显得比较繁琐。
这是整个平台的一个发展路径,最早的时候刚才说了,金融机构可能是以秒为单位,平常的时候我们达到了让客户一天的时间就可以把模型配置好发布上去,现在是分钟级的,就是说你的模型从产出到发布、到上线整个过程是分钟级的,那我们下一阶段想达到秒级,就是说你的模型的配置和发布上线的过程对客户来说可能是没有任何感触的,他其实在后台简单配置下就可以去上线了,这是整个平台的一个路径。
关于天创
最后介绍一下天创,天创是一家金融科技公司,成立至今已经有差不多三年的时间,以“数据+风控+金融”模式打通金融服务价值链,通过大数据技术及风控能力连接金融端和产业端,为客户提供全面、专业、高效的数据服务、风控服务和解决方案。天创能够为客户提供反欺诈、信用评估、授信审批、风险监控、催收等全流程的产品和服务,以及面向消费金融、互联网、农业、园区、汽车等细分领域的风控解决方案。
天创的整体服务能力是T.D.P。T是什么呢?就是风控咨询,整个天创的风控的团队非常强的,由国内外顶尖金融机构以及国内高校相关专业毕业的的优秀人才组成;D是数据和数据产品,天创提供各种类型的基础数据和基于基础数据加工的信用报告、数据变量等数据产品服务;P是系统平台,主打风云决(决策系统平台)和三方数据管理平台(三方数据管理平台)。通过T.D.P整体解决方案给金融机构和核心企业解决金融风险问题。
浏览1642次
浏览5268次
浏览7439次
浏览9837次
浏览2190次
浏览5707次
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈