大数据风控助力银行破局消费金融

来自:民生大数据 2020-03-25

摘要:

长尾客群的规模效应在科技金融的支撑下不断显现,与此同时,监管机构正酝酿消费金融的强监管框架,出台多项法案对参与方的数据采集合规性以及自主风控能力提出更高要求,银行要想在该领域获得更好的发展,需要在获客及风控流程上不断迭代优化。传统Fico评分卡建模技术拥有简洁、易解释的优势,但其弊端也非常显著——无法支持对白户及薄征信客群的精准信用评估。为了帮助信用优质的薄征信客户获得银行贷款,笔者所在团队使用大数据风控技术,基于行内丰富的非债务类变量开发了“新竹信用分”产品,能够支持对银行存量客群,包括白户及薄征信等长尾客群进行精准信用评估。此外,该产品不依赖于征信等外部数据,可随时量化存量客户的信用水平,因此可以在贷款营销等场景下提供客户分层依据,帮助业务人员差异化配置营销资源,实现风控与获客的平衡。

关键词: 消费金融、大数据风控、薄征信

一、金融科技助力普惠金融

近年来,现代科技成果正不断改造及创新金融产品、经营模式及业务流程,成为金融业转型升级的加速器。我国金融科技的发展主要经历了三个阶段,首先是20世纪80年代的金融业务电子化,即计算机普及、现代通信网络和数据库技术推动了金融数据电子化和业务流程化;21世纪初期则出现了金融渠道网络化,即在智能手机、移动互联技术的发展下,诞生了网上银行、手机银行、第三方支付等应用,金融服务的获取渠道也逐渐从线下向线上迁移;2016年以来,以机器学习、自然语言处理等关键技术为核心,以大数据、云计算等数据处理或计算能力为基础支撑的人工智能技术与金融行业深度融合,不断优化金融服务流程、提升金融服务质效,“智能金融”的服务模式不断深化。

改革开放以来,金融业一直注重深度发展,而在广度即普惠性上还有巨大的发展空间。近期 央行发布的《金融科技(FinTech)发展规划(2019-2021年)》指出, 部分金融机构存在同质化低效竞争、轻视长尾客户的规模效应、创新试错容错机制缺失的问题。 商业银行过去将资源集中投放于头部优质客群,而受限于信息获取及风控技术等因素未将信贷等金融服务深入至长尾客群,随着经济进入新常态、利差空间收窄、新资本协议推行,以及互联网金融介入导致泛同业竞争加剧,商业银行需要开拓新的业务领域以谋求发展。

二、消费金融的行业现状与发展前景

近两年线上消费信贷借力金融科技实现快速增长,成为银行零售业务的重要突破口,多家商业银行纷纷通过线上渠道拓展消贷业务,触及长尾客群。根据央行《中国区域金融运行报告(2018)》所示,消费金融具有广义与狭义两种定义方式,广义消费金融包含了传统商业银行发放的住房按揭贷款、信用卡等个人信贷产品,狭义消费金融则不包含车房贷款部分,而是指以消费为目的,贷款周期不超过24个月,金额不超过20万元的信用贷款。商务部报告显示,2018年我国消费金融市场 (不含房贷)规模8.45万亿元,市场渗透率22.36%, 预计2020年市场规模将达到12万亿元,渗透率逐渐提高至25.05%。与国内相比,美国消费金融产业起步较早,渗透率超过40%,对比可见我国消费金融市场提升空间较大,发展前景广阔。

(一)多方竞争抢占赛道

在我国,消费金融的主要服务商分为商业银行、持牌消费金融公司和新兴互联网消费金融公司三类。 商业银行的竞争优势在于稳定、低成本的资金来源,其特点是成熟的风控能力以及审慎的风险偏好在此基础上商业银行的消费信贷不良率整体控制在较低水平; 在部分发达国家,持牌消金公司是消费信贷的主要参与方,而在我国,受制于较高的设立门槛和有限的资金来源,消费金融公司发展速度有限,目前我国已开业消金机构24家,且其中多数有银行背景,在2018年业绩披露中净利润超过5亿元的消金公司仅有五家;第三类是以小贷公司为代表的互联网消费金融,自2011年起,蚂蚁金服、京东金融等互联网公司均成立小贷公司,推出的花呗、借呗、京东白条等产品 依托庞大的平台流量和丰富的消费场景迅速发展,触及更广泛客群 ,其中就包含过去银行难以覆盖到的长尾客群。

(二)创新合作模式——联合贷款及助贷

流量及风控是消费金融发展的两个重要因素。银行资金成本低、但缺乏消费场景及线上流量,小贷公司依托成熟的互联网平台沉淀出大流量及丰富的消费场景,却受政策约束通常只有1-3倍资金杠杆(注:小贷牌照与消费金融牌照不同,后者具有10倍杠杆优势)。在风控领域, 银行的优势是可借助央行征信系统进行信用信息互通,且长期的风控模型迭代让银行拥有较稳健的风控体系。但近年来随着人工智能和大数据的应用,头部互联网金融公司凭借其沉淀的高维数据体系进行用户画像、开发一系列大数据风控模型及产品用于消贷的推广及准入,且因其数据覆盖面及覆盖客群较广,具有一定风控优势。

互联网金融公司需要解决资金来源问题,而银行也需要获得更大的线上流量来拓展业务,在此背景下诞生了联合贷款、助贷等创新消贷产品。其中,联合贷款是由两家及以上资金方联合出资,共同进行风控和贷后管理的信贷方式,助贷通常是消金或小贷公司通过自有风控流程筛选目标客群后将较优质的客户输送给银行等机构进行风控终审,并完成贷款发放的业务模式。以上两种创新消贷模式将多方在资金、流量、科技等方面的能力进行互补、融合,但需要注意的是, 随着联合贷款及助贷业务的快速开展, 潜在的产品风险逐渐暴露出来,主要表现为银行作为主要出资方难以依据自身风控体系对导流客户进行精准的风险量化,存在过度依赖合作企业风控能力的现象。 除此之外,相关领域的监管政策制度不够健全,虽然各地区已逐渐出台政策规范联合贷款及助贷的业务开展,如2019年10月北京银保监局出台《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,要求“严格落实自主风控原则,不得仅根据合作机构提供的数据或信用评分直接作出授信决策”等,但该类监管规范的细节仍有待完善,包括对核心风控具体包括哪些环节的定义等。

三、增量客群流向互金,银行消贷如何破局

在监管日渐强调自主风控的背景下,银行搭助贷风控便车、做甩手资金方的日子远去,同样,随着监管机构对数据采集阀门的扎紧(如2019年10月爬虫整顿风暴行动中,因涉嫌侵犯个人隐私、助力暴力催收,多家知名数据风控公司已停止爬虫相关业务),外部数据产品的合规性、有效性、稳定性难以保证。 90后及无征信人群为消费金融增量群体 ,银行等金融机构为其提供信贷服务的能力不足,该流量逐渐导向持牌消金公司和互联网消费金融。综合以上几点,在竞争日益激烈的消费金融赛道上, 银行要想在消费信贷上取得更长远的发展,须持续优化自身风控体系,重视长尾客户的规模效应,在产品和准入流程的设计,以及量化工具的打造上覆盖更广泛的客群。

(一)信用评分技术的发展及对比

信贷流程中最主要的风险量化工具是信用评分。在不同时代的经济环境下,金融机构针对信贷业务采用的风控策略在不断调整,信用评分技术更是适应时代的潮流不断进行着迭代优化。信用评分最早由Fisher(1936)在统计学领域提出,Davidnurand(1941)提出可以用同样的统计方法来区分“好”“坏”贷款,进而评价贷款的信用风险。当时的美国,贷款审批决策依赖于信用分析人员的个人经验,随着二战爆发,大批信用分析人员参军,为了给更多没有经验的分析人员提供参考,他们将一些基本分析准则记录下来,这便是信用评分领域最早的专家系统。20世纪六十年代起,信用卡业务的迅猛发展催生出了更为高效的信用评分系统,客户分析法便是那个年代主流的分析方法,通过收入、消费习惯等对客户进行分类,利用聚类分析、相关性分析等方法分析不同类型客户的还款表现,归纳不同指标对贷款逾期的影响,但受制于当时的计算能力和数据质量,该方法停留在较浅层的数据相关性。20世纪七八十年代在信用评分领域扮演重要角色的是以Fico为代表的,以构建模型为核心的预测方法,通过15-20 个变量,将每个变量赋予一定的分值,并通过变量系数调整各变量权重,以最终的分数作为客户信用评分结果。20世纪九十年代后, 以Fico评分为代表的传统信用评分技术局限性逐渐显现,如:较少的变量(可加工的信息不够全面)、依赖的广义线性算法(萃取知识的能力有限)、需要强经验嵌入的特征工程(建模实验中难以快速迭代)等。 如今,依靠高维度数据源和机器学习算法的大数据风控技术给信用评分问题带来新的思路。

(二)传统评分技术与大数据风控技术的对比

以Fico为代表的传统个人信用评分技术从信用偿还历史、信用账户数量、使用信用的年限、正在使用的信用类型和新开立的信用账户五个维度设计变量,并代入线性评分模型进行评分。这类传统评分技术被广泛运用于我国各大商业银行,评分数据源主要来自中国人民银行征信中心提供的个人征信报告。Fico评分技术诞生于美国,美国消费金融起步早、信贷记录覆盖全, 截至2019年5月,我国央行征信系统信贷记录覆盖率仅为38%,远低于美国的75% ,15岁以上的美国人中,2/3以上持有信用卡,但在中国这一比例仅为21%。由此可见传统Fico评分技术在国内环境下的局限性显著——缺乏征信记录或者征信记录较短的人,包括学生、年轻白领、广大蓝领等,需要一定的融资支持,但很难从银行得到第一次贷款。在互联网金融蓬勃发展的当下,这部分新增流量正持续导入持牌消费金融公司和互联网小贷公司,一定程度上削弱了银行在消费金融领域的竞争优势。

以ZestFinance为代表的大数据风控产品则用机器学习算法加强非债务数据的风险刻画能力,从消费者的其他数据,例如交易记录、资产信息、人脉等来量化与违约的相关性, 大多数互联网金融机构正是依托这种技术来发展自身风控能力,将信贷服务延伸至更广泛的客群。需要注意的是入模数据的维度及广度直接影响模型精度,我国的大部分大数据评分产品暂未做到像ZestFinance整合各第三方平台数据源。

总结,广泛运用于银行的传统架构的信用评分体系依赖于客户的历史信贷数据,未有效利用客户生产、生活中产生的其它真实数据,这些数据一定程度上反映了客户的信用水平,应当被有效利用。 大数据风控技术下的个人信用评分体系对于新进入个人信用服务的客户具有较强的接纳能力,是构建普惠金融体系的途径之一,可以在缺少历史信用数据时的个人信用评分体系进行补充,保障信贷审批的运行。

四、大数据风控领域的一次尝试——

“新竹信用分”

本方案的出发点是基于银行自有数据生态打造量化风控方案,践行“ALL DATA IS CREDIT DATA”,借助机器学习技术发挥非债类数据对信用评估的补充作用。方案之核心产出——“新竹信用分”可在任何需要对存量客户进行信用评估的场景为业务人员提供参考,同时为银行探索薄征信这一信贷蓝海客群贡献一份力量。

(一)产品介绍

经过数据质量筛选及反复建模实验,最终信用分模型纳入五大类、500余个行内变量,分别为基本信息(5%),资产(15%),交易(45%),产品(15%),其它标签及资质类特征(20%)。基本信息包含客户的年龄、职业、学历等;资产类特征则主要基于客户在行内各类金融资产的余额、占比、波动和相对排名情况设计变量,有效反应客户的偿债能力;交易类特征聚焦客户的动帐交易,包括对客户资金流向、交易对手、交易金额、交易波动及消费能力的一系列统计,侧重于描绘客户的消费习惯和人脉状况;产品类特征聚焦于客户对银行的一系列金融产品,如理财、基金、贵金属等的购买赎回历史,该类信息可反映客户黏性,也可以一定程度反映客户的所处社会层级和风险偏好,若客户同时为我行信用卡或贷款客户,模型还会参考其信用卡额度及还款情况;建模过程还将过去几年我行数据挖掘工作沉淀的客户标签充分利用,另外,一些反映客户行内资质的数据,如代发工资等信息也被纳入评分卡变量。

本次建模目标是让 评分卡可以对行内存量客户,含信用白户、薄征信客户及有征信客户进行风险量化 ,考虑到银行自有消贷产品过去极少对信用白户进行放款,故建模阶段除了行内自有消贷、联合消贷的样本外,模型还适当引入了有风险表现的信用卡申请白户(申请我行信用卡前已持有我行借记卡且为信用白户)进行样本增广,利用迁移学习的思路使得模型对白户、薄征信客户及有信用历史的客户均具备一定的风险刻画能力。

(二) 应用场景

1.薄征信客户授信

我行消费贷款申请者中约两成为白户、薄征信客户(信贷记录不足两年),信贷记录不足两年的申请人(以下简称薄征信客户)占比与渠道强相关,一般在线渠道的薄征信客户比例高于线下渠道,外部引流渠道会高于行内自有渠道。当存量薄征信客户申请进入决策流时,传统准入评分卡模型难以对其进行精准的信用量化,此时可调用本产品的打分结果作为授信参考,为优质的薄征信客户增信、帮助解决薄征信授信难的问题。该产品的应用将打破银行难以用自主风控方式为薄征信客群提供信贷服务的现状,增强零售消贷业务的竞争力。

2.风控前置的精准营销

由于贷款类产品的特殊性,依靠客户经理线下地推或电呼人员向高资质客户电话营销的方式响应率较低,且由于营销阶段难以评估客户风险,即便营销成功也无法保证申请通过率,消贷营销效果有待提高。针对这一痛点,可采用本产品对存量客户进行预筛,并结合贷款意愿评估结果,将存量客户映射到“风险&意愿”二维矩阵上,导出低风险、高意愿的客户名单进行贷款营销,将风险评估前伸至营销阶段,助力消贷业务提升。

(三)前景与展望

在信用社会下,大数据风控技术让更全面的个人信用评估成为可能。为客户创立“信用账户”是提升客户黏性的一种方式,同时,从信用维度出发进行客户分层管理,能够为资源的差异化配置提供抓手。大数据风控模型的比较优势是对多维度弱变量信息的加工能力,变量的丰富程度和数据质量直接影响着模型的精度及稳定性。随着国家对公民数据隐私的立法保护、监管对企业间数据交换的管理趋严,如何运用多方安全计算等新方法引入外部数据,探索联合建模、打破“数据孤岛”,让银行的大数据风控模型覆盖更广阔的客群是下一步的探索方向。

- end -  

团队介绍:

我们是民生银行信息科技部数据模型管理团队,以打造智能化风控、智能化营销和智能化管理模型体系为目标,以数据为依托,以模型为载体,以解决业务问题提供解决方案为价值导向,在这个领域我们善于思考、乐于分享,开拓创新。